IBM Watson Text to Speech でテキストの読み上げ
はじめに
Text to Speech とは、テキストを自然に感じで読み上げた音声を作成しているサービスです。
日本語に対応しています。
実際試してみると、人間が喋るよりも、音声は機械的ですが、まったく問題なく聞き取れます。
IBM Cloud への登録は済ませてある事を前提に、手順を記載して行きたいと思います。
1. まずは、IBM Cloud でリソースの作成
Text To Speech のページを開き、リソースを作成します。
2. 資格情報 (ユーザ名/パスワード) の確認
リソースの作成が完了すると、資格情報のページに移動します。
以下の赤枠の「表示」をクリックして、ユーザ名・パスワードを確認します。
3. curl コマンドで APIを実行してみる
{username}, {password}を自分の物に書き換えて、コマンドを実行し下さい。
実行後、カレントディレクトリに "hello.ogg"が作成されたら成功です。
再生すると「はじめまして」と喋ってくれるハズです。
curl -X POST -u "{username}:{password}" \
--header "Content-Type: application/json" \
--header "Accept: audio/ogg" \
--data "{\"text\":\"はじめまして\"}" \
--output hello.ogg \
"https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=ja-JP_EmiVoice"
0 件のコメント:
コメントを投稿