Amazon Polly でナレーションを読み上げる

 

Amazon Polly とは、テキストを音声に変換してくれるサービスです。Amazon が提供しているAIを利用したサービスでディープラーニング機能により日々進化しているようです。

最近ではこの Amazon Polly を使ってFMのDJを人間の代わりにニュース原稿を読む取り組みが行われ、注目が集まっています。まだまだ人間ほどに気持ちを込めたり、流ちょうな流れで話すことは難しいですが、ディープラーニング機能による学習でみるみる上手く話せるようになるでしょう。

そこで、動画制作やプレゼン資料作成の際、ナレーションを誰かに頼んでいたり、高価なボイス作成ソフトを使用したりせずに Amazon Polly を利用してみるのは一考の価値があるかもしれません。

使用するにはまず、AWS のアカウントを無料作成し、トップページから polly を検索します。

Amazon Polly

すると早速テキスト入力画面になりますので、読みたいテキストを入力して「音声を聴く」ボタンを押せば、読み上げてくれます。驚くほど簡単です!

言語は24あり、47の声から選ぶことが可能とありますが、私のログインページからですと選択できるのは「ロシア語」「日本語」「英語(インド)」「英語(ウェールズ)」「英語(オーストラリア)」「英語(米国)」「英語(英国)」の7言語でした。

音声は「Mizuki(女性)」と「Takumi(男性)」の2音声。英語ですと8音声ありますので、徐々に増やしていくものと推測できます。

料金は毎月500万字までは無料!それ以降は、大体1分程度の音声で$0.004程度です。大量に読み上げることがなければほぼ無料で利用できるのではないでしょうか。

他にも発音など細かな設定も「SSML」や「レキシコン」で可能なようですが、こちらはちょっと勉強が必要です。いずれにしても、この Amazon Polly はかなり便利だと感じました。これまではボカロソフトや高価な音声生成ソフトに頼っていましたが、そこからは卒業できそうです。


愛知県西尾市の映像制作・動画制作会社、株式会社モーション・ビジュアル・ジャパンは骨太なドキュメンタリー映像も得意です。ドキュメンタリーならでは真実味溢れる映像をご検討でしたら是非お問合せください。

制作実績を見てみる 問い合わせてみる