VOICEPEAK 商用可能 6ナレーターセット
コロナ以来、授業のスライドにナレーションを入れて動画にすることが増えた。対面授業ができなくなったり、教員自身が療養することになったときに、ナレーション入りの講義スライドを配布しておけば、授業を中断せずに済む。
ナレーションには自分の声を使うことが多いだろうが、録音のための環境整備が大変なこともある。そのようなとき、スライドのナレーションに、音声合成ソフトを利用できる。
利点は:
- スタジオや録音機材がなくても制作できる(普通の部屋では、雑音や残響が入りがち)
- 声質がいつでも同じ(人の声だとその日の調子に左右される)
- セリフの改変に対応しやすい(人の声だと音声の切り貼りが大変)
欠点は:
- 不自然な話し方になりがちで、聞き取りにくい
- 平版な話し方になりがちで、聞き飽きる
- 専門用語を読み間違えがち
最近の音声合成では、これらの欠点は改善されてきている。
AIを取り入れて、ホンモノの人のような話し方が可能だ。また、イントネーション、アクセント、間の取り方、喜怒哀楽の感情を調整できるソフトもある。ユーザー辞書に対応していて、専門用語を読み間違えないようにできるソフトもある。
無料あるいは低額で使えるものとしては、次がある:
プラットフォーム | アクセントやイントネーションの調整 | 間合いの調整 | 感情表現 | ユーザー辞書 | 無料 | 有料 | URL | |
---|---|---|---|---|---|---|---|---|
voicepeak 商用可能6ナレーターセット | Windows / Mac / Linux | 可 | 可 | 可 | 可 | 機能限定の試用版 | ¥29,800 | https://www.ah-soft.com/voice/narrator/ |
VOICEVOX | Windows / Mac / Linux | 可 | 可 | 可 | 可 | フルセット | – | https://voicevox.hiroshiba.jp/ |
音読さん | Web | 不可 | 可 | 不可 | 可 | 200,000字/月 | ¥1,980/月〜 | https://ondoku3.com/ja/ |
VoiceText Web API | API | 不可 | 不可 | 可 | 不可 | 二次利用不可 | ReadSpeaker | https://cloud.voicetext.jp/webapi |
CoeFont | Web | 可 | 可 | 可 | 可 | 数種類の声/1作品 | ¥500/月〜 | https://coefont.cloud/ |
Text to Speech | Mac | 不可 | 不可 | 不可 | 不可 | macOSの機能 | – | https://support.apple.com/ja-jp/guide/mac-help/mh35738/machttps://ondoku3.com/ja/ |
- 音声の品質とソフトの使いやすさで、voicepeakが好ましい。声がナレーション向き。商用利用可能なのもよい。
- VOICEBOXも声の品質がよいが、アプリの使いやすさでは改善の余地がある。また、声がどれもアニメっぽいので用途が限られる。
- 音読さんは、イントネーションやアクセントがしばしば変になって聞き取りにくい。
- VoiceText Web API は、ターミナルでコマンドを打って使う。フロントエンドのアプリを作って使うとよい。「モヤさま」のナレーションにこの声のうちの「SHOW」が使われている。利用登録が必要。
- CoeFontは、声の種類の多いことが特徴。声の品質はvoicepeak、VOICEBOX、VoiceTextに及ばない。
- Text to Speachは手軽に使えるが、日本語の読み間違いが多い。英語の声の品質は高い。
ここでは、voicepeakとVOICEBOXを試す。
音声合成をこれから使ってみようというなら、まず無料のVOICEBOXを試し、次にvoicepeakの試用版を試すのがよさそうだ。VOICEBOXで十分ならそのまま、不足ならvoicepeak。評者の場合は後者になった。
voicepeak
voicepeakは有料のソフトで、パソコンにインストールして使う。試用版をまず試して、自分の環境で動作チェックしてから購入しよう。
ダウロード版とパッケージ版がある。パッケージ版にはインストールDVDとシリアルナンバーが付いている。インストーラーはダウンロードすることもできるので、パソコンにDVDドライブがなくても大丈夫。
インストールとライセンス認証のときにインターネット接続が必要になるが、アプリの使用自体はオフラインでもよい。
VOICEPEAK 商用可能 6ナレーターセット には、ナレーション向きの声が男女各々3種類と、女児のアニメ声1種類が付属している。その他、有料オプションの声もあり、全15種類になる。
声の品質が高い。商用利用可能で、教材として配信することも許諾されている。
医学用語などの専門用語は読み間違うことが多い。読み間違うときには、ユーザー辞書に登録する。読みだけでなくイントネーションも定義できる。ユーザー辞書のインポートやエクスポートができる。
辞書のインポート/エクスポートによって、辞書のバックアップが可能だ。かな漢字変換辞書を流用できるかもしれない。エクスポートすると次のようなテキストで、拡張子が「.vdc」のファイルができる(「胸鎖乳突筋」が登録されている):
[ { "sur": "\u80f8\u9396\u4e73\u7a81\u7b4b", "pron": "\u30ad\u30e7\u30a6\u30b5\u30cb\u30e5\u30a6\u30c8\u30c4\u30ad\u30f3", "pos": "Japanese_Futsuu_meishi", "priority": 5, "accentType": 1, "lang": "ja" } ]
日本語がUnicodeエスケープシーケンスになっている。
『グレイ解剖学 原著第4版』から、胸部の冒頭を音声にした。読み間違う部分はユーザー辞書で直してある。間合いを長めにし、感情を調節して元気な声にした。
VOICEBOX
VOICEBOXは、無料ながら、付属する声が多い。声の品質や機能もvoicepeakに並ぶ。
ただし、ソフトの使いやすさに改善の余地がある。特に、ユーザー辞書機能。新しい単語を登録しても、セリフを一旦削除してから打ち込み直さないと、それが反映されない。また、インポートやエクスポートができない。
上と同様に、『グレイ解剖学 原著第4版』から、胸部の冒頭を音声にした。ところどころ読み間違っている。ユーザー辞書に登録したが、すぐには反映されない。どうやっても反映されない部分もあり、あきらめた。
コメントを投稿するにはログインしてください。