夜のNHKニュースで,AI自動音声合成によるというキャプションが出るものが登場した。これは,VOICEPEAKを使っているのかと調べると,NHK放送技術研究所が開発した独自の日本語音声合成システムらしい。
今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号」を自動的に生成し、それを「系列変換モデル」の入力データとすることで大量のデータを効率的に学習させ、日本語の合成音声の品質を向上させることに成功しました。
また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にしました。
ということで違和感なく聞くことができるレベルになって,NHKの朝のニュースにも採用されはじめた。VRのアバターによるニュースが始まるまであと一歩だ。アナウンサーは放送局のかかえるタレント的存在になっているが,その傾向に拍車がかかる。
なお,VOICEPEAKは29,800円くらいで購入できて商用利用も可能だが,VOICEVOXという無料の中品質音声合成ソフトウェアも登場していた。
[1]音声合成ソフトの進化がすごい!(PC Watch 2022.4.16)
0 件のコメント:
コメントを投稿