Microsoftが提供するAzure AI Speechがアップデートし、AI音声生成機能であるPersonal Voiceでより表現力豊かな音声を生成できるようになりました。
アクセントやしゃべり方の“癖”に対応
Azure AI SpeechのPersonal Voiceは、数秒の音声サンプルから自分のAI音声を生成することができる機能です。
これまでのPersonal Voiceでは、生成された音声の発音が機械的であったり、表現力が欠如しているという問題点がありました。
今回行われたAzure AI Speechのアップデートでは、従来の課題であった表現力が改善されたほか、同じ言語でも様々な地域のアクセントやしゃべり方の“癖”に対応できるようになりました。これにより、同じ英語でも英国アクセントや米国アクセントなどを区別して発音できます。
Azure AI Speechは日本語をはじめ100以上の言語に対応しており、今回のPersonal Voiceのアップデートも対応している全言語に適応されています。
Azure AI Speechとは
Azure AI Speechは、Microsoftが提供する、音声生成AIです。音声をテキストに変換する「音声テキスト変換」や、テキストを音声に変換する「テキスト読み上げ」、発言者を特定する「話者認識」などの機能を実装しています。
参照元:Personal Voice upgraded to v2.1 in Azure AI Speech, more expressive than ever before
自分と同じ声なのに一切感情がこもってないの、めちゃくちゃ怖そう。