AI音声合成サービスを提供するCoeFontは、AI音声モデル「CoeFont v3 Fuji」を11月13日に一般公開しました。本モデルは、発話リズムの調整機能と感情表現に対応した日本語AI音声モデルです。このサービスにより同社は、動画制作・ナレーション・教育・アプリ音声など、幅広い分野で自然な音声出力と感情の再現を目指しています。

「v3 Fuji」チャレンジが公開。自身の声でAIモデル制作に挑戦可能
CoeFontは、今回の一般公開に合わせて、誰でも自身の声でAI音声モデルの制作に挑戦できる「v3 Fuji」チャレンジも公開しました。
本チャレンジでは、参加者が喜怒哀楽などの感情別収録と通常収録を合わせて1,500文を録音します。ただし、収録直後にAI音声モデルが生成されるわけではなく、収録された音声はCoeFont側で審査されます。審査を経て採用が決定した一部の方の声が、「CoeFont v3 Fuji」対応のAI音声として正式に採用される流れです。採用可否およびモデル化の時期は、対象者にのみ後日個別で案内されます。
「CoeFont v3 Fuji」の3つの特徴
「CoeFont v3 Fuji」は、感情の再現力に焦点を当てたCoeFont独自のAI音声モデルです。本製品には以下3つの特徴があります。
- 発話リズムの調整機能:人間の発声特性を解析することで、抑揚・間・リズムなどをより再現し、聞く人に「話しかけられている」感覚を与える音声に。
- 多様な感情表現への対応:喜怒哀楽といった感情のゆらぎやテンションの変化も、従来モデルより細かく表現可能に。
- 長時間利用や業務用途に対応した音質:クリアかつノイズの少ない音質で、長時間にわたる利用でも快適性を維持する設計となっており、商用利用や業務用途にも適した仕様に。
本モデルは、無料ユーザーでも3回まで試用が可能で、プランに応じて月間8,000文字から最大100万文字まで利用できます。
CoeFontとは
CoeFontは、テキストを音声に変換する日本発の音声合成サービスです。特徴は「声」を細かく学習し、自然な抑揚や感情表現まで再現できる点にあります。ユーザー自身の声を収録してオリジナル音声を作ることも可能で、ナレーション制作、動画編集、接客AI、教育用途など幅広く利用されています。API連携にも強く、開発者がアプリやサービスに組み込みやすいのも利点です。用途に合わせて多数の声質が選べるため、音声生成の汎用プラットフォームとして使われています。
参照元:CoeFont、最新AI音声モデル「CoeFont v3 Fuji」の一般公開を開始!


![[科学で考えるソニックマーケティング]第1回:なぜだろう、フランスワインが飲みたい気がする・・](https://audio-marketing.jp/wp-content/uploads/2024/04/B_Tact_img_1kai.png)
声だけで喜怒哀楽を表現するのって意外とめっちゃ難しいよな。チャレンジ自体は楽しそうやけど。