サイバーエージェントは、研究開発組織「AI Lab」によるリサーチインターンシップの成果を含む論文2本が、音声・音響信号処理分野の国際会議「ICASSP 2026」に採択されたと発表しました。これらの研究成果は、5月にスペイン・バルセロナで開催される同会議にて発表される予定です。

音声データの信頼性を高めるハルシネーション対策
採択された1本目の論文は、劣化した音声を高品質化する生成的音声強調技術における課題解決をテーマにしたものです。
背景雑音などを除去する過程では、存在しない音素が生成される音素の欠落や、本来の声質が変わってしまう話者性の不一致といった、AI特有の誤情報(ハルシネーション)が発生するリスクがありました。同研究では、AIが出力する際の確率分布に基づいた信頼度スコアを活用し、不適切な出力を自動でフィルタリングする手法を提案しました。これにより、ノイズを含む膨大な音声資源から、学習に最適な高品質なデータセットの効率的な構築ができるようになります。
「音の高さ」の推定精度を向上させる新手法
2本目の論文では、音声や音楽分析の根幹となる基本周波数(音の高さ)の推定精度を向上させる新手法を提案しています。
複数のモデルによる推定結果を統合する投票方式の理論的裏付けを解明し、さらにモデル間の微細なズレを補正する技術を開発しました。話し声だけでなく、歌声や楽器音といった多様な音源において、従来の最新手法を上回る解析精度を実現しています。特にノイズの多い環境下でも安定した推定が可能なため、歌声変換やアクセント推定といった実社会のさまざまなシーンへの応用が可能となります。
高品質なコンテンツ生成支援プロダクトへの応用
AI Labでは、これらの研究成果を動画広告制作における音声合成技術の向上や、バーチャルヒューマンをはじめとする高品質なコンテンツ生成支援プロダクトへ応用していく方針です。
デジタルツイン音声やボイスボットなど、音声技術を活用した広告表現の幅が広がっています。サイバーエージェントは、今後もこれらの技術をビジネスや社会課題の解決に資するプロダクトへ実装していくとしています。
ICASSP(アイキャスプ)とは
ICASSPは、IEEE(電気電子学会)が主催する、音声・音響信号処理分野において世界で最も権威ある国際会議のひとつです。世界中からトップクラスの研究者が集まり、最新のアルゴリズムや技術成果を発表します。ここで採択される技術は、数年後の音声認識、音声合成、AI音声アシスタントなどの基盤となることが多く、音声テクノロジーの進化の方向性を占う重要な指標といえます。
参照元:AI Lab、音声・音響信号処理分野のトップカンファレンス「ICASSP 2026」にて2本の論文採択



なんかわかんねーけど、すごそう。