NTT東日本は、AIスタートアップのNABLASと共同開発を進めている「高精度な電話音声フェイク検知技術」のデモを公開しました。
1月28日に開催された「NTT東日本グループ 地域ミライ共創フォーラム2026」で披露されたもので、生成AIによる音声合成を悪用したなりすまし被害の防止を目指します。

生成AIによる「クローンボイス」の脅威と国内外の被害実態
現在、生成AI技術の飛躍的な発展により、専門知識がなくとも短時間の音声データから本人そっくりの「クローンボイス」を作成することが可能になっています。わずか5分程度の録音や、SNS上の動画から抽出した著名人の声をもとに、なりすまし音声が容易に生成できる状況にあります。
生成AIによる音声合成技術を悪用した特殊詐欺被害は、世界各地で社会問題化しています。今後は精巧なフェイク音声を用いた手口が急増することが懸念されています。
ひかり電話と連携し、リアルタイムでフェイク音声を見抜く新技術
NTT東日本がAIスタートアップのNABLASとともに開発を進めている本技術は、同社の「ひかり電話」と検知エンジンを連携させる仕組みです。通話データを2秒ごとに検知エンジンへ送り込むことで、リアルタイムに音声がフェイクかどうかを識別し、利用者の端末へ判定結果を通知します。
この技術の大きな特徴は、固定電話や携帯電話、IP電話など、異なる電話環境における音声圧縮(コーデック変換)に対応している点です。一般的に、電話回線を通した音声は品質が変化するため検知が困難とされてきましたが、両社は追加学習によって高い検知精度を維持する技術を確立しています。また、海外の生成AI企業からも技術協力を受けており、最新の生成AI技術の動向を踏まえた検知モデルの開発に活かしています。
自治体業務への展開を見据えた今後の展望
本事業は、総務省が主宰する「インターネット上の偽・誤情報などへの対策技術の開発・実証事業」の一環として、2025年8月から進められています。開発中のシステムでは、利用者ごとに検知の閾値を設定できる仕様となっており、将来的には高い信頼性が求められる広報や防災、危機管理業務を担う自治体をはじめ、幅広い分野への展開を視野に入れています。
NTT東日本は、DID/VC(分散型ID/検証可能資格)技術も活用しながら、自治体向けの偽・誤情報対策を含めた総合的な安心・安全な通信環境の構築を目指しています。
電話音声フェイク検知技術とは
電話音声フェイク検知技術とは、AI(生成AI)によって作られた「なりすまし音声(クローンボイス)」を、独自のアルゴリズムでリアルタイムに識別する技術のことです。通話中の音声データから、AI生成音声特有の特徴を解析、AI生成特有の不自然なパターンを解析し、2秒程度の短時間で真贋を判定します。固定電話や携帯電話といった回線ごとの音声圧縮(コーデック)の影響を排除し、高精度な検知を維持できるのが特徴で、オレオレ詐欺などの特殊詐欺を防ぐ新たな盾として期待されています。
参照元:NTT東日本がAI活用で電話音声詐欺に対応、高精度な音声フェイク検知技術でオレオレ詐欺などを防ぐ
![[科学で考えるソニックマーケティング]第27回:ジングルかソニックロゴか?それが問題だ。](https://audio-marketing.jp/wp-content/uploads/2025/04/Tact_img_27kai.png)

![[科学で考えるソニックマーケティング]第12回:シュガーレスガム全米売上No.1に貢献したCMを徹底解析!](https://audio-marketing.jp/wp-content/uploads/2024/09/B_Tact_img_12kai.png)
AIの嘘は、もはやAIが暴くしかないんか。