AI音声技術の研究開発を行うParakeetは4月14日、音声ファイルから最も声質の近い話者を推定する話者識別モデル「Paramatch」のデモ版を公開しました。アップロードされた音声を分析し、話者データベースから類似する話者上位3名と類似度スコアを提示します。本モデルは、無断学習されたAI音声の学習元となった声の持ち主を特定する手がかりを得ることを目的としています。

AI音声の学習元を推定する話者識別モデル「Paramatch」
Parakeetが公開した「Paramatch」は、アップロードされた音声ファイルを解析し、話者データベースから最も声質の近い話者を予測するAIモデルです。類似度の高い話者上位3名とスコアを提示する仕組みで、30秒以下の音声ファイルに対応しています。
同モデルは、無断学習されたAI音声から元の声の持ち主を特定する手がかりを得るために開発されました。デモ版の音声データはサーバーに保存されず、二次利用も行われません。本モデルの学習データは、音声合成など他のプロジェクトへ転用されることもないとしています。
開発の背景とAI音声をめぐる権利の問題
AI音声合成技術の発展により、声優・俳優の音声を無断学習したモデルや合成音声が拡散される事例が後を絶ちません。日本の著作権法第30条の4では、個人が私的に楽しむ範囲の学習は認められています。しかし、無断学習モデルの配布や、第三者が特定の声優・俳優の声で自由に発話できる状態を作る行為は、実演家のアイデンティティを脅かす別の問題であるとParakeetは指摘しています。
こうした課題に対し、Paramatchは、表現者の権利を守るための有効な対抗策となり得るかを実証ベースで検証することを目的に公開されました。
業界関係者との共同検証を視野に公開
Parakeetは、実際の不正事例に対する有効性を検証するため、声優・俳優や所属事務所、権利者団体らとの共同検討を開始します。具体的には、識別精度の向上、権利保護の枠組みづくりに関する技術的助言、共同プロジェクトへの参画などを進める計画です。
同社は、リアルタイムAIボイスチェンジャー「Paravo」において、知的財産権の保有者とライセンス契約を結び、適切に利益を還元する仕組みを構築した実績があります。今回のデモ公開を、業界関係者との対話の起点にするとしています。
Parakeetとは
Parakeetは、福島県双葉郡広野町に本社を置く企業で、AI音声技術の研究開発を行っています。リアルタイムAIボイスチェンジャー「Paravo」などの音声関連技術を開発しており、声優事務所やIPホルダーとライセンス契約を結び、声優の音声を活用したサービスの提供にも取り組んでいます。また、音声分析や話者識別など、音声データを活用した技術の開発も行っています。
参照元:「その合成音声、誰の声ですか?」無断学習されたAI音声から元の声優を特定する話者識別モデル「Paramatch」デモ版を公開



声は大切な資産だよ。