Geminiに生成音楽モデル「Lyria 3」を搭載。テキストや写真から楽曲生成が可能に

米Googleは2月19日、GeminiにGoogle DeepMindの生成音楽モデル「Lyria 3」を導入したと発表しました。これにより、音楽生成機能のベータ版提供が順次開始されます。テキストや写真、動画から歌詞付きの楽曲を生成できるほか、AI生成コンテンツを識別する「SynthID」にも対応しています。

Geminiに生成音楽モデル「Lyria 3」を搭載。テキストや写真から楽曲生成が可能に
引用元:Gemini で音楽生成

Geminiに搭載された生成音楽モデル「Lyria 3」

Google DeepMindが開発した生成音楽モデル「Lyria 3」がGeminiに導入され、音楽生成機能のベータ版として提供が開始されました。ユーザーはテキストで楽曲のテーマや雰囲気を説明することで、歌詞付きの楽曲を生成できます。

また、写真や動画をアップロードし、その内容をもとに楽曲を制作することも可能です。生成された楽曲は約30秒の長さで、AIモデル「Nano Banana」によるカスタムカバーアートとともに出力され、ダウンロードや共有リンクを通じて他者と共有できます。

Googleは本機能の目的について、「音楽の傑作を生成することではなく、自分自身を表現するためのユニークな方法を提供するものである」と説明しています。

生成方法と利用イメージ

テキスト入力ではジャンルやムード、個人的な思い出などを説明することで、雰囲気に合った歌詞付き楽曲を生成できます。画像や動画を素材として利用する場合は、Geminiがその内容をもとに雰囲気に合った歌詞付きの楽曲を生成します。

生成されたコンテンツには、Nano Bananaによるカスタムカバーアートが付与されます。これらの機能はGemini上で提供され、生成した楽曲はダウンロードや共有リンクを通じて共有できます。

Lyria 3で強化された音楽生成機能

Googleによると、Lyria 3では従来モデルと比較してオーディオ生成機能が向上しています。プロンプトに基づいて歌詞を自動生成できるほか、スタイルやボーカル、テンポなどの要素をより詳細に指定できるようになりました。

また、生成される楽曲のリアリティや音楽的な複雑性も向上したとされています。テキスト入力による指示だけでなく、写真や動画を用いた生成においても、これらの強化された機能が適用されます。

SynthIDによる音声検証機能と提供条件

Geminiで生成されたすべての楽曲には、GoogleのAI生成コンテンツを識別する電子透かし「SynthID」が埋め込まれています。この透かしは知覚できない形で音声データに付与され、AI生成コンテンツの識別を支援する仕組みです。さらにGeminiでは、ファイルをアップロードしてAI生成かどうかを確認できる検証機能が音声にも拡大されました。

GoogleはLyria 3の開発にあたり、音楽コミュニティとの連携や著作権への配慮を行ってきたと説明しており、特定アーティストの模倣ではなくオリジナルの表現を目的として設計されているとしています。音楽生成機能は18歳以上のユーザー向けに、日本語を含む複数言語で提供されます。なお、Google AI Plus、Google AI Pro、Google AI Ultraの各サブスクリプションユーザーは、より多くの楽曲を生成できる仕組みとなっています。

Nano Bananaとは

Nano Bananaは、Geminiアプリ内で生成コンテンツに付随するカスタムカバーアートを作成するための機能として紹介されています。Lyria 3による音楽生成では、作成された約30秒の楽曲に対し、Nano Bananaで生成されたビジュアルがカバーアートとして付与されます。楽曲とあわせてダウンロードや共有が可能な仕様です。

参照元:Gemini で音楽生成

AMI(エイミー)

写真から曲が生まれるなら、犬の散歩もMV化しそう感ある。