- Google、制御性 / 表現力 / 品質が向上した最新のテキスト読み上げ AI モデル「Gemini 3.1 Flash TTS(Text-To-Speech)」を発表。
- これまでよりも全体的な音声品質が向上し高品質な音声生成が実現しただけでなく、“Gemini 3.1 Flash” ファミリーとしての低コストが特徴となる最新テキスト読み上げ AI モデル。
- 新たに埋め込み音声要素「オーディオタグ」も導入。
Google は 2026 年 4 月 15 日(水)、制御性 / 表現力 / 品質が向上した最新のテキスト読み上げ AI モデル「Gemini 3.1 Flash TTS(Text-To-Speech)」を発表しました。
「Gemini 3.1 Flash TTS」は、これまでよりも全体的な音声品質が向上し高品質な音声生成が実現しただけでなく、“Gemini 3.1 Flash” ファミリーとしての低コストが特徴となる最新テキスト読み上げ AI モデルです。複数話者による対話や 70 以上の言語に対応し、自然言語によるきめ細やかなコントロールにも対応しています。
さらに「Gemini 3.1 Flash TTS」では、新たに埋め込み音声要素「オーディオタグ」も導入。これにより、音声スタイル / ペース / 発話方法を、直感的に制御できるようになりました。
「Gemini 3.1 Flash TTS」は、マルチモーダル生成 AI 開発プラットフォーム「Google AI Studio」や機械学習開発プラットフォーム「Vertex AI」などにて、開発者向けに展開されます。また、グループウェア「Google Workspace」の動画編集サービス「Google Vids」にも導入されます。
Source:Google













コメントを残す