2026/4/16

オーディオタグ導入！「Gemini 3.1 Flash TTS」発表

この記事のポイント

Google、制御性 / 表現力 / 品質が向上した最新のテキスト読み上げ AI モデル「Gemini 3.1 Flash TTS（Text-To-Speech）」を発表。
これまでよりも全体的な音声品質が向上し高品質な音声生成が実現しただけでなく、“Gemini 3.1 Flash” ファミリーとしての低コストが特徴となる最新テキスト読み上げ AI モデル。
新たに埋め込み音声要素「オーディオタグ」も導入。

Google は 2026 年 4 月 15 日（水）、制御性 / 表現力 / 品質が向上した最新のテキスト読み上げ AI モデル「Gemini 3.1 Flash TTS（Text-To-Speech）」を発表しました。

「Gemini 3.1 Flash TTS」は、これまでよりも全体的な音声品質が向上し高品質な音声生成が実現しただけでなく、“Gemini 3.1 Flash” ファミリーとしての低コストが特徴となる最新テキスト読み上げ AI モデルです。複数話者による対話や 70 以上の言語に対応し、自然言語によるきめ細やかなコントロールにも対応しています。

さらに「Gemini 3.1 Flash TTS」では、新たに埋め込み音声要素「オーディオタグ」も導入。これにより、音声スタイル / ペース / 発話方法を、直感的に制御できるようになりました。

「オーディオタグ」導入

「Gemini 3.1 Flash TTS」は、マルチモーダル生成 AI 開発プラットフォーム「Google AI Studio」や機械学習開発プラットフォーム「Vertex AI」などにて、開発者向けに展開されます。また、グループウェア「Google Workspace」の動画編集サービス「Google Vids」にも導入されます。

Source：Google

投稿タグ

ハッシュタグ

#Gemini #Gemini3.1Flash #Gemini3.1FlashTTS

この記事をシェア

AI 要約をシェアに含める

著者情報

石井順

月間最高 245 万 PV を誇る、運営歴 10 年以上の当サイト「Jetstream（旧 Jetstream BLOG）」の管理人：石井順です。海外ガジェットの個人輸入や EC サイト運営、Google 公式認定プログラム「Google ヘルプヒーロー」での活動を経て、国内外ガジェット情報や Google 系アプリ / サービスの新機能情報など、当サイトを通して幅広く発信しています。