- Google、Google AI「Gemini」 最新モデル群「Gemini 3.5」の一つとして展開する最新音声モデル「Gemini 3.5 Live Translate」を正式発表。
- 70 以上の言語を自動検出し、話者のイントネーション / ペース / ピッチを維持したまま滑らかで自然な翻訳音声を生成する AI 音声モデル。
- 「Google 翻訳」と「Google Meet」から展開。
Google は現地時間 2026 年 6 月 9 日(火)、Google AI「Gemini」 最新モデル群「Gemini 3.5」の一つとして展開する最新音声モデル「Gemini 3.5 Live Translate」を正式発表しました。
最新音声モデル「Gemini 3.5 Live Translate」は、70 以上の言語を自動検出し、話者のイントネーション / ペース / ピッチを維持したまま滑らかで自然な翻訳音声を生成する AI 音声モデルです。話者が話し終えるまで応答しない「ターンバイターン方式」とは異なり、連続的に翻訳音声を生成する点が特徴です。
また「Gemini 3.5 Live Translate」は、多言語入力にも対応。リアルタイムで多言語音声間の翻訳を実現する AI 音声モデルです。
文脈を考慮しつつも話者の会話とのバランスを取り、ぎこちない間もなく、スムーズな音声が提供されます。これにより、セッション全体を通した話者と翻訳音声のズレは、わずか数秒程度となる模様です。
このほか「Gemini 3.5 Live Translate」は、ノイズ耐性にも優れていて、騒がしい環境や予測不可能な環境でもスムーズに動作します。つまり、多言語での通話 / 会議 / レッスン / ライブ放送などにおけるライブ翻訳システムとして活躍します。
「Gemini 3.5 Live Translate」は、2026 年 6 月 9 日(火)より Google 製品全体で順次展開されますが、「Google 翻訳」と「Google Meet」から展開されます。
Source:Google(https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/)















コメントを残す