- Google、「Google I/O 2026」において、画像 / 音声 / 動画 / テキストなどのマルチモーダルな入力を組み合わせた高品質な動画生成だけでなく、動画編集にも対応する新しい AI モデル群「Gemini Omni」を正式発表。
- 「Gemini Omni」は、自然な会話でより簡単に動画生成と編集を指示できる新しい AI モデル群。
- まずは最初のモデルとなる「Gemini Omni Flash」が、「Google AI Plus」「Google AI Pro」「Google AI Ultra」メンバーシップ向けに「Gemini」アプリと「Flow」にて展開。
Google は現地時間 2026 年 5 月 19 日(火)、同日開催した開発者向けイベント「Google I/O 2026」において、画像 / 音声 / 動画 / テキストなどのマルチモーダルな入力を組み合わせた高品質な動画生成だけでなく、動画編集にも対応する新しい AI モデル群「Gemini Omni」を正式発表しました。
「Gemini Omni」は、自然な会話でより簡単に動画生成と編集を指示できる新しい AI モデル群です。キャラクターの一貫性や、シーンの文脈を維持したまま動画内の要素を変更したり、新しいオブジェクトを追加したりなどを、自然な会話で指示することができます。
また、ユーザー自身の見た目と声を学習させたデジタルアバターを生成し、そのデジタルアバターを動画内に登場させる機能も搭載。テンプレートも用意されているので、専門的な機材や技術を持たないユーザーでも、手軽に動画生成や編集が可能です。
なお、「Gemini Omni」で生成された動画には、肉眼では見えないデジタル透かし技術「SynthID」が挿入されます。
「Gemini Omni」では、まずは最初のモデルとなる「Gemini Omni Flash」が、「Google AI Plus」「Google AI Pro」「Google AI Ultra」メンバーシップ向けに「Gemini」アプリと「Flow」にて展開されます。また、「YouTube ショート」では、無料で利用できるようになる予定です。
Source:Google(https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/)















コメントを残す