要約 / ポイント
Veoのすり替えゲーム
Google I/Oの基調講演では強力なOmniモデルが紹介されたが、明白な見落としがあった。以前から話題になっていた動画生成AIであるVeoについては全く言及がなかったのだ。観測者たちは、イベント前から大きな話題を呼んでいたGoogleの専用動画ツールの消滅について即座に疑問を呈した。この注目すべき不在は、Googleの進化するAI戦略に関する中心的な謎を引き起こした。
Googleのラボ、Gemini、AI Studio担当副社長であるJosh Woodwardは、後に状況を明らかにした。彼はOmniが根本的にVeoを包含していると示唆し、Omniは「全て」であると説明した。この戦略的な動きは、Googleの増大する命名の乱立に対処し、多数のAIブランドをより統一された旗印の下に統合することを目的としている。例えば、現在のOmniモデルは、Gemini 3.5 Flashによって駆動され、その動画生成および編集機能のために既にVeoのバリアントを活用している。
今後、GoogleはOmni Proが今後数ヶ月以内にローンチされることを確認した。この待望の次世代モデルは、その動画機能に大幅な改善を約束している。業界関係者は、Googleの合理化された命名規則に沿って、Omni Proが、以前であればVeo 4としてローンチされていたであろう、強力な動画に特化した後継モデルであると広く信じている。
ジェネレーターではなく、コンポジターである
Google DeepMindのLogan Kilpatrickは、明確な視点を提供している。Omniは純粋な生成AIとしてではなく、「AI After Effects」として機能するというのだ。この比喩は、既存のメディアの編集、リミックス、合成におけるその中核的な強みを強調し、生の作成からインテリジェントな操作へと焦点を移している。
Omniは現在、効率的なGemini 3.5 Flash上で動作しており、その動画機能のためにVeoのバリアントを活用している。しかし、その真の力は、今後数ヶ月以内に予定されている、より堅牢なGemini 3.5 Proのリリースによって解き放たれるだろう。これは全てのメディアタイプで大幅な改善を約束している。
初期の実演では、Omni独自の編集インテリジェンスが明らかになっている。魅力的なユースケースの一つは、静止したGoogle Mapsのスクリーンショットを、動的で文脈を認識するアニメーションのターンバイターンシーケンスに変換することである。Omniは単にアニメーション化するだけでなく、シーンを理解し、要素をインテリジェントに操作して、まとまりのある複雑な視覚的物語を作り出す。
この洗練されたメディアコンポジターは、多様な入力をシームレスな出力に統合し、既存の映像、画像、音声に対して比類のない制御を提供する。GoogleはOmniを、AIメディアを構築、操作、強化するための強力な新しいレイヤーとして位置づけ、クリエイターに単純な生成を超えたツールを提供している。
Googleの埋蔵された宝
Omniの大々的な発表の裏で、Google I/Oでは、ひっそりと強力なAI機能群も発表され、これはクリエイターのワークフローにおける大きな変化を示唆している。これらの「埋蔵された宝」は、ユーザーが生成AIとどのように対話し、それを基盤として構築するかを再定義することを約束している。
Flowへの抜本的なアップデートは、クリエイターがカスタムAI動画ツールをゼロから構築することを可能にする。この機能は単純なプロンプトを超え、ユーザーが独自の視覚効果や機能を「vibe-code」することを可能にし、事実上、彼らを独自のオーダーメイドの生成プロセスの設計者へと変える。
GoogleのGenie 3は、かつてSFに限られていた「ホロデッキ」の可能性を示しています。Google Street Viewと直接統合することで、Genie 3はあらゆる現実世界の場所からインタラクティブでプレイ可能な3D世界を生成できるようになりました。かつてない忠実度でレンダリングされた、子供時代の通りの仮想再現を探検するのを想像してみてください。
初期段階のマルチプレイヤーデモは、Genieの広大な未来をさらに示唆しています。これらの生成された環境には、洗練されたAIエージェントを配置でき、複雑なシミュレーションの基礎を築きます。このビジョンは単なるゲームを超え、都市計画、仮想トレーニング、ダイナミックな物語体験への応用を示唆しています。GoogleのI/Oでの静かな発表は、広大で非常に興味深く、おそらく過小評価されている未来を示唆しています。
新しいクリエイタースタック
GoogleのI/Oでの発表は、ばらばらのモデルではなく、一貫した戦略を明らかにしました。Omniは中央の編集および合成エンジンとして機能し、Flowと統合することで、クリエイターがゼロからカスタムAIビデオツールを構築し、効果的に独自の「バイブコーディング」効果を作成できるようにします。これらを補完するのが、没入型世界構築のためのGenieと、洗練されたAIオーディオ生成のためのLyriaであり、パワーユーザー向けの広大で相互接続されたエコシステムを形成しています。
これは深遠なパラダイムシフトを表しています。Googleは「最高の」スタンドアロンジェネレーターを巡る競争から脱却し、深いワークフロー統合に焦点を当てています。同社は、クリエイターがAIを単にプロンプトするだけでなく、AIと*共に*構築できる基盤レイヤーを構築しています。これにより、きめ細かな制御とカスタマイズが可能になり、大まかな作業から複雑なデジタルクラフトマンシップへと移行します。
クリエイターは新たな必須課題に直面しています。未来は単一の優れたジェネレーターを特定することではなく、相互運用可能なツールの包括的なスイートを習得することです。このアプローチは、クリエイティブプロセスに対する前例のない制御を提供し、アーティストがこれまで想像できなかった精度でメディアを彫刻することを可能にします。Googleは最高のAIビデオツールを静かに発表しましたが、この統合されたビジョンの全貌をあなたに伝えませんでした。
よくある質問
GoogleのOmniモデルとは何ですか?
Omniは、さまざまな入力と出力を処理するように設計されたGoogleの新しいマルチモーダルAIです。ビデオの場合、Veoのバリアントを使用しており、単なる生成ではなく、高度な編集、リミックス、合成に焦点を当てた「AI After Effects」として位置付けられています。
OmniはGoogleのVeo AIに取って代わるのですか?
実質的に、はい。関係者によると、OmniはGoogleのAIツールを統合するための戦略的なブランド変更です。今後のOmni Proは、おそらくVeo 4と名付けられるはずだったものであり、Omniの傘下での新しい方向性を示しています。
Omniは他のAIビデオツールとどう違うのですか?
他のツールがテキストからビデオへの生成に焦点を当てる一方で、Omniの強みはその編集機能にあります。これは、コンテキストを認識しながら既存の映像をリミックス、合成、操作するためにきめ細かな制御を必要とするクリエイター向けに設計されています。
Googleは他にどのような「隠れた」AIツールを公開しましたか?
Omniと並行して、GoogleはFlowを静かに更新し、ユーザーがカスタムビデオツールを構築できるようにしました。また、Genie 3ワールドモデルをGoogle Street Viewに接続してインタラクティブな世界を作成し、Lyria AIオーディオプラットフォームを拡張しました。