Google Omniリーク：Veo 4 AI VideoとKreaのMidjourney代替

要約 / ポイント

Googleの次世代AI動画モデル「Omni」がI/Oに先駆けてリークされ、強力な新しいAIエージェントを示唆しています。一方、Krea 2はMidjourneyのクリエイティブな王座に直接的な攻撃を仕掛けています。

Googleの船に穴が開いた

Googleの船は、年次I/Oカンファレンスを控えて、異例の時期尚早な情報流出に見舞われました。通常は口の堅いこのテクノロジー大手は、今や情報流出というデジタルの海を航海しており、内部の失策か計算された宣伝キャンペーンかという憶測を呼んでいます。この予期せぬ情報公開は、次世代AIの片鱗を明らかにし、公式発表への期待を高めています。

最も注目すべきは、コードネーム「Omni」または「Omni Bag」と呼ばれる新しいAIモデルが明らかになったことです。RedditユーザーのZacatac_391が最初にOmniのモバイルUIを発見し、そのスクリーンショットを共有して、高度なAI動画エージェントとしての可能性を明らかにしました。初期情報によると、Omniは単純な生成を超え、動画のリミックスやチャット内での直接編集といった機能を提供し、より統合されたインタラクティブなAIとして位置づけられています。

Omniのリークされた動画は、1280x720の解像度で10秒間の持続時間を誇り、Geminiを通じて利用可能なVeo 3.1の現在の8秒、720pクリップからの顕著なアップグレードとなっています。メタデータは「VO mode Omni」を示唆しており、全く新しいモデルIDではなく、既存のVeo 3.xフレームワークの進化を示唆しています。これは、Omniが洗練されたVeoの上に位置する高度なレイヤーであり、テキスト、画像、音声、動画をシームレスに統合することで、GoogleのマルチモーダルAI機能を強化する可能性があることを意味します。

Omni以外にも、大量の情報にはいくつかの主要なAIイニシアチブが含まれています。リークされた詳細は以下の通りです。 - Googleの主力マルチモーダルモデルであるGemini 3.1の段階的なアップデート。 - 新しいGemini 3 Pro imageモデル。おそらく「Nano Banana 2 Pro」という名称の後継となるでしょう。 - 更新されたLyria音楽ジェネレーター。これは以前、その音声合成能力で感銘を与えたモデルです。

I/O前の情報開示の連鎖は、Googleの意図について疑問を投げかけています。これは偶発的な見落としだったのか、あるいは一部で理論化されているように、ステージングサーバーで「インターンが『すべて編集を承認』ボタンを連打した」結果だったのか？それともGoogleは意図的に統制を緩め、主要な開発者イベントに向けて戦略的に期待感を高め、物語をコントロールしたのか？これらのリークのタイミングと広範さは、重大な内部侵害か、あるいは最新のイノベーションの幕が正式に上がる前の、統制された宣伝における達人の技かのいずれかを示唆しています。

Omniの紹介：すべてをこなすAI

Googleの次の主要なAI動画提供サービスである「Omni」が最近浮上し、その正体について即座に疑問を投げかけました。Omniは待望のVeo 4なのか、Veo 3.xの重要なアップデートなのか、それとも全く新しい基盤モデルなのか？初期情報によると、より複雑な状況が示唆されており、単独のVeo 4というよりも、既存のVeoバリアントの上に位置する高度なレイヤーである可能性が高いです。このモデルのリークされた出力とメタデータは、Googleの生成AI戦略における大きな転換を示唆しています。

RedditユーザーのZacatac\_391によって最初に発見されたリークされたモバイルおよびウェブのユーザーインターフェースは、深くマルチモーダルなシステムを示唆する機能を披露しました。これらのUIは、既存の動画のリミックス、チャットインターフェース内での直接編集、テンプレート駆動型生成といった機能を示し、基本的なテキストから動画への生成を超えています。この統合されたアプローチは、単なる静的な生成モデルではなく、より強力でインタラクティブなAIエージェントを示唆しています。あるリークされたデモでは、教授が数式を導き出す様子が映し出されており、動画内での首尾一貫したテキスト生成が実演されていました。

Omniの背後にあるコンセプトは、真のオムニモデル、つまりテキスト、音声、画像、動画といった複数のモダリティをネイティブに処理する単一のシステムであるようです。このようなアーキテクチャは、異なるデータタイプ間でのシームレスな移行とインタラクションを可能にし、ユーザーが統合された環境でコンテンツを操作・生成できるようにします。Geminiへのこの統合により、Omniは包括的なクリエイティブおよび生成エージェントとして位置づけられ、前例のない流動性で複雑なクロスモーダルプロンプトを理解し、応答することができます。

重要なことに、流出した生成動画から抽出されたメタデータには、「VO mode Omni」と明示的に記載されています。この詳細と、それが個別のモデルIDとして表示されないという事実から、Omniは基盤となるVeoの基盤の上に構築された強化されたモード、または洗練されたラッパーとして機能していることが示唆されます。このモードからの出力は、Veo 3.1の8秒の制限から動画の長さを9〜10秒に延長し、1280x720の解像度を維持しています。これは、Veoの機能に対する大幅なアップグレードを意味し、より幅広いアプリケーション向けに設計された強力で多用途なレイヤーとして、新しいOmniブランドの下で提示されています。

「Will Smithテスト」がすべてを明らかにする

RedditユーザーのZacatac_391は、おなじみのAI動画チャレンジである「Will Smithテスト」で、流出したOmniモデルを早速試しました。当初、「Will Smithがスパゲッティを食べている」というプロンプトを試みたところ、システムが拒否したため、Zacatac_391はより一般的な「特定のWill Smithではないタイプ」に調整しました。その結果生成された1280x720の解像度の9秒の動画は、Omniの機能への魅力的な一端を提供しました。

Omniの出力は、Will Smithに似た2人の男性がパスタを囲んで握手し、会話している様子を描写していました。特筆すべき強みとしては、クリップ全体を通して強力なキャラクターの一貫性と一貫した音声生成が挙げられ、AI生成動画における視覚的および物語の流れを維持する上で大きな進歩です。全体的な美学と質感も、Googleの既存のVeoモデルからの明確な系譜を示していました。

その進歩にもかかわらず、流出した動画にはいくつかの明確な欠陥が見られました。両方のキャラクターが握手中に同時に話しているように見え、不自然なインタラクションを生み出していました。具体的な視覚的グリッチには、一方のキャラクターの皿にある「ぶら下がった麺の問題」や、テーブルの上のグラスがショット間で不可解にも2つから3つに増えるという、不可解な空間的な矛盾が含まれていました。

Zacatac_391の同一のプロンプトを、Veo 3を搭載した現在の公開版Geminiで実行したところ、著しい対照が示されました。Geminiの出力は、著しく洗練されておらず、ダイナミックさに欠けるシーンを提示し、Omniの優れた生成能力を裏付けました。この比較は、品質とスタイルの明確な飛躍を浮き彫りにし、OmniがVeo 3の8秒、720pの機能を超えた実質的な進化を表していることを示唆しています。Googleの動画モデルの詳細については、Veo — Google DeepMindを参照してください。

重要なことに、モデルが握手や対話のような複雑なインタラクションを、その不完全さにもかかわらず処理できる能力は、より洗練された基盤アーキテクチャを示唆しています。これは、単なるスタンドアロンの動画生成ツールではなく、動画のリミックスやチャット内での直接編集をサポートできる統合されたAIエージェントとしてのOmniのより広範なビジョンを示唆しています。流出したクリップからのメタデータに「Veo mode Omni」と表示されていることは、これが完全なVeo 4リリースではなく、既存の機能を強化する堅牢なVeo 3.xアップデートである可能性をさらに示唆しています。

SeedanceとSoraの亡霊との対決

GoogleのリークされたOmniモデルは、競争が激しく、しかし驚くほど不安定なAI動画生成の状況に浮上しました。このタイミングは、OpenAIのSora Appがその法外な推論コストのためにサービスを停止したという報道に続くもので、幸運に感じられます。これにより、即座に市場の空白が生まれ、Googleが運用費用を管理し、約束された機能を提供できれば、Omniが潜在的な最有力候補となる位置付けになります。

Omniの出力をSeedance 2.0と比較すると、RedditユーザーZacatac\_391の「特定の人物ではないWill Smithタイプ」のプロンプトによって示されるように、興味深い美的対比が生まれます。Omniの結果は、以前のGoogleモデルを彷彿とさせるおなじみの「雰囲気と質感」を提供しました。しかし、Seedance 2.0は驚くほど映画的なシーンを生成し、Theoretically Mediaのホストはそれを「極秘ファイルと何らかの秘密作戦」の物語を示唆していると表現しました。その洗練された劇的な雰囲気は、より様式化された出力を求めるユーザーからしばしば主観的な好感を得ます。

Seedance 2.0が特定の美学を求める人々にアピールするかもしれませんが、公正なベンチマークは直接的な競合他社との戦いを超えて進みます。真の進歩は、OmniをGoogle自身の前世代モデルであるVeo 3と比較することにしばしばあります。この内部比較は、表面上は微妙な更新に見えても、大きな進歩を明らかにします。これは、Googleが既存のフレームワーク内での反復的な改善にコミットしていることを強調しています。

Omniの出力持続時間は9秒に延長され、Veo 3の8秒の制限からの具体的な改善を示しています。また、一貫した1280x720の解像度を維持しています。リークされた動画から抽出されたメタデータは、その正体をさらに複雑にし、「Veo mode Omni」と明示的に記載されています。これは、Omniが完全に新しいフルバージョンのVeo 4モデルではなく、更新されたVeo 3.xバリアントとして動作していることを示唆しており、既存のアーキテクチャの洗練を示しています。

この微妙な区別は、Googleが完全に再構築されたシステムを立ち上げるのではなく、既存のシステム内で持続時間や潜在的な忠実度のような機能を強化することに焦点を当てたことを示唆しています。リークされた情報からは、リミックスやチャット内編集を統合したエージェントのような機能が示唆されており、単純な動画生成を超えて、よりインタラクティブな制作スイートへと進化しています。Google I/Oは、特に主要な競合他社の突然の不在を考慮すると、この急速に進化する分野におけるOmniの正確な役割と将来の軌道を間違いなく明確にするでしょう。

これはジェネレーターではなく、エージェントです。

Omniのリークされた機能は戦略的な転換を示しており、従来のテキストから動画へのジェネレーターをはるかに超えるものとして位置付けています。GoogleはOmniをAI動画エージェントとして構想しているようで、ユーザーが生成メディアとどのように相互作用するかを根本的に再構築しています。これは単にプロンプトを送信して静的な動画ファイルを受け取るだけではありません。Omniは、更新されたVeo 3.xバリアントの上に位置し、その中核となる生成機能を洗練されたインタラクティブなレイヤーで強化し、継続的な制作を可能にするように設計されているようです。

このエージェントベースの設計の実用的な意味合いは広範であり、生成モデルではこれまで見られなかった流動的で反復的なワークフローを約束します。ユーザーは、チャット内編集のような機能を通じて、作成物に対して直接的かつ詳細な制御を得ることができ、プロセス全体を再起動することなく、動画要素を即座に対話的に調整できます。Omniは、既存の動画のリミックスや、事前に定義されたテンプレートをその場で適用することを可能にすると報じられており、コンテンツクリエイターがブランドの一貫性を維持したり、同じセッション内で多様なスタイルを探索したりするための前例のない柔軟性を提供し、効率とクリエイティブな出力を向上させます。

この高度な機能は、Google の包括的な Gemini 戦略と深く統合されています。同社は、個々のアプリケーションを超えて、すべての創造的および生産的なタスクを単一の統合された会話型インターフェース内に統合することを目指しています。したがって、Omni はこのフレームワーク内でオールモダリティモデルとして機能し、テキスト、画像、音声、ビデオの同時生成と操作をシームレスにサポートするように位置付けられています。この戦略的連携により、Omni はスタンドアロンツールとしてではなく、Gemini の包括的な AI エコシステムの重要な統合コンポーネントとして位置付けられ、すべてのメディアタイプで一貫したユーザーエクスペリエンスを推進します。

このようなエージェント主導のアプローチは、ユーザーインタラクションを受動的な「生成」から能動的な「コラボレーション」へと移行させる、深遠なパラダイムシフトを示します。ユーザーは、一回限りのコマンドではなく、AI と継続的な対話を行い、リアルタイムでビデオコンテンツを繰り返し洗練し、形作ります。シーンをリクエストし、すぐに AI に「照明をゴールデンアワーに変更して」または「繊細なバックグラウンドトラックを追加して」と依頼し、即座に更新を受け取ることを想像してみてください。これにより、より有機的なクリエイティブプロセスが促進され、ユーザーは微妙なコントロールを得て、初期のコンセプトから洗練された出力までの道のりを加速させ、AI を活用したビデオ作成のダイナミクスを根本的に変えます。

Krea が Midjourney に警告の一撃を放つ

Google のリークされた Omni モデル以外にも、もう一つの重要な進展がありました。Krea が新しい K2 image model を携えて帰ってきたのです。この更新されたプラットフォームは、高品質で美しい画像生成における Midjourney の長年の優位性に対する直接的かつ野心的な挑戦を示しています。Krea は、既存のツールでユーザーが経験する一般的な問題点に対処し、クリエイティブなワークフローを簡素化することを目指しています。

Midjourney ユーザーは、主に混乱を招く Discord UI に限定された断片的なエクスペリエンスを頻繁に経験します。パーソナライゼーションオプションや、スタイル参照 (S-refs) の微妙な適用には、複雑なコマンドと広範な実験が必要となることが多く、多くの人にとって急な学習曲線を生み出します。Krea 2 は、合理化されたアプローチでこれらの不満に直接対処します。

Krea の戦略は、美的探求を分かりやすくすることに焦点を当てています。その直感的なインターフェースは、複雑なプロンプトエンジニアリングの手間をかけずに特定の視覚スタイルを求めるアーティストやデザイナーにとって、よりアクセスしやすい入り口を提供します。このユーザーエクスペリエンスへの注力により、クリエイターは芸術的なビジョンを迅速に繰り返し、洗練させることができます。

さらに、Krea はその強力な生成機能を包括的な編集ツールスイートと統合しています。ユーザーは、統一されたプラットフォーム内でムードボード、スタイル転送、LoRA トレーニングなどの機能を活用し、初期の画像生成から詳細な洗練までシームレスに移行できます。この包括的なアプローチは、複数のアプリケーションを使いこなすことに対する魅力的な代替手段を提供します。

Krea 2 は、単なる画像生成ツールとしてだけでなく、エンドツーエンドのクリエイティブエコシステムとして位置付けられています。その機能、特に生成ツールと編集ツールの独自の組み合わせに関する詳細については、Krea: AI Creative Suite for Images, Video & 3D のウェブサイトをご覧ください。この統合されたワークフローは、デジタルアーティストにとってより優れた制御と効率を約束する、重要な進化を表しています。

Krea の美的エンジン内部

Krea 2 の美的エンジンは、洗練されたユーザー中心のワークフローで動作し、クリエイティブな制御を最前線に置いています。その心臓部となるのは、視覚的な美学を定義するための強力な事前生成ツールである革新的な Mood Board システムです。このユニークな機能により、ユーザーは単一のピクセルを生成する前に芸術的なビジョンを明確に表現でき、従来の AI 画像作成パラダイムを根本的に変えます。

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

ユーザーは、希望のスタイルに合わせて厳選されたPinterestボードのように機能する、包括的なビジュアルブループリントを作成します。特定の参照画像をアップロードし、カラーパレットを細心の注意を払ってキュレーションし、テクスチャ要素を選択して、詳細な美的プロファイルを構築します。この重要な事前視覚化ステップにより、深いスタイルの整合性が確保され、AIのクリエイティブな出力が精度高く指示され、単純なテキストプロンプトを超えたものになります。

ムードボードが細心の注意を払って準備されると、実際の画像生成プロセスが開始されます。Krea 2は、多様な芸術的ニーズに対応する2つの異なる高性能モデルを提供します。特にMedium modelは、イラストレーションスタイル、グラフィックデザイン、コンセプトアートの生成に優れており、シャープで表現力豊かなビジュアルを提供します。

対照的に、Large modelは驚くべきフォトリアリズムのために設計されており、複雑なディテール、リアルなテクスチャ、微妙なライティングを備えた画像を生成します。ユーザーは、直感的なクリエイティブスライダーの配列を使用して作品をさらに洗練させ、画像の詳細、構図のバランス、環境光などのパラメーターを細心の注意を払って調整し、最終出力に対してきめ細かな制御を提供します。

例として、「竹林のバイキング戦士」の生成を考えてみましょう。ユーザーはまず、豊かな視覚的参照でムードボードを埋めます。これには、霧のかかった緑豊かな竹林の風景、歴史的なバイキングの鎧の非常に詳細な描写、特定の落ち着いたアースカラーの配色が含まれる場合があります。また、劇的な映画のような照明や、北欧神話の特定の芸術的表現への参照を組み込むこともできます。

包括的なムードボードが確立されたら、ユーザーはフォトリアリスティックな機能のためにKrea 2のLarge modelを選択し、テキストプロンプトを入力します。Krea 2は、ムードボードからの抽象的な視覚的ヒントとテーマ要素を、具体的で高品質な画像コンポーネントにインテリジェントに変換します。結果として得られる画像は、単なるテキストの文字通りの解釈ではなく、ニュアンスのある作品です。

それは、ユーザーの最初の美的選択によって細心の注意を払って定義された、正確な雰囲気、テクスチャの豊かさ、スタイルのニュアンスを帯びています。これは、基本的なテキストから画像へのモデルの能力をはるかに超えており、Krea 2が特定の芸術的意図に深く合致したユニークで高品質な画像を生成する能力を示しています。このプラットフォームは、美的実現のための洗練されたツールとして位置付けられています。

Style Transfer & LoRAsで現実をリミックスする

Krea 2は、従来のテキストから画像への生成を超えた、きめ細かな芸術的制御のための高度な機能を提供する包括的なクリエイティブプラットフォームとしての地位を確立しています。この洗練されたワークフローにより、アーティストは独自の美学を作品に直接注入することができ、出力が一般的なAIの解釈ではなく、明確なビジョンを反映することを保証します。Kreaのデザインは、クリエイティブプロセスへのより深い関与を促進します。

この高度な機能の中心にあるのは、Kreaの革新的なStyle Transfer機能です。ユーザーは最大4つの異なる参照画像をアップロードし、K2 modelがそれらを細心の注意を払って分析します。この複数画像参照プロセスにより、最終出力のスタイル、テクスチャの粒度、および微妙なライティング条件に正確な影響を与えることができ、比類のない美的方向性を提供します。

このダイナミックなシステムは、予期せぬ、しかし魅力的な結果を頻繁に生み出し、コミュニティではしばしば「ハッピーアクシデント」と呼ばれています。アーティストは、単なるテキストプロンプトだけでは達成が極めて困難、あるいは不可能であったであろう、まったく新しい視覚言語とユニークなスタイルを発見します。これにより、前例のない創造的な道が開かれ、真に独創的な芸術的表現が可能になります。

美しいブレンドを超え、Krea 2 はプロフェッショナルなワークフローのために設計された、パワーユーザー向けの包括的なツールスイートを統合しています。アーティストはプラットフォーム内で直接カスタムの LoRAs をトレーニングでき、プロジェクト全体で高度にパーソナライズされたスタイルの統一性を実現します。この深いカスタマイズにより、Krea は特定の視覚的特徴を学習し再現できるため、ブランドの一貫性や個人的な芸術的発展にとって非常に貴重な資産となります。

クリエイティブなツールキットをさらに強化するため、Krea は統合された編集機能を提供します。ユーザーは内蔵ツールを使用して生成された画像を微調整し、外部ソフトウェアの必要性を排除できます。このプラットフォームには、堅牢なクロップおよび拡張機能も含まれており、シームレスな構図の洗練とインテリジェントなキャンバス拡張を可能にし、生成後のプロセスを効率化します。

Krea の包括的なアプローチは、生成AI分野における強力な競合相手としての地位を確立し、クリエイターがデジタルアートの限界を押し広げるための洗練された環境を提供します。そのコア生成エンジンとこれらの高度な操作ツールの戦略的な組み合わせは、繊細な制御と高度にカスタマイズされた視覚的出力求める人々にとって強力な選択肢となります。

点と点をつなぐ：Google の壮大な AI 計画

Google の次期 I/O カンファレンスが目前に迫っており、Omni のリークは同社の野心的な AI 戦略を垣間見る重要な機会を提供します。これは単なる新しいビデオモデルではありません。Omni は、更新された Lyria 音楽ジェネレーターと、画像およびテキスト用の新しい Gemini モデルとともに、壮大な発表に向けて準備された完全な マルチモーダルクリエイティブスタック を示唆しています。

Omni は、おそらく Veo 4 または 3.x の派生版であり、リミックス、チャット内編集、10秒間の1280x720ビデオ生成が可能な AI ビデオエージェントとして機能し、単純なテキストからビデオへの生成をはるかに超えています。数学の公式を正しく導き出すリークされた教授によって示されたこの広範な機能は、テキストの一貫性と整合性における一般的な AI の弱点に対処します。

Lyria および Gemini モデルの新しいバージョン（Gemini 3.1 および画像に特化した Gemini 3 Pro、または Nano Banana 2 Pro を含む）が提供を完了します。これらのツールは、Google エコシステム 全体に深く統合され、Android の「Gemini Intelligence」を強化し、将来のハードウェアを向上させ、最終的にシームレスなエンドツーエンドのクリエイティブワークフローを提供すると考えられます。

この包括的なアプローチにより、Google は競合他社が匹敵することに苦労する、比類のない AI クリエイティブスイート を提供する立場にあります。Krea が画像生成をターゲットとし、Midjourney が美学を支配する一方で、Google の野心はビデオ、音楽、テキスト、画像にわたる統合プラットフォームにまで及びます。

タイミングは適切です。OpenAI の Sora App は、高い推論コストのためにサービスを停止したと報じられており、高度な AI ビデオ分野に空白が生じています。Google の戦略は、その巨大なインフラストラクチャを活用して、堅牢で統合されたアクセスしやすいクリエイティブな原動力となる Omni でその空白を埋めることです。

デジタルクリエイターのための新しい戦場

Google のリークされた Omni モデルと Krea の K2 による再登場は、AI クリエイティブランドスケープにおける極めて重要な変化を示しています。これらの明確でありながら補完的な進歩は、単一目的の AI モデルを超え、デジタルクリエイター向けの包括的な 統合エコシステム へと急速に移行している業界を浮き彫りにしています。孤立した生成ツールの時代は急速に終焉を迎えつつあります。

Omni は、おそらく Google の Veo 4 であり、AI ビデオエージェント の台頭を象徴しています。これは、単に10秒間の1280x720ビデオクリップを生成する以上のものを約束します。リークされた UI は、Gemini 内での深い統合を示しており、リミックス機能、チャット内編集、構造化されたテンプレートを提供します。これにより、Omni は単なるテキストからビデオへのジェネレーターではなく、ビデオ作成のための包括的なソリューションとして位置づけられます。

Krea 2は対照的に、新しい画像モデルを中心に構築されたまとまりのあるcreative platformとしての地位を確立しています。そのワークフローは、Mood Boards、高度なstyle transfer、およびLoRA trainingに及び、反復的な画像生成と洗練のための完全なツールスイートを提供することで、Midjourneyの美的優位性に直接挑戦しています。Kreaはアーティストがプロジェクトのライフサイクル全体を管理できるようにします。

これらの進展は両方とも、複雑なクリエイティブな要求に応えるために進化する市場を浮き彫りにしています。クリエイターは現在、初期コンセプトから最終出力まで、ワークフロー全体をサポートし、複数のモダリティと編集機能をシームレスに統合するプラットフォームを求めています。この変化は、クリエイティブプロセスにおける摩擦を減らす、より直感的で強力なツールを要求しています。

デジタルアーティストにとって、このパラダイムは計り知れない力と前例のないクリエイティブな自由を提供します。しかし、それはまた新たな必須事項をもたらします。競争力を維持するためには、これらのますます洗練され相互接続されたプラットフォームを習得することが不可欠になります。急速に進化するこれらのツールセットへの適応が、成長するAI主導のクリエイティブエコノミーにおける成功を決定するでしょう。

クリエイティブAIにおけるイノベーションは、前例のないペースで加速しています。デジタルクリエーションにおける優位性をめぐる戦いは始まったばかりであり、明日のアーティストのためにより洗練されたツールと統合された体験を約束します。創造、編集、エージェンシーの境界線は曖昧になりつつあり、AIが包括的なクリエイティブコントロールを可能にする未来を告げています。

よくある質問

Google Omniとは何ですか？

Google Omniは、噂されている新しいAIモデルで、おそらくVeo 4または大幅なアップデートです。リーク情報によると、これはチャット内で直接ビデオを生成、リミックス、編集するためのGeminiに統合されたマルチモーダルAIエージェントであると示唆されています。

Krea 2はMidjourneyの競合ですか？

Krea 2は、Midjourneyの特徴的な芸術的表現をターゲットに、ムードボード、スタイル転送、統合された編集ツールを含む、よりユーザーフレンドリーなワークフローを提供することで、直接的な競合として位置づけられています。

新しいGoogleビデオモデルのリークされた仕様は何ですか？

リークされたメタデータによると、「Omni mode」と呼ばれる新しいモデルは、1280x720の解像度で9〜10秒のビデオを生成し、以前の8秒の制限からわずかに増加しています。

Google OmniはSeedance 2.0のような競合他社よりも優れていますか？

初期比較では、Googleの以前のモデルよりも明確な改善が見られます。主観的ではありますが、一部の初期出力はSeedance 2.0のような競合他社よりも映画的ではないように見えますが、統合された「エージェント」としての可能性がその主要な利点となる可能性があります。

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.