このロボットの新しいスキルがすべてを変えました

中国のロボットが、専門家が数年先だと考えていたタスクを遂行しました。これはAIの大きな飛躍を示しています。この画期的な成果は、一度は安全だと考えられていた熟練職の自動化に向けた全球的な競争を引き起こしています。

Stork.AI
Hero image for: このロボットの新しいスキルがすべてを変えました
💡

TL;DR / Key Takeaways

中国のロボットが、専門家が数年先だと考えていたタスクを遂行しました。これはAIの大きな飛躍を示しています。この画期的な成果は、一度は安全だと考えられていた熟練職の自動化に向けた全球的な競争を引き起こしています。

世界中で聞こえた一針

群衆は、通常の人間のサーカスのトリックを期待して集まった:箱の持ち上げ、演出された押し合い、あるいは慎重に階段を歩く姿。しかし、2022年12月22日、中国のステージに登場したのはTARSロボティクスのマシンで、テーブルに座り、針を手に取り、リアルタイムでロゴを手刺繍し始めた。安全ネットも、あらかじめ刺繍されたテンプレートもなく、ステージの照明の下で落ち着いて縫い進めるロボットがそこにいた。

刺繍は些細なものに思えるが、物理学に目を向けるとその重要性がわかる。ロボットは針に糸を通し、両手を協調させ、動くたびにしなったりよれたりする生地にサブミリメートルの針目を配置しなければならなかった。ほんの一つのミスで糸が切れ、針が外れ、パターンが自己崩壊してしまう。

柔らかい材料は、数十年にわたって産業用ロボティクスにとって悪夢のような存在でした。従来のアームは、剛性で反復可能な作業に優れています:この金属部品を拾い、あそこで落とし、1,000回繰り返します。糸や布は常に形を変え、予測不可能にねじれ、リアルタイムで力の調整を常に要求します。

TARSのヒューマノイドが視覚的な躊躇なくシーケンス全体を滑らかにこなす様子を見て、部屋にいるロボティクス技術者たちに明らかなことがありました:これは振り付けされたギミックではないということです。そのシステムは針と糸を視覚的に追跡し、瞬時に力を調整し、長時間の繊細な操作を通じてその体を揺るがすことなく保持しました。その組み合わせは、単なる動作制御ではなく、本物の具現化された知性のように見えてきます。

ロボットがこれをできるようになると、刺繍について話すのをやめ、他のすべてのことについて話し始めます。同じ能力はほぼ直接的に次のことに対応します:

  • 1ケーブルハーネス組立
  • 2精密電子機器製造
  • 3混雑した作業台での精密な機械組立

工場が依然として高度なスキルを持つ人間の手に留保している仕事です。ヒューマノイドが箱やパレットを移動させる中で、柔軟な材料を巧みに操作することができれば、その方程式が一変します。ヒューマノイドは単なる力仕事の労働者から、潜在的な専門職の代替品へと変わるのです。

この静かな刺繍が12月の舞台に響き渡り、まるでスタートのピストルのように響きます。ロボティクスの競争は、もはや誰が最も重い荷物を運べるか、あるいは誰が最も速く歩けるかに焦点を当てていません。今や、日常的に人間の労働者が行っていることに非常に似た洗練された移行可能なスキルを習得できる者が勝負を決める時代です。

ロボティクスのソフトマテリアルの悪夢を解決する

イラスト:ロボティクスのソフトマテリアルの悪夢を解決する
イラスト:ロボティクスのソフトマテリアルの悪夢を解決する

柔らかい素材はロボットの自信を不安に変えます。金属部品とプラスチックハウジングは置いた場所に留まりますが、や布は逆の動きをします。伸びたり、ねじれたり、引っかかったり、膨らんだりして、曲がった縫い目や破れた縫い目におけるわずかなミスをすべて記憶しています。

ロボットにとって、その混沌は従来の動作計画に組み込まれたほとんどの前提を崩します。固体の物体は固定された形状と予測可能な接触点を持っていますが、ゆるい糸は事実上無限の形状と接触状態を持っています。動作の毎ミリメートルが、事前に計算された軌道が決して予測しなかった方法でシステムを変えることがあります。

刺繍はこの問題を増幅させます。ロボットは、針、糸のループ、そして動く布のパッチを調整しながら、糸が切れず、またたるまないように適切なテンションを保たなければなりません。各ステッチは布をわずかに歪めるため、作業対象自体がロボットの依存する地図を常に書き換えています。

それは感知と制御を厳しい条件に押し込めます。システムは、針が布に触れたとき、糸が絡み始めたとき、布が平面から逸脱したときを感じるために、高速で高解像度の力フィードバックを必要とします。視覚追跡は、変形する背景の中で、薄い反射針と極細の糸を、変化する照明の下で、サブミリメートルの精度で追わなければなりません。

精度の要求は時間とともに増加します。たった一つのロゴには、何千もの個別の動作が必要になることがあります。針の挿入、引き抜き、持ち替え、テンション調整などで、1ステップあたり0.1mmのずれが生じると、パターンが壊れてしまいます。ひとつのミスで針が曲がり、糸がほつれたり、生地がひどく皺寄りになって、全体が廃棄物になってしまうのです。

ファナック、クーカ、またはABBのクラシックな産業用アームと対照的に、それらのシステムは以下のタスクを支配しています: - 車両フレームのスポット溶接 - 20 kgの箱のパレタイズ - 機械加工部品を治具間で移動すること

彼らはフェンスで囲まれたセル内で、固定されたジグ、硬い部品、そして一度調整された後に何百万回も再生される再現可能なパスを用いて作業します。高い力、低い不確実性、ほぼゼロの変動。

TARSロボティクスは、そのヒューマノイドを全く逆の環境に投入しました。ステージ上で、ロボットは針を通し、目で布を調整し、目に見える間や回復動作なしに精密な両手の縫い目を実行しました。穴を探すこともなく、接触時にぶれもなく、パターンの途中でリセットすることもありませんでした。

その安定した流動的な動きは、良好なサーボ調整以上のものを示しています。それは、最悪の条件下においても、視覚、力、および動きを統合し、真の具現化された知性を生み出すことができるシステムを明らかにしています。柔らかく変形可能な材料は、決して同じようには振る舞いません。

不可能を実現するトリニティ

ロボティクスの業界関係者は、TARSロボティクスの12月のイベントを終えた後、会長の陳怡峦博士の言葉「トリニティアプローチ」について語っていました。データ、AI、物理を別々の孤立したものとして扱うのではなく、TARSはそれらをリアルワールドから常に学び続ける連続的なフィードバックループに組み込んでいます。

そのループの基盤には、TARSの人型ロボットのすべての関節、カメラ、力センサーから高解像度のテレメトリーデータを収集するデータプラットフォーム「Sense Hub」があります。これらのデータストリームは、会社のAWE 2.0 AIワールドエンジンに直接供給されます。このエンジンは、シミュレーションで学習しながらも、実際にハードウェアで起こる出来事に常に再調整する具現化されたモデルです。

「刺繍のやり方」を暗記するのではなく、AWE 2.0はタスク間で転用できる一般的な身体技能を学びます。TARSは次のような基本的な訓練に重点を置いています: - バランスと全身の安定性 - 両手の協調とリーチ - 不確実性下での微細な力の制御 - ギラつき、遮蔽、変形する材料に対応できる視覚

そのスキルは、TシリーズやAシリーズのヒューマノイドにソフトウェアアップデートのように展開されます。刺繍ロボットが針に糸を通し、ねじれたフィラメントを追跡し、布のたるみを補正する際には、まさにその同じ基本要素を再構成しており、単発の「縫製スクリプト」を実行しているわけではありません。

それを実現するために重要なのは、デジタルと物理的行動の間のギャップが異常に小さいことです。チェン博士は、AWE 2.0がシミュレーションで学ぶことが最小限の劣化で移行できることを強調しました。つまり、仮想空間で手首を安定させる動作ポリシーは、モーターが熱を持ったり、生地が実際のステージで寄るときでも、その姿勢を保つということです。

その緊密なシミュレーションと現実の調整により、TARSは従来のロボティクスラボではなく、インターネット企業のようにスケールできます。主任科学者である丁文超博士が説明したように、複数のタスクにおける成功率は、実世界のデータを追加し、モデルを洗練させることで大幅に向上しました。これは、古典的なAIスケーリング法則に従ったものです。

スピードがショックファクターを増幅させる。TARS Roboticsは2025年2月5日に設立され、わずか12ヶ月でコンセプトペーパーから、自らロゴを生で手縫いするヒューマノイドへと進化しました。投資家たちは注目しました:エンジェルラウンドで1億2000万ドル、さらに「エンジェルプラス」ラウンドで1億2200万ドル、初期の資金調達合計は2億4200万ドルに達しました。詳細は中国スタートアップTARSが精密製造タスクを実行するヒューマノイドロボットを発表に記載されています。

ロゴを超えて:次にロボットが行う仕事とは

刺繍はパーラー・トリックのように見えるが、それを工場のフロアに適用すると話は変わる。移動する生地の上で、柔らかい糸をサブミリメートル単位で制御することは、狭いスペースにケーブル束を通したり、フレキシブルPCBを配置したり、小さなコネクタを潰さずに取り付けたりするのと同じクラスの問題である。人型ロボットが針、糸、布を数分間制御できるようになると、EV生産ラインのワイヤーハーネスの作業がほぼ簡単に思えてくる。

自動車および航空宇宙の工場は依然としてケーブルハーネスの組み立てに人間に依存しています。なぜなら、ワイヤーがねじれたり、引っかかったり、予測不可能な反発をする際にロボットは苦労するからです。現代の車のハーネスには数キロメートルのケーブル、何百ものクリンプポイント、数十のカスタムクリップが含まれることがあります。製造業者は、その作業を低賃金地域にアウトソーシングすることが一般的であり、既存の自動化技術ではその変動を大規模に処理できないためです。

電子工場も同様の限界に直面しています。表面実装機は、1時間あたり40,000個のコンポーネントを配置しますが、人間は依然として脆弱なFFCリボンをはめ込み、フレックスディスプレイを整列させ、奇形部品を手作業ではんだ付けします。もしTARSのヒューマノイドが動いている布の中を縫い針で導けるのなら、原理的には0.3mmコネクタをスマートフォン基板に導入したり、揺れるプラスチックフレームにカメラモジュールをはめ込んだり、パッドを破損したりレンズを割れさせずに行うことができるでしょう。

それにより、高価値で「ロボットには面倒すぎる」仕事の長い尾が解放されます。

  • 1EVや航空機における複雑な配線ハーネスの配線とテーピング
  • 2カメラモジュールやMEMSセンサーのような脆弱な精密電子機器の取り扱い
  • 3時計、光学ドライブ、医療機器の精密機械組み立て
  • 4現在、ライン上でシニア専門家を必要とする再作業や修理作業

深圳、スウォン、グアダラハラ、またはチェンナイの電子機器ハブにおいて、これは製造プロセスの最後の10%を締めくくるのは熟練した人間の手だけであるという核心的な前提を揺るがします。一般的な器用さを学び、それをタスク間で移動させるヒューマノイドは、それらのエコシステムを競争力のあるものに保つ労働の堀を直接攻撃します。もし現在の手作業の組み立て作業の20~30%が次の10年で自動化されるなら、数百万の熟練オペレーター、ライン技術者、そして専門職が圧力にさらされる一方で、資本は人々でいっぱいの建物ではなく、具現化されたAI労働者の艦隊を制御する者に流れます。

太平洋を越えて: 会話を交わすヒューマノイド

イラスト:太平洋を越えて:会話をするヒューマノイド
イラスト:太平洋を越えて:会話をするヒューマノイド

太平洋を越えて、カリフォルニアのオフィスキッチンで異なる種類の人型の瞬間が展開されました。Figure AIの新しいFigure 03は刺繍や溶接をするのではなく、会話をし、リクエストを受け、落ち着いてシャツを手渡す様子は、過剰に資格を持った季節労働者のようでした。

Figure AIのCEO、ブレット・アドコックは、クリスマスの直前である12月23日に短いクリップを投稿しました。彼はロボットに基本的な事実について質問します:どこで作られたか(カリフォルニア州サンノゼ)、どの世代に属しているか(第3世代)、そしてどの世代が最も優れているか。Figure 03は明確に答え、自身の世代を最も先進的と宣言するという社会意識の高い一言も添えます。

次に実践テストがあります。アドコックは、異なるサイズが別々のバスケットに入ったセットアップから中サイズと大サイズのシャツを求めます。図03はその場面をスキャンし、毎回正しいバスケットを選び、つまずくことなく適切なシャツを手渡します。これは、混乱した実世界のレイアウトにおける具現化された知能の小さなですが示唆に富んだ例です。

そのカジュアルなやり取りの裏には、Figure AIの新しいHelixモデルが存在します。これは、ビジョンと言語、アクションのシステムです。別々の認識、音声、制御モジュールを組み合わせるのではなく、Helixは以下をつなぎます: - シーンの視覚的理解 - リクエストの自然言語解析 - 腕や手の動作計画と制御を一つの連続したループで。

その統合は、図03が「中間シャツ」というフレーズから「この特定のオブジェクトがこの特定のバスケットにある」というアクションに移行できる理由を説明しています。それは厳密に決まったスクリプトに従っているわけではなく、プロンプトから一般化し、環境を解釈し、ほとんど無造作に見える複数のステップの行動を実行しています。

視聴者は依然として大きな問題に注目していました:レイテンシー。図03は質問に答える前に約2〜3秒間停止し、その遅延をあるコメント者はダイヤルアップインターネットに例えました。ロボットは音声を聞き、処理し、応答を生成し、話すという各段階が摩擦を生み出し、会話を微妙に不自然に感じさせています。

一方、ハードウェアはまったくもって鈍重には見えません。図03は約1.77メートルの高さで、以前のモデルよりも速く動き、重さは約9%軽くなっています。メッシュ生地とフォームパディングを使用した柔らかい外装に、ワイヤレス充電や統合された安全システムが加わり、工場のフロアやリビングルームを実際に歩き回りたいと思えるような存在に近づいています。

機械の不気味な遅れ

スピーチ、つまり口頭表現がFigure AIのデモの中で最も話題となりました。視聴者はBrett Adcockの質問とFigure 03の返答の間にある2~3秒の遅延に注目しました。この間隔は awkwardさを感じさせるには十分ですが、技術的には驚くべきものです。この小さなギャップは、自然に思える思考する存在の幻想がいかに脆弱であるかを明らかにしました。

人間は無意識のうちに対話において0.5秒未満のロールプレイを期待しています。おおよそ300〜500ミリ秒を超えると、言葉やジェスチャーが完璧に見えても、対話は遅延のあるZoomコールのように感じ始めます。コメント欄では、図03のタイミングを「ダイヤルアップインターネット」と呼んで、その雰囲気をぴったり表現しており、近未来のサイエンスフィクションから来たかのように動きや推論が優れているロボットに対する厳しい比喩となっています。

原因は神秘的ではなく、パイプラインの物理学です。ロボットは以下を行う必要があります: - 音声をキャプチャして音声認識を実行する - 大規模な言語モデルを使って意図を解釈する - 回答とアクションを計画する - 音声を合成し、動きを調整する

各ステージは、通常データセンターのGPUへのネットワークホップを介して、数十ミリ秒から数百ミリ秒を追加し、遅延が重なります。安全性チェック、ログ記録、または冗長性の追加は、さらに遅延を生じさせます。

それは、人型ロボットにとって会話のタイミングが本当のラストマイル問題となることを意味します。図03は、シャツのサイズを特定し、正しいバスケットを選び、命令に応じて中サイズまたは大サイズを渡すことができ、すべてはそのヘリックスビジョンランゲージアクションモデルによって支えられています。しかし、言葉のやり取りが滞る瞬間、人々はパートナーを見るのをやめ、クラウド推論を待っている機械を見始めます。

これを解決するには、積極的なオンボードコンピューティング、より緊密なモデル統合、そして予測的なターンテイキングにおける新たな工夫が必要です。ちょうど中国のTARSヒューマノイドロボットが世界初の二手縫いを達成したように、「ハード」の意味を再定義することができるロボットの手において、サブセカンドでの人間レベルのレイテンシーが、これらの機械が同僚のように感じられるのか、あるいは脚のついたキオスクのように感じられるのかを決定づけるでしょう。

iPhoneのように売り切れたロボット犬

ロボット犬はかつてKickstarterの好奇心の一つでしたが、Vita Dynamicsの新しいV-Botはフラッグシップガジェットのように売れました。事前注文が開始されると、この四足のロボットはわずか52分で1,000台以上を売り上げ、工業機器の売上曲線のようではなく、むしろiPhoneの発売日のグラフのような売り切れの動きを見せました。

V-Botは家庭や小規模ビジネスを対象とし、研究機関ではありません。購入者は、巡回し、支援し、観察するための機械に4桁の金額を支払っていますが、それはすべてをクラウドに送信することなく行います。それだけでも、前世代の接続カメラや「スマート」スピーカーとは大きく異なる点です。

V-Botの背後には、128 TOPS(テラオペレーション/秒)と評価されたローカルAIスタックが稼働しており、高性能なエッジ推論ボックスとほぼ同じ計算クラスに位置しています。その処理は完全にデバイス内で行われ、ナビゲーション、認識、および音声インタラクションをサポートし、オフボードに生のビデオや音声をストリーミングする必要はありません。Vita Dynamicsはプライバシー最優先のアプローチを強く打ち出しており、継続的なクラウドアップロードはなく、ユーザーがデータ保持を管理でき、オーナーが同期を選択した際にはログが暗号化されます。

完全自律運転がスペックシートの中心にあります。V-Botは家庭やオフィスの地図を作成し、家具や人々の周りにルートを描き、独自に充電サイクルを管理します。オーナーは高レベルの目標—夜間巡回、部屋間の配送、基本的な点検作業—を設定し、ロボットは低レベルの経路計画や障害物の交渉を行います。

ハードウェアは「プロトタイプではなく、アプライアンス」という哲学に従っています。シャーシは密閉されたアクチュエーターやIP等級のハウジング、複数時間の稼働が可能な交換可能なバッテリーパックを使用しています。Vita Dynamicsは、耐落下性、自己起立機能、工業用アームではなくプレミアムノートパソコンに近いサービスモデルを宣伝しており、安定性と実験的な機能のための定期的なメンテナンスとファームウェアチャネルを提供しています。

その52分間の完売は、どんなスペックよりも重要です。それは、中価格帯のラップトップや電話と同じくらいの価格で、玩具ではなく、実体を持つAIへの本物の、待ちきれない需要があることを証明しています。消費者はもう、光沢のあるヒューマノイドデモをただ見ているだけではなく、毎日自分の家やオフィスを自ら移動するロボットのためにお金を振り込んでいます。

世界初の人型ロボットが運営する工場ラインの内部

イラスト:世界初のヒューマノイドが運営する工場ラインの内部
イラスト:世界初のヒューマノイドが運営する工場ラインの内部

中国の工場では、ヒューマノイドはデモではなく、従業員として扱われています。世界最大のEVバッテリーメーカーであるCATLでは、ヒューマノイドロボットが生産ラインで人間の専門技術者と肩を並べて立ち、隔離された研究開発セルではない場所で稼働しています。

CATLのパイロットラインでは、パック製造の最もストレスの多い部分、つまり誤りが数百ドルの価値があるバッテリーを壊してしまう可能性のある最終組立および検証段階にヒューマノイドを使用しています。これらの作業は、これまで現場で最も経験豊富な技術者に任されていました。

Spirit AIのXiaomiヒューマノイドは、その爆風半径の真ん中に位置しています。このロボットは高スループットのバッテリーラインで稼働しており、パックが数秒ごとにコンベヤーベルトで流れ、タクトタイムはためらう余地をまったく与えません。

その主要な作業リストは、安全エンジニアの悪夢のようだ: 最終品質検査、高電圧コネクタの挿入、そして継続的な異常監視。各バッテリーパックは、厳密な力の限界とミリ単位の整列を伴った複数の正確な挿入を要求し、その後に視覚的およびセンサーに基づく検証が行われる。

品質管理のために、Xiaomiは多段階の検査ループを実施しています。カメラと深度センサーが、ずれたバスバー、欠 missing したファスナー、微細なケースの変形を検出し、一方でトルクと電流のサインが目に見えない組み立ての問題を示します。

コネクタの挿入は、巧妙な操作の限界を押し上げます。ロボットは、高電圧プラグを狭いハウジングに角度をつけて挿入し、正確な力のプロフィールを適用し、シールを過剰にストレスをかけたり、後で負荷下でアークする可能性のあるピンを曲げたりすることなく、完全に装着されたことを確認しなければなりません。

異常監視はヒューマノイドを移動式のフェイルセーフに変えます。これは熱ホットスポット、ゆるんだハーネス、不規則な振動を監視し、疑わしいものがあれば、欠陥のあるバッチがラインを離れる前に人間の監督者に報告します。

CATLの導入からの数値は、これが単なるハイプであると主張する人々にとって厳しいものです。Xiaomiは成功率99%を超え、この分野で何年も経験を積んできた最高のスペシャリストたちと同等の成果を上げています。

スピードはもはや「ロボット罰箱」に座ってはいません。サイクルタイムは経験豊富な人間の作業者と一致し、既存のタクトにスムーズに組み込まれ、上流や下流のステーションに遅延を引き起こすことはありません。

しかし、作業負荷は人間の限界を超えています。1台のXiaomiユニットは、熟練技術者のほぼ3倍の1日の作業量を処理し、長時間のシフトを欠けることなく、ラインレイアウトが変更されても再トレーニングは不要です。

CATLにとって、それはテンプレートに翻訳されます。人間と同じ物理的「インターフェース」を持つドロップイン型ヒューマノイドですが、ソフトウェアのようにスケールします。他のすべての企業にとっては、実際の現場でのヒューマノイドが運営する生産ラインの最初の信頼できる設計図となります。

アイコンが世界デビューの準備を整えています

アトラスは10年間、ロボティクスのバイラルスタントダブルとして活躍し、パルクールやバックフリップ、建設コスプレを緻密に編集されたYouTubeクリップで披露してきました。CES 2026では、ボストン・ダイナミクスのアイコンがついにラボを離れ、世界的なステージに登場します。自動車業界で最も大きな研究開発予算を持つ親会社に支えられています。

2021年にボストン・ダイナミクスを買収したヒュンダイは、現在、ヒューマノイドをEVやソフトウェア定義車両と並ぶ重要な柱として位置づけています。企業は、年間約30,000ユニットのヒューマノイドを生産する専用の米国工場を計画しており、アトラススタイルのマシンを研究プロトタイプから、製品ロードマップに非常によく似たものへと移行させる予定です。

その規模は、ロボティクスがスペクタクルからインフラへと移行していることを示しています。伝統的な自動車メーカーが毎年数万台のユニットをコミットするとき、それはYouTubeの視聴回数を追いかけているのではなく、ヒューマノイドがパレットを積み込み、部品を移動させ、最終的に産業用アームと並んで同じラインで働くことに賭けているのです。

現代自動車の動きは、TARSロボティクスの中国での刺繍デモ、Figure AIの会話型Figure 03、そしてVita Dynamicsの完売ロボット犬と同じ12ヶ月の期間にあたります。このスタックがどれほど速く成熟しているかを知るためには、TARSロボティクスが手刺繍可能なヒューマノイドロボットをデモンストレーションしたを参照してください。これは「パーティーショー」を精密組立作業の青写真へと変えています。

今変わるのは、誰が賭けをしているかということです。Figure、Agility Robotics、UBTechのようなスタートアップは依然として迅速に動いていますが、現代自動車、CATL、その他の産業巨人たちは、今や数年にわたる資本支出やグローバルな展開について語るようになっています。ヒューマノイドロボティクスはもはや夢物語ではなく、Atlasをためらいながらも鉄の tendon を持つマスコットとして次の汎用機械プラットフォームのように見えてきています。

具現化されたAIの時代はもはやシミュレーションではない

中国のライブステージでの刺繍、カリフォルニアのリビングルームでおしゃべりをするヒューマノイド、1時間以内に完売するロボット犬、そして中国のEVバッテリーラインの一部を静かに占拠するヒューマノイドたち、これらはすべて同じ方向を指し示しています。これはSFの短編ではなく、具現化されたAIが一つの閾値を越えた同時的なスナップショットです。月齢数ヶ月のスタートアップであるTARS Roboticsが、2025年2月5日の設立から年内にライブでサブミリメートルの手刺繍デモを行うまでに至ると、根本的な変化がスタックに起こったといえるでしょう。

TARSの器用さを示すデモ、Figure AIの会話型Figure 03、Vita Dynamicsの完売したV-Bot、CATLの人型ロボットが運営する生産セルは、一つの特徴を形成しています。ロボットはもはやパレットを移動させたり、ハードコーディングされた腕の軌道を繰り返すだけではありません。彼らは人間のような複雑な環境の中で、見ること、決定すること、行動することができるのです。ビジョン・ランゲージ・アクションモデルであるFigureのHelixやTARSのAWE 2.0 World Engineは、知覚、言語、制御を三つの別々の研究課題ではなく、単一のフィードバックループに統合します。

スピードこそが真のプロットツイストです。柔らかい材料の操作のような作業は「5〜10年先」のものとされていましたが、TARSはそのタイムラインを約10か月のデータ、AI、物理学の共同トレーニングに圧縮しました。図03は、ラボのプロトタイプからカジュアルに会話をし、シャツを分別するヒューマノイドへと約1年で進化し、V-BotのiPhoneスタイルの完売ウィンドウは、消費者市場がもはや自律型機械を購入することに躊躇しないことを示しています。

業界はさらに加速しています。CATLがバッテリーラインでFachkräfteäfteを置き換えるためにヒューマノイドを導入することは、ロボットがもはやパイロットやPRの演出ではなく、資本支出計画の項目になっていることを示しています。ボストン・ダイナミクスがアトラスをグローバルな舞台に向けて準備し、中国の工場がケーブルハーネス、精密電子機器、ファインアセンブリのためにヒューマノイドを静かに標準化する時、重心はデモから導入へと移ります。

具現化された知性がシミュレーターを離れました。データ駆動型の一般的なコントロールスタックは、足、車輪、そして人間と一緒に働き、応答し、ビデオや自然言語から新しいタスクを学ぶことができる腕に搭載されています。労働、物流、高齢者ケア、そして日常生活におけるこれらの影響はもはや仮説の域を超えており、工場の生産ライン、倉庫の通路、そしてリビングルームでリアルタイムで交渉されています。

よくある質問

なぜロボットが刺繍をすることがそんなに大切なのでしょうか?

刺繍は、ソフトで変形しやすい素材(糸、生地)をミリメートル未満の精度で扱い、リアルタイムでの力の調整を必要とします。この作業は従来の自動化にとって悪夢のようなものであり、新しいレベルの「具現的知能」と器用さを証明し、複雑な組み立て作業に向けた自動化の扉を開きます。

エンボディードAIとは何ですか?

具現化されたAIとは、ロボットのような物理システムに人工知能を統合したもので、物理的な世界を認識し、推論し、相互作用することができます。これは、単に事前にプログラムされたタスクを実行するのではなく、実際のデータを通じて一般的なスキルを学びます。

ヒューマノイドロボットはすでに仕事を置き換えているのか?

はい。世界最大の電気自動車バッテリーメーカーであるCATLは、製造ラインにヒューマノイドロボットを導入し、以前は熟練した人間の労働者が行っていた品質管理業務を実施しています。その結果、高い成功率と生産性の向上を報告しています。

TARSとFigure AIロボットの違いは何ですか?

TARSロボットのデモは、その刺繍タスクを通じて、革新的な微細運動スキルと器用さを披露することに焦点を当てました。Figure AIのデモは、人間とロボットの相互作用を強調し、カジュアルな環境での会話能力とタスク理解を特徴づけましたが、スピーチの遅延に関する課題も明らかになりました。

🚀Discover More

Stay Ahead of the AI Curve

Discover the best AI tools, agents, and MCP servers curated by Stork.AI. Find the right solutions to supercharge your workflow.

Back to all posts