最近、UBITECH社が開発した「Walker S」というロボットのデモが公開され、多くの注目を集めました。このデモでは、ロボットが衣服をたたむ、色のアドバイスを提供する、テーブル上のスイッチを並べ替えるなど、複数のタスクを自律的にこなす様子が示されました。特に印象的だったのは、このロボットが着脱可能な手を持っている点で、これによりさまざまな種類の作業に柔軟に対応可能であることが強調されました。また、Walker SはBaiduが開発した大規模言語モデル「ERNIE Bot」を使用しており、これがタスクの効率的な遂行を支えています。このロボットは産業用途にも対応しており、電気自動車の組み立てラインでの品質検査などにも利用されています。
公開日:2024年4月5日
※動画を再生してから読むのがオススメです。
最近、かなり印象的なロボットのデモがありましたが、残念ながら、このイベントについてのメディアの取り上げが不足していたため、広く見落とされていたものでした。
これは、UBITECHという会社のロボティクスデモです。彼らはかなり長い間ロボットを製造しています。
このデモについて取り上げる理由は、最近見たデモと非常に似ているからです。
最近見たFigureのデモに慣れている方であれば、彼らが達成しようとしていることはほぼ同じレベルです。
もう話すことはありません。デモを見て、具体的に何かを見てから、私の考えをお伝えします。初めて思うよりも、これが少し印象的だと思う理由を。
Walker、明日出張に行くの。
このシャツを手伝って畳んでくれる?
もちろんです。
Walker、シャツを畳みましたか?
はい、畳みました。
Walker、この黒いシャツにはどんな色のパンツがより良く似合うと思いますか?
Walker、テーブルのスイッチを別々の皿に乗せるのを手伝ってください。
Walker、分解の正確さと効率性をどのように確保していますか?
私たちは先ほど、Ubitec Walker Sからかなり印象的なデモを見ました。このデモに興味を持ったかどうか、感銘を受けたかどうかは別として、それは本当にクールなものだったと思います。
最初に見落とされていたかもしれないことの1つは、最初の数秒で、このロボット、Walker Sが実際に取り外し可能な手というクールな機能を持っていることを見ることができたことです。
このロボットは文字通り手を置くことができ、非常に磁力的であり、何らかのモジュラーデザインのようであり、実際に本当にクールであり、おそらく将来的には異なる部品がアップグレードされる限り、このロボットが自己アップグレードできる可能性があることを意味します。
このモジュラーデザインは、私たちが異なる種類のロボットを扱っていることを示しています。
このスタートビットは過小評価すべきではないと思います。それは異なることに使用できるだけでなく、非常に効果的だと思います。なぜなら、Walker Sがモジュラーデザインを使用できる可能性があるからです。
おそらく、それは、より繊細なアプローチが必要な特定のタスクを行う必要があると気づくかもしれません。
それは素早く歩くことができます。
手を適用することになるので、パッと手を当てて、そのタスクを自分の手で効果的に行うことができます。
もしくは、何かをつかむ必要があり、異なる種類の手、異なる種類のグリッパーが必要な場合、その異なるグリッパーを適用して、作業に取り掛かることができます。だから、それはこのデモについて多くの人が見逃したと思うことです。その応用はかなり印象的です。
他の人型ロボットを見てみると、最近会社が行ったこと、Agility Roboticsは実際に最近手を変え、Boston Dynamicsも同じことをしました。
ロボットが異なる業界のタスクに適した取り外し可能または交換可能な手を持つことができるようになるのは、将来のトレンドになるのかと思っています。理論的には、それは意味があります。
モジュラーデザインは本当に印象的なもののようです。
もちろん、印象的だったもう一つのことは、これが完全に自律しているようであり、どんなAIシステムが稼働しているかをここで見ることができます。ここには、AIモデルの視覚的表現のようなものがあり、これは以前のロボティクスのアップデートで見たような、実際にリハーズされたデモのようには見えません。
ここには書いてあります、Walker、明日出張があります。
手に持っている衣類をたたむのを手伝ってくれますか?
そして、その手に持っている衣類から始まったことがわかります。
衣類は確かに本当に難しいものです。
ここには、タスクの分解と計画が書かれており、私はこれをすることができると書かれています。
そして、この右上隅にも、このタスクを行っているオンボードビジョンモデルのようなものが見えます。
彼らが現在使用しているシステムは、これが過去に行われたかのようではなく、リアルタイムであることがわかっています。
これは本当に、本当に、本当に効果的なものであり、自律的でリアルタイムで、シャツを置く様子を見ることができ、その後、シャツの他の部分をつかんで、柔らかい物体の操作を示しています。
それから、シャツのその部分をつかむことができ、その部分を折りたたむことができ、手をスライドさせることができることがわかります。
そして、シャツを完全に折りたたむことができ、タスクを完了したかのように見えます。
そして、シャツを取り戻し、腕を本当に奇妙な方法で動かしますが、正直言って、かなり不気味です。
ロボットの手がこうしてひねりながら動く様子、私は、ロボットからはちょっと不気味さを感じます。
ロボットは人間ではないことはわかっていますが、それでも私が言及したいと思うことです。
とにかく、その後、彼らは基本的にロボットに話しかけ、洋服のたたみ終わったかと尋ねます。
「はい、持っています」と彼は言います。
そして彼は服を拾い上げて彼に手渡すことができます。
これは、実際に本当に素晴らしいと思います。
そして、私は時々、特定のデモに感心しない人もいると知っていますが、シャツを自律的に取り、折りたたみ、そしてそのシャツを拾って誰かに手渡すことができることは、TeslaのOptimusから最近見たデモよりも難易度が高いと思います。実際、その時点では自律的ではなかったと思います。
それについては完全には確信が持てませんが、私の記憶では、ロボットがそれを自律的に行うデモはほんの数回しかなかったと思います。
これは本当に効果的なもののようです。
そして私がそう言う理由は、シャツのようなものを折りたたもうとするロボットは、それが厳密には硬い物体ではないということです。
それは柔らかい物体のようです。そのため、非常に効果的に行うためには異なる種類の操作が必要です。
そして彼はWalkerに尋ねました、「この黒いTシャツに合うパンツは何ですか?」
そして彼は、「濃い色のパンツと合わせる方がフォーマルな場にはより適しています」と言います。
基本的に、ここでは、Teslaと似ているものを再び見ることができました。
基本的に、私たちはこのWalkerロボットがテーブルのスイッチを交換して整理するのを見ることができました。
私たちは、視覚言語モデル、おそらくオブジェクトベースの60ポーズ認識、自律的な動作計画があることを見ました。
これらは、彼らが追加したテキストです。
私は数日前にこのデモを見ましたが、彼らはこの更新されたものをリリースしました。だからこそ、これを取り上げたかったのです。
先ほど言ったように、これは自律的にこれらのアイテムを異なる方法で整理できるようです。
これがどのようにして行われたのかは非常に魅力的だと思います。
このロボットには持っていないことが1つあると思いますが、これはロボットを批判しているわけではありません。彼らはかなり素晴らしいことをしていると思いますが、それはあまり流暢ではないように見えず、あまり速くも見えません。
ここで、その人が実際にそれを調整することができるのが見えます。
なぜそうしたのかはよくわかりませんが、視界に入っているように見えました。
右下の角にビジョンシステムが見えます。
これが人物であること、そしてここにスイッチがあることを識別することができます。
なぜその人がそれを動かしたのかはよくわかりません。
ロボットが少し混乱したかもしれませんが、リアルタイムの軌道計画を行い、それらのオブジェクトを配置することができることがわかります。
そして、もちろん、それがそこに置かれたことを見た後、ロボットはそのオブジェクトを元の位置に戻すことができます。
そして、そのタスクが完了したのが見えます。
そしてもちろん、ここでこの質問がされ、それに対応します。
そして、ここでWalker Sロボットの追加の詳細に入ることになります。
おおむね、ソーティングタスクの結果の正確さと効率性をどのように確保しますか?
そして、基本的には、物事がうまくいくことをどのように確保するかという質問ですか?
そして、ここでそれを詳しく説明します。
私がこれをOpenAIの最近のブレイクスルーとかなり似ていると言った理由は、これが最初のロボットの1つであり、オンボード大規模言語モデルを使用して特定のタスクを完了するために使用されているためです。これらのタスクは実際には利用できず、ロボットをより効果的にするために特定のタスクを変更する必要があります。
そして、それを右下の角に記述しているのが見えます。
プロセス中、私はBaidu Foundation Model PlatformのErnieボットを使用して、視覚言語モデルまたは視覚モデルと組み合わせてタスクを分解し、理由を説明し、異常を検出し、把握を更新して、干渉があってもこのタスクを成功裏に完了させることを保証しています。
彼らは基本的に、このAIロボットをより効果的にするためにBaiduのモデルを使用していると言っています。
これがとてもクールな理由は、もしあなたが覚えているなら、私たちはFigureとこのデモを見ました。そして、もし気を取られていないなら、これは私のチャンネルで過去数日間で最も視聴された動画の1つです。多くの人々が実際に何が起こっているかの重要性を理解していると確信しています。
そしてポイントは、このロボットは正直に言って、物事をどれだけ速く動かし、関節やアクチュエータがどれだけ流れるように動くかという点で、流動性の違いがすぐに見えることです。
しかし、自律的に計画を立て、タスクを実行する能力においては、かなり類似した能力があることを否定することはできません。
この会社について疑問に思っていることの一つは、UBITECHは一体何者なのかということですか?
この会社は突然現れたのでしょうか?
彼らは一体どこから来たのですか?
彼らは何をしているのですか?
ここで一体何が起こっているのでしょうか?
基本的に、UBITECH Robotics Corp LtdはUBITECHとしても知られており、人工知能とヒューマノイドロボティクス部門で活動している会社です。
そして、この会社は2012年に設立され、スマートサービスロボットの研究開発、設計、スマート生産、商業化に従事しています。
この会社の提供するものは実際にかなり多様で、消費者向けに設計されたヒューマノイドロボットから、医療、教育、商業サービスを含むさまざまな分野で活用されるスマートサービスロボットまで幅広いです。
そして、今ご覧いただいているビデオは、彼らが最近行った大きな発表の一部です。
UBITECHは実際にロボティクス分野で大きな進歩を遂げており、技術的に先進的でありながら、顧客のニーズに応えるよう設計された製品を開発しています。
会社は実際に、数々の注目すべきプロジェクトや業績に関与してきました。
例えば、そのロボットは新型コロナウイルスパンデミック中に医療従事者を支援するために使用され、Adibotのような消毒用に設計されたロボットを開発しています。
そして、彼らは革新的な技術がConsumer Electronics Showなどのイベントで認められています。
最近、実際には、25人の投資家から5回の資金調達ラウンドで13.4億ドルを含む、かなりの投資を集めています。
そしてもちろん、最近、画面で見ているように、彼らは香港証券取引所に上場し、実際には重要なマイルストーンと成長と発展を示すものでした。
そして、その日以来、株価はかなり上昇しています。
ここには、最近、その既存のロボティクス会社を使用して、最新の大規模言語モデルと既存の最新のビジョンモデルを統合し、AIシステムの能力を向上させるために活用することを決定した革新的な中国企業があります。
そして最近、彼らは香港証券取引所に上場しました。
中国も再び努力を強化しているようです。他国のロボティクスの発展に追いつくために。
それは実際にはかなり印象的です、彼らができるようになったことのいくつかは。
そして、実際に最近の発表がありましたが、それについてお話したいと思います。
Walker Sというのは一体何なのか、と思っているかもしれませんね?
実際、このロボットが一体何なのか、と思っているかもしれませんね?
どれくらい優れているのでしょうか?
Walker Sロボットは、実際には産業用途に設計されたヒューマノイドロボットで、電気自動車の組み立てラインでの作業を含む。
この先進的なロボットは、同社が様々な産業用途や消費者向けにヒューマノイドロボットを開発・展開するための広範な取り組みの一環です。
Walker Sモデルは、電気自動車の組み立て工程での応用が特に強調されており、ヘッドライトカバーの品質検査やドアロックやシートベルトの検査、電気自動車会社のロゴの取り付けなどの作業においてパイロットされています。
この展開は、ロボットの精密で反復的なタスクにおける能力を示し、組み立てラインの自動化と効率化に貢献しています。
そして、スペック面でのWalker Sロボットは、身長4.75フィート、体重170ポンドで、スムーズで柔軟な動きを可能にする36自由度を備え、SLAM(同時位置同定と地図作成)を含む高度なナビゲーションとビジョンシステムを特徴とし、家庭やビジネス周りでの自律航行や動的環境を通過するための障害物回避を行います。
その自己バランス能力には、力、視覚、聴覚、空間認識を含むさまざまなセンシングシステムが実際に備わっており、精密なタスクを実行し、人間環境と安全にやり取りすることができます。
そして、このロボットは、半構造化された環境で動作するよう設計されており、複数の種類の地形を歩行し、手と目の協調や物体操作を必要とするタスクを実行することができます。
各アームには7つの自由度があり、より大きな操作性とスペースの柔軟性を可能にし、ロボットの全身の柔軟性と制御システムにより、重心を適応させてバランスを保ち、精密なタスクを実行することができます。
全体として、Ubitec Walker Sロボットは、ロボティクスの分野での重要な進歩を表しており、彼らがどのように追いついたのかはかなり驚くべきことです。
この最近のロボットのデモでは、実際にロボティクス工場で特定のことを行うことができるようになったようで、このパイロットはかなり成功したようです。工場にあり、特定のことを行っているようです。
かなり遅いように見えますが、アプリケーションはアルファ/ベータ段階にあるようで、おそらく100ドル,000のロボットよりも安いであろう人間を実際に入手できる状況で、周囲を見回し、特定のことを行う必要があると思いますが、将来的には組み立てラインの一部になる可能性があると思います。
そして、このロボットについて私がかなり奇妙だと感じることの1つは、物をつかむ方法の不気味な性質です。
例えば、このロボットがここで物をつかむのを見たとき、シートベルトをつかむのを見たとき、手をこの不気味な方法で動かし、それをつかむことができました。
そして、私はわからない、このロボットは、私を怖がらせているとは言いませんが、確かに非常に興味深いです。
もう1つ知っておくべきことは、もちろん、このロボットには実際に使用されているオンボードの大規模言語モデルが搭載されており、基本的にはBaiduを使用しているということです。
大規模言語モデルの開発とベンチマークの焦点となってきたBaiduのERNIE BotとOpenAIのGPT-4の競争は、さまざまなソースから、これらのモデルのパフォーマンスに関する洞察が提供され、さまざまなベンチマークでの強みと弱点が強調されています。
ERNIE BotはBaiduによって開発され、報告によると、あるベンチマークでGPT-4を上回っているとされており、これらの議論は中国語を含み、BaiduはErnie 3.5というモデルのバージョンがChatGPT-3.5を総合能力テストで上回り、より高度なChatGPT-4をいくつかの中国語能力で上回ったと主張しています。
一方、GPT-4は、さまざまなプロフェッショナルおよび学術的なベンチマークで人間レベルのパフォーマンスが認められており、模擬バー試験でトップ10%の受験者に合格しています。
ERNIE Botは、中国語のテストで優れたパフォーマンスを示し、AGI evalやCE evalなどのAI言語モデルをテストするために設計されたベンチマークでGPT-4を上回っています。
しかし、英語の能力に関しては、GPT-4がERNIE Botよりも優位を保っています。
一般的な能力に関しては、Ernie 4.0は最新のイテレーションであり、パフォーマンスの面でGPT-4と同等であると主張されており、おそらく彼らのロボット、Walker Sが使用しているものだと思われます。
もちろん、GPT-4と同等の最新世代であるErnie 4.0は、理解、生成、推論、記憶の改善が見られ、CEOのRobin Liは、複雑な文を正確に解釈し、高品質なコンテンツを生成する能力の向上を強調しました。
基本的に、ERNIE Botの進歩は創造的な執筆、推論、コード生成に現れており、トレーニング、推論、パフォーマンスの大幅な改善が見られます。
ここでの結論は、OpenAIと、もちろん、BaiduやUBITECHとの企業間の比較において、何らかのグローバルな競争が増加しているということです。
彼らは他の企業や彼らがしていることに非常に注意を払っており、このパートナーシップがまさにFigureがOpenAIとやろうとしていることと非常に似ていることがわかります。
そして、ERNIE Botは中国語のタスクや特定のベンチマークで優れたパフォーマンスを示していますが、GPT-4は幅広い専門的および学術的なタスクで優れていることを示しています。
したがって、将来では、これが国境を越えた企業間で最大の競争の1つになる可能性が非常に高いようです。
そして、企業が常にお互いを上回ることができるか、あるいは特定の企業が完全に支配することができるか、それを見るのは非常に魅力的だと思います。
競争が始まったようです。国家はロボティクスに関して最善を尽くそうとしており、競争が始まったようです。
このロボットについてどう思われるか教えてください。
かっこいいと思いますか?
このロボットは、ロボットのような姿と競争することになると思いますか、それとも彼らはあまりにも先を行き過ぎていますか?
競争は良いと思います。
確かに、これらの製品の消費者としては、より多くのアップデートを受けることができ、最終的にはより良い製品を手に入れることができるため、楽しみが増えますが、全体的には、誰がより効果的に、効率的に自分のものを開発し、より多くの投資家を確実に引き付けるかによって、競争は興味深いものになると思います。
このロボットについてのご意見をお聞かせください。
その姿を消すことになると思いますか?
これが次の革命になると思いますか?
しかし、別の視点から見ると、これは実際には、実際の大規模言語モデルを持つ自律ロボットのデモとしては印象的だと思います。
以上のことを踏まえて、次のAIのアップデートで皆さんにお会いしましょう。