テスラのエロン・マスク最高経営責任者(Elon Musk)はこのほど、同社のテスラロボット(Tesla Bot)を発売した。オプティマス(Optimus)と呼ばれるこのロボットは、足を引きずってステージを歩き、手を振り回し、腕を振り回し、動作が遅い。マスク氏は、すべてが計画通りに進めば、このロボットは3~5年以内に2万ドルを費やす可能性があると予測している。しかし問題は、それが私たちのためにできることです。しかし、私たちが深く研究する前に、テスラのロボットを駆動する主要な設備を見てみましょう。
テスラロボットアクチュエータ
これ アクチュエータ 任意のロボットの主要な駆動システムです。ロボットは運動部品のあるコンピュータにすぎない、あるいは言い換えれば、ロボットはアクチュエータとセンサのあるコンピュータにすぎないと言えます。テスラはロボットのために独自のアクチュエータを開発し、3種類の回転アクチュエータと3種類のタイプを使用している リニアアクチュエータ.
テスラがなぜ標準化されたリニアアクチュエータを使用していないのか知りたいなら、例えば FIRGELLI アクチュエータ。これは、ロボットが最終的に軽量化、省エネ、高電力密度、低コストを実現するために独自のシステムを開発しなければならないという制約があるためです。テスラは、このロボットを1台2万ドルで小売したいと主張している。それ自体は、23個のアクチュエータ、強力なPC、大量のセンサ、バッテリパックが必要なため、数時間以上継続することができ、強固なスケルトンを加えて接続することができます。
テスラロボットリニアアクチュエータ
テスラが開発したリニアアクチュエータは特定のキャラクタに高度な特異性を持っており、ロボット以外の他のアプリケーションにはあまり役に立たないことを意味しています。彼らのアクチュエータは惑星ローラシステムを採用しており、テスラは惑星ローラシステムと呼ばれている。しかしこれは基本的にボールねじ設計のコードであり、モータの中間にある従来の電機子コイルではなくブラシレスコアモータを使用して設計することにした。これは、ボールねじの設計が非常に効率的で、消費電力が低いが、コストも高いことを意味します。彼らはブラシレス電源システムを使用しています。これは寿命が大幅に速くなり、ソフトウェアによって制御される高度に特定の駆動モードを可能にすることを意味しています。
旅行の長さは約2「長いです。ピアノを500キロの重さで持ち上げている写真のように、これは大きな重さです。なぜこれだけの重さを持ち上げる必要があるのか知りたいかもしれません。これは、金属骨格に取り付けたときにアクチュエータの移動には移動の行程を大きくする必要があるからです。そのため、ロボットの足を動かす場合、足は約150度、または2フィートを超える長さで移動する必要があります。0度から3フィートの弧度まで左右に振る。人間は10万年以上も進化した体で足の筋肉を利用することができるようになったが、リニアアクチュエータで実現するのは容易ではない。だから私が言いたいのは、アクチュエータは500 kgの重量を2インチ以上に引き上げることができるが、アクチュエータがレバーに接続されると、力は著しく低下し、レバー率に依存するが、速度は増加し、これは良いトレードオフである
テスラロボットのデモンストレーション。
2022年9月30日に発表された最新のBot演説に対するテスラ自身の見解
エレン・マスク献上:W私たちはあなたに見せるために非常にエキサイティングなものがあります。私はあなたが印象的になると思います。私は確かに私たちのOptimusロボットにいくつかの期待を設定したいと思っています。あなたが知っているように、去年はロボットの服を着た人にすぎませんでしたが、私たちはまだいません。私たちは長い道のりを歩いています。私はあなたが知っていると思います。それに比べて、とても印象的になると思います。全自動運転における人工知能の進歩と、それをより多くの用途にどのように応用するかについてお話しします人間型ロボットのような現実世界の人工知能の問題に関わることが多く、それを超えて ここテスラで私たちがしていることがAGIに有意義な貢献をする可能性があると思います。そして、私たちは公開されている会社であるため、ガバナンスの観点からそれを行う良いエンティティを実際に教えてくれたと思います。在庫のクラスとそれは一般の人々がテスラをコントロールします、そして私はそれが実際に良いことだと思います。多分私は狂っていないかもしれません私は知りません。ええ、AIオートパイロットでの進歩とDojoとの進歩について多くのことを話します。そして、チームを連れ出し、長いQ&Aを行うので、タフに尋ねることができます質問。実存的な質問が必要なものは何でも、できるだけQ&Aの時間を確保したい場合は技術的な質問をしてください。
やあみんなミラノ私はオートパイロットで作業していて、ゴムです。私はリジーなプロジェクトの機械エンジニアです。
機械的メカニズムケーブルはありませんええ私はあなたたちと一緒に参加したいです
今夜でもそれはあなたが準備ができているのを見るのは初めてでしたテスラ車で実行される自動運転コンピューターは、これが文字通り、ロボットがテザーが今夜ステージにあったのは文字通り初めてであるため、ロボットは実際に私たちがあなたに見せた以上に多くのことをすることができますそれがその顔に落ちたくなかったので、今すぐロボットが他の多くのことをしているビデオをいくつか紹介します。
ええ、私たちは過去数ヶ月にわたって私たちがやったことをもう少し見せたかった離れて、ただ歩き回ってステージで踊り、謙虚な始まりですが、自動操縦ネットワークが実行されているのを見ることができます
その新しいプラットフォームでは、それについて直接芽のために再訓練されていますそれはあなたが見ることができますレンダリングされたビューはロボットです。ロボットが見ている世界は何なのか、このようなオブジェクトを非常に明確に識別することです。オートパイロットが行ったのと同じプロセスを使用して、ネットワークをトレーニングしてデータを収集し、その後、
上半身をもう少し説明する例です
今後数ヶ月間、数ヶ月でネイタンになろうとすることをしようとすることこれは、実際にはフリーモント工場の実際の駅でもあります。
あなたが見たのは私たちがバンブルCと呼んでいるものであることを今日見せなければならないことはそれだけではありません。チームは信じられないほどの仕事をしており、実際には楽観主義者のボットを持っています
両方のアクチュエータバッテリーパック制御システムで設計された完全なテスラ歩く準備ができていませんでしたが、数週間で歩くと思いますが、ロボットと、実際に生産に入るものにかなり近いものを見せたいと思いました。そうすることはそれを引き出しましょう
オプティマスプロダクションユニットには、能力があると予想しています
すべての指を独立して親指を動かすには、2つを持っています
自由の程度で、それは反対の親指と左と右手の両方を持っているので
ツールを操作し、便利なことをすることができます。私たちの目標は便利なものを作ることです
ヒューマノイドロボットはできるだけ早く、
私たちが車の設計に使用する同じ規律は、それが可能になるように製造用にそれを設計するために言うことです信頼性が高い低コストでロボットを大量に作るので、それは非常に重要なことです。 tは知性を持っています
自分で世界をナビゲートすると、彼らも非常に高価です、そして、これは楽観的な社会であり、非常に有能なロボットですが、おそらく最終的には非常に大量のユニットで作られており、車よりもはるかに低いと予想されます。
おそらく2万ドル未満が私の推測だと思います
楽観的な可能性は非常に効果的に感謝されていると思います
いつものように、いつものようにテスラのデモが暑くなっていますだからそれは良いことですそれは良いですええ、チームが着用し、チームは信じられないほどの仕事をしました。彼らがやったことを非常に誇りに思っていることは、彼らが本当に素晴らしい仕事をしたことです私はこのチームの全体に手を差し伸べたいと思っているので、あなたは今、オプティマスを洗練するためにまだやるべきことがまだあることを知っていますそれを改善することは明らかにこれがOptimusバージョン1であり、それが本当にこのイベントを開催している理由です。何百万人もの人々とそれが好きな可能性を助けることができるように規模を拡大します。資本に制限がない時点で一人当たりの生産性は、経済がその時点で何を意味するのかは明らかではありません。豊富な未来の未来はあなたが人々に貧困がない場合
製品やサービスの面で必要なものを何でも持つことができますそれは本当に文明の根本的な変革です。明らかに、変革が肯定的で安全であることを確認したいと考えていますが、それがテスラがこれを行っているエンティティと考えている理由です。一般の人々は非常に重要であり、見落とされるべきではありません。これは不可欠だと思います。なぜなら、テスラがやっていることが好きではないなら、一般大衆がテスラで株式を購入して投票することができるからです。
これは私があなたに知って欲しいことをすることができないことが非常に重要であるように大したことです時々人々はそうではないと考えていますが、それは真実ではないので、これを実現する企業エンティティが一般の人々が適切に影響を与えることができることが非常に重要であることを知っています。私はあなたが自動運転車が確かに世界に多大な影響を与えることを知っていると言った。
少なくとも半桁の輸送の生産性おそらく、おそらくより多くのUMの楽観主義者は、実際に何が均等であるかが明らかではないように、経済的生産量の2桁の潜在的な改善があると思いますが、私たちはこれを行う必要がある正しい方法でこれを行う必要がありますそれは慎重かつ安全に、そして結果が文明にとって有益なものであり、そして私がこれができないと人類は明らかに重要であることを保証します。ここで正しいことをすることを本当に気にかけていることは常に正しいことをしたいと思っており、善意で地獄への道を支払うことはありません。そこで私たちはそれをしたいので、正しいことをしたいので、あなたは私たちに加わり、それを実現するのを手伝うことを知っています。
さて、あなたは今日いくつかのロボットを見たので、クイックタイムラインの要約をしましょう。
コンセプトですが、コンセプトは私たちをそれほど遠くに導きません。
実生活の学習をできるだけ早く入手して、出てきて皆さんのために小さなルーチンをしたロボットを手に入れてください
6か月以内に、それからソフトウェア統合ハードウェアのアップグレードに基づいて構築しましたが、それ以来数か月にわたって
並行して、私たちはここで次の世代を設計しています
ですから、この男は、私たちがすべてを活用していることがわかっている車両設計プロセスの種類の基礎に根ざしています
私たちがすでに持っていることは明らかに昨年から多くの変化がありますが、いくつかのことがあります
まだ同じです。
いくつかの理由で重要ですが、私たちが人体がどれほど素晴らしいかを考えるのに多くの時間を費やすのは楽しいです
この信じられないほどの動きの範囲は通常本当に驚くべき強さです
運動とは、指先を目の前の椅子に置くと、膨大な範囲の動きがあることに気付くでしょう
たとえば、指先を動かすことなく、肩と肘があります。それらの関節をすべて動かすことができます
その主な機能を知っているロボットは、本当に有用な仕事をすることです。
それは必ずしもそれらの自由度のすべてをすぐに必要としないかもしれないので、私たちはそれを最小限に剥奪しました
28の基本的な自由度の、そしてもちろんそれに加えて私たちの手の
人間はいくつかのことでもかなり効率的であり、他の時間ではそれほど効率的ではないので、たとえば私たちは小さなものを食べることができます
数時間自分自身を維持するための食べ物の量は素晴らしいですが、私たちがただ座っているときはいません
攻撃的ですが、私たちはちょっと非効率的です私たちはちょっと燃えるようなエネルギーなので、ロボットプラットフォームで私たちが何をしているのか
やろうとするのは、アイドル電力消費が可能な限り低くなることを最小限に抑えることです。
スイッチをフリップして、すぐにロボットが有用な仕事をするものに変わります
それでは、この最新世代についていくつかの詳細について話しましょう。
オレンジは私たちが少しでも青で私たちの電気システムで到達するアクチュエーターです
だから今、私たちは一種の人間ベースの研究を持っていて、私たちは両方とも私たちの最初の開発プラットフォームを持っています
このデザインのために引き出すための研究と実行再び、私たちはその車両のデザインを使用しています
基礎なので、デザインと分析を通じてコンセプトからそれを取り入れ、
次に、コストや効率性などのために最適化する方法に沿って構築と検証
これらは、この製品を最終的にスケーリングするための重要なメトリックであるため
私たちの部品数を減らし、可能な限りのすべての要素の消費電力を削減します。
私たちの四肢でのセンシングと配線を減らして、あなたがあなたの手と足の多くの塊を想像することができます
動き回るのが非常に困難で消費的であり、私たちは両方を集中させます
プラットフォームの物理的中心への配電と私たちの計算
したがって、胴体の真ん中には、実際には胴体です。バッテリーパックがあります。これは2.3キロワット時間のサイズです
これは約1日分の仕事に最適ですこのバッテリーについて本当にユニークなこと
パックは、すべてのバッテリーエレクトロニクスがパック内の単一のPCBに統合されているので、すべてを意味します
センシングから、充電管理と電力分布の融合からすべてのものにあります
ある場所では、車両製品とエネルギー製品の両方を活用して転がします
これらの重要な機能はすべてこのバッテリーに含まれるため、合理化された製造は非常に効率的であり、
単純な冷却方法バッテリー管理と安全性、そしてもちろん、Teslaを活用できます
既存のインフラストラクチャとサプライチェーンを作るために、私たちの脳のように進むことができます
頭の中ではありませんが、私たちの胴体にもかなり近いです。
オートパイロットハードウェアと両方を活用したいすべての車両に完全な自動運転コンピューターを出荷し、
ヒューマノイドプラットフォーム用のソフトウェアですが、要件とフォームファクターが異なるため
最初にいくつかのことを変えるので、私たちはまだ人間の脳が行うすべてをするつもりです
ビジョンデータの処理複数の感覚入力と通信に基づいて、分割された2番目の決定を行う
したがって、通信をサポートするために、ワイヤレス接続とオーディオサポートが装備されています
また、ロボットと人の両方を保護するために重要なハードウェアレベルのセキュリティ機能もあります
ロボットの周りにあるので、私たちは一種のコアができました
私たちはこの男にいくつかの手足が必要になるでしょう、そして私たちは私たちのアクチュエーターと私たちの完全なことについてあなたに少しあなたに見せたいと思っています
機能的な手も同様ですが、それを行う前に、私は少し話すつもりのマルコムを紹介したいと思います
ロボットの構造基盤[拍手]
ありがとう
テスラには、非常に複雑なシステムを完成させる機能があります。
ここでは、実際の物理的なクラッシュの上に重ねられたモデル3のシミュレーションクラッシュが
実際、このモデルの複雑さをあなたにアイデアを与えることがどれほど正確であるかは信じられないほどです
それはすべての結び目ボルトンワッシャーすべてのスポット溶接を含み、それは3500万度の自由度を持っていますそれは非常に驚くべきものです
そして、私たちがこのようなモデルを持っていなければ、私たちは世界で最も安全な車を作ることができないだろうと言うのは本当です
ロボットに影響を与えるために、自動車側からの能力と方法を活用できますか
さて、モデルを作成でき、クラッシュソフトウェアがあったので、ここで同じソフトウェアを使用しました。
これの目的は、それが理想的には倒れていないことを確認することですが、それは表面的なダメージではありません
たとえば、ロボットの脱臼した肩に相当する腕でギアボックスを壊したくありません
修正が困難で高価なので、私たちは与えられた仕事に取り掛かりたいと思っていました
同じモデルを採取することもでき、以前に解決されたモデルからの入力を使用してアクチュエーターを駆動できる場合
それを生き返らせるので、これはロボットにこれらをしてほしいタスクの動きを生み出しています
タスクは、一連のタスクが何であれ、2階を歩いてしゃがみ込んでいる箱を拾い上げています
モデルこれは単純な歩行を示しています私たちは私たちを助けるすべてのコンポーネントにストレスを作成することができます
コンポーネントを最適化これらは踊るロボットではありません
実際、モーダルの動作ロボットの最初の5つのモードと通常、人々がロボットを作るとき、彼らは確実にします
最初のモードは、10 hertzに向かって上位のシングルフィギュアの周りに上がっています
誰がこれをするのか、歩行のコントロールを簡単にすることは、あなたが保証できないなら歩くのは非常に難しい
あなたの足がぐらつき、それは1つのロボットを作っても大丈夫です私たちは何千もの数百万を作りたいです
炭素繊維チタンからそれらを作るという贅沢はありません。
とても硬いので、これらの高いターゲットを持つことはできません私はそれらを愚かなターゲットと呼びます
私たちはそれらをより低いターゲットで動作させる必要がありますので、それについて考えればそれはうまくいくでしょう
これは、私たちは水浸しのゼリーと骨の袋だけで投げ込まれています。
私の足は10 hertzで振動しません私たちは低頻度で動作しますので私たちは
ロボットが実際にコントロールを難しくすることができることを知っているので、これからモーダルデータと
それを歩くことを可能にする制御システムにそれを剛性と供給
税金を少し変えるだけで、私たちはそこからインスピレーションを得ることができます
生物学と私たちは、膝の機械的な利点が実際にはかなり表現していることがわかります。
4つのバーリンクと同様に、それは非常に非線形であり、実際には驚くことではありません。
膝のトルクを膝のトルクに曲げると、曲がっているときはずっと多いと思います。
まっすぐなので、あなたは非線形機能を期待するでしょう、そして実際に生物学は非線形です
これは非常に正確に一致するので、それが4つの表現です
リンクは明らかに物理的には4つのバーリンクではありません。特徴は似ていると言ったので、私はそれを賭けています
あまり科学的ではないもう少し科学的になろうと私たちはこのグラフを通してすべてのタスクをプレイしましたが、これは
私たちがストレスについてしたと言ったタスクをしゃがむ歩行のピケットを見せているのですが、それがええと、
水平軸の膝に対する膝は、膝がこれらすべてを行う必要性を示しています
タスクを実行してから、ピークの上部にサーフィンをすることでカーブをかけます。それはこれが必要なものだと言っています
ロボットにこれらのタスクを実行させます
したがって、実際には緑の曲線である4つのバーリンクを見ると、
4つのリンクが実際に線形化されている力の特性は、実際に言っていることが力を下げたということです
それがアクチュエータが可能な限り低い力を持っている理由です。
青い曲線は何ですか?
ここに私の足から突き出て、アクチュエータを装着してシンプルな2つのバーリンクがあります
それはあなたがシンプルな2バーリンクでできる最善のことであり、それがより多くの力を生み出すことを示しています
効率的ではないアクチュエーターなので、実際にはどのように見えますか
あなたが見るように、あなたが見るように、それは膝に非常にしっかりとパッケージ化されていますあなたは良いものを見る
1秒で透明になると、アクチュエータで動作しているフルバーリンクが表示されます。
アクチュエータの力と変位を行い、今あなたをコンサートに渡します
だから私は私はあなたにデザインプロセスとアクチュエーターについて話したいと思います
私たちのロボットのポートフォリオuhなので、
パワートレインデザインに関しては、車とロボットがここで重要な最も重要なことはエネルギーの質量とコストです
私たちは車からロボットにデザインエクスペリエンスのほとんどを引き継いでいます
したがって、特定のケースでは、2つのドライブユニットとドライブユニットのある車が表示されます
時刻0〜60マイルの車を加速するか、運転するために使用されます
都市は28のアクチュエーターと28のロボットと
アクチュエータレベルでのタスクは何なのかは明らかではないので、タスクがあります
階段や登山、または翻訳する必要がある重い物を運ぶような高レベルです
ジョイント仕様へのジョイントしたがって、モデルを使用します
それは私たちの関節のトルク速度軌跡を生成します
その後、私たちの最適化モデルに供給され、実行されます
最適化プロセスこれは、
ロボットは回転して歩いていることができるので、このトルク速度があるとき
私たちはアクチュエータの効率的なマップの上に置いた軌跡で、私たちは一緒にできます
消費電力とエネルギー蓄積を生成するための軌跡
タスク対時間のエネルギーを使用すると、システムを定義できます
特定のアクチュエータのコストとクラウドに簡単なポイントを入れてから
これは、クラスターと赤い線で解決することにより、数十万のアクチュエーターのためにパレートの前面を示しています
Xが示すように最適なものを探す優先領域はどれですか
この特定のジョイントのために選んだ好ましいアクチュエータのデザインなので、今度はすべてのジョイントに対してこれを行う必要があります
最適化する28のジョイントがあり、クラウドを解析します。すべてのジョイントに対して再びクラウドを解析します
今回のスペックと赤い軸は、すべてのオーダーメイドのアクチュエータのデザインを示しています
ここでの問題は、ユニークなアクチュエータのデザインが多すぎることと
私たちがまだ対称性を利用しても、何かを作るには多すぎます
製造可能なユニークなアクチュエータデザインの量を減らすことができる必要があるので、何かを実行します
今回は再びクラウドを解析する共通性研究と呼ばれます
同時に複数のジョイントの共同パフォーマンス要件を同時に満たすアクチュエーターなので
結果として生じるポートフォリオは6つのアクチュエーターであり、カラーマップに中央の図を表示します
ええと、アクチュエータはこのスライドでも見ることができます3つのロータリーと
3つの線形アクチュエーターはすべて、質量あたりの優れた出力力またはトルクを持っています
特にロータリーアクチュエーターには、高速側の角度接触に統合された機械的なクラッチがあります
ボールベアリングと高速側と低速側のクロスローラー
ベアリングとギアトレインはひずみ波ギアであり、3つの統合センサーがあります
こことオーダーメイドの恒久的な磁石機械線形アクチュエーター
リニアアクチュエータには惑星ローラーと逆惑星のねじがあります
効率と圧縮、耐久性を可能にするギアトレインとして
したがって、私たちの線形アクチュエーターの力能力を実証するために
その限界の下でテストするために実験を設定しました
そして、私はあなたにビデオを楽しませます
そのため、アクチュエーターは持ち上げることができます
ハーフトーンナインフットコンサートグランドピアノ
そして
これは要件ですそれは私たちの筋肉ができるので、持っているのはいいことではありません
それらが直接駆動されたり、四頭筋筋が同じことをすることができるときに直接駆動されるときも同じ
膝が力を変換するアップギアリンクシステムであるというだけです
私たちの丘の端エフェクターの速度に、
人体の敏ility性なので、これは人体について驚くべき主なものの1つです。
この時点で私の役割を締めくくり、私はあなたに手について話すつもりだった同僚のマイクを歓迎したいと思います
デザインありがとうございましたコンスタンティノス
ですから、人間とヒューマノイドのアクチュエータがどれほど強力であるかを見ました
人間も信じられないほど器用です人間の手は動く能力を持っています
毎秒300度で数万の触覚センサーがあります
そして、それは私たちの日常生活のほぼすべてのオブジェクトを把握して操作する能力を持っています
私たちのロボットハンドデザインのために、私たちは生物学に触発されました。
私たちの指は、柔軟で強い金属腱によって駆動されます私たちは広く完成する能力を持っています
開口部の電力は、小さな薄くて繊細なオブジェクトの精密な握りのために最適化されているが
だから、なぜ人間のようなロボットの手がうまくいっているのは主な理由だからです。私たちの工場と私たちの周りの世界は
人間工学に基づいているように設計されているので、それが意味するのは、工場のオブジェクトが把握できることを保証することです
しかし、それはまた、私たちが今まで見たことがないかもしれない新しいオブジェクトが、人間の手と私たちによって把握される可能性があることを保証します
ロボットの手も同様に、これらのオブジェクトは私たちの手に設計されていると言っているので、かなり興味深いです
新しいオブジェクトに付随するために私たちの手に変更を必要とする代わりに
私たちの手に関するいくつかの基本的な統計は、6つのアクチュエーターと11の自由度があるということです。
指を駆動してセンサーフィードバックセンサーフィードバックを受信することは本当に重要です
私たちが把握しているオブジェクトについてもう少し学びましょう。
私たちの手は宇宙にあります私たちの手の重要な側面の1つは、それがこの適応性を適応的にしているということです
基本的に、手が把握されているオブジェクトに適応できるようにする複雑なメカニズムとして関与しています
別の重要な部分は、このクラッチメカニズムが保持できるように、バック以外の運転可能な指駆動があることです
そして、私たちがどのように進んだかを聞いたばかりのハンドモーターをオンにすることなくオブジェクトを輸送します
Tesla Botハードウェアの設計に進みました。これをミラノと私たちの自治チームに引き渡して、これをもたらします
ロボットトゥライフマイクに感謝します
大丈夫ええと、ビデオで前に示したすべてのクールなものが投稿されました
過去数年にわたってオートパイロットを行った驚くべき言葉のおかげで、ほんの数ヶ月で可能です
これらのコンポーネントのほとんどは、あなたがそれについて考えれば、ボット環境に非常に簡単に移植されました
車輪のロボットから脚のロボットまで、それらのコンポーネントの一部はかなり似ており、他の一部は必要です
より重いリフティングそうなので、たとえば私たちのコンピュータービジョンニューラルネットワーク
オートパイロットからボットの状況に直接報告されていますそれはまったく同じ占有ネットワークです
ここでボットで実行されているオートパイロットチームで、後でもう少し詳細に話しかけていること
このビデオは本当に変更された唯一のことは、私たちが思い出さなければならなかったトレーニングデータです
また、あなたの輝きフィールドで作られた作業を使用して得るためにこれらの占有ネットワークを改善する方法を見つけようとしています
たとえば、ボット環境の本当に大きなボットレンダリング
マシンは、ボットが対話しなければならないかもしれないと読んでください
考えるべきもう一つの興味深い問題は、主にそのGPSのシグナルの感覚を持つ屋内環境にあります。
たとえば、最寄りの充電ステーションを見つけるために、目的地に移動しようとしているので、トレーニングを受けています
高頻度を識別するためのより多くのニューラルネットワークは、
ボットカメラは、ボットがその環境に移動すると、時間の経過とともにフレーム間でそれらをストリーミングして追跡します
そして、私たちはそれらのポイントを使用して、その環境内のボットのポーズと軌跡のより良い推定を取得します。
歩いています私たちはまた、かなりの仕事をしました
シミュレーション側で、これは文字通りロボットの移動を統合したオートパイロットシミュレーターです
これは、オペレーターシミュレーターシミュレーターで実行されているモーションコントロールコードのビデオであり、
ロボットの進化は時間の経過とともに歩きますので、ご覧のとおり、4月に非常にゆっくりと始めて加速し始めます
過去数か月にわたって腕のバランスをとるなど、より多くの関節とより深い高度な技術のロックを解除するにつれて
したがって、運動は特に1つのコンポーネントです。これは、車からボットに移動すると非常に異なります。
環境なので、もう少し深さを保証すると思います。同僚にこれについて話し始めてほしいと思います。
今は外国人
こんにちはみんな私はフェリックス私はプロジェクトのロボット工学エンジニアであり、私は歩くことについて話すつもりです
簡単な右の人々は毎日それをしているようですあなたはそれについて考える必要さえありません
しかし、たとえば、エンジニアリングの観点から挑戦している歩行にはいくつかの側面があります
自分の良い表現を持つことを意味する身体的自己認識
手足の質量あなたの足のサイズは何ですか、あなたもエネルギー効率の良いゲートを持っている重要です
さまざまなスタイルのウォーキングがあり、それらのすべてが等しく効率的であると想像できます
最も重要な維持バランスは落ちないでください、そしてもちろん動きも調整します
あなたのすべての手足のうち一緒にいるので、今では人間はこれをすべて自然に行いますが、エンジニアやロボット奏者として私たちは持っています
これらの問題について考えること、そして私たちが私たちの移動計画と制御においてそれらにどのように対処するかをあなたに示すつもりなら
積み重ねて、運動計画と債券の表現から始めます
ロボットの運動学のダイナミクスと接触特性のモデルとそのモデルと目的のモデルを意味します
ボットのパス私たちの移動プランナーは、システム全体の参照軌跡を生成します
これは、モデルの仮定に関して実行可能な軌跡を意味します
プランナーは現在、3つの段階で動作します。足音の計画を開始し、モーション写真システム全体で終了します
そして、これがどのように機能するかを少し深く掘り下げましょう。このビデオでは、計画よりも足音が計画されているのがわかります
希望のパスに続いて地平線があり、私たちはこれから始めて、その後
人間と同じように、つま先をオフにしてストライキを獲得して、これらの足跡をつなぐ軌跡
そして、これは私たちにシステムの高効率のために大きな歩幅と膝の曲がりを減らします
最後の段階は、大量の軌跡の中心を見つけることです。
私たち全員が計画が良いことを知っているので、バランスを保つシステム全体
また、実際にそれらを実現する必要があります
[拍手]ありがとうフェリックスこんにちはみんな私の名前
アナンドですか、私はコントロールについてあなたに話をするつもりですので、フェリックスのモーションプランを見てみましょう
実際のロボットに現実の世界に話しかけて、何が起こるか見てみましょう
それはいくつかのステップを要し、それは少し残念です
しかし、私たちはそれを機能させるいくつかの重要な作品をここに欠けています
フェリックスが言及したように、モーションプランナーは理想化されたバージョンを使用しています
それ自体とそれの周りの現実のバージョンこれは正確ではありません
また、軌跡やレンチの枝を通して意図を表明します
それが世界に運動したい力とトルク
現実は、類似のモデルよりもはるかに複雑です。ロボットはそうではありません
簡略化されたバイブレーションとモードコンプライアンスセンサーノイズなど
そして、あなたが現実の世界にボットを置くとき、それは現実の世界に何をしますか
まあ、予期しない力は、プランナーが本質的に知らない、そしてそれは本質的にモデルのダイナミクスを引き起こします
特に、二重運動のように動的に安定しているシステムに不安定化を引き起こします
だから私たちはそれについて何ができるか、私たちはセンサーを使用している現実と私たちの理解を測定します
ここで私に国家の推定とステータスを行う世界は、態度と骨盤のポーズを見ることができます
本質的には、ロボットが歩いているときに追跡される大量軌道の中心とともに、人間の前庭系
オフィス環境には、必要なすべてのピースがあります
ループを閉じるために、より良いボットモデルを使用して、現実の理解を使用します
私たちは州の推定を通じて得たものであり、私たちが望むものと私たちが期待するものと私たちが期待するものを比較しました
現実は、
ここのロボットここロボットは確かに突き出されていることに感謝していませんが、そうではありません
直立しているという見事な仕事ここでの最後のポイントはロボットです
散歩だけでは手と腕を使う必要があります
役に立つ操作について話しましょう
[拍手]
みなさん、こんにちは私の名前はテスラボットのエリックロボティクスエンジニアです。話したい
ロボットが現実の世界で物事を操作する方法について私たちはオブジェクトを操作したいと思っていました
できるだけ自然に見え、すぐにそこに着くので、私たちがやったことは
このプロセスを2つのステップに分けています。
それらをデモンストレーションと呼んでから、これらのモーション参照をオンラインで現在の現実世界の状況に適合させました
それで、私たちはオブジェクトを拾うという人間のデモを持っているとしましょう。
手の場所を表すキーフレームの束としてここで視覚化されたデモンストレーション
肘を胴体を使用して、逆運動学を使用してそれをロボットにマッピングできます。
これらの多くは今、私たちは一緒に作業できるライブラリがありますが、単一のデモはそうではありません
現実世界に広がる変化、例えば、これは非常に特殊な箱にしか適用されません
場所があったのでもう一つ作りました
トラック・オプティマイザ、手がどこにあるべきかを解決するロボットのバランス
動作を現実世界に適応させる必要がある場合、例えば
ボックスがこの位置にある場合、最適化器は作成されます
次はミラノで話し合います
オプティマス次はどうするラリー
はい、だから私たちが過去数ヶ月間に何をしてきたのかをよく知ってほしいです。
ええ、私たちはいくつかの役に立つことを始めましたが、遠くて役に立たない--まだ長い道のりがあります
私たちの前では、うん、次の数週間での最初のことは、少なくともオプティマスを得ることだと思う
Bumble Cと同様に、あなたが以前見た別のバグプロトタイプ、Beyondもあるかもしれませんが、私たちも始めます
私たちの工場の実際の使用例に焦点を当て、本当にこの問題を解決しようとしましたが、私はすべてを使い切ってしまいました
前述の現実世界におけるこの製品の導入に必要な要素
うん、室内ナビゲーションは管理やサービスのすべての人にとって優雅であることを知っています。
製品の規模を拡大するために必要なコンポーネントですが、私はあなたの状況を知りませんでしたが、その後
今夜のショーを見て、私たちは次の数ヶ月か数年以内に完成できると確信しています。私は
この製品が現実になり、経済全体を変えたので、Optimusチーム全体に感謝します
この数ヶ月の仕事はとても不思議だと思います。これはわずか6、8ヶ月で完成しました。ありがとうございました。
非常に[拍手]
ありがとうございました
やあ、私はアショーク、私はミラノと一緒に自動運転チームを指導して、神様、それを超えるのは難しいです
オプティマスの部分は彼がどうしてもやってみる
ええ、ここ数年で製造されたテスラはすべてあると思います
自動車を自動運転させるハードウェア私たちはソフトウェアを開発してきました
昨年の今頃、私たちはますます高い自主権を増やしました
その時から、約2000台の車が私たちのFSDテスト版ソフトウェアを運転していました
ソフトウェアのロバスト性と機能を向上させ、これまでに16万人のお客様に提供してきました
はい[拍手]
これは無料ではありません。エンジニアリングチームの過去1年間の汗と血から来ています。
例えば昨年は75000のニューラルネットワークモデルを訓練しました
8分ごとにモデルが出てきて、チームから出てきて、それを評価します
クラスタ、そして私たちは281モデルの本当に自動車の性能を高める車種を発売します
この革新的な空間はスタック全体で計画ソフトウェアが発生している
インフラストラクチャ・ツールは雇用さえすべて進歩している
FSGテスト版ソフトウェアは、ナビゲーションできるはずの車を完全に運転することができます
駐車場から駐車場への疾病管理・予防センターへの信号と駐車標識駐車
交差点を曲がる際の物体との交渉など
これらはすべて、私たちが車で動作するニューラルネットワークを介したカメラの流れに由来しています
サーバや自動車上で動作しているものには戻らず、世界モデルを形成するすべての出力を生成します。
自動車の周りでは、計画ソフトウェアはこれに基づいて自動車を駆動する
今日は、システムを構成する多くのコンポーネント、つまりネットワークの占有を基礎として議論します
システムの幾何学的レイヤーこれはマルチカメラ映像神経です
画像から全世界の物理占有率を予測するネットワーク
ロボット、だから物理的に存在するもの、木の壁、建物、自動車の壁、何
あなたは知っていますか?それが具体的に存在するかどうかを予測して、それはそれらとそれらの未来の運動を予測しています
幾何学的な基礎の上に、私たちはより多くの意味層を持っています。
道路をナビゲートするにはもちろんレンズが必要ですが、道路にはたくさんの
さまざまなチャネルがあり、さまざまな方法で接続されているため、一般的なコンピュータでは非常に難しい問題です
平面集合とその連結性を予測する視覚技術により、言語に深く入り込むことができます
テクノロジー、そしてコンピュータビジョンだけでなく他の分野から最新のテクノロジーを取り入れてこのタスクを遂行します
車両には、それらを制御するために完全な運動状態が必要です
これらはすべてニューラルネットワークのビデオストリームから直接ネットワークに流れ込んで多くの
処理して、完全な運動状態、位置決め速度、加速度、これらすべてを出力します。
ネットから直接出てきて、最小限の後処理しか必要ありません。これは私にとって本当に面白いです。なぜなら、
これは私たちがどのような世界に住んでいるのかさえも考えられます。これらのネットワークは第4位を予測しています
これらの物体を検出することさえできないと考えられている場合、これらの位置の導関数
無料ではありませんが、大量のデータが必要なので、複雑な自動タグがあります
元のセンサデータでスキャンするシステムは、
サーバが高価なニューラルネットワークを実行するためには、情報をタグに抽出するために数時間かかることがあります。
その上で、私たちのシミュレーションシステムを使って統合します
画像を作成します。これはシミュレーションなので、通常はすべてのラベルが付いています
これらはすべて潤滑性の良いデータエンジン配管を通っています
いくつかのデータを使ってベースラインモデルを訓練し、それを車に運び、故障が何であるかを見てみましょう。一旦故障が分かったら
艦隊を掘削し、適切なラベルを提供できないことを特定し、訓練セットにデータを追加しました
このプロセスは問題を系統的に解決し、私たちは車で実行するすべてのタスクに対してこのようにしました
はい、これらの新しい大規模なニューラルネットワークを訓練するために、今年は訓練インフラを約
40%から50%ですので、今日は複数の
米国でクラスタを訓練し、人工知能コンパイラも開発した
これらのニューラルネットワークに必要な新しい動作をサポートし、最良の底辺にマッピングします
ハードウェアリソースと私たちの今日の推理エンジンを配布することができます
船上の2つの独立系の単一ニューラルネットワークは、本質的には2つの相互接続された独立したコンピュータである
シンプルな自動運転コンピュータでは、これを実現するためにエンドツーエンドを厳格に制御する必要があります
この新しいシステムの遅延により、FSDプラットフォーム全体により高度なスケジューリングコードを導入しました
これらのすべての車の中で動作するニューラルネットワークがベクトル空間を生成し、これも
ロボットや車の周りの世界、そして計画システムをその上で実行し、軌跡を得る
モデルベースの最適化された組み合わせを使用して、衝突を回避したり目的地にスムーズに到達したりする
さらに、迅速な最適化に役立つニューラルネットワーク
今日、私たちは本当にこれらの分野のすべての進展を紹介することができて嬉しいです。私たちにはエンジニアリングリーダーが待機しています
これらの異なるブロックとこれらの動力を説明してください。自動車だけでなく、同じ部品もオプティマス上で動作しています。
ミラノで以前展示されていたロボットについて、私はチームが計画部分の議論を始めることを歓迎します
こんにちは、parel jointです。このクロスシーンを使ってみましょう
この交差点に近づくために自動運転機で計画と意思決定を行う方法を直接探究します
小さな通りで、私たちが入る前に
交差点の反対側の歩行者は横断することにした
横断歩道を使わずにこの歩行者に対して右から車にまで譲る必要があります
歩行者と交差点の反対側の車両との関係も理解しています
私たちが素早く解決する必要があるオブジェクト内の依存関係の多くが
人間は本当に得意だということです場面を見てみるとあらゆる相互作用が最も評価されると
有望なものとして、一般に合理的なものを選択する
これらの相互作用のいくつかを見てみましょう自動操縦システムがこれを前にして
側面のプロファイルで非常に攻撃的な発射をする歩行者は明らかに私たちは、
歩行者と私たちは、ペデストリアンと彼の可愛いペットを、ゆっくりと前進させることができただろう
歩行者歩行者と車との間の隔たりのために私たちは車のジャークになり
右側からのものですが、これが使用可能な安全な相互作用のみである場合には、この対話を拒否するべきではありません
最後に、私たちは、最初はゆっくりと時間を見つけることを選択することを選択した
すべてのエージェントがパスした後で、操作を終了し、終了します。
これらの相互作用のすべてを評価することは特にモデリングに関心を持っているときには些細なこと
他の薬剤に対するより高い導関性 ( 例えば、縦方向のものなど )
純粋に衝突チェックに頼るときに、右からの車が要求する車が必要とするジャーク
モジュール式の予測は、有効な相互作用の多くを見逃すことになるため、これまでに得られるものだけです。
これは基本的に、エゴの軌道上でのマルチエージェント・ジョイントの軌道計画問題を解決するために基本的に低下する。
他のすべてのエージェントはどれだけの速さでどれだけの速さで最適化できるか
この最適化問題を実行すると、多くのインクリメンタル近似が発生した後でも、 10 ミリ秒の順序で閉じられます。
現在では、典型的な混雑する予測不能な左には、それぞれ 20 個を超えるオブジェクトが
複数の異なる将来モードを持つオブジェクトの場合、関連する対話の組み合わせの数が増加します
プランナーは 50 ミリ秒ごとに決断を下す必要がありますこれをリアルタイムで解決するためには
相互作用探索と呼ばれるフレームワークに依存していますこれは基本的には並列化された研究の集まりです
ここでの州間の移動は、キネマティックのエゴの運動的状態に対応する
他のエージェントの状態 ( 名目上の将来の複数のマルチモーダル予測と、シーン内のすべての静的エンティティー )
行動空間は物事が面白いということで、私たちは一組の機動的な軌道を使う
多数の間分の決定について分岐する候補者と、より長い間のインクリメンタル目標について
ホライズン・マニューバ、ウォーク・スルー・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク
私たちは、これらが表現されるものとして、視界を移動することによって、次のようなビジョン測定
これを使用してゴールのセットを作成するだけでなく、潜在的な機能と同様に、スパースの抽出
以下に対応するレーン・ネットワークまたは非構造化領域からの再度のレーンの候補
私たちがこれらの金の束を持っていると、人間のデモに由来する確率マスク
私たちは、古典的な最適化のアプローチとともに、私たちの方法を組み合わせることによって、シードの軌道を作る
ネットワーク・プランナーは、顧客フィードからのデータを再トレーニングしてから、これらの無料のデータを取得します。
私たちはこれらの軌道を利用して、最も重要な相互作用を発見する相互作用の分岐を開始します。
私たちの場合、これは、私たちがそれの前で主張するか、またはそれに屈するかどうかという、歩行者に対する相互作用であると考えられる
当然左側の選択肢は高率の選択肢で、優先順位を付けない可能性が高いため、当社支店をさらに追加することができます
この最適化を実現するためのより複雑な相互作用をより多くの複雑な相互作用をもたらすという選択肢があります
問題は徐々に多くの制約を伴うもので、その研究はより多くの相互作用分岐への分岐を維持する
より多くの目標はこのノードのそれぞれの評価においてうそをつく
それぞれのノードの内部での研究が始まったのは
私のような制約が段階的に追加されるという古典的な最適化手法を用いた軌道
これはかなり良いものだとしても 1 回につき 1 ~ 5 ミリ秒で 1 ~ 5 ミリ秒近くかかるでしょう
100 を超える対話を評価しない場合、これはスケールしません。
そこで私たちは軽量の照会可能なネットワークを構築しプランナーのループで走らせることができました
これらのネットワークは、フリートからの人間のデモンストレーションで訓練され、リラックスした時間制限を持つオフラインのソルバーと
これを使ってランダウン・ランタイムを 1 つのアクションにつき 200 マイクロ秒まで下げることができました
これだけでは十分ではありません今でも十分な研究が必要なので十分ではないのです
検索スペースを効率的に整理する必要があります。そのためには、各項目のスコアを設定するために、
これらの軌跡のいくつかはかなり標準的なものですが衝突チェックの束をたくさんすることでジャークというものを分析します
顧客のフリート・データが、ここでも重要な役割を果たすために、実際に必要とされるものが必要です。
私たちは 2 セットの軽量の変量ネットワークを運営していますこれらのネットワークの 2 つのセットを
FST のベータフリートからの介入で、結果として得られるものとしてのスコアを提供する
次の数秒の間に介入し、 2 番目は人間の行動に起因する人間のデータを提供することに依存している
人間の推進された軌道に与えられた選択された行動がどの程度近くにあるかについての得点
得点は、相互作用をさらに分岐させ、計算を集中させ続けるために、探索空間を整理するのに役立つ
最も有望な結果は、これについての冷静な部分である
アーキテクチャーとは、お客様がお客様が提供するデータ・ドリブン・アプローチの間にクールな混合を
多くの手で設計されたコストに依存する必要はなく現実に物理学に基づく検査でそれを基盤にしているのです
私が説明したことの多くは現場で観察できるものと同じものでした
フレームワークは、 8 つのカメラからのビデオ・フィードを使用する、その背後にあるオブジェクトに拡張する
世界の 3D 占有率を生成するために、ここにある青色のマスクは
可視性領域は基本的に最初にブロックされるという
あなたがこの可視性マスクを消費するシーンではゴースト・オブジェクトと呼ばれるものを生成します
産卵地域をモデル化しこの幽霊の状態遷移をモデル化した場合には上に見える
制御応答を調整している場合には , オブジェクトが正しく
その存在の可能性の関数はとても良い人間のような行動を引き出すことができます
これらの占有ネットワークをどう生成するかについて詳しく説明するためにこれを記入しておきます
私の名前はフィル・フィル私が過去 1 年間に構築した占有ネットワークの詳細を共有します
このネットワークは私たちの車の周囲の 3D で物理的な作業をモデル化するための解決策です現在は
お客様が視覚化しています。ここでご覧になるのは、社内開発ツールの道路ネットワーク出力です
稼働中のネットワークは 80 台のカメラのビデオ・ストリームを入力として単一の統一されたボリュームを生成します
私たちの車の周りのすべての 3D ロケーションに対して、ベクトル空間に直接占有すること
ビデオの接触があることから、その場所が多く占有されている確率を予測する
瞬時に眼中にある障害物を予測することができる
それぞれの場所ごとに、カーブ・カー・歩行者などの一連のセマンティクスが生成されます。
ここに色分けされている色の低いデブリス
モデルが一般化されたネットワークであるため、占有フローも動作に対して予測される
静的オブジェクトと動的オブジェクトが明示的に生成されることを示すことはありません。
ここにスイング・トレーナーのようなランダムな動きをモデル化する
このネットワークは現在、すべてのテスト環境で FSD コンピューターを使用して実行されています。
私たちの神経加速器を使って 10 ミリ秒ごとに非常に効率的な実行を
このようにして、各カメラ画像を最初に再認証するアーキテクチャを見てみましょう。
カメラの校正と画像が表示されたのはネットワークに与えられたもので
典型的な 8 ビットの RGB イメージです一番上にある画像から分かるように
12 ビットの生の写真の画像をネットワークに提供することで 4 つの
より多くの情報を、 16 倍のダイナミックな範囲に加え、削減された
アドビの ISP が間違っていないため、レイテンシはもう一組のレコードを持っていて、
FPS をバックボーンとして画像スペースの機能を抽出し、次の 3D 位置を構成します。
キーおよび値がアテンション・モジュールに適合するように、 IMG スペース・フィーチャーを使用して照会する
アテンション・モジュールの出力は、高次元の空間処理機能です。
これらの特殊機能は、一時的に車両のオードメトリーを使用
この空間的時間的特徴の最後の動きを引き出す
最終的な占有率と占有率のフロー出力を生成する D 畳み込みのセットを通して
それらは固定サイズのボクサー・グレーとして形成されており、制御上の計画に十分なほど正確ではない
高解像度を得るためには、 1 ボクセルのフィーチャーマップにも生成します。このマップは、 3D 空間で MLP にフィードされます。
任意の位置に位置と意味を取得するための照会をポイントします
このモデルをよく知ってから別の例を見てみましょう右側には関節バスがあります
バスの出発点として、ここでは L 字形のボクサーとして強調されている
まず、カートの前面を青で回転させて、前頭型バスがゼロを持つと予測されるモデルを青で示します
占有率フローと s-バスが、バス全体を青に移動させる
そしてネットワークがバスの正確な曲率を予測していることも分かります
これは従来のオブジェクト検出ネットワークにとって非常に複雑な問題です私がこの問題を
1 つのキュボイドを使用するか、曲率に適合するためには 2 つを使用するが、占有ネットワーク
私たちが気にしているのは目に見える空間の中の占有物なので正確に曲率をモデル化することができます
ボクセルのグレードの他に、占有ネットワークはドライブリの表面を作る
乾燥した表面には、 3D 幾何学と意味構造の両方があるが、それらは特に治癒においてコントロールが非常に有用である
曲がらみのある道路が曲面を曲がらり、ボクセル・グレーはその代わりに独立している
ボクセルのグリッドは実際にはここで暗示されていますヒーローのクエストにあります
予測されている表面の 3D 形状を見ることができます
プランナーは、この情報を使用して、ヒルクレストのためにさらにスローダウンする必要があるかどうかを判断することができます。また、
ボクセルの等級が表面で一貫して君臨していることを見る
Box のソースと表面に加えて私たちも最近のニューラル・レディング・フィールドでの突破口に興奮しています
私たちは両方とも光の色の特徴を取り入れています
ネットワーク・トレーニング、および Nerf の入力状態としてのネットワーク出力を使用することによる
アショクは非常に興奮していますこのことが彼の個人的な週末のプロジェクトとしての彼の
これらの神経を基にしています私はアカデミアがこれらの神経を
ファウンデーションは、言語のための大容量データ・セットのように、言語のためのモデルを開発しますが、視覚神経
コンピュータ・ビジョンの基盤モデルを提供することになりますなぜならそれらは幾何学や幾何学に基づいて
これらのネットワークを監視し、オントロジーを定義するための要件の凍結を提供します。
これらの画像を区別するために監督は自由ということになります未来のことを考えると
画像が入ってくるということを知っているということでネットワークが一貫性を生み出し
私が観察したすべての像に対して異なる表現になる場面の容積表現
個人的には未来のコンピュータ・ビジョンの未来だと思いますが今は私たちが初期の作業をしているのは分かっていますが
テスラそしてアカデミアでの未来について考えてみましょう
1 つのシュトツ予測というのは容積率の大きさの組み合わせです
私の個人的な賭けによる性的賭けですこれは初期の結果の
3 次元のデータから 3D レコンストラクションを提供する代わりに、画像空間における RGB の完全再投影に焦点を当てます。
1 次目標は、警告 3D スペースを正確に表現することで、これをすべての目的に対して実行したいと考えています。
あらゆる天候や照明の環境における世界のデータを無料で提供することができます
問題を解決するために皆さんを探していますそして最終的には占有ネットワークが訓練され
大きな自動レベルのデータセットを持っている人がいない状態で私はティムに話をします
このネットワークを訓練するために必要なのはフィル
[ 拍手 ] 誰もがトレーニングの話をします
2 つのビデオを見てきました 4 つか 5 つのビデオをご覧になっています
より多くのクリップスについてもっと心配したいと思っています
フィルだけの占有するネットワークが動画を撮るだけで 14 億人
ネットワークを訓練するためのフレームがありますもしあなたが見たものをネットワークに 1 万本持っていたら 1 時間はかかるでしょう
もし 1 つの GPU があるとしてもそうでない GPU が 1 万時間かかると
訓練の仕事が正しい速さで走るのを待つことができる人間の時間というのは
平行線に行く必要があるということですこれにはもっと計算が必要なので
スーパーコンピュータを構成するスーパーコンピュータを 3 つのスーパーコンピュータを作り
14000 gpus のうち、 10 000 gpus を訓練用に使用し、約 4 千個を使用します。
これらのビデオの自動ラベル付けのための gpus は、分散管理されたビデオの 30 ペタバイトに保存されている
お客様のデータ・セットを、お客様の考え方と同様に、固定されたものとして考えるべきではない
100 万フレームの画像を使っていると想像してみてください非常に流動的なものとして考えなければなりません
これらのクラスターを 1 日ごとに 50 万以上のビデオが集まり
これらのビデオピソンビデオのインスタンスを毎秒 400 万個追跡しています
これは私たちが捉える必要があるということです保存政策を支配するためには
分散されたビデオ・キャッシュは、これらすべてが膨大な量のインフルなものであり、これらはすべて、私たちが構築して管理する
家では 40 000 を買えるだけではない
あと 30 ペタバイトのフラッシュ mvme をつなぎ合わせ、それを一緒にするだけで、実際には実際には多くのことを実行する
仕事をしたいと思いますが実際には皆さんが実際にやりたいことは
GPU や Dojo になるかもしれませんこれは後でお話ししますが
システムのすべての部分に障害を発生させたいということを意味します。
この加速器をアウトパフォームする必要がありますこれは非常に複雑なので
お客様のストレージが、すべてのデータをノードに配信するために必要なサイズと帯域幅を確保する必要があることを意味します。
これらのノードは、機械学習にフィードするための CPU とメモリーの適切な量を必要とする必要があります
この機械学習フレームワークは GPU に引き渡す必要がありますそしてトレーニングを始めますが
信頼できる方法で数百または数千の GPU を使用する必要があります
logstap という方法で高速で接続する必要があります相互接続が非常に複雑になることもありますが
2 番目の点で道場についてお話したいと思います
私たちがクラスターで行った最適化は多くのビデオを利用して
ビデオはとても似ています映像やテキストについてのトレーニングとは全く違いますビデオはとてもよく確立されていると思います
文字通りより複雑なものになりますそれが私たちが終わらせる必要がある理由です
ストレージ層を加速して加速度を最適化することができますなぜなら光子の数を訓練しているからです
私たちのフリートから直接来ているビデオでは、私たちが直接列車を乗せるようなビデオは、全く投稿していない
私たちが選択した枠の中にあるものを探しているものを
彼らが依存しているフレームは iFrame やキーフレームで共有され共有されるものにします
メモリは GPU からのダブルバーへと移動し、ハードウェアのデコーダを使用するだけで、
実際に GPU 上でビデオを解読していますこれは非常に良いニシキのニシキのピートンピトルクの拡張です
稼働中のネットワークのために 30 以上のトレーニング速度を向上させ、基本的に全体を解放しました。
他のことをするために CPU を使っているだけですただ単にトレーニングだけでは
もちろん皆さんにはある種の地上の真実が必要ですそれは興味深い問題ですが
あなたの地上の真実を保管する目的はあなたが必要な地上の真実に到達したいということです
最適化のために最適化するために必要とする最小限のファイル・システム操作と最小サイズのロード
内部的に修正された 1 つの大きな装置として計算クラスターが表示される必要があるため、クラスター間のスループット
制約およびしきい値を設定することで、
私たちが使っているのは私たちが使っているものです私たちはこのことを私たちの根拠としている特徴キャッシュと推論出力を
たくさんのテンソルがそこにありますここにあるマンガだけがあなたのテーブルです
お店をお店にしたいと思います。ディスク上でロールアウトしたときには、何かをお使いになることを
例えばビデオタイム・スタンプのように、ヘッダ内にこれらすべてを入れ、最初のヘッダでインデックス付けします。
ディスク上のどこに行くかを正確にお読みになりますもしテンソルがあれば
異なる寸法を最後に連続した寸法として配置するための寸法で、異なるタイプのものも試行
これを圧縮して最も最適のものをチェックしますこれが実際には大きな一歩であるということです
機械学習ネットワークからの無知の出力を、以下の周囲に回転させる機能を提供
私たちが保管するときにはストレージの効率を最大 20 度まで向上させることができます
列をサイズ順に並べ、すべての小さい列と小さな値が一緒になっているようにするために、
1 つの値がオーバーラップする可能性があります。これらの値は、後で使用する必要がないように、後で使用するために使用します。
別のファイル・システム操作を行って私がオンになっていることもあります
2 つのプロジェクトに触れました内部ではこれは非常に大きな持続的な取り組みの一部なのです
これらの最適化を通じて蓄積し集約することができるようになりました
2 倍の速さで占有するネットワークを占有するネットワークを増やすことができるようになっています。計算や移動を増やすと
数日ではなく数時間でこれを訓練することはできませんそれを手にしたいと思います
ジョンを計算する最大のユーザーは
私の名前はジョン・エモンズ、オートピロ・ビジョンのチームをリードします。 2 つのトピックをお話します
第一にレーンを予測する方法と 2 番目の方法は道路上の他のエージェントの将来の行動を予測する方法です
自動操縦の初期段階で、車線検出問題をイメージ空間の瞬時セグメンテーションの課題としてモデル化した
私たちのネットワークは非常にシンプルでしたがほんの数種類の種類の車体を印刷することができるだけでした
幾何学図形は、隣接してセグメント化できるイーグル・レーンを具体的に区分する。
レーンとそれにはフォークのための特別なケーシングがあり、この問題の単純化モデル化を
ハイウェイのような高度に構造化された道路で働いていましたが今日私たちはシステムを構築しようと
より複雑な操作をすることができます。具体的には、交点で左右に曲折をしたいと考えています。
この単純化されたモデル化を適用しようとすると道路の位相がかなり複雑で多様化することがあります
ここで問題が起こるのはほんの一瞬一瞬のことで
私たちがやろうとしているのは自分たちのコネクティビティーにおけるラメのスパークのセットを予測することです
このグラフを予測するニューラル・ネットワークは、ノードがレーン・セグメントで、エッジがエンコードされている
これらのレーン間の接続を利用して、レーンを検出することができます。
ニューラルネットワークは 3 つの構成要素で構成されています 1 つ目の構成要素には
8 つのビデオ・ストリームをエンコードする、畳み込み層の注目層と他のニューラル・ネットワーク層
車両のカメラで、豊かな視覚表現を作り出す
そしてこのデジタル表現をコード化されたロードマップと共に拡張します私たちがコード化したデータを
私たちがレーン・ガイダンス・モジュールと呼ぶ、追加のニューラル・ネットワーク層の集合。このマップは HD マップではなく、
様々な道路の車線カウント、およびその他の属性のセットを交差するレーンのトポロジーに関する有用なヒントを提供しています。
ここで最初の 2 つのコンポーネントを作るのに役立つ
世界をエンコードする高密度テンソルだが、私たちが本当にしたいのは、この高密度テンソルを
それらのコネクティビティーでのレーンのスマート・セットは、イメージのような問題にアプローチします
入力が高密度テンソルで、出力テキストが特別な言語になると予測される場合の位置決めタスク
私たちはテスラのコネクティビティでランネスをエンコーディングするために開発しました言葉と言葉を
トークンは、トークンの中のトークン接頭部修飾子の Ordering における、 3D スペース内のレーン位置です。
タスクを言語としてモデリングすることにより、これらのレーン間の結合関係をエンコードします。
問題は、最近の自己回帰的なアーキテクチャーと、複数のものを処理するための言語コミュニティからの技術を活用することができる
私たちがコンピュータのビジョンの問題を解決するだけでなく私たちが最先端のものを適用していることが問題の変調性にもなります
言語モデリングと機械学習はより一般的に私はこの言語構成要素をより詳しく説明することにします
画面に描かれているのは衛星画像ですこれは地域の面積を表しています
先端の先端を車で車線グラフと呼んでいます最終的にはこの神経をどうするかということです
まず最初に私たちの最初のものを作りたいと思います
この緑のドットでは、この緑のドットの位置は次のようにエンコードされます。
今、このインデックスを直接予測することはないということを 3D 世界によるコースグリッドへのインデックス
あまりにも計算コストがかかりすぎるので格子ポイントが多すぎてカテゴリー型を予測することができないからです
これに対する配布は両方ともトレーニング時間とテスト時間に影響を与えるのではなく私たちがすることは
世界は、まず、可能な場所について熱マップを予測し、次に、最も可能性の高い場所でラッチを掛けます。
これを基に予測を洗練し、正確な点を得ることができる
私たちはこのトークンの位置がどこにあるか分かりませんがこの事件では新しいタイプを知りませんが
レーンは開始トークンとしてアプローチします。これは、スター・トークンが存在しないためです。
私たちの言語の付加的な属性を最初のフォワードパスから予測しそれらをエンコードし
一緒に組み合わされたテンソルのセットを生成する、学習された追加埋め込みを使用すること
これは私たちのランゲージの言語の最初の言葉ですここでの文章の中でまず最初に
次に、次のレイン点を同様の方法で印刷することで、このプロセスを続行する
このレーンのポイントは新しいレーンの始まりではなく以前のレーンの継続ということです
これは継続的なトークンタイプではありませんが
このレーンは前に保護された平面に接続されています。これは、私たちが行う正確な形状を
一連のスプライン係数を取り戻し、このレーンをコード化します。
そしてそれを次の単語として追加しますこれらの継続レーンを予測し続けると、
予測グリッドの終わりには別のレーン・セグメントに移動しますが現在ではシアン・ドットが表示されます
それはそのピンクの点とは関係がありません実際にそれをフォークしているのは青のことだと
フォーク・タイプとフォーク・トークンがあることを示しています
実際に、 fork がユーザーの元になる以前のトークンをポイントします。
フォークポイントの予測値が実際には索引ゼロなので、実際には予想されていたようなトークンを元に戻すことができます
私たちは繰り返しこのプロセスを継続しています
「 Ling 」グラフでトークンをトークン化した後、ネットワークは文トークンの終わりを予測します。
私たちがこれを行う理由は単に複雑なものを作りたいからという理由だけではないということです
これはニューラルネットワークのような完全なマシンを開発するという感じですが
道路に沿ってレーンをセグメント化しようとしていますが、例えば、道路に沿ってレーンをセグメント化しようとしていますが、
はっきりしているのは、道路がはっきり見えず、 2 車線または 3 車線があり、あなたが言うことができないということ
単純なセグメンテーション・ベースのアプローチでは、両方とも 2.5 レーンの状態とその両方を描画するだけです。
後処理アルゴリズムは、そのような予測があるときには、すぐに失敗するだろう、そのような問題は、私の言う意味では終わらない
これらの結合性のある状態を交差点の中で予測する必要がありますこれは近道ではあり得ないということです
このセグメンテーションのような同じようなオーバーラップにアップグレードしなければならなかったのはハイワイヤーのようなものだということですがそれを改善しようとすると
これらを別々の層に配置するのは本当に難しい問題に過ぎません言語が現代的なものを得るためにとても良い枠組みを提供するのは
後処理でこれをすべて実行しようとすることを知っているのではないかということを知っているのではなく、事後のサンプル
しかしこれは自動操縦のためのものではありません私が思うにこれはオプティマスのために使うことができます
これを「レーン」と呼んでいますがここではご存知の方はご存知かもしれませんがエンコーディングの可能性を知っているかもしれません
工場の中や家の中にいる人たちが歩いているとか
ロボットに頼みましょうキッチンに話をさせてください工場のどこかの場所に
そして一連のパスウェイズを予測しますこの通路を通るとロボットがロボットを利用して
どうやってキッチンに行くかということですナビゲーションの問題を単純化するための素晴らしいフレームワークを提供するだけで
下流のプランナーはすべて正しいので最終的には
このレーン検出ネットワークは、ネットワークから直接接続されるコネクティビティーのレーンのセットです。
ここでの追加のステップはこれまでのところ単純化していませんが、密度の高い予測を分散したものとして
これは、ネットワークの直接的なフィルターに掛けられた出力の出力です。
私はレーンについて少しお話しました私たちの未来の経路をどうモデル化し予測するかということです
オブジェクトに関する他の意味論を 2 つの例を通して簡単に説明することができます
ここには車があります赤い光を走らせて私たちの手の前を向き
このような状況は、私たちが使用できるすべてのオブジェクトについて、 Horizon の短時間の軌道の将来を予測することです。
これらは、ここで危険な状況を予測し、衝突を避けるためにブレーキングやステアリング操作が必要であることを適用する必要があります
右側のビデオでは左側の車線の前に 2 台の車が駐車しています左車線の 1 つは
荷降ろしされているのでドライバーがなぜそこに駐車したのか分からないが重要なのは私たちの神経ネットワークが停止したと予言していたことです
これは赤い色です他の車線には静止していますがそれは静止していても
明らかに赤信号が緑に変わるのを待つだけです両方の物体が静止していても速度がゼロであってもそれが意味論として
ここで重要なのは、私たちが、目の前にある駐車した車の後ろに閉じ込められることがないように
これらのエージェント属性のすべてを予測すると、リアルタイム・システムを構築しようとするときに、いくつかの
私たちは、自動操縦が変化する環境にすぐに反応できるようにするために、私たちは目的のセクションスタックのフレーム率を最大化する必要がある
神経ネットワークが 2 つの段階に分割される推論レイテンシを最小化するためにミリ秒ごとにここで重要なのは
最初の段階では、エージェントが存在する場所を 3D スペースで識別しました。
2 段階目では、 3D の位置にあるセンサーを引っ張り、それを追加データで追加します。
することができます。その後、この仕様ステップで処理を行うことができます。
ニューラルネットワークでは、最も重要な領域に計算を集中させることで、待ち時間の一部に対して優れたパフォーマンスを提供します
それをすべてのオートピロット・ビジョン・スタックは、単に幾何学やキネマティクスだけを予測します。
世界は安全で人間的な運転を可能にする豊富なセマンティクスを予測しています
私たちが FSD のコンピュータ上でクールなニューラルネットワークをどうやって走らせているかを伝えることはできません
[ 拍手]
今日は私が SRI ですがこの FSC ネットワークを動かせるために必要なことを
私たちは今日の推定待ち時間のために最適化することができます
ジョンが話していた FSG レーン・ネットワーク
このトラックを始めたときこの FSC レーンネットワークを移動エンジン上でネイティブに実行できるかどうかを知りたいと思いました
FSD コンピュータで構築した社内のニューラルネットワークアクセラレータは
このハードウェアを組み立てる際にはシンプルでそれができることを確認しました
途方もなく高速なドット製品があるが、この建築は自動車である
回帰的で反復する場合に、内部ループ内の複数のアテンション・アテンション・ブロックを突き抜けています。
スパース・ポイントを直接的に生成することで、ここでの課題は、
高密度の点のある製品エンジンについての解析ポイント予測とスパースの計算を行うことで
移動のためにネットワークがヒート・マップを予測するように
現時点で最も可能性のある空間の位置は Arc Max と 1 の空間を
空間位置のインデックスの 1 つのハードエンコードを行う心臓操作
ここでは、この索引に関連付けられた埋め込み表から、この索引に関連付けられた埋め込みを選択する必要があります。
SRAM で検索テーブルを作りましたそして私たちは SRAM で検索テーブルを作りました
ちょうど行列の乗法でこのすべてのものを達成できるような、この埋め込みの次元は
この埋め込みをトークンキャッシュに格納したいというだけでなく
反復ごとに再計算するのではなく、将来のポイント予測のために再利用することで再計算する必要があります
これら全ての操作をドット・プロダクト・エンジンに対して行ったところでのトリックです私たちのチームが
これらのすべての操作を方法で旅行エンジンにマップする創造的な方法を見つけた
このハードウェアが設計されたときには想像もできなかったものですが
このモデルを作るために多くのオペレーションと機能を実装しています
パフォーマンスを最適化するだけでなく、受理の正確性を向上させることができる
これらの全てが 10 歳以下の 7500 万のパラメータモデルを実行するのに役立ちました
たった 8 ワットの電力を消費する待ち時間のミリ秒
しかしこれはこの車の中で唯一の建築物ではありません他の多くの建築モジュールやネットワークが
車の中でネットワークの規模を拡大する必要があります全てのネットワークの 10 億個のパラメータが
1000 個のニューラルネットワーク信号を結合させることで確実に
私たちは共同でそれらを最適化し計算を最大化し
使用率のスループットおよび待ち時間の最小化を最小限に抑えるためにコンパイラを構築する
構造を従来のコンパイラに共有するネットワークが巨大化し
150k ノードと 375k の接続を持つニューラル・ネッツのグラフは
それらを独立したサブグラフに分割し、それらのそれぞれをコンパル化
推論デバイスのためにネイティブにサブグラフをすると、ニューラル・ネットワークがある
このリンク時間最適化を実行する従来のリンカーに構造を共有するリンカー
計算メモリとメモリを使ってオフラインの最適化問題を解決することができます
帯域幅の制約が、車内で実行される最適化されたスケジュールによって提供されるようにする
実行時にハイブリッドスケジューリングシステムを設計しましたこれは基本的に
これらのネットワークをモデルに実行するために、 1 つの SOC および分散スケジューリングでの 1 つの SOC と分散スケジューリングでの異
計算の使用効率を 100 滴にするための並行して、あらゆるものを最適化する必要があります
ネットワーク・アーキテクチャーをすべてコンパイラーがチューニングすることによる、ソフトウェアのレイヤー
低遅延の高帯域幅 RDMA リンクを srcs をまたいで実装し、実際にはさらに深い帯域幅を実現する方法
加速器のキャッシュコヒーレントと非一貫性のないデータ・パスを理解し、最適化することは、
全てのレベルで最適化を行うことで最大フレーム率やミリ秒単位毎に最適化を
ここではこれがこれだけです
車内で動いているニューラルネットワークを可視化することができますこれは私たちのデジタル・ブレーンです
これらの操作は全くのものではないが、車内で実行されているいくつかの実際の操作を名称に掛けるのには
このネットワークを 10 億個のパラメーターによって訓練または訓練するためには大量のデータが必要とされます。
自動ラベル・パイプラインを使用してこれを実現する方法について
ありがとうシェリーありがとう
私はジュルゲン・チャンと私は自前で幾何学的なビジョンを率いています
オート・ラベリングについての話をしましょう
様々な種類のネットワークをサポートするためのあらゆる種類のラベリング・フレームワークがあります今日私は
正常に列車を編成し、一般化するために、すごいレーン網に焦点を当てます。
私たちが何千万回もの旅に出かけたと考えるネットワークは
おそらく 100 万の交差点であるかそれ以上に
どうやってそれを達成できるかということは十分達成可能であることは確かです
すでにティムの説明になっているので、 1 日に 500 000 回の現金が必要になるということで、私たちは旅行の量を
しかし、それらすべてのデータをトレーニング・フォームに変換することは、非常に難しい技術的な問題である
この課題を解決するために様々な方法のマニュアルを手にしました
1 番目の列から 2 番目の列までの 2 番目から 3 番目のものまで、約 100 倍の改善を提供しました
スループットは向上していますが私たちはより良いオート・ラベリングマシンを獲得しました
品質の高い多様性とスケーラビリティーを提供する
これらの要件を満たすために必要なのは膨大な量のエンジニアリング作業にもかかわらず
新秩序のラベリングマシンがマルチトリブの再構築によって 500 万時間分を交換できるようにする
10 000 回のラベリングのためのクラスターでのわずか 12 時間の手動ラベル付け
そこで私たちがどう解決したかというと最初のステップは高精度の軌道と構造の回復による
マルチカメラ・ビジュアル・インナーシャル・オドメトリー。ここでは、地上面を含むすべての機能がビデオから推測されます。
ニューラルネットワークによって追跡され、ベクトル空間に再構成される
車の軌跡の典型的なドリフト速度は 1.3 センチメートルになります
センチメートル当たり 0.45 ミリ・ラジアン毎メートルで、コンパクト計算機を考えるとかなりままである
リカバリー・サービスおよび未加工の詳細も、強さとして使用されます。
後の手動検証ステップのガイダンス ( これも FSD ごとに使用可能になります )
移動データとともに、前処理された軌道や構造を得るための車両
2 番目のステップはマルチタイプの再構築ですこれはこのマシンの大きな部分とコア部分です
ビデオは前に表示されたトリップがどのように再構成され位置合わせされているか
他の人が同じ車ではない他の人との他の交通手段を利用することでこれは複数の人が
コース整列合わせのペアごとの接合の最適化後に、さらに表面的な改良といったインターネット・ステップ
結局、人間の分析家がやってきて、ラベルをきめ細かく分析する
そのため、各ハッピー・ステップはクラスター上で既に完全に並列化されているため、
通常、プロセス全体では、ほんの数時間かかる
最後のステップは、実際には新しい旅行を自動ラベル付けすることです
ここでは、同じ複数の移動合わせエンジンを使用しますが、事前に構築された再構築と各新規配置の
それは、すべてのクリップを完全に再構成するよりもずっとシンプルであるため、
マニュアルの代わりに他のラベルに移動するのにかかる時間は 1 回につき 30 分
手動によるラベル付けの数時間、これはスケーラビリティーのキーでもあります。
この機械は、私たちがこの機械を使用している限り、この機械は
約 50 本の木が新たに注文されるように、計算やトリップのデータを
このシーンからラベルを貼られているものもありますここには 53 の異なる車があり
これが私たちが世界の宇宙空間を捉えて変革する方法なのです
私が注目したいのはネットワークの監視をどうするかということですが
私たちの車線にラベルを付けていますが、私たちは、プランナーや多くの仕事を行うほぼ全ての仕事に自動労働者を
物体やその他のキネマティクスなどの形状に関係する人のいないように、完全に自動的なものである
オート・フューチャーズはオート・ラベリングによるものばかりで、同じことは占有率にも当てはまります。
この周りに機械を作りましたもう一つのスライドをもう一つ戻すことができないように
それはクラスター上で並列化されているので、かなり簡単に聞こえるということですが、
こんなものが来るのは楽しいことではありませんしばらく前にこんなことがあるのは楽しいことではありません
自動ラベル付けが行われます。誰かがスクリプトを作成すると、作業が開始され、作業が開始されます。
ボリュームはかなり高いので明らかに解決策を必要としていますそこには他にも 2 人のエンジニアがいました
私たちのチームは興味をそそられています私たちがしなければならないことを知っているということは
基本的にはパイソンのような機能をしなければなりませんまず最初にクリップを引っ張ります
最終的にはネットワークの推論が別のネットワークの推論になりますがこれを実現するためには
大きさが大きいので、 1 日に 100 000 個のクリップを知っているか、 100 000 個のアイテムを知っているかをお知らせします。
それは良いことではありません技術者たちは少しのポストや少しの情報を知っています
肘のグリースをしています一方で私たちはもう少し後になって 20 人の
これらの機能のうち 100 万が 1 日ごとに 50 万倍ほどの
これらの機能の 1 トンをストリーミング・ファッションで走らせるということですそれは
トレーニングをするだけでなくオート・ラベリングも必要とされていますそれは実際にはトレーニングをすることで
ラベルを作成し、実動ラインのように、これに適用されるすべての同じコンセプトのような品質の在庫を生成します
ラベル・ファクトリーがあてはまれているのは車の工場が正しいということです
ええと、結構結構です
このセクションでは、ネットワークのために、いくつかの難題と興味深い例をいくつか共有したいと思います。
人間にとっては恐らく上からのものと同じくらいの例があります嘘や霧のような夜のようなものです
また、駐車している車による大いなる結論による結論と、雨の夜にも、カメラのレンズの上に雨が降っている。
これらは難題だが、一度元のシーンが他のクリップによって完全に再構成されると、それらのシーンはすべて
自動ラベル付けされているので、これらの難しいシナリオにより、カードがさらに良くなる
それでミディデイビッドにマイクを渡せ Sim がラベルの上に新しい世界を創り出していることをより詳しく知ることができます
あなた
私の名前はデビッドでシミュレーションについてお話ししますシミュレーションは重要な役割を果たす
ソースやラベルを付けるのが難しいデータを提供することはできないが、 3D シーンには気難しいほど遅い
模擬場面を私の後ろで演奏するのを例にとるために
サンフランシスコのマーケット・ストリートとの複雑な交差点には、次の 2 週間がかかります。
芸術家は完成し私たちのために私たちのために私たちは痛々しくゆっくりとした時間を使うこと
jaeganの自動化された地上の真実ラベル、いくつかのブランドの新しいツールがあります。これにより、これを手順的に生成できる
たった 5 分でこんな感じになりますこれは以前よりも数千倍も速く
自動化された地面を配管することによって始められるように、私たちのシーンの中に潜ることができる
ロード境界から始まるソフトウェア・フーディーニ内の模擬 World Creator ツールに対する真実ラベル
ラベルを使用して、実線のメッシュを生成し、レーン・グラフ・ラベルを使用してそれを再トポロジー化することで、重要な道路に情報を提供
クロスロード・スロープや詳細な素材の混合などの詳細
次に、直線データとスイープ形状をサーフェス上で使用し、それを道路に投影してレーン・ペイントを作成することができます。
中央の端を使用している次に、吐いたものを紡ぎす
アイランド幾何学によってランダム化された葉を取り込むことで場面の可視性を劇的に変化させます
現在では外の世界は一連のランダム化されたヒューリスティクスによりモジュラー・ビルディング・ジェネレータによって生成されることができる
無作為に配置された物を無作為に作成すると同時に視覚障害物を作ることができますが、
木は、それの下の葉を、細い線または縁の下に落とす
次に、地図データを持って、交通信号のようなものや、追跡することができる停止記号などの位置を知らせることができます
レーンの数のような重要な情報を収集し、正確な通りの名前を取得するための通常の
レーン・グラフを使って、レーンの接続性を判別し、レーンの方向性を判別できるようにします。
道路標識は道路標識付きの道路標識ですそして最後にレーンのグラフ自体が
ランダム化されたトラフィックの変量インサイダー・シミュレーターを作成するためにレーンの隣接性やその他の有用な測定基準を決定することができる
繰り返しますがこれは自動的にループしているアーティストで数分以内に起きていることですこれで私たちは
全てがデータとヒューリスティクスに基づいているのでかなり涼しいものもあります
単一の地面の真実の視覚的な変化を作り出すためのパラメーター、オブジェクトの配置と無作為としての微妙な変化が可能
都市のような環境の全く新しい生物や場所のような、より大きな変化への物質的なスワッピング
郊外部や田舎において、特定のものに対して無限の標的の順列を作ることができます。
真実を突き出す必要があるということですそしてこれらの全てが
私たちは地上の真実を変えることでこれをさらに一歩進めることができます
ジョンは自分のネットワークに、方向性ロードマーキングにもっと注意を払うよう望んでいると言う
近日中の左折車線をより正確に検出するために私たちは車線グラフを内側から順番に変更し始めることができます
この交差点を通して完全に新しい流れを作るのを助けるシミュレーター ( シミュレーター )
より正確な予測を作成するために、ネットワークの注意を道路のマーキングに集中させます。これは、この方法をどのようにして
ツールを使用することで、実際の世界からは得られない新しいデータを作成できます
このツールの真の力はそのアーキテクチャにあり我々が全てのタスクを無限に並列に実行できるかどうかということです
目の真実を変えるために、タイルの創造者ツールが動作を変えるのを見た
その隣のものにラベルを入れると、タイル抽出ツールを使用できます。
このデータを約 150 メートルの大きさのジオハッシュ・タイルに分割して
データを個別の形状やインスタンスファイルに保存することで簡単にデータを提供できるようになります
未来のためにエンジンの不可知性をレンダリングすることを可能にする
タイル・ローダー・ツールを使用すると、現在行っているジオハッシュ ID を使用して、これらのキャッシュ・タイルをいくつでも呼び出すことができます。
通常、フリート・ホットスポットまたは興味深い陸地グラフを中心とした、 5 つのタイルまたは 3 個の 3 つのタイルで
タイル・ローダーの位置は、これらのタイル・セットを消費の U 資産に変換します
Unreal Engine によって、最初のスライドで見たものから完成したプロジェクト・プロダクトを提供します。
これは私たちの地図を見ることができる大きさとスケールのためのものです
サンフランシスコの都市の通りの大半を簡単に生成できるようになりました数年も仕事も数年もかかりませんでしたが
2 週間で 1 人の人が 2 週間の間に全ての人の管理を続けて
ツールの中で PDG ネットワークを使ってこのデータを使用することで
これを計算して、これらのすべてのタイル・セットを一晩再生成すると、すべての環境が
新しいオントロジーと信号が絶えず存在するため、トレーニングにとって非常に重要な一貫した品質と特徴
解放されて完全な円を手にするために
これらすべてのタイル集合を地上の真実データから生成しましたこれには本物の世界からの奇妙な複雑さが含まれています
手続き上の視覚と交通の多様性を組み合わせることで制限付きのデータを作成します
Sim セクションから学習するネットワークを提供し、それをケイトに渡して、私たちがどのようにしてできるのかをケートに
すべてのデータを使用して自動操縦性を向上させます
私の名前はケイト・パークです私がここにいるのはデータエンジンの話ですが
データを通してニューラルネットワークを改善することで私たちがどのように介入介入を決定するかを
データを利用してこの特定のクリップの人生を歩きますこのシナリオでは
オートピロットは変化に近づいており、交差する車両がトラフィックのために停止済みであるということを間違って予測する
私たちが車の中でスローダウンする車は車の中には誰もいないということですこれは私たちが作ったものです
不正確な予測を識別するためのツールは、ラベルを訂正し、これを分類します
このクリップは、 126 のうちの 1 つであるという評価セットにクリップする
私たちはこのことを理由に駐車した車と診断されています
技術資源の慣習によらずに、この評価セットを治すことができる
この課題を解決するための難問を解決するために
何千もの例を採る必要がありますテスラは私たちのデータを使い
不正の要求データを調達し、前に表示されたツールを使用して
現在のモデルの誤った予測を外科的に標的にすることで、我々が最も価値のあるものを加えるだけである
私たちの訓練の例としては 13 900 のクリップを手術的に修正し
なぜならこれらは現在のモデルがモデルアーキテクチャを変える必要すらないという例です
この新しい価値のあるデータによる簡単な更新では、この問題を解決するには十分であり、もはや予測できないように見える
オレンジで示されているように止まっているが、赤で示されたように停めた車が停止した
アカデミアでは人はデータ定数を保持しているがテスラにはデータがあるということが
時間と時間を見て、そのデータは最も決定論的なレバーではないとしても最良のものの 1 つであるというのは、まさにその反対です。
これらの介入を解決するためにデータ・エンジン・ループを見せただけです
1 つの挑戦のケースですこれらの駐車場は交代で駐車していますが 1 つの信号には
このデータ・エンジン・ループを、バスであるかどうかを診断したすべてのシングル・チャレンジ・ケースに適用します。
カービー道は駐車場の通行を止めました私たちはデータを追加するだけではなく
今年もまたこの意味を完璧に設定しました今年私たちは車の移動信号を 5 回更新しました
あらゆる重みの更新によって新しいデータについての訓練を受け車の動きの正確さをアップさせ
このデータエンジンフレームワークは私たちのすべての信号に適用されます
マルチ・カム・ビデオには、データが「自動ラベル付き」のラベルが付いているか、オフライン・モデルであるか、またはシミュレートされているか
オンライン上のモデルと Tesla がこれを行うことができるのは艦隊のおかげで
私たちのエンジン・チームが構築したインフラと、ネットワークを提供するラベル・リソースをご利用になることをご確認
膨大な量の計算が必要となりますこれをピートとガネシュに渡して
dojo スーパーコンピューティング・プラットフォームのありがとう ( 拍手)
ありがとうケイティ
私たちの名はピート・バノンです私はピート・バノンという習慣を
シリコンと低電圧のテスラのチームそして私の名前はガネーシュ・ベンカット私が
ドジプログラム
私はなぜ車を運転しているのかということをよく聞かれます
訓練用スーパーコンピュータを構築し、根本的にこの問題を解決する会社
Tesla の心臓 Tesla の本質はハードコア・テクノロジーであることを誤解している
会社全体で、人々は科学と工学で一生懸命に働いている
私たちが利用できる基本的な理解と方法を
自動車用のエネルギーソリューションロボットを作ることができます
世界の人間の状態を改善することができますこれはとてもエキサイティングなものでこれはとても面白いものです
今日の半導体グループの小さな部分は Dojo について少しお話しします
過去 1 年で何ができるかをアップデートしましたがその前に少しだけお伝えしたいと思います
最初のデザインの背景については数年前に私たちが目標を達成し始めた頃に
私たちのオートピロット・チームのトレーニング待ち時間の大幅な改善
彼らが今日で訓練した最大のニューラルネットワークは、急速にその能力を示す 1 ヶ月以上にわたって実行される
代替案を検討し、評価することで 30X の速度を上げることができるようになる
競争力と競争力のある方法で提供できれば本当にいい
多くの算術演算を用いてチップを作りたいということです
私たちは非常に高い効率性を発揮することができるということです私たちはそれをできるかどうかについて多くの時間を費やし
DRM の様々なパッケージ化のアイデアを使っていますが、それらはすべて失敗し、最後までは
私たちは、このシステムのための主記憶媒体としてドラムを拒絶することを拒否し、その代わりに焦点を当てることにした不自然な行為
SRAM に内蔵された SRAM には、残念ながら控えめなものがある
容量が非常に高く、帯域幅が非常に高く、待ち時間が非常に長いため、高い使用率を実現することが可能
演算装置を使用して
例えば仮想記憶を必要とする場合には他にも選択肢がたくさんあります
ページテーブルにはスペースがありませんでした仮想記憶もありませんでした
アクセラレーターは、コンパイラに提示される、ハードウェアの Rob のボンド・ピースです。
コンパイラでは、終点の方法で起こることをすべてスケジューリングする責任があるので、必要ない、または
また、モデルを追求するために選択したシステムにおいても、割り込みを望んでいる
最も典型的な状況ではない訓練方法論としての並列性
今日のほとんどの機械はデータ並列処理を利用していますがデータ並列性を利用していますが記憶容量を
これらの選択によって私たちは機械を作っていくことができました
現在のものとは異なるものがありました他の目標の一つとして重要なのは
限界があります私たちは計算用の織物を構築したいと思いますほとんどの部分では無制限の方法で
今は物理的な限界がありますがあなたのモデルが
コンピュータを買うには大きすぎるのです今私たちが探していたより大きなコンピュータをコンピュータにとっては
マシンは GPU CPU の例としてかなり固定された比率でパッケージされています
生産能力とネットワーク容量を使い道にしたいと思っていますそして私たちはモデルが進化するように
それらの様々な要素の比率を変え、システムをより柔軟にすることで
自明なチームで、「ノー・リミッツ」のような哲学のように、私たちのガイド星がありました
私たちの選択は全てその周りを中心に選択されました
従来のデータセンター・インフラストラクチャーではなく、
これらのプログラムを高速で実行する能力により
それが私たちが統合した理由だということを
垂直方向にデータセンター全体を縦横にしてデータセンターを垂直方向に
データセンターを統合することで、電力を最適化できる新しいレベルの効率を引き出すことができる
デリバリー・冷却およびシステム管理の全体
Box を Box で実行するのではなく、データセンター全体のスタックを統合します。
これらの箱をデータセンターに入れそしてこれを実行したいと思いました
初期の段階で、私たちのための規模の限界を把握する
私たちが Dojo 環境を専任のソフトウェアに統合するためのソフトウェア・ワークロードは非常に初期の段階で多くのことを学びました
レッスンと今日のビル・チャンは、ハードウェアのアップデートやいくつかの情報を引き継がせる
私たちが直面している課題の中でラジブ・クリアンが
私たちのコンパイラ技術を垣間見るとともに、私たちのクールな結果をいくつか見て
そこで行くんだ
ピートありがとうガネッシュのおかげで今夜はハイレベルで始める
私たちのシステムが直面している課題や課題のステージを設定することができるというビジョンが
パフォーマンスを向上させるためにソフトウェアがこれを活用する方法についても
今や私たちの道場へのビジョンは、単一の統合加速を非常に大規模にすることです
1 つのソフトウェアが、グローバルにアドレス可能なシームレス計算機を見ることができる
非常に高速なメモリと均一な高帯域幅で接続されています
今私たちが使う必要があることを実現するためには
テクノロジーを活用してパフォーマンスを向上させることで密度を向上させることができます
チップからスケールアウトシステムまでのすべての階層を
シリコン・テクノロジーは何十年もの間このことを行ってきました
ムーアの法則に従い、密度と統合によってパフォーマンスのスケーリングを得ることができる
ビジョンを実現する上で重要な一歩となったのは 25 人の死を統合することだけではないということです
非常に高帯域幅ですが、それらを接続するだけで、あらゆる追加タイルに拡張できます。
昨年私たちは初めての機能訓練用タイルを披露しましたその時は既にワークロードが動いていました
それ以来、チームは一生懸命、熱心に展開してきた。
目盛りの規模では驚くべき進歩を達成しましたそして多くのマイルストーンは
もちろん多くの予期せぬ課題に直面していますがこれは私たちの失敗の速さが
哲学は私たちに境界を押し付け
現在、パフォーマンスの密度を押し上げているのは、 1 つの領域がパワー・デリバリーの
ここではコンピュート・ダイに電力を届ける必要があり直接影響を与えることがあります
トップ・ラインの計算性能ですがこれを行うには前例のないほどの密度で対応する必要があります
ほぼ 1 ミリ秒の二乗の平方の電力密度でのダイ・ピッチ
極端な統合のためには重層的な垂直になる必要があります
複雑な異機種混合の物質スタックが存在するため、
我々は、特に CTE の物質的な移行を慎重に管理する必要が
この場合 CTE は熱膨張問題の係数が基本的な物質特性となっているのは
注意深く管理されていなければスタック・アップは文字通りに裂かれることになります
そこで私たちはこの取り組みを始めましたベンダーと協力してこれを実現するために
発電所を建設する必要があるということに気付きました
スケジュールとリスクをバランスさせるために短時間で反復してサポートします。
システムを立ち上げソフトウェア開発を実現することで最適なデザインを見つけることができます
最終的な生産目標を達成するために CTE を 50 % 以上削減することができました
初期のバージョンで 3x を超えるパフォーマンスを達成します
最大化すると同時にこの最適な材料の積み上げを見つけることができなくなる
密度の性能は非常に難しい
ここで私たちは予期しない課題を抱えることになりますここでは
コンポーネント障害につながった統合の境界
これは、私たちがより大きく、より長いワークロードに拡大し、それから断続的に単一のものにまで拡大したときに始まり
タイルの上の場所は、今や回復可能な失敗として始まったが、私たちが幾らかの失敗を押し出したために
より高く、より高い力は、永続的な失敗になる
この失敗を理解するためにはなぜ私たちはどのようにして
すべてのレベルで密度を解決する電源モジュールは、
X Y 平面が使用されるために実際にシステム性能を達成するためのコーナーストーンです
高帯域幅通信は、他のすべてを垂直に積み重ねた
これは私たちのダイ以外のすべての構成要素を電源モジュールに統合しなければならないということ
私たちの時計やパワー・サプライやシステムコントローラなどが
この場合、障害は我々の発振器からのクロック出力を失うことによるものである
広範囲にわたるデバッグの後、根本原因はモジュールの振動に起因していることが判明しました。
私たちの近くのコンデンサに電気代を与える
今や帽子を歌うことは新しい現象ではなく電力デザインにおいても非常に一般的な
通常、クロックチップは基板の非常に静かな領域に置かれ、しばしば
電気回路の影響を受けませんがこれらの発振器が必要とする積分のレベルを達成するために必要なのは
我々のスイッチング周波数のために、非常に近接している
振動共鳴によって私たちのメムスで自動操縦機の振動が引き起こされ
この問題の解決策をクラックする原因となった発振器
ソフトな端末キャップを使用することで、振動を減らすことができる複数のアプローチ
私たちは、外側の平面の方向に対して下位の Q 因子を使用して、メーム部分を更新できます
また、スイッチング周波数の頻度を更新して、共鳴をこれらの周波数から遠ざけることもできます
現在密度が低いセンシティブ・バンドの追加
私たちがインフラのレベルで多くの進歩を続けているのは
データセンターのインフラストラクチャーのあらゆる側面を再検討する必要があることを認識しました
前例のない電力と冷却密度をサポートするために
Dojoの高密度冷却をサポートするために完全にカスタム設計された CDU を導入しました
必要がありますが驚くべきことにこれは棚からの購入費用とかではなく
これを変更すること、および、 Dojo キャビネットが十分な電力と冷却装置を統合しているため、
標準化された標準の行全体を慎重に設計する必要があります
インフラを整備することで、私たちはすでにこの内閣の複数回の反復を経て
今年初めに私たちは電力と冷却のテストを開始しました
インフラを整備しました 2 メガワットを超えると発電所を切り抜けるということです
都市は昨年、私たちはただ一つを導入した
私たちのシステムのいくつかの構成要素 D1 ダイと訓練用タイルは
我々は、出口ポッドを目標として、システムの残りの部分を、構築するために必要なものを、
この出口ポッドの外に、システム・トレイがキー・パーツとして
私たちがシームレスにシームレスにシームレスにできることを実現する単一のアクセラレーターの
キャビネット内だけでなく、キャビネットの間でタイルをつなげる
これらのタイルをアクセラレーター全体にわたって非常にタイトな間隔でつなげることができます
これが私たちのユニフォームを実現するための方法ですこれはラミネート・バス・バーで
超高密度の統合において非常に高い電力機械と熱のサポートを統合することができます
それは高さ 75 ミリで、 6 台のタイルを 135 キログラムで支える
これは、完全にロードされた 3 から 4 個の高性能ラックに相当する
次に訓練用タイルにデータを送る必要がありますこれは dojo インターフェイスプロセッサを開発したところです
トレーニングデータをステージングするための高帯域幅のドラムのシステムを提供します
TTP のカスタムを使って、トレーニング・タイルに完全なメモリー帯域幅を提供します。
高速のイーサネットを使っていることをアクセラレーター全体で通信するプロトコルです
標準のイーサネット上でこのカスタム・プロトコルを拡張し、ネイティブ・ハードウェア・サポートを提供する
というのは、ソフトウェアのオーバーヘッドもほとんどかからないし、それに接続することもできる
標準の Gen 4 pcie インターフェースを使用
現在は 1 枚のトレイにつき 20 枚のカードをペアにして 640 ギガバイトの高さを提供します
帯域幅の流れを示します。これは、トレーニング・タイルのための集約メモリー・レイヤーを
これらのカードは、 pcie とイーサネットを通して、最も高い帯域幅の INGEST パスである
また、大容量の Dojo を横断するショートカットを可能にする、高いラテックス z 接続パスを提供します。
現在、アクセラレーターはホストを統合しています
システム・トレイの下に直接、これらのホストは、 INGEST 処理を提供し、インターフェースに接続します。
pcie を使用した、これらのホストを介したプロセッサーの提供
ビデオ・ベース・トレーニングおよびユーザー・アプリケーションがこれらのユーザーに提供されるデコーダ
これらのホストを標準的な x86 Linux 環境で提供することができます。
これらのアセンブリーの 2 つを 1 つのキャビネットに置き、それを直接行う予備電源機構と組み合わせることができます
3 フェーズ 480 ボルト AC 電源から 52 ボルト DC 電源への変換
全てのレベルの密度に焦点を当てることで一つのもののビジョンを実現することができます
カスタム D1 のユニフォーム・ノードから開始しているアクセラレーターが終了しました
これらを完全に統合された訓練用タイルにつなぎ合わせ最後にシームレスに接続することができます
キャビネット境界を越えて私たちの Dojo アクセラレータを形成する
2 つのフル・アクセラレーターを出口ポッドに収容することができます
すべての ml 計算量を結合させることができます。
テクノロジーと統合は、ほんの数回しか行われていません
次に計算を行うことにより、ソフトウェアがどのようにこれを活用してパフォーマンスを向上させるかがわかります
[ 拍手]
ビルの名前はラジブです私は数をお話しします私たちのソフトウェアの積み重ねが pi で始まるように
1 つの標準のピトーチモデルへの私たちの意志を箱から外す、引き裂かれた拡張
私たちは jit コンパイラーと、ハードウェアにデータを供給する INGEST パイプラインについてさらに詳しく説明します
抽象的なパフォーマンスで、平均使用率がアクセラレーターの占有率を上回る
ハードウェアがどのようにしてピーク・パフォーマンスを提供するかを確認しました。コンパイラーが使用するパフォーマンスを
コードの実行中にハードウェアが実行されます。データを取り出すことができるようにするための、 INGEST パイプラインのジョブです。
ハードウェアがそれまでにないほど高いスループットで、なぜ通信が行われるのかについてお話しします
束縛されたモデルは規模を拡大するのは難しいが、それ以前に、なぜモデルのようなレネット 50 がより簡単に拡張できるのかを見る
1 つのアクセラレーターを使用して開始すると、順方向および逆方向パスの後に最適化プログラムが
これを拡張することで複数の加速器に対して複数のコピーを実行することができます。
バックワード・パスを削減する必要があります。これにより、パイプラインを使用して、これを行うことができます。
このセットアップは、ほとんどほとんどの場合、後方に通過する
より大きな活性化のあるモデルのためのリニング
私たちは、一つの問題にぴったり合うバッチサイズを走らせるとすぐに問題になる
多くの場合、アクセラレーターは、バッチの Norm サーフェスよりも小さく、この研究者を中心に、このセットアップを複数回実行します。
同期バッチの Norm モードでアクセラレーターを使用すると、クリティカル・パスにバインドされた待ち時間が発生します。
転送パスには通信障害がありますがそれには通信障害がありますが
これは通常、コンパイラに適した手間のある手作業で、最終的にスカートがない
あなたの国が 1 つの加速器に収まらない場合には通信を制限することができます
我々の技術者たちの努力によってこれらのモデルは直線的にスケールしません
その模型を高い使用率で高い使用率で作動させるために作られた道場
密度の統合は、モデルの計算限界部分を加速させるだけでなく、レイテンシーも加速される
ノルムのように束縛された部分や勾配のような帯域幅の境界部分などの束縛部分
すべての縮小された、またはパラメータすべてが、ドホメッシュの一部を切り刻みます
すべてのモデルを実行するには、ユーザーが行う必要があるのは、 1 つのモデルに収まるだけの大きさのスライスを作成する
区分がそれ自身を提示した後の、特定のモデルのための浴室の表面
1 つの大きなアクセラレーターが、ユーザーが内部の実行詳細を気にすることを心配することを解放する
コンパイラの仕事として、この抽象的な微粒子を同期するプリミティミティースを抽象化することに
均一な低レイテンシは、統合境界テンソルにわたる並列処理の全形式を容易に高速化できる
通常は SRAM に保管され、レイヤーの実行のために複製されるのは、高 Dojo に依存する場合です。
この複製時間テンソル複製を非表示にする帯域幅、およびその他のデータ転送が計算にオーバーラップされる
また、コンパイラーは、収益性が高い場合にレイヤーを再計算することもできます。
ほとんどのモデルはこの箱の中で例を挙げました最近公開された安定した拡散モデルを例にして
ボックスから数分で走れ、カンパラは 25 の道場の模型にそれをマップすることができた
Dojo で動作する安定した拡散によって生成された火星にあるサイバートラックの写真をここに撮っています
[ 拍手]
Tesla Design Studio チームと一致する前にいくつかの方法がまだ残っているように見えます。
通信のボトルネックがコンパイラの酸性検査によってどのように阻害されるかについてもお話ししました
基礎となるハードウェアは、前述のようなクロスダイバッシュのフォーム層を実行しており、これがシリアル・ボトルネックになる可能性があります。
学士号の通信段階は、局所平均値と標準偏差を計算するノードで始まる
これらの値を減らしてそれらの値を再生し、それらの値を並行して再開するよう調整する
ですから、 25 の Dojo ドットで理想的なバッチ・フォームは、前のより少ないアクティブ化ということになります。
一度に 350 個のノードが存在すると予想されるすべてのマウスに分割され
局所的な平均値と標準的な除算の値を調整し、生成するために死ぬ場合、理想的にはこれらはさらに
どこかで終わる最後の価値とタイルの真ん中にまで縮小しましたそして私たちが放送したのは
中心から放射されるこの値は、コンパイラーが実際に Bachelor 操作をどのように実行するかを確認します
25 回のディセの間に、通信木はコンパイラとその木から抽出された
タイミングが実際のハードウェアからのもので、 25 人の死亡時に 8750 ノードが表示される
バストラムの平均値と標準偏差バルブを縮小してブロードキャストするための調整
ダイヤル・ローカル・リダクションの後に、タイの中央部に対するグローバル縮小
ハードウェアの放送によって中東から放射される低価格放送を
この操作には 5 個の
25 個の Dojo dice でのマイクロ秒は、 24 時間で 150 マイクロ秒を要します。
これは、 gpus に対するマグニチュードの改善の命令である。
そして、あるバッチ・ノームのコンテキストでは縮小された操作について説明しましたが、それが重要なことです。
他のすべてのコミュニケーション・プリミティブにも同じ利点が適用され、これらのプリミティブは大規模に対応する必要があります。
フル・モデルのパフォーマンスを向上させるためのトレーニングを行うことができます。これに共鳴する 50
現実世界のテスラのワークロードの良い表現ではなく、それが標準的なベンチマークであるため、そこから始めることができる
私たちはすでに 100 人の死を完全に一致させることができますが、おそらくは道場のヒントとなるでしょう。
この数字を打つことができるということです 1 人の死につき 8 本のバッチで
でも Dojo はより大きな複雑なモデルに対応するよう作られていました現実の世界に立ち向かうために
現在の GPU クラスターと 2 つのモデルの使用パターンを確認したワークロードは自動ラベル付け機能を
オフライン・モデルのクラスをネットワークにしています。現場の真実と占有ネットワークを生成するために使用されます。
自動ラベル・ネットワークについては、占有ネットワークの間に高い算術強度を持つ大きなモデルがあります。
これらのモデルを選択したのは現在の GPU クラスターの大部分を占めているからです
異なる方法でシステムに挑戦することになります
これらの 2 つのネットワークをどうやって行うかということです私たちが目にする結果は複数のシステムで測定されています
GPU と Dojo だが、私たちのオートラベリング・ネットワークでは、 1 つの死亡番号に正規化されている
以前の世代の vrms で稼働している現在のハードウェアで、 a100 のパフォーマンスを既に超えることができます。
私たちの生産ハードウェアは、 a100 のスループットを倍にするために、より新しいvグラムを使用する
私たちのモデルでは、いくつかの重要なコンパイラ最適化によって、
a100 我々は、占有ネットワーク上でさえも大きな跳躍を見る
約 3x になる約 3x の生産設備を備えた
外国 [拍手]
コンパイラパフォーマンスのレベルは、 5 、 6 GPU のうちの 2 つの 3 つのうちの 1 つを置き換えることができる
1 つの Dojo タイルを持つボックス ( 拍手)
この Dojo タイル・コストは、これらの GPU ボックスの 1 つよりも少なく
ネットワークが実際に意味するのは
1 週間足らずの間に訓練するのに 1 週間以上かかった
私たちが測定したものを測定する際に、私たちが見ていないパイの松明のレベルでは、それがうまくいくことはなかった
私たちの予想されるパフォーマンスはその結果ですこのタイムライン・チャートは私たちの問題を小さな緑の小さなバーが
アクセラレータ上で実行されているコンパイルコード。行は、主に、
ハードウェアは、高密度の ml 計算 Dojo ホストがあるデータを待っています。
データ・ローダーが、この 1 つのホスト上で実行されている GPU ホストに比べて、効率的に 10x 以上の ml 計算を行うことができます
データ・ローダーの拡張容易性を解決するために、すべての ml ハードウェアに対応する
この 1 つのホストの限界を超えテスラ輸送プロトコルがデータを移動させるという問題を
ホスト・タイルと INGEST プロセッサーをシームレスに横断し、 Tesla を拡張した
ネットワークを介して動作するトランスポート・プロトコル。 TTP を活用するためにdニックと呼ばれる dojo ネットワーク・インターフェースを構築しました。
このイーサネットでは、任意のホストが dnic カードを使用して DM に接続できるようになります。
他の TTP の端点から私たちは道場のメッシュから始めました
dニックカードを搭載したデータ・ロード・ホストの層を追加しました
これらのホストをイーサネット・スイッチ経由でメッシュに接続し、このデータ・ロード層のすべてのホストが以下のように機能します。
ハードウェアによって加速された dma を介した Dojo メッシュ内のすべての TTP エンドポイントに到達
これらの最適化が私たちの占有率の 4 % から上昇した後
データ・ロード・セクションが減少しているため、 97 % まで
データ・ロード・セクションが大幅に削減され、 ml のハードウェアがビジー状態のまま維持されていることが、実際に
これらの変化が後になってすぐに 100 人になるためには、ピトーチからの期待されるスピードが、
私たちはビジネスに戻ってきたのでハードウェア設計から始めました
単一の巨大加速器の視力のサービスにおいて、伝統的な統合の境界を破る
お客様のパフォーマンスを向上させた上で、コンパイラーと層がそのハードウェアの上にどのように構築されるのかを見てきました
これらの複雑な実世界のネットワークは私たちの最初の大規模展開が私たちの高さをターゲットに
現在、 72 時間に 4000 gpus を占有する、算術度の高い自動ラベル付けネットワーク
高密度のコンピューターと高性能の GPU ラックには、以下の機能が提供されます。
4 つの Dojo キャビネットのみによる同じスループット
[ 拍手]
これらの 4 つの Dojo キャビネットは、 2023 年の第 4 四半期までに構築するという我々の最初のエクソポッドの一部になるでしょう
これはテスラのオートラベリング能力の 2 倍以上に
[ 拍手] 最初の追加部分は合計の一部です
パロアルトの壁の向こう側に建設する予定の 7 つの部分があります
( 笑 ) (拍手) これらのエキソポッドの 1 つからのディスプレイ・キャビネットがあります
6 つのタイルは、 640 ギガバイトの台の上に 54 ペタフロップスのトレイに密集したものである
消費電力やホストによる高帯域幅メモリーの提供
新しいバージョンのものを作っている多くの人たちは
あらゆるクラスター・コンポーネントを常に改良しソフトウェアを向上させ新しいスキルの限界を打ったのです私たちが
次の世代ハードウェアで 10 倍の改善を得ることができます。
お客様の野心的な目標を実現するためには、最良のソフトウェアとハードウェア・エンジニアが必要とされていますので、お客様と
tesla.com の AI に感謝します [拍手]
すべての権利は、私に知らせてください
十分な詳細をお願いしたいと思っています。
今は疑問に思うようになりましたええと私がチームと思うのは
ステージに出て来ましたが私たちは本当に深みを見せたかったのです
Tesla の人工知能の幅も
ハードウェア・ロボット・アクチュエーターおよび [Music] の計算
会社の知覚を変えることができないかということを
多くの人が私たちはただの車の会社だと思っていますが -
ほとんどの人はテスラが間違いなくテスラのリーダーであるという考えを持っていません
現実世界の AI ハードウェアとソフトウェアそして私たちは
おそらく、おそらく最も急進的な最初のものとは何か
クレヨンのスーパーコンピュータというコンピュータ・アーキテクチャに興味があるかと思います
世界に影響を与える世界で最も進んだ技術のいくつかを開発しています
ポジティブな方法を教えてくれますそうする場所を教えてください火を消すということです
目の前にマイクがあると思いますが
後ろのマイクでのマイク
とても感謝しています私はここに感銘を受けたことがあります
オプティマスはなぜ、なぜ彼らが狩りをやらないのか理由はなぜ、なぜ、
テンドンがあまり耐久性がなく、かつ、狩りをするための柔らかい運転アプローチ
春にロードされたとしても、これはかなり涼しいイエスだ
これは素晴らしい質問ですがあるタイプのアクチュエーション・スキームにはトレードオフがあります
あなた方の間にあるのはテンドン尿のシステムかどうかということです私が今キープしているのは
口の近くにいるのはもう少し近くでジェレミーのクールムに近いことを覚えています私たちが行った理由は
テンドンベースのシステムでは最初に合成テンダンを調査したのは分かっているということです
金属が沸騰しているケーブルは、これらのケーブルの利点の 1 つとして、ずっと強くなっています。
多くの部品を手にするために多くの手を握らせたいというのは
小さなリンケージの多くが大きな理由の 1 つを作っているときに問題があることを知っているということです
ある意味では、あなたは反逆者になることができるという意味で、テンドンがリンケージより優れていることを知っているということです。
基本的にあなたにはギャップやあなたを持たないことが
主に春に積載されたものを主に、指の中の石器の動きを知っている
私たちが能動的な開口を許可することを可能にします
2 つのアクチュエーターが指を閉じて開けたところでテンドンが動かされていることが分かります
密閉されていますスプリングスが受動的に拡大していますこれは私たちの手にも見られるものです
能動的にフレックスを拡張できる能力を持っているということですそしてまた
私たちが目標としているのは「オプティマス」というのは最大限に有用なロボットを
できるだけ早くヒト型ロボットの様々な問題を解決する方法がたくさんあります
私たちはおそらく技術的に正しい木を登っているわけではありません
ソリューションと私は、お客様が時間とともにここに表示するテクニカル・ソリューションを進化させるためにオープンしていることをお話します
私たちは石に閉じ込められていないのではなく何かを選ぶ必要があります
私たちはロボットをできるだけ早く生産できるようにしたいと思っています
そして私の言ったことをできるだけ早く実現しようとしているということです
ボリューム上で作ることができ実用的なロボットをテスラの内部で私たちの工場の内部でテストすることができます
役に立つというのは自分のことを理解するためには
現実のループを閉じてロボットが実際に役に立つことを確認します
私たちはそれを使って物を作るために使います
私たちは現在デザインしていますがバージョン 2 になることを確信しています
バージョン 3 では、時間とともにかなり大幅にアーキテクチャが変化する可能性がある
申し訳ありませんがあなたはオプティマス・ロボットで素晴らしい仕事をしたことが
二足のロボットは本当に難しいのですが私が気になっているのはあなたの計画に欠けているものがあるかもしれないということです
人間の精神の効用です私は、オプティマスが今までにパーソナリティーを得ることができ、私たちのことを笑うことができるだろうかと
私たちの服は絶対に折りたたみだが、彼らは冗談を言う。
私たちは、私たちが本当に面白いバージョンのオプティマスを持っていたいと思う
そうすれば楽観主義者は功利を得ることができタスクもできるようになります
友達の仲間と友達のようなもので、そして、そして、そして、 um と um が一緒にいるようなもの
皆さんはこのロボットのクリエイティブな使い方について皆さんに考えます
コア・インテリジェンスとアクチュエーターが存在するということを知っていますか ?
あらゆる種類のものを理解することができます。
私が思うにロボットを装束してロボットを見て
多くの異なる方法でロボットをスキャンすることができます私は人が
非常に興味深い方法をいくつかのオプティマスに変換すること
この素晴らしいプレゼンのおかげで私はオプティマスの介入に相当するものがあるかどうか知りたいと思いました
人間が何が起こっているかということに同意しないことを通して人間のロボットは人間のロボットに
それは望ましい情報源となるかもしれません
そうだということはそうだと思います私たちには、
ロボットを遠隔操作しそれが何か悪いことをするときには介入します特にロボットを訓練するとき
ロボットを止めることができるということですロボットを止める方法でデザインを
手を握りしめるのは嫌だとか手か何かを潰すのが嫌なのは止められないといけない
私たちはシミュレーションシステムから多くのことを学ぶことができます
衝突の有無をチェックし、それらが悪い行動であることを監督します。私たちは時間をかけて最適化します
ご存知のようにサイファイトの映画で見たアンドロイドのアンドロイドをご存知のように
次世代のデータを扱うスター・トレックですが、ロボットをよりロボットのように、より親しみやすくすることができます。
そしてあなたは明らかに人間をエミュレートし非常に自然だと感じることができることを知っていると思います
人工知能が一般的に向上するように、ロボットにそれを追加することができます。
明らかに簡単な説明をすることができるということです
その中にあるものを高レベルの命令にしてそれを破ることができるということです
一連のアクションを実行し、それらのアクションを実行する
ええと、オプティマスのことを考えると、それを考えるのはエキサイティングなことだと思う
改善と経済生産の規模を達成することができます
本当にエキサイティングなことですテスラがこのミッションを始めた頃にはアドベントの活動を加速させることが
オプティマスによる再生可能エネルギーまたは持続可能な輸送
このミッションがテスラのミッションであるということはまだ Tesla のミッションであるということです
私が無限のアバンダンスを知らないことを加速させる任務
無制限の無制限経済だということは、厳密にはそうではない
オプティマスは厳密にはええと話すことではない
あなたが知っている持続可能なエネルギーを加速することで
ある人よりも物事をより効率的にすることができるということです私が知っている限りでは
持続可能なエネルギーだが、私は、その使命は効果的にオプティマス・アトのアドベントと共に、いくぶん広げられると思う
私が未来の事を知らないことを知ってるでしょうあなたは私があなたを思っていることを知っている
楽天家や私が皆さんのことを知っていると思いますが私は楽観的になります楽観主義者がどうなるか
ご存じのようにこのテクノロジーはどんな技術でも
1 年のうちに 2 年 3 年 4 年 5 年後にどんなものがどんなものかを見たいと思うなら
確かだと言うのは確かだと思うオプティマス・ウムの何が起きたか知ってるのに対して君は他の多くの
テクノロジーズはここで名前の名前を知ってるのは知ってるけど
[ 笑] そうですね
私は、「オプティマス」は、「マインド・ブローイング」のように 5 年後には信じられないほど素晴らしいものになると思います。
それが起こるのを見たいと思います私は、あなたが私の考えを
私はここでジャスティンという素早い質問をしています私はジャスティンというのは
ロボットと私の 2 番目の会話型機能のように拡張することを計画する
それに対するフォローアップの質問は、エンドゴールがオプティマスとの最終目標を何にするかということです
ええっと楽観主義者なら会話能力を持ってる
お話したいと思いますが会話をすることができますが
最後のコールの見地から自然なことなので、私はそれがゴナ・キープだと思うのを私は知らない
進化を続け、どこがどこで終わるかは分からないが、
私たちが常に注意しなければならないことを確実に知っているところに興味がある場所もある
あなたの知っていることはターミネーターの経路をダウンさせないということです私の知っていることを知っている人は
「ターミネーター」のようなビデオで頭蓋骨を脱いで始めるかもしれないと考えていました
押しつぶすかもしれないが、それを本気でやりたいかどうかわからないかもしれないが、私たちは私たちがオプティマスを望んでいることを知っている。
安全にするために安全装置で設計することができますし地元では
ロボットを止めることができます。あなたが知っているのは、基本的に、
インターネット上では更新できない制御 ROM がありますこれは非常に重要なことだと思います
非常に率直なうな
リモコン・ボタンのようなもので、リモート・リモート・コントロールは
それは変えることができない
でも興味深いことに、面白くないことはないでしょう。
いいですか ? 今日皆さんには道場とその応用がある魅力的な商品がありますので
Dojo プラットフォームの将来は、 AWS やサービスなどのインフラストラクチャー・インフラストラクチャーとサービスのようなサービスを提供したいと思います。
これは Nvidia のようなチップのようなものになりますこれは基本的に将来のものです 7 つのものを使うということは
ナノメートルを開発するために開発者のコストは 1000 万 US ドル以上になり、企業単位でペニスを作ることができます。
つまり私は Dojo というのはとても大きなコンピューターで実際には多くの
多くの冷却を必要としているので、 Dojo があーのように作動する方がもっと理にかなっていると思います。
アマゾンのウェブサービスは、それを他の誰かに売ろうとするより
最も効率的に Dojo を操作できるようにするのはそれがあなたのサービスになるということです
使えるオンライン上でモデルを訓練できる場所を利用できるようになります
より速く、より少ないお金で、そしてそれを
ソフトウェア 2.0 への世界移行
それはビンゴのカードです 5 つのテキラを飲む方法を知らなければならないと知っています
それで、ソフトウェア 2.0 を見ることができます
( 笑) 私たちは多くのニューラルネットを利用します
時間とともにより多くの神経があるということを理解しているということを
人々が使いたいネットのネット上で最も低いコストで最も低いコストを
ネット・トレーニング・システムですその方向には多くの機会があると思います
私の名前はアリ・ジャハニアンですこの出来事についての私の名前はとてもインスピレーションを与えてくれていることです
疑問は私が何を考えているのかということです
人間ロボットは私たちの感情や芸術を理解しそれに貢献し
私たちの創造性は、あなたがいると思う
すでに非常に興味深いものを生み出すことができるロボットを見ていると
Dali um や Dali 2 のような芸術です um
私たちは人工知能を見てそれが一貫性のある映画を生成することができると考える
面白い映画のように冗談を言っているので AI の速さがどれくらい速いか
Tesla 以外の多くの企業での上昇率
私たちはとても興味深い未来に向かっています
コメントしたいと思います私は「 Optimist ロボット」はデジタル芸術だけでなく
テキストや声の中にダンスの動きを求めることができますそして将来それらを作ることができます
物理的な心臓のようなものではないということですデジタルアートではなく
物理的なアートを作ることができるようにしたいと思いますサッカーをするのと同じように
私は、より俊敏なものを得る必要がありますが、確かに時間をかけて
Tesla 自動操縦のスライドのプレゼンテーションのおかげで、私は気付きました
皆さんが使っていたモデルは言語モデルに大きく動かされていました私はその歴史が何なのか疑問に思っていました
それがどれだけ改善されたかというとそれが面白い選択だと思っていたのです
ランゲージ・モデリングのための言語モデルがあるため、言語モデリングに移行する理由の 2 つの側面がある
最初のトークは大声で話そうとしましたが
言語モデルは 2 つの方法で私たちを助けることができます最初の方法は私たちが手にできない
それ以外の点では、私たちがレーンを高密度の 3D 立体ソートでしか予測できないと予測したときには、以前にも
ある種のレーンをモデル化していますが、交差している間に、それを作らずにそれを実現することはできません。
グラフの予測は、高密度のセグメンテーションでこれを実行しようとすると、レーンの予測がマルチモーダルであることもありません。
物事がどのように他のものを見るか正確に知るために十分な視覚情報を持っていない場合もある
交差予測を一般化して生成する方法を必要とする交差点の側面
3 つのレーンの 2 つのレーンを同時に予測したくないのは、このような言語モデルのような生成モデルの 1 つにコミットしたいとき
よろしくお名前はジョバンニ・ウム・プレゼンテーションのご挨拶のお礼です
FSD のチームにお聞きしたいことがありますニューラルネットワークのために
どうやってユニットテストを行うかテストをしています例えば私の中には
何千もの数の症例が
ニューラルネットワークをご説明しますそれを製品としてリリースする前にそれを通過させなければなりません
ソフトウェア部門のテスト戦略は何かというと一連のテストのようなものです
ソフトウェア自体の単体テストを定義していますがそのニューラルネットワークモデルには VIP セットが定義されています
私たちが必要としているものでは十分ではないような大規模なテストセットがあるとしても
異なる障害モードのための洗練された VIP セットでそれらをカーレートして成長させます
私たちが過去に失敗してきた何百何千もの例をご紹介したいということです
私たちはこれらの失敗の歴史全体に対してテストする新しいモデルを作成しました
このテスト・セットに追加することで、これらのモデルをサイレント・モードで出荷する「 Shadow モード」を使用することができます。
車はデータを取り戻します障害が発生している場所にデータを取り戻します QA プログラムが非常に広範囲でデータを
顧客にヒットする前に 9 レベルのフィルターを適用するのは難しいですが、それは本当に良いことです
これを効率的にするために、私は QA のテスターの 1 人なので、 QA には
車はクリエイターのように運転されていますので私はいつも車の中で
最新のアルファ・ビルドが全くクラッシュしないようにキューに入れます
非常に多くのバグがあるということです私には疑問があります
ええと、ええと、ええと、ええと、ええと、あーの大きなモデル
GT3 からのデータおよびモデル・パラメーターを使用してスケールアップすると、本当に
ヤシは、実際に推論することができるのですが、それが本質的なスキニングであることがわかります。
データとサイズを持つ基本的なモデルでは、少なくとも 1 つの
全ての問題を解決できる可能性のある教師モデルをモデルにしています学生モデルには
100 に関連する基本的なモデルは私たちの自動車のラベリングモデルとよく似ていますが
車の中でモデルを走らせています私たちが車で走るモデルは完全にオフラインのものですが
車の上でリアルタイムで走らせることができますそれらをオフラインにして良いラベルを作っているサーバー上で
オンラインネットワークを訓練しそれが 1 つの蒸留所になり
ファウンデーション・モデルにおいてこれらの生徒がモデルをモデルにしているというのは
データ・セットには複数のペタバイトがあります。これらのタスクの一部は、実際には、
キネマティクスなどのキネマティクスのような大規模なデータセットがあります全ての物体のキネマティクスで
4 回目の微分や人々はカメラの検出深さでは検出できないと思っていました
加速度が高くこれらのより高い導関数が正確であることがどの程度正確であるかを想像してみてください
このような大規模なデータ・セットや大きなモデルから来ていますこれらのデータ・セットは基本モデルと同等のものを
幾何学やキネマティクスなど、ジョンを追加したいものなど
基本的には、ビッグデータ・セットを使用するときには、基本的には基本的には、基本的には非常に大きな問題があることを確認
より大きなデータ・セットを使用することで、モデルのパフォーマンスが大幅に改善され、基本的には初期化のたびに
いくつかの他の補助タスクから事前に訓練されたステップをネットワークで把握しています。これにより、
大きなデータ・セットを使用して自己管理または監視を行い、多くの場合、多くの支援を
イーロンの初めの時点で、 Tesla は人工的な一般情報を構築することに興味を示しているという。
テクノロジーの変革をもたらす潜在的な影響を与えられたシステムに投資するのが賢明なように思えるような
技術的な AGI の安全性については特に私が知っているのは Tesla の多くの
技術的な狭い人工知能の安全調査テスラが意図していたことを知りたい
特に技術的な人工的な一般情報の安全性を専門的に構築しようと
もし、もし私たちが人工的な人工物への大きな貢献をすることになるとしたら
一般の諜報機関は安全性に投資することを確信しています私は AI の安全に大きな信奉者なのです
政府レベルでの AI のようなものでなければなりません政府レベルの規制当局の
公共安全に影響を与えるような規制当局に航空機の規制権限を持つように
自動車、食品、薬品、そしてそれが公衆安全と人工知能に影響を及ぼすからだ
公衆安全にも影響を与えていますこれは政府が理解していることではありません
私が思うには、ええと人を保証する審判がいるべきだと思いますか ?
AGI の安全性については、次のようなことがよく似ていると思います。
アクセス可能なデータ・セットのような AGI を作成するために必要なエレメントは、非常に大きい
重要なのは車とヒューマノイドロボットの数が多いことが
ビデオデータのペタバイトをご存知ですか ?
本物の世界からの音声データですこれは人間のように
最大のデータ・セットはおそらく最大のデータ・セットです。これは、データ・セットの他にも
明らかにインターネットをインクリメンタルにスキャンしますがインターネットがあまりできないことは
何百万何億ものカメラが現実の世界に存在し
音声やその他のセンサーを使って言ったように私たちは
おそらく最も多い量のデータを持っているだろうし、おそらく最も多くの TR のデータを持つ
訓練のための力だと思うかもしれない
AGI への貢献
セミトラックがそこに戻っているのに気がついたのですが、それについて話をしていないのは、セミトラックを探していただけだということです
感覚的な観点から考えていることは何を考えているかというと
それが真の理由ではないと思われる場合には車だけでなく
車を運転できるということは基本的には車を運転することができます車を運転していると
カメラに目を持つ神経網は基本的には基本的にそれは本当にそうでなければ
あなたの 1 次センサーは 2 つのカメラの速度が非常に低速ですが
遅いギンバウムで、それはええと、それはええと、そうだと
2 台のカメラを持った生物学的な神経網が遅いギンバルではセミトラックを運転できるということです
8 台のカメラが連続して 360 度ビジョンを持つようになったなら
より高いフレームレートで操作していて反応率が高くなることは明白だと思いますが、あなたが多くの車を運転できることは明白だと思います
私の名前は、アクシェイという人よりも良いことです。
Optimus を知っていると仮定した場合のイベントは、さまざまなユースケースに使用されます。
これらのユースケースのために異なる部分で進化することになるでしょう
異なるソフトウェアやハードウェアのコンポーネントを独自に開発してデプロイし、それらをご存知のようにデプロイすること
最適化の中で、フィーチャーの開発がより速くなるようにするために
質問への最適参照
私たちが不運にも理解できず、私たちのニューラル・ネットが問題を理解しなかったのは
ええっと、次の問題はよくある
装置を自動操縦装置に切り替えたいと考えています歯車のスイッチを
FSD は私たちとカナダ以外の国々にもベータをしていますそして次の疑問は
スタックの最大のボトルネックや技術の障壁とは何かということです
自動操縦が人間よりも優れた性能のマトリックスになるということを理解することができる
安全保証と人間の信頼とも一致しています 4V の fstb と一致していると思います
幹線道路と市を一つのスタックとして組み合わそうとしている人たちがいます
大きな改善があるかもしれませんがちょっとしたことを実験することができます
私たちは、私たちが考えることができると期待しています。
技術的な観点からすると、 FSD のベータは、その sfsd beta をロールアップできるようにすべきである。
年末までには世界中ではあるが、私たちは多くの人にとって
我々は規制当局の認可を必要としているので、我々は他の国の規制当局の承認によって若干進行している
でも、技術的な観点から考えると、
年末までには世界的なベータに行くことになりますが
私たちが来月発表することになっているのは、それが、いつも特に良いことだということです。
高速で動いているクロス・トラフィックの速度と他の多くのことを評価することで、誰でも推敲します。
というのは私が思うに生産と生産の間の違いが
自動運転のベータ版と自動運転のベータ版ですがそれらの違いは時間とともに小さくなってきています
わずか数ヶ月前には、 FSD と実動の両方で、同じ視覚専用オブジェクト検出スタックを使用しています。
すべての乗り物のオートピロットにはまだ 1 次とは違いがいくつかあります
レーンを予測することでレーンのモデル化をアップグレードしました私が話したような複雑な形状を扱うことができるようになりました
私たちは今でもシンプルな車線モデルを使っていますが、現在の FSD ベータモデルを拡張して
すべてのハイウェイ・シナリオをええと、ええと、それと FST のバージョン
ベータ版では実際には統合されたスタックを使っています
FSD は市内の通りとハイウェイの両方でスタックを積んだけど ... 私にとってはうまく機能してるけど、それを検証する必要がある
大雨のような豪雨のような砂塵のような天気の中で、
ご存知のように広い範囲の生産スタックよりも良い仕事をしています
環境の中では私たちはとても近いと思うかもしれませんが私はそう思うかもしれません
年末までには間違いなく年 11 月のパーソナルドライブの中で FSD を
私たちが持っている実動スタックよりも高速道路ドライブ上のスタックが既に存在していることもあります
今年の終わりまでに FSC スタックの一部として駐車場が積み重ねられているので、基本的に私たちをあなたたちにもたらします
駐車場の車の中に座り、駐車場の端まで駐車場の端まで駐車場前まで運転する
一年で、そして、最適化する基本的指標が基本であるという点において
1 つの間に必要な介入の 1 つの間に何マイル
車が一杯で何マイル運転できるかを、とても助力しているだけだ
介入の前に自治権が必要であるため、安全性が重要となる
これが私たちが毎週測定している基本的な指標で、私たちは急進的なものになっている
どうもありがとうございました。ありがとうございました。
私の名前をとても刺激的に表現することはデイジー私には技術的でない
皆さんにとっては興味があります 20 代の間に何があるかというと
あなたが知りたいことは、あなたが自分の若い自己に与えるアドバイスとは何か
私は何か役に立つことを理解しようとしている
テスラに入隊したのは 1 つのことだ
多くの賢い人たちと同じように自分で公開しようとしていると思います
私はできる限り多くの本を読み
私がやっていることを知っていると思いますが
そのため、私は、それと同時に、メリットがあると思います
必然的に強烈で楽しんでるような感じじゃない
ほんの少しだけ私が 20 か 20 か何かを私が知っていることを
バラを止めて、匂いを嗅ぐことは、時には良い考えとなるだろう
私たちがファルコン 1 ロケットを開発している時のようなものだと知っているでしょう
クワドリリン環礁ではこの美しい小さな島がありました
私たちはロケットを開発していますその期間中にロケットを開発中ではなく
浜辺では、天気のよいビーチに飲み物を飲んだ方がいいよ
ありがとうございましたこれまでのロボット工学の人々が
これは 10 年前に運転することにとても似ているということですが
車の運転は 10 年前の私たちが 10 年前にしていなかったことを実際に見ていた 10 年前よりずっと難しくなっていることが分かりました
それは例えば、ヒューマノイドの AGI のようなものになるだろう
HEI は非常に速い速度で進んでいるということは私にはよくあることだと思います
1 週間もないうちに、何か意味のある発表もないし、ええと、
この時点で、 AI のような時点で、ほとんどのルールベースのゲームで勝るように見える
それは非常に印象的な芸術を生み出すことができます
あなたが知っている非常に洗練されている会話に従事する
書きエッセイを書きますこれらは改善を続けて
より多くの有能な人材が働いているからです
AI ではハードウェアがよくなっています私は AI がスーパーにあるのは
私たちがやっていることとは無関係に、改善の強さの強い指数曲線のように
テスラの指数曲線から幾分効果が得られるでしょう
AI による改良もまた、非常に良いことに
自動車メーカーが自動車のギアボックスにパワーエレクトロニクスのバッテリーを充電するアクチュエータを
皆さんご存知のように私が知っているようなセンサーや
4 つの車輪のロボットと腕と脚のロボットの間の最大の違いはアクチュエータを手にすること
実際に実際にはアクチュエーターやセンサーの問題ですそして明らかにあなたがどのように
それらのアクチュエータやセンサーを制御していますがそれは実際のアクチュエータやセンサーで
アクチュエータをコントロールすることができます私が知る必要のある材料を
説得力のあるロボットを開発しています
エランは文字通り人間性を文字通りのテスラというレベルに持っているということです
あなたは人類を次のレベルに連れて来るようにあなたがオプティマス・プライムと言った
今後の Tesla の工場ではオプティマスが最適化され、新しい Tesla になるだろう。
ファクトリーは、オプティマス・プログラムによって完全に実行されます。
一般の人々がヒューマノイドを秩序にすることができるということです
工場での簡単な作業で最適のタスクを開始することにします例えばロードするのが
あなたが見た映像の中で見たのとは別に、あなたのために 1 つのパーツを積み込んでいるのは
もう一つの場所に配置する、または、より伝統的なロボットの 1 つに部品を積み込む
細胞が体を溶接していることを知っていることを知っているということです私たちが理解するように
どうすれば役に立つのかということですそして徐々に状況の数を増やしていきます
有用で、私は、オプティマスが最適化されている状況の数は
とても速く飛躍的に成長するというのは有用です
人が命令できるという点ではそうではないと思いますが
私は、あなたが人に 1 つのことを受け取ることができると思う
私が 3 年以内におそらく言うことがあるとは思わないかもしれません
3 年から 5 年以内の 5 年以内に、おそらくオプティマスを受け取ることができる
私はできるだけ多くのスマートな人たちを世界中の人々に与えられるようにするためにもその進歩を達成するための最善の方法を感じています
テスラのサイズと資源はロボット会社と比較して - 現在の人類の研究の状況を
ある種の Tesla がオープンソースのようなものを
シミュレーションのハードウェアパーツ、 Tesla がまだ優勢なプラフォーマーであると思う
Android OS のようなものや iOS のような人間全体にとっての iOS のようなものになり得るものです
オプティマスをテスラの研究者だけにするのではなく
工場はそれを開いて全世界に人間の研究を探査させることができます
私たちは、オプティマスがええと、それが悪い方法で使われる可能性があると考えている。
私たちは可能なことを考えていますので
最適化者を提供します。ここでは、最適化者に指示を提供しますが
あなたが克服できないロボット工学の法則によって統治されているのはあなたのご存知です
他人やええとの危害をしないことを知っているでしょう
おそらく私たちは最適な「オプティマス・アア・アイ」を使っていくつかの安全関連の問題について考えてみましょう
いくつか質問をしてから来てくだらないことに感謝します
ディープ・ for オプティマスの深く 1 つの深さと 1 つの道に疑問があります
何が理想的なコントローラの帯域幅になっているかというと広い質問の中には
会社の深さと幅のための広告で、何が固有なのかを
誰もが帯域幅に対応したいということを可能にする
問題はそう技術的な帯域幅があるということです
帯域幅の問題を解決するために必要な帯域幅の問題を解決するためには、
何をしたいのかということですこのタスクの周波数変換を何が必要としているか
手足の使い方をしたいと思いますそれが帯域幅を得るための数字ではありません
それは帯域幅が広範囲の問題ではないかということです
私はその幅と深さについてよく覚えていませんが、深さと深さには答えがあります
この疑問の裏には興味がありました帯域幅や人を増やすことになるでしょう
ロボットのデクタリティの影響と反応時間の影響について知っていることを知っている
あなたが州を救うことができるのは州を救うことができない国を救うことができます
100 までのハーツに行くけど 10 25 のことを知らない
時間の経過とともに、帯域幅はかなりの増加になると思いますが、それはかなりの時間にわたって増加しますが、
最小限の待ち時間を最小化することを最小化したいと思います
うーん私が思うに深さというのは私たちが持っているものとは
私たちはこの時点ではかなり大きな会社なので専門知識の分野を多くの分野において
自律性を作るために、または、電気自動車を作るために、そして、自動的に電気を作るために発達する
私たちが持っているのは Tesla というのは基本的には全シリーズのスタートアップのようなもので
今までのところ、ほとんど全てが成功しているので、私たちは何か正しいことをしなければならない
私が思うにイランの会社には環境があるということを考えています
偉大な技術者は栄えることができます多くの企業では
もし本当に才能のあるエンジニアが実際にはいられないというのは私にはわからないでしょう
彼らの才能は多くの会社で抑圧されています。
エンジニアリング・タレントが抑制されているという一部の企業がそうではないかもしれませんが
でもそれはとても快適でお金をたくさんお金でお金を払った方がいいですが実際には
生産はとても低いのでハニー・トラップのようなものがあるので
米国のシリコンバレーにあるハニー・トラップは、必ずしもエンジニアにとって悪い場所には見えないけど、
優秀な技術者が参加して何が得られたかということです
そのエンジニアリング・タレントの生産量は非常に低いと思われます
楽しんでいるようですが私が電話する理由はいくつかのハニー・トラップ社が
シリコンバレーの Tesla は、私たちが要求しているハニー・トラップではなく、あなたが多くのことを成し遂われるようなものだということを
とても涼しいものになるでしょうし簡単なことではありません
もしあなたがスーパーの才能ある技術者ならあなたの才能は私には使われないだろう
他のどの場所よりも大きな程度であると考える
SpaceX もそうだと思いますハイラインに 2 つの質問があるのは
自動操縦のチームにとってここ数年の間私はあなたの進歩を続けてきたようなものです
あなたが言ったように「今すぐ意味のセグメンテーションを行っている」と言ったようにレイの検出に変化があったということです
車線を作るための乗り換えモデルを構築しています他にもいくつかの共通の課題があります
現在直面しているのは未来の研究者として皆さんが解決しているようなものです研究者が働くように
2 つ目の問題は私が皆さんのようなデータエンジンについて本当に知りたいと思っているようなものです
男性は車が止まっているようなケースを言いましたどうすれば車が止まっているのか
データエンジンについてのデータからそれだけではなくデータエンジンについてのデータが大きくなります
まず最初の質問の答えを「占有ネットワーク」を例として使っていますプレゼンテーションで見たものを
1 年前には存在しませんでした私は 1 年しか経っていませんでした私は 12 人以上の占有率と
ネットワークには 1 つのファウンデーション・モデルがありますが
あらゆる場所で物理的な世界を歩き回っているということです常に状況は
1 年以上前にとてもやりがいがあるということです 1 年以上前に戦争があると 2 つの場所を運転するようなものです
この曲線は私たちが持っているのと同じような静的なエッジによって表現されているということです
カーブと壁の大きな違いは私たちが気付いた後に違う選択をするということです
私たちはこの問題を根本的に再同期させる必要がありますこれがどうなるかということを
過去 1 年間に我々が征服したことがある難題の 1 つの例として
どうすればいいのかという疑問に答えるためにいくつかの方法があります
2 つの例が私たちの信号の中で不一致の引き金を引き出しているということです「パークレット」というのは
駐車場と運転の間のフライカーが引き金を引き、 2 つ目は、より多くのシャドウ・モードを活用できます
お客様が車を無視したとしても、お客様が車を止めてしまうという論理なのですが、お客様がこのデータを取り戻そうとすると
様々なトリガー・ロジックがありますこれらのデータ・キャンペーンを元に戻すことができます
あの素晴らしいプレゼンテーションに感謝しますありがとうございましたこんなにも
多くの企業が AGI の問題に焦点を当てていますこの問題がなぜ難しいかというと
なぜなら、問題自体は、いくつかの会社がいくつかの定義を定義するのに非常に難しいからです。
Tesla が ATI の問題をどのように定義しているのか、そして特に Tesla が Tesla に何を焦点にしているのかを
私たちは AGI に特に焦点を当てていないだけではありません
「 HGI は、私たちが何をしているかについての創発的特性と思われる」と
これらの自律走行車と自律型の人型を作っているからです
実際に巨大なデータストリームの中にあるということです
処理されているのは現実世界のデータやデータの量ではありません
インターネットを検索するだけです世界の外にいる必要がありますそして人々と交流し、道路と交流し、そして、あなただけが
地球は大きな場所であり現実は複雑で複雑なものだということは私が思うに
何千万もの人が何千万人もの人を知っているということを知っているとしたら
自律走行車とそれに匹敵する人間の数かもしれません人間の目の前にあるものよりも
それがデータの量だけでなくビデオが処理されているということで
車の方が人間よりも確実に良くなると知っているように見えるかも
ドライバーとヒューマノイドロボットはますます増えつつある
おそらく、人間とは区別できない、そして、あなたが言ったように、あなたが言ったように
AGI の新興の特性
そして間違いなく人間は集合的に一種の一種の超知的知性だと知っています特に私たちは
人間と人間の間のデータ速度を改善することができますインターネットは初期の頃には
インターネットのようなものが、突然、突然、突然、神経系を手にするようなものを手にするようなものでした。
人間の要素は繋げることによって人間の知識をすべて知ることができる
ほとんど全ての知識をインターネットに接続していましたが以前は交換していたことがあります
データを転送するためには、データを転送するためには、データを転送しなければならないので、情報を転送する必要があります。
人は人から別の人に手紙を運び、その間にたくさんのものを持っていく必要があるだろう
この位置はこんな感じでした私が考えているのはこの考え方が
議会図書館にいたとしても世界中の情報や情報を入手することができなかったとしても
間違いなくそれを検索することはできませんでした私は議会図書館にいる人が
私が意味するのは一種の平等の要素の一つです
インターネットのようなものが史上最大のイクナライザーとなっています
歴史のどの学生にも情報または知識へのアクセス権の条件
千年前に遡るというのはごく少数の本のようなものです
本は信じられないほど高価なものですが、読み方を知っているのはごく一部の人だけで、さらに小さなものが
今では本を持っている人の数が瞬時にどんな本にもアクセスできるようになったということです
基本的に、それを無料で提供することは、非常に素晴らしい
私が最近尋ねたのは「歴史の時代がどうなるか」という質問に
最も多くの答えが今の私の答えでした
これは歴史上最も興味深い時期です私は多くの歴史を読んでいます
そうすることで私たちはそれを維持するために最善を守らなければなりません
初期の質問の一つに遡ることができます時間の経過とともに起こっていることを
Tesla のオートモデルに関しては、私たちが
ニューラル・ネッツは、徐々に、ますます多くのソフトウェアを吸収してきているし、もちろん限界に達している。
車に見られるビデオを見てそれらを比較すると
ステアリングホイールやペダルからのステアリング入力で、非常に単純な入力で、原理的にそれを
その間には何の関係もないということですこれこそが人間が生体神経網を使って
ビデオとそのビデオを基にしているビデオを基にしているのは
その間に他のソフトウェアを持たないステアリングホイールとペダルは、まだそこにはいないが、徐々に
その方向に行くと、最後の質問が待っている
あなたは私の前に質問があると思いますそこで私は 2 つのことをします
あんな素晴らしいプレゼンのおかげで、ええと、ええと、ええと、それに感謝する
FSD が多くの人に使われているということです会社のリスクをどう評価するか
パフォーマンス統計の観点からの許容度、および第三者からの透明性または規制の必要性について、それがどのようなものであるかについて
パフォーマンスのためのしきい値のように、十分に定義されている
何マイルもの間、あなたは私をよく知っている
Tesla における 1 つの設計の 1 つの要件は安全というものですが
車の機械的な安全性という点では、車の安全性という点では、どの車も損傷する可能性が最も低いという点で
本質的には、単に受動的な機械的安全のために、政府によって
クラッシュ構造とエアバッグがあります私たちの中で最も高いのは
積極的な安全性を評価することができますそして私はそれが
安全の行為はとんでもないほど良いということです人間というよりも単に冷ややかだということは
それから、私たちは、私たちがこのことを広く公表することに関して
車による走行距離の統計を語ることはできません
自律性や自律性を持たないテスラ車は、ハードウェアを 2 つ提供します
ハードウェアは 3 つ、 FSD ベータ版はええとええと、
私たちはずっと安定した改善を目にしていますが時々そこには
車がどうなるか分からないのを待つのは君の二分法だ
ある人よりも 3 倍安全な技術を導入することはありますがそれは道徳的に間違っていると思います
あなたが思うに、あなたが思うに、自治を加えることはええと、ええと
怪我と死の皆さんは、あなたがそれを展開するのは道徳的義務を持っていると思いますが、あなたはそれを
大勢の人に訴えられますなぜなら命を救った人は人生があることを知らないから
保存され人々が時々死ぬか怪我をする人は確かに知っていますあるいは彼らの財産は
自問自前で問題があるということを知りたいということです
何回の事故がどれだけ多くの事故を発生させたかについて、何マイルもの間の事故の数を
私たちは交通事故で 300 万台以上の車が運転されていることを知っていますこれは数キロにもわたって
毎日が完璧ではないけれど、それが重要なのは、それが何かというよりは明らかに安全だということである
それを配置することはええと、私は最後の問題
ここでの最後の質問のおかげでそう思う
えぇ、えぇ、ええと、私は、あー
私はハードウェアで働かないかもしれませんハードウェアのチームや皆さんが
私に啓発されるのは、なぜ対称性があるというのか
私たちが持っているのは人間のためだということです
私たちは他の人よりも筋肉のセットを使います時には着用していて
いくつかの共同の失敗やアクチュエーターを見に行くということです
もっと時間がかかるということは、これが非常にプレステージであるということを
私たち人間は超人間に関するファンタジーとフィクションをとてもベースにしているということです
私たちのように腕を広めたいと思っている私たちのような能力は
これらは、非常に多くのファンタジー・ファンタスティクスのデザインを知っている
それ以外のすべてのものは、バッテリーと輝度の観点で
何かを得るためにすべての側面を活用することができるかもしれません
あなたのロボットについてもっと興味がないと思いますが
これらの方向を探ることができると思っています私が思うにこれらの方向性を
「インスペクター・ガジェット・ガジェット・ガジェット」を本物にするというのはご存じですね私たちは今私たちを知っていますが
基本的なヒューマノイドがうまく機能し、目標は最速の道だということを
実用的なヒューマノイド型ロボットにとってこれが現実のものとなると思います
文字通り、私たちが行っていることを確認する
何かが最も困難なことの 1 つとして役立つものに、役に立つこと
実際にその曲線の下で高効用をすることができました何人の人が知っているかということで
あなたは平均してどのくらいの人にどれだけの助けを提供したか
それからどれだけの人がこのユーティリティを利用して有用な製品を実際に出荷しようとしているかを
人々は多くの人々がとても気にしていないということは、非常に硬いものである
その理由が分かると思いますが - シフト商品を持っている会社と商品が違うということを知らない会社の違いが
これは夜と一日のゲームなので製品を出荷するとその価値をコストに
特にハードウェアで非常に難しい、入力のコストよりも価値のある出力
時間を超えて私たちは創造的なことをし 8 つの腕と何をするか
異なるバージョンのハードウェアがあるかもしれませんハードウェアがあるかもしれません
私たちのような楽観主義者にモノを加えることができるような会社のような
電源ポートで追加されたか、またはその電源ポートのようなものが追加された場合、または添付ファイルを追加することができます。
最適主義者は携帯電話にそれを追加することができます時間の経過とともにできるだけのクールなことができるかもしれません
それにアドオンを作る中小企業のエコシステムかもしれません
オプティマスはハードワークのためにチームに感謝してる
あなた達は凄いわええと・・・ありがとう
皆さんにお礼を申し上げます皆さんがオンラインでの調整によりオンラインで来てくれてありがとう
これが素晴らしいビデオの一つになると思いますこれらのビデオは皆さんがこのビデオを
最も興味深いものを見つけることができるということです非常に多くの詳細をご紹介します文字通りとても多くの詳細をご紹介します
ビデオは余暇の中で面白いものを見つけ他の部位をスキップする部位に集中することができます
皆さんにお礼を申し上げましょう毎年これをやってみましょう月々のポッドキャストの一部を
ええとあーだが君にはわかってると思う
乗馬のためにお連れしますそしてクールなことが起きていることをお見せしますありがとうございました