Elon Musk, CEO von Tesla, hat kürzlich den Tesla Bot des Unternehmens vorgestellt. Der Roboter, der Optimus mit dem Coden genannt hat, schlurfte über eine Bühne, winkte mit der Hand und pumpte seine Arme in einer langsamen Tanzbewegung. Musk sagt voraus, dass der Roboter innerhalb von drei bis fünf Jahren 20.000 US -Dollar kosten könnte, wenn alles nach Plan verläuft. Aber die Frage ist, was kann es für uns tun. Aber bevor wir uns darauf einlassen, schauen wir uns die Hauptgeräte an, die den Tesla -Bot antreiben.
Tesla Bot Aktuatoren
Der Aktuatoren sind das Hauptantriebssystem für jeden Roboter. Man könnte sagen, ein Roboter ist nichts anderes als ein PC mit beweglichen Teilen, oder mit anderen Worten, ein Roboter ist ein PC mit Aktuatoren und Sensoren. Tesla hat seine eigenen Aktuatoren für den Bot entwickelt, es verwendet 3 Arten von Rotary -Aktuatoren und 3 Arten von Arten von Lineare Aktuatoren.
Wenn Sie sich fragen, warum Tesla keine standardisierten linearen Aktuatoren wie die verwendet hat FIRGELLI Aktuator, weil sie mehrere Einschränkungen haben, was bedeutet, dass sie ihre eigenen Systeme entwickeln müssen, um die Roboter letztendlich leicht, leistungsstärker, leistungsstarke, hohe Stromdichte und niedrige Kosten zu haben. Tesla hat behauptet, dass er den Bot für jeweils 20.000 US -Dollar in den Einzelhandel bringen möchte. Dies an sich ist eine große Reihenfolge für etwas, das Gong ist, um 23 Aktuatoren und leistungsstarke PCs, viele Sensoren und ein Akku zu erfordern, um mehr als ein paar Stunden zu dauern, sowie ein starkes Skelett, um alles zusammenzuhalten.
Tesla Bot Lineare Aktuatoren
Die linearen Aktuatoren, die Tesla entwickelt hat, sind für eine bestimmte Rolle hochspezifisch. Dies bedeutet, dass sie für eine andere andere Anwendung als einen Roboter nicht wirklich von großem Nutzen sind. Ihre Aktuatoren verwenden ein planetarisches Rollensystem und Tesla nennt es, aber dies ist im Grunde genommen Code für das Lead -Crow -Design mit Ballschrauben. Dies bedeutet, dass das Ball -Lead -Design -Design sehr effizient ist und weniger Leistung verbraucht, aber auch teurer. Und sie verwenden ein bürstenloses Stromversorgungssystem, was bedeutet, dass die Live -Spanne erheblich schneller ist und hochspezifische Laufwerksmodi von der Software gesteuert wird.
Die Länge der Reise ist nur etwa 2 "lang, und als das Bild zeigte, dass sie ein Klavier bei 500 kg anheben, ist dies eine Menge Gewicht. Sie fragen sich vielleicht, warum es so viel Gewicht heben muss? Nun, das liegt daran Metall -Skelett, die Reisen der Aktuatoren müssen das Schock von dem, was es bewegt Etwa null zu einem 3-Fuß-Bogen. Der Huma-Körper, der über 100.000 Jahre entwickelt hat, erlaubt uns Menschen, dies mit unseren Beinmuskeln zu tun, aber einen linearen Aktuator dazu zu bekommen, ist keine leichte Aufgabe. m Machen ist, dass der Antrieb 500 kg Gewicht über 2 Zoll heben kann, sobald der mit einem Hebel verbundene Aktuatoren, je nach Verhältnisverhältnis erheblich reduziert wird, und die Geschwindigkeit erhöht sich jedoch, was zu einem schönen Handel führt -aus.
Tesla Bot Präsentation.
Hier ist, was Tesla selbst über die neueste Bot -Präsentation zu sagen hatte, die sie am 30. September 2022 gehalten haben
Elon Musk präsentiert: W.Ich habe einige wirklich aufregende Dinge, die Sie Ihnen zeigen können, ich denke, Sie werden ziemlich beeindruckt sein. Ich möchte einige Erwartungen in Bezug auf unseren Optimus -Roboter festlegen, da es soweit Sie letztes Jahr wissen, dass es nur eine Person in einem Roboteranzug war, aber wir haben nicht einen langen Weg zurückgelegt und ich denke, Sie wissen im Vergleich dazu, dass es ist wird sehr beeindruckend sein. Und wir werden über die Fortschritte in der KI sprechen, um sich voll und ganz selbst zu bemühen und wie sie sich für mehr bewerbenIm Allgemeinen zu realen KI -Problemen wie einem humanoiden Roboter und sogar darüber hinaus. Ich denke, es gibt ein gewisses Potenzial, dass das, was wir hier bei Tesla tun Klasse von Aktien und das bedeutet, dass die ÖffentlichkeitKontrolliert Tesla und ich denke, das ist eigentlich gut, um, wenn ich verrückt werde, können Sie mich das entlassenist wichtig, vielleicht bin ich nicht verrückt, ich weiß nicht. Also ja, wir werden viel über unsere Fortschritte im AI -Autopilot sowie über die Fortschritte mit Dojo sprechen, und dann werden wir das Team herausbringen und ein langes Q & A machen, damit Sie hart fragen können Fragen. Was auch immer Sie für existenzielle Fragen technischen Fragen möchten, wenn es so viel Zeit für Fragen und Antworten haben möchte. Lassen Sie uns damit erraten, was täglich.
Hey Leute, ich bin Mailand, ich arbeite an Autopilot und es ist Gummi, ich bin Lizzy, ein Maschinenbauingenieur im Projekt auch in Ordnung, also sollten wir den Bot ansprechen, bevor wir das erste Mal diesen Roboter ohne Backup -Support -Kranes ausprobieren,
Mechanische Mechanismen Keine Kabel nichts Ja, ich möchte mich mit euch zusammenschließen
Heute Abend, aber es war das erste Mal, dass wir dich bereit sehen, lass uns gehenSelbstfahrender Computer, der in Ihren Tesla-Autos übrigens läuft, ist es buchstäblich das erste Mal, dass der Roboter heute Abend auf der Bühne auf der Bühne war, sodass der Roboter tatsächlich viel mehr tun kann, als wir Ihnen gerade gezeigt haben, dass wir Ihnen uns nur gezeigt haben Ich wollte nur nicht, dass es ins Gesicht fällt, also werden wir Ihnen jetzt einige Videos von dem Roboter zeigen, der eine Reihe anderer Dinge macht, um ja, die weniger riskant sind.
Ja, wir wollten ein bisschen mehr zeigen, was wir in den letzten Monaten getan habenMit Apart und einfach herumlaufen und auf der Bühne tanzen und nur bescheidene Anfänge
ist gerade für die Knospe direkt auf dieser neuen Plattform umgeschickt, die ich zu Wasser sehen kannEine gerenderte Ansicht, die der Roboter ist, was die Welt ist, die der Roboter sieht, also ist es sehr deutlich, dass Objekte wie dieses Objekt erfassen, das er aufnehmen sollte. Wir verwenden den gleichen Prozess wie für Autopilot, um Daten in Ihren Netzwerken zu sammeln, die wir dann auf dem bereitstellen
Roboter, das ein Beispiel ist, das den Oberkörper ein bisschen mehr veranschaulicht
Etwas, das wir gerne in den nächsten Monaten in ein paar Monaten zusammenfassen werden, würde ich sagen, dass ich es perfektionieren würdeDies ist auch eine tatsächliche Station in der Fremont -Fabrik, an der sie arbeitet.
Das ist nicht das einzige, was wir heute zeigen müssen, damit Sie Bumble C genannt haben. Das ist unser grobe Entwicklungsroboter, der mit semi-off-the-Shelf-Aktuatoren verwendet wird, aber wir haben es tatsächlich noch einen Schritt weiter als das sind schon weiter verbreitet als das schon Das Team hat einen unglaublichen Job gemacht und wir haben tatsächlich einen optimistischen Bot mit a
Voller Tesla, der auf beiden Aktuatoren Batteriepackungssystem entworfen wurdeAlles, was es nicht ganz zu Fuß lief Bringen wir es heraus
Wir erwarten, dass wir in der Optimus -Produktionseinheit 1 haben, was die Fähigkeit ist
Alle Finger unabhängig den Daumen bewegen, haben zwei
Freiheitsgrade, so
Es ist in der Lage, Werkzeuge zu bedienen und nützliche Dinge zu tun. Unser Ziel ist es, einen nützlichen Wert zu machen
Humanoider Roboter so schnell wie möglich und wir haben ihn auch mit dem entworfen
Gleiche Disziplin, die wir bei der Gestaltung des AutoMachen Sie den Roboter in hohem Volumen bei geringen Kosten mit hoher Zuverlässigkeit. Das ist unglaublich wichtig. Ich habe die Intelligenz zu
Navigieren Sie alleine durch die Welt und sie sind auch sehr teuer,und in niedrigem Volumen gemacht, während dies die optimistische Gesellschaft und der äußerst fähige Roboter ist, aber in sehr hohem Volumen wahrscheinlich letztendlich Millionen Einheiten hergestellt wird und es wird erwartet, dass es viel weniger kostet als ein Auto.
Ich würde sagen, wahrscheinlich wären weniger als zwanzigtausend Dollar meine Vermutung
Das Potenzial für optimistische ist ich für sehr effektiv geschätzt
Leute Hey, wie immer Tesla -Demos, kommen heiß in heißAlso okay, das ist gut, das ist gut. Super stolz auf das, was sie getan haben, ist, dass sie wirklich einen großartigen Job gemacht haben. Verbessere es offensichtlich ist dies nur Optimus Version Einer und das ist wirklich der Grund, warum wir dieses Ereignis abhalten, um einige der talentiertesten Menschen der Welt zu überzeugen, wie ihr Tesla beizutreten und es Wirklichkeit werden zu lassen und es zum Tragen zu bringen bei Skalieren Sie so, dass es Millionen von Menschen helfen kann und das und das Potenzial, das es mag, ist wirklich verwirrt den Verstand, weil Sie sagen müssen, wie eine Wirtschaft eine Wirtschaft ist und produktive Einheiten mit der Produktivität der Kapitalzeiten produktion ist Produktivität pro Kopf an dem Punkt, an dem es keine Einschränkung des Kapitals gibt, es ist nicht klar, was eine Wirtschaft zu diesem Zeitpunkt überhaupt bedeutet Zukunft der Fülle eine Zukunft, in der es keine Armut gibt, wo Menschen Sie
kann in Bezug auf Produkte und Dienstleistungen alles haben, was Sie wollenEs ist wirklich eine grundlegende Transformation der Zivilisation, da wir es offensichtlich wissen, dass wir sicherstellen möchten Öffentlichkeit ist sehr wichtig und sollte nicht übersehen werden.
Dies ist eine große Sache, als wäre es sehr wichtig, dass ich nicht einfach tun kann, was ich will, du weißtManchmal denken die Leute das nicht, aber es ist nicht wahr, also wissen Sie, dass es sehr wichtig ist, dass die Unternehmenseinheit, die dies hat, dies passiert, etwas, was die Öffentlichkeit richtig beeinflussen kann, und so denke ich Ich sagte, dass Sie wissen
Produktivität des Transports um mindestens eine halbe Größenordnung vielleicht einGrößenordnung Vielleicht mehr UM -Optimisten Ich denke Es ist sorgfältig und sicher und sorgt dafür Setzen Sie sich wirklich darum, das Richtige hier zu tun, immer danach, das Richtige zu tun, und zahlen Sie wirklich nicht den Weg in die Hölle mit guten Absichten, und ich denke, der Weg zur Hölle ist größtenteils mit schlechten Absichten gepflastert, aber hin und wieder gibt es eine gute Absicht in Dort wollen wir es tun, um das Richtige zu tun.
In Ordnung, also haben Sie heute ein paar Roboter gesehen
Konzept, aber ein Konzept bringt uns nicht sehr weit. Wir wussten, dass wir eine echte Entwicklungs- und Integrationsplattform brauchten
Holen Sie sich so schnell wie möglich mit realem Leben
hatte das innerhalb von sechs Monaten aufgebaut
Parallel dazu haben wir auch die nächste Generation diese hier entworfen
Dieser Typ ist also in der Grundlage des Fahrzeugdesign -Prozesses verwurzelt, von dem Sie wissen, dass wir alle nutzen
Diese Erkenntnisse, die wir offensichtlich bereits haben, gibt es seit letztem Jahr viel, aber es gibt ein paar Dinge
Das sind immer noch gleich, dass wir feststellen werden, dass wir diesen wirklich detaillierten Fokus auf die wahre menschliche Form haben, die wir denken, dass wir das denken
Angelegenheiten aus ein paar Gründen, aber es macht Spaß, dass wir viel Zeit damit verbringen, darüber nachzudenken, wie erstaunlich der menschliche Körper ist, haben wir
Diese unglaubliche Bewegungsfreiheit typischerweise wirklich erstaunliche Stärke ein Spaß
Übung ist, wenn Sie Ihre Fingerspitze vor Ihnen auf den Stuhl setzen, werden Sie feststellen, dass es eine große Bewegungsfreiheit gibt, die diese Bewegung gibt
Sie haben beispielsweise in Ihrer Schulter und Ihrem Ellbogen, ohne Ihre Fingerspitze zu bewegen. Sie können diese Gelenke alle bewegen
über den Ort, aber der Roboter, den Sie kennen, ist seine Hauptfunktion, wirklich nützliche Arbeiten zu leisten und
Es braucht vielleicht nicht unbedingt all diese Freiheitsgrade sofort, also haben wir es auf eine minimale Art abgestreift
von 28 grundlegenden Freiheitsgraden und dann natürlich auch unsere Hände zusätzlich dazu
Menschen sind in einigen Dingen auch ziemlich effizient und in anderen Zeiten nicht so effizient, sodass wir zum Beispiel eine kleine essen können
Menge an Essen, um uns für mehrere Stunden zu erhalten, das ist großartig, aber wenn wir nur irgendwie herum sitzen
Offensiv
Wenn wir dies tun, werden wir diesen Leerlaufstromverbrauch so gering wie möglich fallen und so können wir gerade gerecht
Drehen Sie einen Schalter um und sofort verwandelt sich der Roboter in etwas, das nützliche Arbeit leistet
Sprechen wir also ausführlich über diese neueste Generation, die wir hier auf dem Bildschirm sehen werden
Orange sind Aktuatoren, die wir in ein wenig und in Blau unseres elektrischen Systems erreichen werden
Jetzt, da wir unsere Art von menschlicher Forschung haben und unsere erste Entwicklungsplattform haben, haben wir beide
Forschung und Ausführung für dieses Design wieder nutzen wir dieses Fahrzeugdesign
Foundation also nehmen wir es vom Konzept durch Design und Analyse und
Bauen Sie dann auf dem Weg auf, um Dinge wie Kosten und Effizienz zu optimieren und zu optimieren
Weil dies kritische Metriken sind, um dieses Produkt zum Skalieren zu bringen, wie werden wir das gut machen
Wir werden unsere Teilzahl und unseren Stromverbrauch jedes möglichen Elements verringern, das wir tun werden wie Dinge wie
Reduzieren Sie die Erkennung und die Verkabelung an unseren Extremitäten, die Sie sich vorstellen können, dass eine Menge Masse in Händen und Füßen zu sehen ist
Seien Sie ziemlich schwierig und der Stromverbrauch, um sich zu bewegen, und wir werden beide zentralisieren
Leistungsverteilung und unser Berechnung zum physischen Zentrum der Plattform
In der Mitte unseres Torsos ist es also der Torso
Das ist perfekt für die Arbeit eines ganzen Tages, was an dieser Batterie wirklich einzigartig ist
Pack ist, dass die gesamte Batterie -Elektronik in eine einzelne Leiterplatte innerhalb des Pakets integriert ist, so dass alles alles bedeutet
Von der Erfindung bis zum Verschmelzen des Ladungsmanagements und der Stromverteilung ist alles auf einmal
An einem Ort nutzen wir auch sowohl unsere Fahrzeugprodukte als auch unsere Energieprodukte zum Rollen
All diese Schlüsselmerkmale in dieser Batterie, sodass die Fertigung wirklich effizient ist und
Einfache Kühlmethoden Batteriemanagement und auch Sicherheit und natürlich können wir Tesla's nutzen
Bestehende Infrastruktur und Lieferkette, um es so zu machen, dass es unser Gehirn ist, ist es
Nicht im Kopf, aber es ist auch in unserem Torso ziemlich nah dran, wir haben unseren zentralen Computer, so dass Sie Tesla bereits wissen
Versendet vollständige selbstfahrende Computer in jedem Fahrzeug, das wir produzieren. Wir möchten sowohl die Autopilot-Hardware als auch die Hardware als auch die Hardware nutzen
Die Software für die humanoide Plattform, aber weil sie sich in den Anforderungen unterscheidet und in Formfaktor sind, sind wir uns
Ich werde zuerst ein paar Dinge ändern, damit wir immer noch alles tun werden, was ein menschliches Gehirn tut
Verarbeitungsdaten verarbeiten, die auf der Grundlage mehrerer sensorischer Eingaben und auch Kommunikation auf Basis mehrerer sensorischer Eingaben geteilt werden
Um die Kommunikation zu unterstützen, ist sie mit drahtloser Konnektivität sowie Audiounterstützung ausgestattet
Und dann gibt es auch Sicherheitsfunktionen auf Hardwareebene, die sowohl für den Schutz des Roboters als auch für die Menschen wichtig sind
rund um den Roboter so jetzt, wo wir unsere Art von Kern haben
Wir werden ein paar Gliedmaßen für diesen Kerl brauchen und würden Ihnen gerne ein wenig über unsere Aktuatoren und unsere vollkommen zeigen
Funktionale Hände, aber bevor wir das tun, möchte ich Malcolm vorstellen, der ein wenig darüber sprechen wird
Unsere strukturelle Grundlage für den Roboter [Applaus]
Danke
Tesla hat die Fähigkeit, hochkomplexe Systeme abzuschließen. Es wird viel komplexer als ein Absturz, den Sie sehen können
Hier überlagert sich ein simulierter Absturz auf Modell 3 über den tatsächlichen physischen Absturz
Es ist tatsächlich unglaublich, wie genau es ist, Ihnen nur eine Vorstellung von der Komplexität dieses Modells zu geben
Es umfasst jede Knoten -Bolton -Waschmaschine jeden Punkt Schweißnaht und es hat 35 Millionen Freiheitsgrade, es ist ziemlich erstaunlich
Und es ist wahr zu sagen, dass wir, wenn wir keine solchen Modelle hätten
Können wir also unsere Funktionen und Methoden von der Automobilseite nutzen, um einen Roboter zu beeinflussen
Nun, wir können ein Modell erstellen und da wir Crash -Software hatten, haben wir hier die gleiche Software verwendet
Der Zweck davon ist sicherzustellen
Wir wollen zum Beispiel nicht sein Getriebe an seinen Armen brechen, was einer verrenkten Schulter eines Roboters entspricht
Schwierig und teuer zu reparieren, also wollten wir uns mit einem Job, der gegeben wurde
Wenn wir auch dasselbe Modell einnehmen könnten und die Aktuatoren mit der Eingabe von einem zuvor gelösten Modell anfahren können
Das Leben zum Leben erwecken, sodass dies die Bewegungen für die Aufgaben erzeugt, die der Roboter diese ausführen soll
Aufgaben erfassen Kisten, die das Hocken drehen, wenn sie nach oben gehen, was auch immer die Aufgaben sind, die wir mit dem Spielen spielen können
Modell Dies zeigt nur einfaches Gehen. Wir können die Belastungen in allen Komponenten erzeugen, die uns helfen
Optimieren Sie die Komponenten. Diese sind keine tanzenden Roboter, die dies sind
Tatsächlich das modale Verhalten die ersten fünf Modi des Roboters und normalerweise, wenn Menschen Roboter machen, stellen sie sicher
Der erste Modus ist um die oberen einzelnen Figuren in Richtung 10 Hertz auf
Wer ist es ist, die Steuerung des Gehens zu erleichtern, dass es sehr schwierig ist, zu laufen, wenn Sie nicht garantieren können
Wo Ihr Fuß herumwackelt, ist in Ordnung, einen Roboter zu machen, den wir Tausende machen möchten, vielleicht Millionen
Wir haben nicht den Luxus, sie aus Kohlefaser -Titanium zu machen. Wir möchten sie auf plastischen Dingen nicht machen.
Ganz so steif, so dass wir diese hohen Ziele nicht haben können. Ich werde sie dumme Ziele nennen
Wir müssen sie bei niedrigeren Zielen zum Laufen bringen.
Dies, aber wir sind nur Taschen von feuchtem Gelee und Knochen, die hineingeworfen werden, wir sind nicht hohe Frequenz, wenn ich aufstehe
Mein Bein, das ich bei 10 Hertz nicht vibriere, arbeiten mit niedriger Frequenz, also wir
Kennen Sie den Roboter, kann die Steuerelemente nur schwerer machen, so
die Steifheit und das Futter in das Steuerungssystem, das es zu Fuß laufen ermöglicht
Nur die Steuer wechseln, die das Knie leicht betrachtet, von dem wir uns etwas inspirieren lassen konnten
Biologie und wir können suchen, um zu sehen, was die mechanischen Vorteile des Knies ist, es stellt sich heraus, dass es sich tatsächlich um ganz darstellt
Ähnlich wie bei der Four-Bar-Verbindung und das ist ziemlich nichtlinear das ist nicht wirklich überraschend, weil wenn wenn
Sie denken, wenn Sie Ihr Bein das Drehmoment auf Ihrem Knie biegen
Gerade, dass Sie eine nichtlineare Funktion erwarten und die Biologie tatsächlich nicht linear ist
Dies entspricht ziemlich genau, also ist das die Darstellung der vier von
Link ist offensichtlich nicht physikalisch vier Balkenverbindungen, wie ich sagte, die Eigenschaften sind ähnlich, aber ich wette, das ist
Nicht sehr wissenschaftlich, lass uns ein bisschen wissenschaftlicher sein, wir haben alle Aufgaben durch das Durchlebnis dieser Grafik gespielt, aber das, aber diese
Zeigt Streikposten, die Aufgaben zu hängen
Das Knie gegen die Kniebiegung an der horizontalen Achse. Dies zeigt die Anforderung, dass das Knie all dies tut
Aufgaben und dann eine Kurve durch sie über die Spitze der Gipfel surfen, und das heißt, dies ist das, was erforderlich ist
Lassen Sie den Roboter diese Aufgaben erledigen
Wenn wir uns also die Vier-Bar-Verbindung ansehen, ist das eigentlich die grüne Kurve und sagt, dass die Nichtlinearität der
Vier von Link ist tatsächlich linearisiert das Merkmal der Kraft, was das wirklich sagt, ist die Kraft, die die Kraft verringert hat
Das ist es, was den Aktuator die niedrigstmögliche Kraft hat, die die effizienteste ist, die wir langsam verbrennen möchten
Was ist die blaue Kurve gut Die blaue Kurve ist eigentlich, wenn wir keinen Vier -Bar -Link hatten, hatten wir gerade einen Arm
Mit einem mit einem Aktuator darauf aus meinem Bein aus meinem Bein räumen, einen einfachen Zwei -Bar -Link
Das ist das Beste, was Sie mit einem einfachen Zwei -Bar -Link tun könnten, und es zeigt, dass dies viel mehr Kraft in der erzeugen würde
Aktuator, der nicht effizient wäre, wie sieht das in der Praxis aus
Wie Sie sehen werden, aber es ist sehr eng im Knie verpackt, Sie sehen ein Gutes
transparent In einer Sekunde sehen Sie den vollständigen Bar -Link dort, der auf dem Aktuator betrieben wird. Dies wird bestimmt
Kraft und die Verschiebungen des Aktuators und übergeben Sie jetzt an Concertina an die
Ich bin also, ich möchte mit Ihnen über den Entwurfsprozess und den Aktuator sprechen
Portfolio in unserem Roboter, so dass es viele Ähnlichkeiten zwischen a gibt
Auto und der Roboter, wenn es um Antriebsstrangdesign geht. Das Wichtigste, was hier wichtig ist, ist Energiemasse und Kosten
Wir übertragen den größten Teil unserer Designerfahrung vom Auto zum Roboter
In dem speziellen Fall sehen Sie also ein Auto mit zwei Antriebseinheiten und den Antriebseinheiten
werden verwendet, um das Auto von 0 bis 60 Meilen pro Stunde zu beschleunigen oder a zu fahren a
Städte fahren auf der Stelle, während der Roboter 28 Aktuatoren hat und
Es ist nicht offensichtlich, was die Aufgaben auf der Ebene der Aktuator sind, also haben wir Aufgaben, die
sind höhere Ebenen wie Gehen oder Klettertreppen oder ein schweres Objekt, das übersetzt werden muss
Gelenk in Gelenkspezifikationen verwenden wir daher unser Modell
Das erzeugt die Drehmomentgeschwindigkeitsbahnen für unsere Gelenke, die
Anschließend wird in unserem Optimierungsmodell gefüttert und durchlaufen
Der Optimierungsprozess ist eines der Szenarien, die die
Roboter ist in der Lage zu tun, was sich dreht und geht. Wenn wir diese Drehmomentgeschwindigkeit haben
Flugbahn Wir haben eine Effizienzkarte eines Stellantriebs gelegt und können mit
die Flugbahn, um den Stromverbrauch und die akkumulative Energie zu erzeugen
Energie für die Aufgabe gegenüber der Zeit ermöglicht es uns, das System zu definieren
Kosten für den jeweiligen Aktuator und geben Sie einen einfachen Punkt in die Cloud, dann tun wir uns dann
Dies für Hunderttausende von Aktuatoren durch Lösung in unserem Cluster und die rote Linie bezeichnet die Pareto -Front
Welches ist der bevorzugte Bereich, in dem wir nach optimal suchen werden, damit das X bezeichnet
Das bevorzugte Stellantriebsdesign, das wir für dieses bestimmte Gelenk ausgewählt haben, müssen wir dies jetzt für jedes Gelenk tun, das wir
Lassen Sie 28 Gelenke optimieren und wir analysieren unsere Cloud, wir analysieren unsere Cloud für jedes Gelenk wieder
Spezifikation und die rote Achse diesmal bezeichnen die maßgeschneiderten Stellantriebsdesigns für jeden
gemeinsam das Problem hier ist, dass wir zu viele einzigartige Stellantriebsdesigns haben und
Auch wenn wir die Symmetrie nutzen, gibt es immer noch zu viele, um etwas Masse zu machen
Hersteller müssen wir in der Lage sein, die Menge an einzigartigen Stellantriebsdesigns zu reduzieren, daher führen wir etwas aus
als Commonity -Studie bezeichnet, für die wir unsere Cloud diesmal wieder analysieren
Aktuatoren, die gleichzeitig die gemeinsamen Leistungsanforderungen für mehr als ein Joint gleichzeitig erfüllen, damit die
Das resultierende Portfolio ist sechs Aktuatoren und zeigen in einer Farbkarte die mittlere Figur
ähm und die Aktuatoren können auch in dieser Folie betrachtet werden. Wir haben drei Rotary und
Drei lineare Aktuatoren, die alle eine große Ausgangskraft oder ein Drehmoment pro Masse haben
Insbesondere der Rotationsaktuator verfügt
Kugellager und auf der Hochgeschwindigkeitsseite und auf der Niedriggeschwindigkeitsseite eine Kreuzwalze
Lager und der Zahnradzug sind ein Dehnungswellenrad und es gibt drei integrierte Sensoren
Hier und die maßgeschneiderte permanente Magnetmaschine Der lineare Aktuator
Es tut mir leid, dass der lineare Aktuator planetarische Walzen und eine umgekehrte Planetary -Schraube hat
Als Ausrüstungszug, der Effizienz, Verdichtung und Haltbarkeit ermöglicht
Um die Kraftfähigkeit unserer linearen Aktuatoren zu demonstrieren
haben ein Experiment eingerichtet, um es unter seinen Grenzen zu testen
Und ich werde Sie das Video genießen lassen
So kann unser Aktuator heben
ein halb Ton neun Fuß Konzert Grand Piano
Und
Dies ist eine Voraussetzung, es ist nichts Schönes zu haben, weil unsere Muskeln können
Das gleiche, wenn sie direkt angetrieben werden, wenn sie direkt angetrieben werden oder Quadrizepsmuskeln dasselbe tun können
Es ist nur so, dass das Knie ein UP -Getriebeverbindungssystem ist, das die Kraft umwandelt
in die Geschwindigkeit am Endeffekter unserer Hügel, um dem Geben zu geben
menschliche Körper Agilität also ist dies eines der wichtigsten Dinge, die am menschlichen Körper erstaunlich sind und ich bin
Abschließe meinen Teil zu diesem Zeitpunkt und ich möchte meinen Kollegen Mike, der mit Ihnen über Hand sprechen wird, begrüßen
Design Vielen Dank Constantinos
Also haben wir nur gesehen, wie mächtig ein Mensch und ein humanoischer Aktuator sein können
Menschen sind auch unglaublich geschickt, die menschliche Hand hat die Fähigkeit, sich zu bewegen
Bei 300 Grad pro Sekunde hat es Zehntausende von taktilen Sensoren
Und es hat die Fähigkeit, fast jedes Objekt in unserem täglichen Leben zu erfassen und zu manipulieren
Für unser Roboter -Handdesign haben wir uns von der Biologie inspiriert, wir haben fünf Finger, einen gegensätzlichen Daumen
Unsere Finger werden von metallischen Sehnen angetrieben, die sowohl flexibel als auch stark sind. Wir haben die Fähigkeit, breit zu vervollständigen
Blendenleistung erfasst und gleich
Warum also ein Mensch wie Roboterhand gut ist der Hauptgrund ist, dass unsere Fabriken und die Welt um uns herum sind
Entwickelt, um ergonomisch zu sein. Dies bedeutet also, dass es sicherstellt, dass Objekte in unserer Fabrik greifbar sind
Es stellt aber auch sicher, dass neue Objekte, die wir vielleicht noch nie gesehen haben
Roboterhand ist auch das Gegenteil, das es gibt
Anstatt Änderungen an unserer Hand vorzunehmen, um ein neues Objekt zu begleiten
Einige grundlegende Statistiken über unsere Hand sind, dass sechs Aktuatoren und 11 Freiheitsgrade einen In-Hand-Controller haben, der
Fördert die Finger und empfängt das Feedback für Sensor -Feedback -Sensor -Sensor -Feedback wirklich wichtig für
Lernen Sie ein bisschen mehr über die Objekte, die wir erfassen
Unsere Hand ist im Weltraum, einer der wichtigsten Aspekte unserer Hand ist, dass sie diese Anpassungsfähigkeit adaptiv ist
ist im Wesentlichen als komplexe Mechanismen beteiligt, die es der Hand ermöglichen, sich an die Objekte anzupassen, die erfasst werden
Ein weiterer wichtiger Teil ist, dass wir einen nicht zurückgeregten fingerbaren Fingerantrieb haben. Dieser Kupplungsmechanismus ermöglicht es uns, zu halten
und transportieren Objekte, ohne die Handmotoren einschalten zu müssen, die Sie gerade gehört haben, wie wir gehen
Wir haben die Tesla Bot -Hardware entworfen, jetzt werden wir sie an Mailand und unser Autonomie -Team weitergeben, um dies zu bringen
Roboter zum Leben danke Mike
Alles klar, dass all diese coolen Dinge, die wir früher im Video gezeigt haben, gepostet wurden
Möglicherweise in wenigen Monaten möglich, dank des erstaunlichen Wort
Die meisten dieser Komponenten portierten ganz einfach in die Bots -Umgebung, wenn Sie darüber nachdenken, dass wir uns nur bewegen
Von einem Roboter auf Rädern bis zu einem Roboter an den Beinen, sodass einige dieser Komponenten ziemlich ähnlich sind und andere benötigen
stärker heben, also zum Beispiel unsere Computer Vision Neural Networks
direkt von Autopilot bis zur Bots -Situation gemeldet, ist genau das gleiche Belegungsnetzwerk
dass wir später mit dem Autopilot -Team, das jetzt hier in dem Bot läuft, mit ein bisschen mehr Details sprechen
Dieses Video hat sich das einzige, was sich wirklich geändert hat, die Trainingsdaten, an die wir uns erinnern mussten
Wir versuchen auch, Wege zu finden, um diese Belegungsnetzwerke mit Arbeiten auf Ihren Strahlungsfeldern zu verbessern, um sie zu bekommen
Wirklich tolles volumetrisches Rendering der Bots -Umgebungen zum Beispiel hier einige hier einige
Machine las, dass der Bot möglicherweise interagieren muss
Ein weiteres interessantes Problem, über das man nachdenken muss, ist in Innenumgebungen hauptsächlich mit diesem Gefühl des GPS -Signals, wie geht es Ihnen
Navigieren Sie kurz zu seinem Ziel, sagen Sie zum Beispiel, um die nächste Ladestation zu finden, damit wir trainiert haben
Weitere neuronale Netze zur Identifizierung hochfrequenter Merkmale wichtige Punkte innerhalb der
BOTS -Kamera -Streams und verfolgen sie im Laufe der Zeit über Frames, während der Bot zu seiner Umgebung navigiert
Und wir verwenden diese Punkte, um eine bessere Schätzung der Bots -Pose und der Flugbahn in seiner Umgebung zu erhalten
Es geht zu Fuß, wir haben auch ziemlich einige Arbeiten an der
Simulationsseite und dies ist buchstäblich der Autopilot -Simulator, zu dem wir die Fortbewegung des Roboters integriert haben
Code und dies handelt
Die Entwicklung der Roboter geht im Laufe der Zeit und so, wie Sie sehen können, haben wir im April ziemlich langsam angefangen und uns beschleunigen
Während wir mehr Gelenke und tiefere fortschrittlichere Techniken wie Arms ausbalancieren, in den letzten Monaten
Und so ist die Fortbewegung speziell eine Komponente, die sehr unterschiedlich ist, wenn wir uns vom Auto zu den Bots bewegen
Umgebung und ich denke, es garantiert ein bisschen mehr Tiefe und ich möchte, dass meine Kollegen darüber sprechen, darüber zu sprechen
jetzt fremd
Hallo allerseits, ich bin Felix, ich bin Robotikingenieur im Projekt und ich werde über das Gehen sprechen
Es scheint einfach, dass richtige Leute es jeden Tag tun, dass Sie nicht einmal darüber nachdenken müssen
Es gibt jedoch einige Aspekte des Gehens, die zum Beispiel aus technischer Sicht herausfordernd sind
Physische Selbstbewusstsein, die bedeutet
Die Masse Ihrer Gliedmaßen Wie groß ist die Größe Ihrer Füße, was zählt, auch ein energieeffizientes Tor Sie haben
Kann sich vorstellen, dass es verschiedene Arten des Gehens gibt und alle gleichermaßen effizient sind
Wichtigste Keep Balance fallen nicht und koordinieren natürlich auch die Bewegung
Von all Ihren Glied
Über diese Probleme nachzudenken und Ihnen zeigen, wie wir sie in unserer Fortbewegungsplanung und -kontrolle ansprechen
Stack, damit wir mit der Fortbewegungsplanung und unserer Darstellung der Bindung beginnen, die
bedeutet das Modell der Kinematikdynamik des Roboters und der Kontakteigenschaften und die Verwendung dieses Modells und des gewünschten
Pfad für die Bots Unser Fortbewegungsplaner generiert Referenzbahnen für das gesamte System
Dies bedeutet machbare Flugbahnen in Bezug auf die Annahmen unseres Modells
Der Planer arbeitet derzeit in drei Phasen und plant Schritte und endet mit dem gesamten Bewegungsfotosystem
Und lassen Sie uns ein bisschen tiefer in die Funktionsweise dieses Videoes tauchen
Horizont folgt dem gewünschten Pfad und wir starten davon und fügen dann für hinzufügen
Trajektorien, die diese Schritte verbinden, nutzen Zehen aus und ergeben Streik genauso wie die Menschen wie Menschen
und dies gibt uns einen größeren Schritt und eine geringere Kniebeugung für eine hohe Effizienz des Systems
Die letzte Stufe findet dann einen Zentrum der Massenbahn, das uns eine dynamisch realisierbare Gebühr dessen gibt
Ganzes System, um das Gleichgewicht zu halten, da wir alle wissen, dass Pläne gut sind, aber wir
Sie müssen sie auch in Wirklichkeit realisieren, sagen wir, Sie wissen, wie wir das tun können
[Applaus] Danke, felix Hallo allerseits mein Name
ist Anand und ich werde mit Ihnen über Kontrollen sprechen. Nehmen wir also den Bewegungsplan, den Felix
Ich habe gerade darüber gesprochen und in die reale Welt auf einen echten Roboter gesetzt, mal sehen, was passiert
Es dauert ein paar Schritte und fällt gut hin, das ist ein wenig enttäuschend
Aber hier fehlen ein paar Schlüsselstücke, die es zum Laufen bringen
Jetzt, wie Felix erwähnte, verwendet der Bewegungsplaner eine idealisierte Version von
selbst und eine Version der Realität um sie herum ist dies nicht genau richtig
es drückt auch seine Absicht durch Flugbahnen und Schraubenzweige aus
Kräfte und Drehmomente, die es auf die Welt zur Lokomote ausüben will
Die Realität ist viel komplexer als ein ähnliches Modell, auch der Roboter ist nicht
vereinfacht, hat es Vibrationen und Modi Compliance -Sensorgeräusch und so weiter und auf und auf
und was also das macht das mit der realen Welt, wenn Sie den Bot in die reale Welt setzen
Nun, die unerwarteten Kräfte verursachen unmodelierte Dynamik, von der der Planer im Wesentlichen nichts weiß und das
verursacht die Destabilisierung insbesondere für ein System, das dynamisch stabil ist wie zweifache Fortbewegung
Was können wir also gut dagegen tun? Wir messen die Realität, wir verwenden Sensoren und unser Verständnis von
Die Welt, die für mich die staatliche Schätzung und den Status hier durchführen
im Wesentlichen das vestibuläre System bei einem Menschen zusammen mit dem Massenzentrum, der verfolgt wird, wenn der Roboter geht
In der Büroumgebung haben wir jetzt alle Teile, in denen wir brauchen
Um die Schleife zu schließen, verwenden wir unser besseres Bot -Modell, das wir das Verständnis der Realität verwenden, das
Wir haben durch staatliche Schätzung gewonnen und vergleichen, was wir wollen, mit dem, was wir von der Realität erwarten, die wir erwarten
Die Realität tut uns, um das Verhalten des Verhaltens zu Korrekturen zu verleihen
Roboter hier, der Roboter, schätzt es sicherlich nicht, gestoßen zu werden, aber das nicht
bewundernswerter Job, um aufrecht zu bleiben. Der letzte Punkt hier ist ein Roboter, der
Spaziergänge sind nicht genug, um seine Hände und Arme zu benutzen, um
Seien Sie nützlich, lassen Sie uns über Manipulation sprechen
[Beifall]
Hallo allerseits, mein Name ist Eric Robotics Engineer auf Teslabot und ich möchte reden
darüber, wie wir den Roboter die Dinge in der realen Welt manipulieren lassen, wollten wir Objekte manipulieren, während
so natürlich wie möglich aussehen und schnell dort ankommen, damit wir es getan haben, ist
Wir haben diesen Prozess zuerst in zwei Schritte unterteilt, um eine Bibliothek mit natürlichen Bewegungsreferenzen zu erzeugen, oder wir könnten wir könnten
Rufen Sie sie Demonstrationen an und dann haben wir diese Bewegungsreferenzen online an die aktuelle Situation in der realen Welt angepasst
Nehmen wir also an, wir haben eine menschliche Demonstration, ein Objekt aufzuheben, wir können eine Bewegungserfassung davon erhalten
Demonstration, die hier als eine Reihe von Keyframes visualisiert wird, die die Stellen der Hände darstellen
Die Ellbogen Der Oberkörper Wir können das dem Roboter mit inverser Kinematik zuordnen und wenn wir eine sammeln
Viele davon haben wir jetzt eine Bibliothek, mit der wir arbeiten können, aber eine einzige Demonstration ist nicht
verallgemeinerbar auf die Variation in der realen Welt zum Beispiel würde dies nur für eine Box in einem ganz bestimmten funktionieren
Ort, also haben wir auch diese Referenzbahnen über a ausgeführt
Trajektorienoptimierungsprogramm, das löst, wo die Hand sein soll, wie der Roboter ausgleichen sollte
während uh, wenn es die Bewegung an die reale Welt anpassen muss
Wenn sich die Box an diesem Ort befindet, erstellt unser Optimierer dies
Die Flugbahn stattdessen wird der nächste Mailand über uh sprechen
Was kommt als nächstes für den Optimus uh tesla y danke Larry
Richtig, hoffentlich hat ihr in den letzten Monaten eine gute Vorstellung davon bekommen, was wir in den letzten Monaten gemacht haben
ähm, wir haben etwas verwendbar gemacht, aber es ist alles andere als nützlich. Es gibt immer noch eine lange und aufregende Straße
Vor uns, ähm ich denke, das erste, was in den nächsten Wochen ist, ist, zumindest Optimus zu bekommen
Par Bumble C Der andere Fehlerprototyp, den Sie zuvor gesehen haben, und wahrscheinlich darüber hinaus werden wir auch anfangen
Konzentrieren Sie sich auf den realen Anwendungsfall in einer unserer Fabriken und versuchen Sie wirklich, dies zu nageln, und ich laufe alle aus
Die Elemente, die für die Bereitstellung dieses Produkts in der realen Welt, die ich früher erwähnte, benötigt
ähm Sie kennen die Innennavigation anmutig für das Management oder sogar die Wartung aller
Komponenten, die zum Skalieren dieses Produkts erforderlich sind, aber ich weiß nichts über Sie, aber danach
Wenn wir sehen, was wir heute Abend gezeigt haben, bin ich mir ziemlich sicher, dass wir dies in den nächsten Monaten oder Jahren erledigen können, und ich mache
Dieses Produkt eine Realität und verändert die gesamte Wirtschaft, sodass ich dem gesamten Optimus -Team für das Harte danken möchte
Arbeit in den letzten Monaten denke ich, dass es ziemlich erstaunlich ist, was alles in kaum sechs oder acht Monaten erledigt hat, danke
Sehr viel [Applaus]
Danke hey an alle
Hallo, ich bin Ashok, ich führe das Autopilot -Team neben Mailand Gott, es kommt so schwer, das zu übertreffen
Optimus -Abschnitt er wird es trotzdem versuchen
ähm jeder Tesla, der in den letzten Jahren gebaut wurde, von denen wir glauben, dass sie das hat
Hardware, damit das Auto selbst fahren, haben wir an der Software gearbeitet
Fügen Sie diesmal im letzten Jahr immer höhere und höhere Autonomie hinzu
Rund 2 000 Autos, die unsere FSD Beta -Software seitdem fahren
verbesserte die Software als Robustheit und Fähigkeit, die wir jetzt bis heute an 160 000 Kunden verschickt haben
yep [Applaus]
Dies ist nicht kostenlos gekommen. Es kam im letzten Jahr vom Schweiß und Blut des Engineering -Teams
Zum Beispiel haben wir 75 000 neuronale Netzwerkmodelle erst ein Jahr geschult, das ist
Ungefähr ein Modell alle acht Minuten, von dem Sie wissen, dass er aus dem Team kommt, und dann bewerten wir sie auf unserem großen
Cluster und dann versenden wir 281 dieser Modelle, die die Leistung des Autos tatsächlich verbessern
und dieser Innovationsraum findet im gesamten Stapel die Planungssoftware statt
Infrastruktur Die Tools, die sogar alles einstellen, geht auf die nächste Stufe voran
Die FSG Beta -Software ist durchaus in der Lage, das Auto zu fahren, aus dem sie navigieren sollte
Parkplatz zum Parkplatzhandling CDC -Fahren für Ampeln und Stoppschilder
Verhandeln mit Objekten an Kreuzungen, die Wendungen machen und so weiter
All dies stammt aus den Kameraströmen, die unsere neuronalen Netzwerke durchlaufen, die auf dem Auto selbst laufen, es ist
Nicht zum Server zurückkehren oder irgendetwas, das es im Auto ausführt, und produziert alle Ausgänge, um das Weltmodell zu bilden
Rund um das Auto und die Planungssoftware treibt das Auto basierend darauf an
Heute werden wir in viele Komponenten eingehen, aus denen das System ausmacht, das das Belegungsnetzwerk als Basis fungiert
Geometrieschicht des Systems Dies ist ein Multi-Kamera-Video Neural
Netzwerk, das aus den Bildern die vollständige physische Belegung der Welt voraussetzt
Der Roboter, also alles, was physisch Bäume Wände Gebäude Autos Wände was ist was
Haben Sie vorausgesagt, ob es speziell vorhanden ist, prognostiziert sie zusammen mit ihrer zukünftigen Bewegung
Auf dieser Basisniveau der Geometrie haben wir mehr semantische Schichten, um zu
Navigieren Sie durch die Straßen, wir brauchen das Objektiv natürlich, aber dann haben die Straßen viel
Verschiedene Gassen und sie verbinden sich auf alle möglichen Arten, daher ist es tatsächlich ein wirklich schwieriges Problem für typischen Computer
Visionstechniken zur Vorhersage der Ebenen von Flugzeugen und ihrer Konnektivität, damit wir den ganzen Weg in die Sprache erreicht haben
Technologien und zog dann den Stand der Technik aus anderen Domänen und nicht nur von Computer Vision, um diese Aufgabe zu machen
Möglich für Fahrzeuge Wir brauchen ihren vollständigen kinematischen Zustand
All dies stammt direkt aus neuronalen Netzwerken Video -Streams Rohvideo -Streams kommen in die Netzwerke, die viel durchlaufen
der Verarbeitung und gibt dann den vollständigen kinematischen Zustand aus, in dem Geschwindigkeiten Beschleunigungen in all dem zulassen
direkt aus den Netzwerken mit minimaler Post -Verarbeitung herauskommt, die für mich wirklich faszinierend ist, denn wie ist wie es ist
Dies ist sogar möglich, was wir in der Welt leben, da diese Magie möglich ist, dass diese Netzwerke den vierten vorhersagen
Derivate dieser Positionen, wenn die Leute dachten, wir könnten diese Objekte nicht einmal erkennen
Ich bin der Meinung, dass es nicht kostenlos gekommen ist.
Systeme, die durch Rohsensor -Daten leuchteten
Server Es kann ein paar Stunden dauern
Nerven in der Karneval
Erstellen Sie Bilder und da es sich um eine Simulation handelt, haben wir trivial alle Etiketten
All dies durchläuft eine gut geölte Data Engine-Pipeline, an der wir zuerst zuerst sind
Trainieren Sie ein Basismodell mit einigen Daten, versenden Sie es an das Auto. Sehen Sie, was die Fehler sind und sobald Sie die Fehler kennen
Wir haben die Flotte für die Fälle, in denen sie fehlschlägt
Dieser Prozess behebt systematisch die Probleme und wir tun dies für jede Aufgabe, die im Auto ausgeführt wird
Ja, und um diese neuen massiven neuronalen Netze in diesem Jahr auszubilden, haben wir unsere Trainingsinfrastruktur um ungefähr erweitert
40 bis 50 Prozent, so dass wir heute bei ca. 14 000 GPUs in mehrfachem vorhanden sind
Trainingscluster in den Vereinigten Staaten Wir haben auch an unserem KI -Compiler gearbeitet, der
Unterstützt nun neue Operationen, die diese neuronalen Netze benötigen
Hardware -Ressourcen und unsere Inferenz -Engine sind heute in der Lage, die Ausführung von zu verteilen
Ein einzelnes neuronales Netzwerk in zwei unabhängigen Systemen auf Schiffen im Wesentlichen zwei unabhängige Computer miteinander verbunden
Innerhalb des einfachen selbstfahrenden Computers und um dies möglich zu machen
Latenz dieses neuen Systems, sodass wir fortschrittlichere Planungscode auf der gesamten FSD -Plattform bereitgestellt haben
Alle diese neuronalen Netzwerke im Auto zusammen produzieren den Vektorraum, der wiederum das Modell der ist
Welt rund um den Roboter oder das Auto und dann funktioniert das Planungssystem darüber hinaus, um Trajektorien zu finden, die
Vermeiden Sie Kollisionen oder reibungslosen Fortschritten zum Ziel, indem Sie eine Kombination aus modellbasierter Optimierung durchführen
Plus neuronales Netzwerk, das dazu beiträgt, es sehr schnell zu sein
Heute freuen wir uns sehr, in all diesen Bereichen Fortschritte zu veranlassen
Kommen Sie herein und erklären Sie diese verschiedenen Blöcke und diese Leistung nicht nur das Auto, sondern auch die gleichen Komponenten laufen auch auf dem Optimus
Roboter, den Mailand zuvor gezeigt hat, begrüßt ich das Panel, um über den Planungsbereich zu sprechen
Hallo alles, was ich parel Joint lass uns dieses Schnittszenario verwenden
Tauchen Sie direkt in die Planung und Entscheidungsfindung in Autopilot ein, damit wir uns dieser Kreuzung nähern
Von einer Seitenstraße und wir müssen allen Kreuzungsfahrzeugen nachgeben, wie wir in die eintreten wollen
Schnittpunkt Der Fußgänger auf der anderen Seite der Kreuzung beschließt, die Straße zu überqueren
Ohne einen Zebrastreifen müssen wir diesem Fußgänger den Fahrzeugen von rechts und der Fahrzeuge nachgeben und
Verstehen Sie auch die Beziehung zwischen Fußgänger und Fahrzeug auf der anderen Seite der Kreuzung
Viele dieser intra-Objekt-Abhängigkeiten, die wir auf einen schnellen Blick auflösen müssen
Und Menschen sind wirklich gut in diesem Szene. Wir sehen uns eine Szene an
vielversprechende und im Allgemeinen eine vernünftige auswählen
Schauen wir uns also einige dieser Interaktionen an, die das Autopilot -System bewertet hat
Fußgänger mit einem sehr aggressiven Start in einem lateralen Profil. Jetzt sind wir offensichtlich ein Idiot für die
Fußgänger und wir würden den Fußgänger und sein süßes Haustier erschrecken, das wir uns langsam kurz vorwärts bewegen können
Für eine Lücke zwischen Fußgänger oder und dem Fahrzeug von rechts sind wir wieder ein Idiot für das Fahrzeug
Von rechts kommen, aber Sie sollten diese Interaktion nicht direkt ablehnen, falls dies nur eine sichere Interaktion verfügbar ist
Zuletzt die Interaktion, die wir am Ende entschieden haben, bleibt langsam die vernünftige
Lücke und dann das Manöver beenden, nachdem alle Agenten vorbeikommen
Die Bewertung all dieser Wechselwirkungen ist nun nicht trivial, insbesondere wenn Sie sich für die Modellierung interessieren
Die Ableitungen höherer Ordnung für andere Agenten zum Beispiel, was ist der Längsschnitt
Juck
Modulare Vorhersagen bringen Sie nur so weit, da Sie viele gültige Interaktionen verpassen werden
Dies läuft im Grunde darauf hinaus, ein Multi-Agent-Gelenk-Flugplanungsproblem über die Flugbahnen von Ego und zu lösen
Alle anderen Agenten, wie viel Sie immer optimieren, wird es eine Grenze dafür geben, wie schnell Sie können
Führen Sie dieses Optimierungsproblem aus. Es wird sich an der Reihenfolge von 10 Millisekunden annähern
Jetzt für eine typische überfüllte unvorhersehbare Links sagen Sie, Sie haben jeweils mehr als 20 Objekte
Objekt mit mehreren verschiedenen zukünftigen Modi Die Anzahl der relevanten Interaktionskombinationen wird in die Luft jagen
Wir, der Planer, muss alle 50 Millisekunden eine Entscheidung treffen. Wie lösen wir dies also in Echtzeit
Wir verlassen uns auf einen Framework, den wir als Interaktionssuche bezeichnen, was im Grunde genommen eine parallelisierte Forschung über eine Gruppe von ist
Manövertrajektorien Der Staatsraum hier entspricht dem kinematischen Zustand des Ego, dem Kinematiker
Zustand anderer Agenten die nominalen zukünftigen multimodalen Vorhersagen und aller statischen Einheiten in der Szene
In dem Aktionsraum werden die Dinge interessant. Wir verwenden eine Reihe von Manövertrajektorien
Kandidaten, um eine Reihe von Interaktionsentscheidungen und auch inkrementelle Ziele für eine längere Ziele zu verzweigen
Horizon -Manöver, lassen Sie uns diese Forschung sehr schnell durchgehen, um ein Gefühl dafür zu bekommen, wie es funktioniert
Wir beginnen mit einer Reihe von Visionsmessungen
Spärliche Extraktionen sowie latente Funktionen verwenden wir, um eine Reihe von Ziele zu erstellen
Die Kandidaten werden wieder aus dem Netzwerk oder unstrukturierten Regionen, die entsprechen
Eine Wahrscheinlichkeitsmaske, die aus menschlichen Demonstrationen abgeleitet ist, sobald wir ein Haufen dieser Gold haben
Kandidaten Wir erstellen Saatgutbahnen mit einer Kombination von klassischen Optimierungsansätzen sowie unseren
Netzwerkplaner, der jetzt erneut auf Daten aus dem Kundenfeed geschult wurde, sobald wir ein paar davon kostenlos erhalten haben
Trajektorien Wir verwenden sie, um sich auf die Interaktionen zu verzweigen, die wir als kritischste Interaktion finden
In unserem Fall wäre dies die Interaktion in Bezug auf den Fußgänger, unabhängig davon, ob wir davor behaupten oder ihm nachgeben
Offensichtlich ist die Option links eine Option mit hoher Strafe, die sie wahrscheinlich nicht priorisiert wird, sodass wir uns weiter anstrengen
Die Option auf der rechten Seite und hier bringen wir immer komplexere Interaktionen auf, die diese Optimierung aufbauen
Problem inkrementell mit immer mehr Einschränkungen und diese Forschung wird immer mehr in der Verzweigung von Interaktionen verzweigt
Weitere Ziele liegen jetzt viele Tricks hier in der Bewertung eines jeden dieses Knotens
der Forschung in jedem Knoten anfänglich mit der Erstellung begonnen
Trajektorien verwenden klassische Optimierungsansätze, bei denen die Einschränkungen, wie ich beschrieben habe, schrittweise hinzugefügt werden
Und das würde jetzt fast ein bis fünf Millisekunden pro Aktion dauern, obwohl dies ziemlich gut ist
Anzahl Wenn Sie mehr als 100 Interaktionen bewerten möchten, skaliert dies nicht
Deshalb haben wir leichte abfragbare Netzwerke aufgebaut, die Sie in der Schleife des Planers ausführen können
Diese Netzwerke werden auf menschliche Demonstrationen aus der Flotte sowie Offline -Löser mit entspannten Zeitgrenzen ausgebildet
Damit konnten wir die heruntergekommene Laufzeit auf die Abschluss von 200 Mikrosekunden pro Aktion bringen
Jetzt alleine zu tun, reicht nicht aus, weil Sie immer noch diese massiv
Durch und Sie müssen den Suchraum effizient beschneiden, damit Sie jeweils ein Tor erzielen müssen
Von diesen Trajektorien sind nur wenige davon ziemlich Standard, dass Sie eine Reihe von Kollisionsprüfungen durchführen. Sie führen eine Reihe von Komfortanalysen durch, was der Idiot ist und
Tatsächlich ist für ein bestimmtes Manöver die Kundenflottendaten hier wieder eine wichtige Rolle spielen
Wir führen zwei Sätze von erneut leichten variablen Netzwerken aus
Interventionen aus der FST -Beta -Flotte, die eine Punktzahl dafür verleiht, wie wahrscheinlich ein bestimmtes Manöver ist, um dazu zu führen
Interventionen in den nächsten Sekunden und Sekunden, die sich ausschließlich auf menschliche Demonstrationen befinden, die menschliche Daten geben
Eine Punktzahl darüber, wie nahe ist Ihre angegebene ausgewählte Aktion an eine menschlich getriebene Flugbahn
Die Bewertung hilft uns, den Suchraum zu beschneiden, um die Interaktionen weiter zu verzweigen und den Computer zu fokussieren
Die vielversprechendsten Ergebnisse der coolen Teil daran
Architektur ist, dass wir eine coole Mischung zwischen UH -datengesteuerten Ansätzen erstellen können, an denen Sie
Sie müssen sich nicht auf viele handgefertigte Kosten verlassen, sondern auch in der Realität mit physikalischen Schecks erden
Jetzt war vieles, was ich beschrieben habe
Das Framework erstreckt sich auf Objekte hinter Okklusionen. Wir verwenden den Video -Feed von acht Kameras
Um die 3D -Belegung der Welt zu erzeugen, entspricht die blaue Maske hier der
Sichtbarkeitsregion Wir nennen es es, es wird im Grunde auf dem ersten blockiert
Okklusion, die Sie in der Szene sehen, verbrauchen wir diese Sichtbarkeitsmaske, um das zu generieren, was wir als Geisterobjekte nennen, die Sie
kann jetzt links oben sehen, wenn Sie die Spawn -Regionen und die staatlichen Übergänge dieses Geistes modellieren
Objekte korrekt, wenn Sie Ihre Kontrollantwort auf einstellen
Funktion dieser Existenzwahrscheinlichkeit Sie können einige wirklich schöne, menschenähnliche Verhaltensweisen extrahieren
Jetzt werde ich es weitergeben, um zu füllen, um mehr darüber zu beschreiben, wie wir diese Belegungsnetzwerke generieren
Hey Leute, mein Name ist Phil, ich werde die Details des Belegungsnetzes, das wir im vergangenen Jahr bauen, teilen
Dieses Netzwerk ist unsere Lösung, um die physische Arbeit in 3D um unsere Autos zu modellieren, und es wird derzeit nicht in unserer gezeigt
Visualisierung der Kunden gegenübersteht und wir werden hier die Ausgabe des Straßennetzes von unserem internen Entwickler -Tool sehen
Das Belegungsnetzwerk nimmt Videoströme aller 80 Kameras, während die Eingabe ein einzelnes einheitliches Volumen erzeugt
Belegung des Vektorraums direkt für jeden 3D -Standort um unser Auto IT IT
sagt voraus, dass die Wahrscheinlichkeit, dass dieser Ort viel besetzt ist, da er Videokontakte hat
in der Lage, Hindernisse vorherzusagen, die sofort verschlossen sind
Für jeden Ort erzeugt es auch eine Reihe von Semantik wie Fußgänger
und niedrige Trümmer wie farblich codiert hier
Der Belegungsfluss wird auch für Bewegung vorhergesagt, da das Modell ein verallgemeinertes Netzwerk ist
Es zeigt keine statischen und dynamischen Objekte explizit, dass es produzieren kann und
Modellieren Sie die zufälligen Bewegungen wie der Ausbilder hier
Dieses Netzwerk wird derzeit in allen Teslas mit FSD -Computern ausgeführt, und es ist
Unglaublich effiziente Läufe etwa alle 10 Millisekunden mit unserem Neuralbeschleuniger
Wie funktioniert dies also zuerst die Architektur, mit denen wir jede Kamera -Bilder korrigieren?
Die Kamerakalibrierung und die Bilder wurden hier dem Netzwerk gegeben
Das typische 8-Bit-RGB-Bild, wie Sie aus den ersten Bildern oben sehen können, sind wir
Geben Sie dem Netzwerk das 12 -Bit -Rohfoto -Konto -Bild, da es vier hat
Bits Weitere Informationen haben 16 -mal bessere Dynamikbereiche und reduziert
Latenz, da wir nicht mehr den falschen ISP in Adobe haben, verwenden wir eine Reihe von Datensätzen und zurück mit
FPS als Rückgrat zum Extrahieren von Bildern Space -Funktionen als nächstes erstellen wir einen Satz 3D -Position
Abfragen Sie zusammen mit den IMG -Space -Funktionen, wenn Schlüssel und Werte in ein Aufmerksamkeitsmodul passen
Der Ausgang des Aufmerksamkeitsmoduls ist hochdimensionale räumliche Merkmale
Diese Besonderheiten werden vorübergehend mithilfe der Fahrzeug -Odometrie ausgerichtet
Um Bewegung abzuleiten, halten Sie diese räumlichen zeitlichen Merkmale ab
durch eine Reihe von D -Faltung, um die endgültige Belegungs- und Belegungsflussleistung zu erzeugen
Sie werden als Boxergrau fester Größe gebildet, was möglicherweise nicht genau genug ist, um die Kontrolle zu planen
Um eine höhere Auflösung zu erhalten
Punktabfragen, um Position und Semantik an jedem willkürlichen Ort zu erhalten
Nachdem wir das Modell besser kennengelernt haben, schauen wir uns ein anderes Beispiel hier an
Die Seitenreihe wird hier als L-förmiger Boxer hervorgehoben, wenn wir uns dem Bus nähern
Bewegen Sie das Blau Die Vorderseite des Wagen
Belegungsfluss und der S-Bus bewegt den gesamten Bus blau
und Sie können auch sehen, dass das Netzwerk die genaue Krümmung des Busses vorhersagt
Nun, das ist ein sehr kompliziertes Problem für das herkömmliche Netzwerk zur Erkennung von Objekten, da Sie sehen müssen, ob ich es gehe
Verwenden Sie einen Quader oder vielleicht eine zwei, um die Krümmung zu passen, aber für das Besatzungsnetzwerk
Da wir uns nur um die Belegung des sichtbaren Raums kümmern, können wir die Krümmung präzise modellieren
Neben dem Voxel -Grad erzeugt das Belegungsnetzwerk auch eine fahrbare Oberfläche
Die Fahroberfläche hat sowohl 3D -Geometrie als auch Semantik. Sie sind sehr nützlich für die Kontrolle, insbesondere bei der Heilung
und kurvige Straßen Die Oberfläche und das Voxelgrau werden nicht unabhängig voneinander vorhergesagt, die die
Voxel Grid stimmt tatsächlich mit der Oberfläche aus, implizit hier wir sind bei einer Heldenquest, wo Sie
kann sehen, wie die 3D -Geometrie der Oberfläche gut vorhergesagt wird
Planer kann diese Informationen verwenden, um zu entscheiden, dass wir vielleicht mehr für den Hillcrest und wie Sie auch können
Sehen Sie, wie sich die Voxelqualität konsequent mit der Oberfläche ausrichtet
Neben der Boxquelle und der Oberfläche sind wir auch sehr begeistert von dem jüngsten Durchbruch im Bereich der neuronalen Lesungen oder
Nerf, in die wir uns befassen, in beiden hellen Farbmerkmalen integrieren
Belegungsnetzwerkstraining sowie unsere Netzwerkausgabe als Eingabestatus für NERF nutzen
Tatsächlich ist Ashok sehr aufgeregt darüber, dass dies schon seit einiger Zeit sein persönliches Wochenendprojekt war
Auf diesen Nerven, weil ich denke, dass die Akademie viele davon aufbaut
Foundation -Modelle UH für die Sprache, die wie Tonnen großer Datensätze für die Sprache verwendet, aber ich denke, dass Vision -Nerven
werden die Grundlagenmodelle für Computer Vision bereitstellen, da sie auf Geometrie und Geometrie basieren
gibt uns eine gute Möglichkeit, diese Netzwerke und Einfrieren der Anforderung zu beaufsichtigen, eine Ontologie zu definieren und die
Die Überwachung ist im Wesentlichen kostenlos, weil Sie diese Bilder nur differenziert machen müssen, so dass ich in Zukunft in Zukunft denke
Idee der Belegungsnetzwerk, wo Sie wissen, dass Bilder hereinkommen und dann das Netzwerk eine konsistente Erzeugung erzeugt
volumetrische Darstellung der Szene, die dann differentiell in jedes Bild verwaltet werden kann, das ich i i i
Ich persönlich denke eine Zukunft der Computervision, und Sie wissen
Denken Sie in Zukunft sowohl bei Tesla als auch in der Wissenschaft in Zukunft, wir werden sehen, dass diese
Kombination aus One-Shot-Vorhersage der volumetrischen Belegung wird das sein
Meine persönliche Wette sexuell, hier ist ein Beispiel für ein frühes Ergebnis von a
3D -Rekonstruktion aus unseren freien Daten, anstatt sich darauf zu konzentrieren, eine perfekte RGB -Reprojektion im Bildgebungsraum zu erhalten
Das primäre Ziel ist es hier, den Warnungen für 3D für das Fahren genau darzustellen, und wir möchten dies für alle tun
Unsere freien Daten über die Welt bei allen Wetter- und Beleuchtungsbedingungen und offensichtlich ist dies eine sehr schwierige
Problem und wir suchen euch, um endlich zu helfen, das Belegungsnetzwerk zu helfen
Mit einem großen Datensatz des automatischen Levels ohne Menschen in der Schleife und damit werde ich an Tim übergehen, um zu sprechen
darüber, was es braucht, um dieses Netzwerk zu trainieren, danke Phil
[Applaus] Alles klar Hey, alle lassen uns über ein Training sprechen
Infrastruktur, also haben wir ein paar Videos gesehen, die Sie vier oder fünf kennen, und ich denke und kümmert mich darum
Mehr und machen Sie sich mehr um viel mehr Clips darauf
Die Belegungsnetzwerke nur von Phil füllen nur Videos. Es dauert 1,4 Milliarden
Frames, um das Netzwerk zu trainieren, was Sie gerade gesehen haben, und wenn Sie hunderttausend GPUs haben, würde es eine Stunde dauern
Aber wenn Sie eine GPU haben, würde es hunderttausend Stunden dauern, so dass dies nicht der Fall ist
Ein humaner Zeitraum, in dem Sie warten können, bis Ihr Trainingsjob richtig läuft
bedeutet
Supercomputer. Deshalb haben wir drei Supercomputer ausgebaut, die umfassen
von 14 000 GPUs, wo wir 10 000 GPU zum Training und ungefähr viertausend verwenden
GPUs für die automatische Beschriftung Alle diese Videos werden in 30 Petabyte eines verteilten verwalteten Videos gespeichert
Cache Sie sollten sich nicht an unsere Datensätze als festlegen, sagen wir, wenn Sie an Ihre denken
ImageNet oder etwas, das Sie mit einer Million Frames kennen, sollten Sie es als eine sehr fließende Sache betrachten, also haben wir eine
Eine halbe Million dieser Videos, die jeden Tag in diesen Cluster in und aus diesem Cluster fließen
und wir verfolgen jede Sekunde 400 000 dieser Art von Python -Video -Instanziationen
Das ist also viele Anrufe, die wir erfassen müssen, um die Aufbewahrungspolitik davon zu regeln
Verteilte Videokange, die all dies zugrunde liegt
im eigenen Haus, damit Sie Sie nicht einfach kaufen können, wissen Sie 40 000
GPUs und dann 30 Petabyte Flash MVME und setzen Sie es einfach zusammen und lassen Sie uns trainieren.
Arbeit und ich werde ein bisschen davon von dem eingehen, was Sie normalerweise tun möchten, ist, dass Sie Ihren Gaspedal so nehmen möchten
dass es die GPU oder das Dojo sein könnte, über die wir später sprechen werden und weil das das teuerste ist
Komponente Hier möchten Sie Ihren Engpass einsetzen, und das bedeutet, dass jeder einzelne Teil Ihres Systems ist
Ich muss diesen Beschleuniger übertreffen, und das ist wirklich kompliziert, dass das wirklich kompliziert ist
bedeutet, dass Ihr Speicher die Größe und die Bandbreite benötigen, um alle Daten in die Knoten zu liefern
Diese Knoten müssen über die richtige Menge an CPU- und Speicherfunktionen verfügen, um sich in Ihr maschinelles Lernen einzuspeisen
Framework Dieses maschinelle Lernrahmen muss es dann an Ihre GPU weitergeben, und dann können Sie mit dem Training beginnen, aber dann Sie
müssen dies über Hunderte oder Tausende von GPU auf verlässliche Weise tun
Logstap und auf eine Weise, die auch schnell ist, sodass Sie auch eine extrem komplizierte Verbindung benötigen, werden wir mehr sprechen
Über Dojo in einer Sekunde, also möchte ich dich zu etwas bringen
Optimierungen, die wir in unserem Cluster durchgeführt haben, also erreichen wir viele Videos und
Das Video ist sehr unähnlich zu sagen, dass das Training für Bilder oder Text, von denen ich halte, sehr gut etabliert ist. Video ist ganz recht
buchstäblich eine Dimension komplizierter ähm und deshalb mussten wir enden gehen
Um von der Speicherebene bis zum Gaspedal zu enden und jedes einzelne Stück davon zu optimieren, weil wir auf der Anzahl der Photonen trainieren
Videos, die direkt aus unserer Flotte stammen, trainieren wir direkt auf denen, die wir überhaupt nicht veröffentlichen, die diese überhaupt nicht verarbeiten
Die Art und Weise, wie es gerade gemacht wird
Frames, von denen sie abhängen, dass dies Ihre Iframes oder Ihre Keyframes sind
Speicher bewegen Sie sie in eine Doppelleiste aus der GPU und verwenden Sie dann den Hardware -Decoder, der nur beschleunigt wird
Dekodieren Sie das Video tatsächlich, damit wir das nativ auf der GPU machen und dies alles in einer sehr schönen Python -Pytorch -Erweiterung ist
Dies entspannte sich für die Belegungsnetzwerke um mehr als 30 Trainingsgeschwindigkeitserhöhungen und befreit im Grunde genommen ein Ganzes
CPU, um etwas anderes zu tun, um Sie nicht einfach mit dem Training zu absolvieren
Videos natürlich brauchen Sie eine Art Bodenwahrheit und äh, das auch ein interessantes Problem ist
Ziel für die Aufbewahrung Ihrer Bodenwahrheit ist, dass Sie sicherstellen möchten, dass Sie zu Ihrer Grundwahrheit kommen, die Sie in der benötigen
Minimale Menge an Dateisystemvorgängen und Last in der minimalen Größe Ihrer benötigten, um für das Aggregat zu optimieren
Cross -Cluster -Durchsatz, da Sie einen Rechencluster als ein großes Gerät sehen sollten, das intern behoben ist
Einschränkungen und Schwellenwerte
ist in uns beheimatet, das als klein bezeichnet wird. Wir verwenden dies für unsere Grundwahrheit unseren Feature -Cache und alle Inferenzausgänge
Viele Tensoren, die da drin sind, und so nur der Cartoon hier, sagen wir, dies sind Ihr UH sind Ihr Tisch, den Sie
Ich möchte dann speichern, dann würde das aussehen, wenn Sie auf der Festplatte aussteigen würden, also nehmen Sie alles, was Sie tun würden
Sie möchten so indexieren, wie zum Beispiel Video -Zeitstempel, die Sie alle in den Header stellen, damit in Ihrem ersten Header
Lesen Sie, Sie wissen genau, wo Sie auf der Festplatte gehen sollen, wenn Sie Tensoren haben, und Sie werden versuchen, die zu übertragen
Dimensionen, um eine andere Dimension als abhängig als zusammenhängende Dimension zu halten, und versuchen Sie dann auch verschiedene Arten von
Komprimierung dann überprüfen Sie, welches am optimalsten war, und speichern Sie dann, dass dies tatsächlich ein großer Schritt ist, wenn Sie dies tun
Das zwischen dem maschinellen Lernnetz ausgestrichene, unverständliche Ausgang des maschinellen Lernens dreht sich um die
Dimensionen ein wenig Sie können bis zu 20 Effizienz des Speichers erhalten, wenn Sie auch speichern, die wir auch speichern
bestellt die Spalten nach Größe so, dass alle Ihre kleinen Spalten und kleinen Werte zusammen sind, so dass, wenn Sie nach einem suchen
Einer Wert, den Sie wahrscheinlich mit einer Lesung über mehr Werte überlappen, die Sie später verwenden, damit Sie es nicht tun müssen
Ein anderer Dateisystembetrieb, damit ich weitermachen konnte, ging ich einfach weiter
Auf zwei Projekte, die wir intern haben, ist dies jedoch tatsächlich Teil einer großen kontinuierlichen Anstrengung, um die zu optimieren
Berechnen Sie, dass wir im eigenen Haus so ansammeln und durch all diese Optimierungen sammeln und aggregieren, dass wir jetzt unsere trainieren
Belegungsnetzwerke doppelt so schnell, nur weil es doppelt so effizient ist und jetzt, wenn wir mehr Berechnung hinzufügen und gehen
Parallele können wir dies nicht in Stunden statt in Tagen trainieren und damit würde ich es gerne weitergeben
der größte Benutzer von Computer John
Hallo allerseits mein Name ist John Emmons Ich führe das Autopilot Vision -Team an. Ich werde zwei Themen mit Ihnen behandeln
Heute ist der erste, wie wir die Fahrspuren vorhersagen, und das zweite ist, wie wir das zukünftige Verhalten anderer Agenten auf der Straße vorhersagen
In den frühen Tagen des Autopilots haben wir das Problem der Fahrspurdetektion als Bildraum -Instant -Segmentierungsaufgabe modelliert
Unser Netzwerk war super einfach
Geometrien speziell würde es die Eagle Lane segmentieren, die sie benachbart segmentieren könnte
Gassen und dann hatte es ein besonderes Gehäuse für Gabeln und verschmolz diese simple Modellierung des Problems
arbeitete für hoch strukturierte Straßen wie Autobahnen, aber heute versuchen wir, ein System zu bauen
Das ist in der Lage, viel komplexere Manöver zu verzeichnen, die wir an Kreuzungen links und rechts abbiegen möchten
Wo die Straßentopologie etwas komplexer und vielfältiger sein kann, wenn wir versuchen, diese vereinfachte Modellierung des
Problem hier ist es einfach völlig zusammen, einen Schritt zurückzutreten, was für einen Moment zurückkommt, was was
Wir versuchen, hier zu tun, ist es, den Funkensatz von lahmen Instanzen in ihrer Konnektivität vorherzusagen und wir wollen eine haben, ist eine
Neurales Netzwerk, das dieses Diagramm im Grunde genommen vorhersagt, in dem die Knoten die Lanesegmente sind und die Kanten die kodieren
Konnektivitäten zwischen diesen Gassen. Wir haben also unsere Fahrspurerkennung
Neurales Netzwerk Es besteht aus drei Komponenten in der ersten Komponente, die wir haben
Faltungsschichten Aufmerksamkeitsebenen und andere neuronale Netzwerkschichten, die die Videoströme von unseren acht codieren
Kameras am Fahrzeug und erzeugen eine reichhaltige visuelle Darstellung
Anschließend verbessern wir diese digitale Darstellung mit einer groben Roadmap -Kartendaten, mit denen wir codieren, mit denen wir codieren
Eine Reihe zusätzlicher neuronaler Netzwerkebenen, die wir das Lane -Leitmodul nennen. Diese Karte ist keine HD -Karte, sondern es
bietet viele nützliche Hinweise auf die Topologie der Gassen innerhalb von Kreuzungen, die die Fahrspur auf verschiedenen Straßen zählt, und eine Reihe anderer Attribute, die
Helfen Sie uns, die ersten beiden hier erzeugten Komponenten a
Dichtes Tensor, das die Welt kodiert, aber wir wollen wirklich diesen dichten Tensor in a umwandeln
Smart Set von Gassen in ihren Konnektivitäten nähern wir uns diesem Problem wie ein Bild
Bildunterschrift Aufgabe, bei der die Eingabe dieser dichte Tensor ist und der Ausgangstext in eine spezielle Sprache vorhergesagt wird, die
Wir haben uns bei Tesla entwickelt, um in ihren Konnektivitäten in dieser Sprache der Wörter und in dieser Sprache der Gassen zu codieren
Token sind die Spurpositionen im 3D -Raum in der Bestellung der in die Token eingeführten Modifikatoren in den Token
codieren die Bindebeziehungen zwischen diesen Gassen, indem Sie die Aufgabe als Sprache modellieren
Problem können wir von den jüngsten autoregressiven Architekturen und Techniken der Sprachgemeinschaft zum Umgang mit dem Vielfachen nutzen
Modalität des Probleme
Sprachmodellierung und maschinelles Lernen im Allgemeinen Ich werde jetzt in ein bisschen detaillierter eingehen. Diese Sprachkomponente
Was ich hier auf dem Bildschirm abgebildet habe, ist das Satellitenbild, das die Art von der Region um die darstellt
Fahrzeug Die Set der Nasenkanten bezeichnen wir als Lane -Diagramm und es ist letztendlich das, was wir aus dieser Neural herausholen wollen
Netzwerk Wir beginnen mit einem leeren Taf
Vorhersage hier an diesem grünen Punkt Diese grüne Punkte wird als codiert als
Ein Index in ein Kursnetz, das die 3D -Welt diskretisiert. Jetzt prognostizieren wir diesen Index nicht direkt
Weil es zu rechenintensiv wäre, gibt es einfach zu viele Netzpunkte und eine kategorische Vorhersage
Die Verteilung darüber hat sowohl Auswirkungen auf die Trainingszeit als auch die Testzeit
World Scary zuerst prognostizieren wir eine Wärmekarte über die möglichen Orte und dann an den wahrscheinlichsten Ort
Dazu verfeinern wir dann die Vorhersage und erhalten den genauen Punkt
Jetzt wissen wir, wo die Position dieses Tokens ist
Lane, also nähern wir uns es als Start -Token und weil es ein Star -Token ist, gibt es keine
Zusätzliche Attribute in unserer Sprache. Wir nehmen dann die Vorhersagen aus diesem ersten Vorwärtspass und codieren sie
Verwenden einer erlernten zusätzlichen Einbettung, die eine Reihe von Tensoren erzeugt, die wir miteinander kombinieren
Welches ist eigentlich das erste Wort in unserer Sprache der Gassen, wir fügen dies zu der Erstposition in unserem Satz hier hinzu
Wir setzen diesen Prozess dann fort, indem wir den nächsten Spurpunkt ähnlich drucken
Jetzt ist dieser Spurpunkt nicht der Beginn einer neuen Fahrspur, sondern tatsächlich eine Fortsetzung der vorherigen Spur
Es ist also ein Fortsetzungstyp, jetzt reicht es nicht aus, das zu wissen
Diese Fahrspur ist mit der zuvor geschützten Ebene verbunden, die wir für ihre präzise Geometrie codieren möchten, die wir tun, von
Wenn wir eine Reihe von Spline -Koeffizienten zurückbilden, nehmen wir diese Spur ein, die wir codieren
Nochmal
Ende des Vorhersagegitter
Es ist nicht topologisch mit dem rosa Punkt verbunden, der tatsächlich davon ausgeht, dass Blue, tut mir leid, dass das Grün ist
Zeigen Sie dort, damit es einen Gabeltyp- und Gabel -Token hat
Zeigen Sie tatsächlich auf vorherige Token zurück, aus denen die Gabel stammt, so dass Sie so
Kann hier sehen, dass der Gabelpunkt -Prädiktor tatsächlich der Index -Null ist, sodass er tatsächlich auf Token zurückgeführt wird, die bereits vorhergesagt werden, wie Sie es tun würden
Sprache Wir setzen diesen Prozess immer und immer wieder fort, bis wir alle alle aufgezählt haben
Token im Ling -Diagramm und dann prognostiziert das Netzwerk das Ende des Satztokens
Ja, ich möchte nur bemerken, dass der Grund, warum wir dies tun
Fast fühlt sich hier jedoch eine vollständige Maschine mit neuronalen Netzwerken an, dass wir einfache Ansätze für versucht haben
Beispiel ah versuchen, die Gassen auf der Straße oder so etwas zu segmentieren, aber dann ist das Problem, wann
Es gibt Unsicherheit, dass Sie die Straße nicht klar sehen können, und es könnte zwei Fahrspuren oder drei Gassen geben und Sie es nicht sagen können
Ein einfacher segmentierungsbasierter Ansatz würde nur eine Art 2,5 -Spur -Situation zeichnen und die
Post -Verarbeitungsalgorithmus würde komisch scheitern, wenn die Vorhersagen so sind. Ja, die Probleme enden dort nicht, ich meine, ich meine, ich meine nicht
Sie müssen diese Bindebedingungen wie diese Bindespuren innerhalb von Kreuzungen vorhersagen, die mit dem Ansatz einfach nicht möglich sind
Ashoks Erwähnung, deshalb mussten wir auf solche Überschneidungen wie diese Segmentierung aufrüsten, aber selbst wenn Sie sich sehr sehr bemühen
Sie wissen
Probe von einem hinteren im Gegensatz zu Ihnen wissen, dass Sie versuchen, all dies bei der Nachbearbeitung zu tun
Dies hört jedoch nicht auf, nur für Autopilot richtig John dies kann wieder für Optimus verwendet werden. Sie wissen, ich denke, sie wären nicht
Gassen bezeichnet, aber Sie könnten sich vorstellen, dass Sie in dieser Bühne wissen, dass Sie hier möglicherweise Wege haben, die Sie kennen, die die möglichen kodieren
Orte, an denen die Leute laufen könnten, ja, es ist im Grunde genommen, wenn Sie in einer Fabrik oder in einer Sie zu Hause kennen
Sie können einfach den Roboter fragen, okay, lass mich bitte mit der Küche sprechen oder bitte zu einem Ort in der Fabrik gehen
Und dann sagen wir eine Reihe von Wegen voraus, von denen Sie wissen würden
ist, wie Sie in die Küche gelangen, es gibt uns wirklich einen schönen Rahmen, um diese verschiedenen Wege zu modellieren, die das Navigationsproblem vereinfachen oder die
nachgeschalteter Planer in Ordnung so letztendlich, von was wir bekommen
Dieses Fahrspur -Erkennungsnetzwerk ist eine Reihe von Fahrspuren in ihren Konnektivitäten, die direkt aus dem Netzwerk stammen, das es gibt
Kein zusätzlicher Schritt hier, um diese zu vereinfachen.
Dies ist nur eine direkte, ungefilterte Ausgabe des Netzwerks
Okay, also habe ich ein wenig über Gassen gesprochen. Ich werde kurz darüber berühren, wie wir modellieren und die zukünftigen Wege in den
Andere Semantik auf Objekten, also werde ich nur sehr schnell zwei Beispiele durch das Video auf dem
Genau hier haben wir ein Auto, das tatsächlich ein rotes Licht betreibt und uns vor uns dreht, was wir tun, um damit umzugehen
In solchen Situationen sagen wir eine Reihe von kurzen Zeithorizont zukünftigen Trajektorien für alle Objekte vor, die wir verwenden können
Diese erwarten die gefährliche Situation hier und wenden Sie an, was Sie wissen, um Bremsen und Lenkmaßnahmen zu vermeiden, um eine Kollision zu vermeiden
In dem Video recht
Wenn ich geladen bin, weiß ich nicht, warum der Fahrer beschlossen hat, dort zu parken, aber das Wichtigste ist, dass unser neuronales Netzwerk vorausgesagt hat, dass es gestoppt wurde
Welches ist die rote Farbe dort, um das Fahrzeug auf der anderen Fahrspur, wie Sie bemerken
Offensichtlich wartet nur darauf, dass dieses rote Licht grün wird, obwohl beide Objekte stationär sind und keine Geschwindigkeit haben, es ist die Semantik, die es ist
Wirklich wichtig hier, damit wir nicht hinter diesem unbeholfen geparkten Auto stecken bleiben
Die Vorhersage all dieser Agentenattribute zeigt einige praktische Probleme beim Versuch, ein Echtzeitsystem aufzubauen
Wir müssen die Bildrate unseres Objektabschnittstapels maximieren, damit Autopilot schnell auf die sich ändernde Umgebung reagieren kann
Jede Millisekunde ist hier wirklich wichtig, um die Inferenzlatenz zu minimieren. Unser neuronales Netzwerk ist in zwei Phasen aufgeteilt
In der ersten Phase identifizierten wir Orte im 3D -Raum, in dem Agenten existieren
In der zweiten Stufe ziehen wir dann Tensoren an diesen 3D -Standorten an
Fahrzeug und dann wissen wir, dass der Rest der Verarbeitung dieser Spezifikationsschritt ermöglicht, die
Neuronales Netzwerk, um den Berechnung auf die Bereiche zu konzentrieren, die am wichtigsten sind, was uns eine überlegene Leistung für einen Bruchteil der Latenzkosten bietet
Also alles zusammenstellen, den Autopilot -Vision -Stack prognostiziert mehr als nur die Geometrie und Kinematik von
Die Welt prognostiziert auch eine reiche Semantik, die ein sicheres und menschliches Fahren ermöglicht
Ich werde die Dinge nicht auf die Straße geben. Wir werden uns sagen, wie wir all diese coolen neuronalen Netze auf unserem FSD -Computer führen. Danke, danke
[Beifall]
Hallo allerseits, ich bin heute SRI. Ich werde einen Blick darauf geben, was es braucht, um diese FSC -Netzwerke in der zu betreiben
Auto und wie optimieren wir die Inferenzlatenz, heute werde ich mich nur auf die konzentrieren
FSG Lanes Network, über das John gerade gesprochen hat
Als Sie diesen Track begannen, wollten wir wissen, ob wir dieses FSC Lanes -Netzwerk nativ auf der Trip Engine ausführen können
Welches ist unser internes neuronales Netzwerkbeschleuniger, den wir auf dem FSD-Computer eingebaut haben
Wenn wir diese Hardware erstellen, haben wir sie einfach gehalten und haben dafür gesorgt
Sache lächerlich schnell dichtes Punktprodukte, aber diese Architektur ist automatisch
regressiv und iterativ, wo es in der inneren Schleife durch mehrere Aufmerksamkeitsblöcke aufmerksam wird
Bei jedem Schritt direkt spärliche Punkte produzieren, war die Herausforderung hier, wie
Können wir dies analysieren, Punktvorhersage und spärliche Berechnung auf einer dichten Punktproduktmotor -Motor sehen, wie wir das gemacht haben
Auf der Reise prognostiziert das Netzwerk die Wärmekarte von
Die wahrscheinlichsten räumlichen Orte des Punktes, jetzt machen wir einen Bogen max und eine
Herzbetrieb, die die eine schwere Codierung des Index des räumlichen Ortes verleiht
Jetzt müssen wir die mit diesem Index verbundene Einbettung aus einer Einbettungstabelle auswählen, die während
Training, um dies auf Trip zu tun
Die Dimensionen dieser Einbettung, so dass wir all das mit nur Matrixmultiplikation erreichen können
Nicht nur, dass wir diese Einbettung auch in einen Token -Cache lagern wollten
Dass wir dies nicht für jede Iteration neu berechnen
Tricks hier, wo wir all diese Vorgänge nur auf der Punktprodukt -Engine durchgeführt haben, ist tatsächlich cool, dass unser Team
Fanden kreative Möglichkeiten, all diese Vorgänge auf der Trip Engine auf eine Weise abzubilden
Das wurde nicht einmal vorgestellt, wann diese Hardware entworfen wurde, aber das ist nicht das einzige, was wir müssen
tun, um diese Arbeit zu machen. Wir haben tatsächlich viele Vorgänge und Funktionen implementiert, um dieses Modell zu erstellen
Kompilierbar, um die Aufnahmegenauigkeit zu verbessern und die Leistung zu optimieren
All diese Dinge haben uns geholfen, das 75 Millionen Parametermodell knapp 10 zu betreiben
Millisekunde der Latenz, die nur 8 Watt Strom verbraucht
Dies ist jedoch nicht die einzige Architektur, die im Auto läuft. Es gibt so viele andere Architekturmodule und Netzwerke
Wir müssen im Auto laufen, um ein Maßstab zu vermitteln
kombinierte produzieren rund 1000 neuronale Netzwerksignale, sodass wir sicherstellen müssen
Wir optimieren sie gemeinsam und so, dass wir den Berechnung maximieren
Nutzungsdurchsatz und minimieren die Latenz, sodass wir einen Compiler nur für Neural erstellt haben
Netzwerke, die die Struktur traditionellen Compilern teilen, wie Sie sehen können, dauert die massive
Diagramm der neuronalen Netze mit 150k Knoten und 375.000 Verbindung nimmt dieses Ding an
Verteilt sie in unabhängige Untergraphen und zwingt jeden dieser
Subgraphen nativ für die Inferenzgeräte, dann haben wir ein neuronales Netzwerk
Linker, der die Struktur an herkömmlichen Linker teilt, wo wir diese Link -Zeitoptimierung durchführen
Dort lösen wir ein Offline -Optimierungsproblem für mit dem Berechnenspeicher und Speicher und Speicher
Bandbreitenbeschränkungen so mit einem optimierten Zeitplan, der im Auto ausgeführt wird
Auf der Laufzeit haben wir ein Hybridplanungssystem entworfen, das im Grunde genommen im Grunde genommen tut
Heterogene Planung für einen SOC und die verteilte Planung in beiden SOCs, um diese Netzwerke in einem Modell auszuführen
Parallele Mode, um 100 Tropfen Berechnungsnutzung zu erhalten, müssen wir alle optimieren
Softwareschichten direkt vom Stimmen der Netzwerkarchitektur des Compilers alle
Die Art und Weise zur Implementierung einer hohen Bandbreiten -RDMA -Verbindung mit niedriger Latenz in den SRCs und in der Tat noch tiefer
Verständnis und Optimierung der cache kohärenten und nicht kohärenten Datenpfade des Beschleunigers im SOC Dies ist eine Menge
der Optimierung auf jeder Ebene, um sicherzustellen
Hier und das ist das ist nur das, was das ist
Visualisierung der neuronalen Netze, die im Auto laufen
Diese Operationen sind nichts anderes als die Faltung der Matrix -Multiplikation, um ein paar reale Operationen im Auto zu nennen
Um dieses Netzwerk mit einer Milliarde Parameter zu trainieren oder zu trainieren, benötigen Sie viele beschriftete Daten, damit Aegon sprechen wird
Wie erreichen wir dies mit der Auto -Kennzeichnung -Pipeline
Danke, danke Sherry
Äh hi allerwunsch, ich bin Jürgen Zhang und ich leite eine geometrische Vision bei Autopilot
Also ja, lassen Sie uns über die Automatikkennzeichnung sprechen
Wir haben also verschiedene Arten aller Kennzeichnungsframeworks, um verschiedene Arten von Netzwerken zu unterstützen, aber heute möchte ich gerne
Konzentrieren Sie sich hier auf das fantastische Netz hier, um erfolgreich zu trainieren und zu verallgemeinern
Dieses Netzwerk zu überall, wo wir glauben, dass wir zig Millionen von Reisen von von
Wahrscheinlich eine eine Million Kreuzung oder sogar noch mehr
Dann, wie es geht, ist es sicherlich erreichbar, dass sie ausreichend beziehen
Betrag der Reisen, weil wir bereits wie Tim zuvor erklärt haben
ähm, aber alle diese Daten in ein Trainingsformular umzuwandeln, ist ein sehr herausforderndes technisches Problem
Um diese Herausforderung zu lösen, haben wir verschiedene Arten des manuellen und automatischen Kennzeichnungen so ausprobiert
Die erste Spalte bis zum zweiten von der zweiten bis zum dritten jeden Fortschritt lieferte uns fast 100x Verbesserung in
Durchsatz, aber trotzdem haben wir eine noch bessere Auto -Etikettierungsmaschine gewonnen, die bieten kann
bieten Anbietern eine qualitativ hochwertige Vielfalt und Skalierbarkeit
Um all diese Anforderungen zu erfüllen, trotz der enormen technischen Anstrengungen, die hier erforderlich sind, haben wir a entwickelt
Neue Order-Kennzeichnungsmaschine, die mit einer Mehrfachtribierungsrekonstruktion betrieben werden, damit dies 5 Millionen Stunden ersetzen kann
Manuelle Beschriftung mit nur 12 Stunden auf dem Cluster zum Beschriften von 10 000 Fahrten
Wie wir es gelöst haben, gibt es drei große Schritte. Der erste Schritt ist eine hohe Präzisionsbahn und Strukturwiederherstellung durch
Multi-Kamera visuelle Trägheitsidometrie So sind hier alle Merkmale einschließlich Bodenoberfläche aus Videos abgeleitet
durch neuronale Netze, die dann im Vektorraum verfolgt und rekonstruiert wurden
Die typische Driftrate dieser Flugbahn im Auto beträgt also 1,3 Zentimeter
pro Meter und 0,45 Milli Radian pro Meter, was in Anbetracht des kompakten Berechnung ziemlich anständig ist
Anforderung als der Wiederherstellungsservice und Rohdetails werden ebenfalls als starke verwendet
Anleitung für den späteren manuellen Überprüfungsschritt Dies ist auch in jedem FSD aktiviert
Fahrzeug, sodass wir zusammen mit den Reisedaten vorverarbeitete Flugbahnen und Strukturen erhalten
Der zweite Schritt ist die Mehr-2-Rekonstruktion, die das große und Kernstück dieser Maschine ist
Das Video zeigt also, wie die zuvor gezeigte Reise rekonstruiert und ausgerichtet ist
Mit anderen Reisen im Grunde andere Reisen verschiedener Personen, nicht dasselbe Fahrzeug, so wird dies von mehreren durchgeführt
Internetschritte wie Kursausrichtung paarweise Übereinstimmungsoptimierung und weitere Oberflächenverfeinerung
Am Ende kommt der menschliche Analyst herein und schließt das Etikett ab
So sind jede glückliche Schritte bereits vollständig parallel auf dem Cluster, damit die
Der gesamte Prozess dauert normalerweise nur ein paar Stunden
Der letzte Schritt ist tatsächlich automatisch, die neuen Reisen so zu kennzeichnen
Hier verwenden wir denselben Multi-Strip-Alignment-Engine, jedoch nur zwischen vorgefertigter Rekonstruktion und jedem neuen
Reise ist also viel einfacher, als alle Clips vollständig zu rekonstruieren
Deshalb dauert es nur 30 Minuten pro Reise zu einem anderen Etikett statt Handbuch
Mehrere Stunden manuelle Kennzeichnung und dies ist auch der Schlüssel der Skalierbarkeit
dieser Maschine skaliert diese Maschine leicht so lange wie wir
Verfügbare Rechen- und Auslösedaten, sodass etwa 50 Bäume neu bestellt wurden
Aus dieser Szene gekennzeichnet und einige von ihnen sind hier so 53 aus verschiedenen Fahrzeugen gezeigt
So erfassen und verwandeln wir die Raumzeitscheiben der Welt in die Welt
Die Netzwerkaufsicht ja, eine Sache, die ich gerne bemerkte, ist, dass es wieder nur darüber gesprochen hat, wie wir automatisch sind
Beschriften Sie unsere Gassen, aber wir haben Autoarbeiter für fast jede Aufgabe, die wir ausführen, einschließlich unseres Planers und viele von
Diese sind vollautomatisch wie keine Menschen, die zum Beispiel für Objekte oder andere Kinematiks involviert sind.
Futures alles kommt nur aus der Autokennzeichnung und das Gleiche gilt auch für die Belegung und wir haben wirklich gerade gerecht
gebaut eine Maschine um diese Weise, ja, wenn Sie eine Rutsche zurückgehen können, nicht mehr mehr
Es heißt parallel auf Cluster, so dass das aber ziemlich einfach klingt, aber aber
Es war wirklich nicht um, vielleicht macht es Spaß zu teilen, wie so etwas dazu kommt, dass wir vor einiger Zeit keine hatten, dass wir keine hatten
Kennzeichnung automatisch überhaupt und dann macht jemand ein Skript, das beginnt, es besser zu funktionieren, bis wir eine erreichen
Das Volumen ist ziemlich hoch und wir brauchen eindeutig eine Lösung, und so waren zwei weitere Ingenieure in
Unser Team, das wie Sie wissen, dass dies interessant ist, wissen Sie, was wir tun mussten, war ein ganzes Diagramm von
Im Wesentlichen Funktionen von Python, die wir nacheinander laufen müssen
Einige Netzwerkeschlüsse dann eine andere Netzwerkinferenz, bis Sie dies endlich erhalten haben, aber Sie müssen dies als eine
Großes Maßstab, also sage ich ihnen, dass wir wahrscheinlich für Sie 100 000 Clips pro Tag oder 100 000 Artikel schießen müssen
Das scheint gut zu sein, und so sagen die Ingenieure gut, dass wir ein bisschen Postgres und ein bisschen kennen können
Von Ellbogenfett können wir es in der Zwischenzeit etwas später tun und 20 machen 20
Millionen dieser Funktionen jeden Tag wieder ziehen wir rund eine halbe Million an
Clips und auf denjenigen, die wir jeweils eine Menge Funktionen ausführen
End Infra, das auch nicht nur ein Training absolvieren, sondern auch automatische Kennzeichnung Ja, es ist wirklich wie eine Fabrik, die
Erzeugt Etiketten und wie Produktionslinien liefern Qualitätsbestände wie alle dieselben Konzepte, die darauf angewendet werden
Label Factory UH, die für Sie die Fabrik für unsere Autos kennt, das richtig ist
Okay, und danke, also ja, so endlich abschließend
In diesem Abschnitt möchte ich ein paar herausfordernde und interessante Beispiele für das Netzwerk mit Sicherheit und sogar noch einmal mitteilen
Für den Menschen wahrscheinlich gibt es von der Spitze, wie Beispiele für Mangel an Lügen Fall oder neblige Nacht oder Kreisverkehr
und Okklusionen durch schwere Okklusionen durch geparkte Autos und sogar regnerische Nacht mit ihren Regentropfen vor Kameraobjektiven ähm
Diese sind schwierig, aber sobald ihre ursprünglichen Szenen vollständig durch andere Clips rekonstruiert sind, die sie alle sein können
Automatisch beschriftet, damit unsere Karten durch diese herausfordernden Szenarien noch besser fahren können
Lassen Sie mich nun das Mikrofon an David übergeben, um mehr darüber zu erfahren, wie Sim die neue Welt über diese Labels dankbar ist
Du
Nochmals vielen Dank, mein Name ist David und ich werde über Simulation sprechen, also spielt die Simulation eine entscheidende Rolle in
Bereitstellung von Daten, die schwer zu beziehen sind und oder schwer zu kennzeichnen sind, aber 3D -Szenen sind notorisch langsam
zum Beispiel die simulierte Szene hinter mir zu produzieren a
Komplexe Kreuzung von der Market Street in San Francisco Es würde zwei Wochen dauern
Künstler zu vervollständigen und für uns schmerzlich langsam, aber ich werde über die Verwendung sprechen
Jaegans automatisierte Grundwahrheitsbezeichnungen sowie ein brandneues Werkzeug, mit denen wir dies prozessig generieren können
Szene und viele mögen es in nur fünf Minuten, das ist tausendmal schneller als zuvor
Lassen Sie uns also in unsere Szene eintauchen, die erstellt wird. Wir beginnen damit, den automatisierten Boden zu verleihen
Wahrheit beschriftet in unser simuliertes World Creator Tooling in der Software Houdini, beginnend mit der Straßengrenze
Etiketten wir können ein solides Straßengattung generieren und es mit den Lane-Graph-Etiketten neu topologisieren. Dies hilft, wichtige Straße zu informieren
Details wie Crossroads Neig und detaillierte Materialmischung
Als nächstes können wir die Liniendaten verwenden und Geometrie über ihre Oberfläche fegen und sie auf die Straße erstellen,
Abziehbilder mit mittleren Kanten, die wir aufbringen können
Inselgeometrie und bevölkern es mit randomisiertem Laub. Dies verändert die Sichtbarkeit der Szene drastisch
Jetzt kann die Außenwelt durch eine Reihe randomisierter Heuristiken ein modularer Gebäudegeneratoren erzeugt werden
Erstellen Sie visuelle Obstruktionen, während zufällig platzierte Objekte wie Hydrants die Farbe der Kurven während der Zeit ändern können
Bäume können Blätter unter sich fallen lassen, um Linien oder Kanten zu verdecken
Als Nächst
Es ist normal, wichtige Informationen wie die Anzahl der Fahrspuren zu sammeln und sogar genaue Straßennamen auf dem
Signiert sich als nächstes mit dem Lane -Diagramm. Wir können die Lane -Konnektivität und die Laichdirektion bestimmen
Straßenmarkierungen auf der Straße und sie begleiten Straßenschilder und schließlich mit Lane Graph selbst wir
Kann die Spur -Adjazenz und andere nützliche Metriken bestimmen, um randomisierte Verkehrspermutationen Insider -Simulator hervorzubringen
Und wieder ist dies alles automatisch, keine Künstler in der Schleife und treten innerhalb von Minuten auf, und jetzt setzt uns das vor
Einige ziemlich cool
Parameter, um visuelle Variationen der einzelnen Grundwahrheit zu erzeugen. Es kann so subtil sein wie die Einstellung von Objekten und zufällig
Materialswacking gegen drastischere Veränderungen wie völlig neue Biome oder Umweltstandorte wie Urban
Vorort oder ländlich
Grundwahrheiten, für die wir mehr Grundwahrheit brauchen, und all dies geschieht innerhalb eines Klicks von a
Button und wir können sogar einen Schritt weiter gehen, indem wir unsere Bodenwahrheit ändern
Sagen Sie, John möchte, dass sein Netzwerk mehr Aufmerksamkeit auf die Richtungsstraßenmarkierungen schenkt
Um eine bevorstehende Linkspur in Captive Links zu erkennen
Der Simulator, der den Menschen hilft, durch diese Kreuzung völlig neue Ströme zu schaffen, um zu helfen
Konzentrieren Sie die Aufmerksamkeit des Netzwerks auf die Straßenmarkierungen, um genauere Vorhersagen zu erstellen. Dies ist ein gutes Beispiel dafür, wie dies ist
Mit Tooling können wir neue Daten erstellen, die niemals aus der realen Welt gesammelt werden könnten
und die wahre Kraft dieses Tools liegt in seiner Architektur und wie wir alle Aufgaben parallel zu unendlich ausführen können
Skalieren Sie so
Etiketten in ihre Kollegen
Um diese Daten in Geohash -Kacheln zu teilen, die etwa 150 Meter pro Quadrat in Größe haben
Anschließend speichern wir diese Daten in separate Geometrie- und Instanzdateien, die uns eine saubere Datenquelle erhalten, die einfach zu finden ist
Laden und ermöglicht es uns, den Motor für die Zukunft agnostisch zu machen
Mit einem Fliesenlader -Tool können wir eine beliebige Anzahl dieser Cache -Fliesen mit einer Geohash -ID beschwören, die wir derzeit tun
Ungefähr diese fünf x fünf oder drei von drei Kacheln, die normalerweise um Flotten -Hotspots oder interessante Landdiagramme drehen
Standorte im Fliesenlader wandeln diese Kachel -Sätze auch in U -Verbrauchsanlagen um
Beim Unreal Engine und gibt Ihnen ein fertiges Projektprodukt aus dem, was Sie in der ersten Folie gesehen haben
Und das setzt uns wirklich auf Größe und Skalierung vor, wie Sie auf der Karte hinter uns sehen können
Wir können die meisten Straßen von San Francisco City problemlos erzeugen, und dies dauerte jedoch weder Jahre noch Monate Arbeit
eher zwei Wochen von einer Person können wir weiterhin alle verwalten und wachsen
Diese Daten verwenden unser PDG -Netzwerk innerhalb der Tools, damit wir wirken können
Berechnen Sie bei IT und regenerieren Sie all diese Fliesen -Sätze über Nacht. Dies stellt sicher
Konsequente Qualität und Funktionen, die für das Training sehr wichtig sind, da neue Ontologien und Signale ständig sind
freigegeben und jetzt den Kreis schließen, weil wir
generierte all diese Kachelsätze aus Bodenwahrheitsdaten, die alle seltsamen Feinheiten aus der realen Welt enthalten
und wir können das mit der prozeduralen visuellen und Verkehrsvielfalt kombinieren, um grenzenlose gezielte Daten für die zu erstellen
Netzwerk zum Lernen und damit schließt der SIM -Abschnitt an Kate weiter, um darüber zu sprechen, wie wir können
Verwenden Sie alle diese Daten, um den Autopilot zu verbessern. Vielen Dank
Danke David Hallo allerseits mein Name ist Kate Park und ich bin hier, um über die Data Engine zu sprechen, die der Prozess ist, mit dem wir
Verbessern Sie unsere neuronalen Netzwerke über Daten. Wir zeigen Ihnen, wie wir Interventionen determinalistisch lösen
Über Daten und führen Sie Sie durch das Leben dieses bestimmten Clips in diesem Szenario
Autopilot nähert sich einer Kurve und prognostiziert fälschlicherweise, dass das Überqueren des Fahrzeugs als für den Verkehr angehalten wird
Ein Fahrzeug, für das wir in Wirklichkeit langsamer werden würden, gibt es niemanden im Auto. Es ist nur unbeholfen geparkt. Wir haben das gebaut
Werkzeug zur Identifizierung der Fehlverhalten korrigieren Sie das Etikett und kategorisieren Sie diese
Clip in einen Bewertungssatz Dieser spezielle Clip ist einer von 126
Damit haben wir als herausfordernde geparkte Autos diagnostiziert
INFRA Wir können diesen Evaluierungssatz ohne technische Ressourcenkunden kuratieren
zu diesem speziellen Herausforderungsfall, um diesen Herausforderungsfall tatsächlich zu lösen
Erfordert Tausende von Beispielen wie IT und es ist etwas, was Tesla trivial kann, nur unsere Daten verwenden
Beschaffung von Infra -Anforderungsdaten und verwenden Sie die zuvor gezeigte Toolierung, um die zu korrigieren, um die zu korrigieren
Beschriftungen, indem wir chirurgisch auf die Fehlverantwortlichkeiten des aktuellen Modells abzielen, fügen wir nur die wertvollsten hinzu
Beispiele für unser Trainingssatz, wir reparieren chirurgisch 13 900 Clips und uh
Weil dies Beispiele waren, bei denen das aktuelle Modell Probleme nicht einmal benötigen, um die Modellarchitektur a zu ändern
Einfaches Weg Update mit diesen neuen wertvollen Daten reicht aus, um den Challenge -Fall zu lösen, damit Sie nicht mehr vorhersagen,
dieses Kreuzfahrzeug wie in Orange gezeigt, aber wie in rot gezeigt gezeigt, geparkt
In der Wissenschaft sehen wir oft, dass Menschen Daten konstant halten, aber bei Tesla ist es
Sehr im Gegenteil sehen wir immer wieder, dass Daten einer der besten, wenn nicht der deterministischste Hebel sind
Um diese Interventionen zu lösen, haben wir Ihnen nur die Data Engine -Schleife gezeigt
Für einen Herausforderungsfall, nämlich diese geparkten Autos, aber es gibt viele Herausforderungen, selbst für ein Signal von
Fahrzeugbewegung Wir wenden diese Datenmotorenschleife auf jeden einzelnen Herausforderungsfall an, in dem wir diagnostiziert haben, ob es sich um Busse handelt
Kurvige Straßen stoppten Fahrzeugparkplätze und wir fügen nicht nur Daten hinzu, sobald wir uns
Tun Sie dies immer wieder, um das Semantik in diesem Jahr zu perfektionieren. Wir haben unser Fahrzeugbewegungssignal fünfmal aktualisiert
Und mit jedem auf den neuen Daten trainierten Gewichts -Update drücken wir die Genauigkeit unserer Fahrzeugbewegung nach oben und nach oben
Dieses Data Engine -Framework gilt für alle unsere Signale, ob sie 3D sind
Multi-Cam-Video, ob die Daten menschlich gekennzeichnet sind, die automatisch gekennzeichnet oder simuliert sind, unabhängig davon, ob es sich um ein Offline-Modell oder ein handelt
Online -Modellmodell und Tesla können dies aufgrund der Flotte im Maßstab tun
Vorteil Das Infra, das unser Motorenteam gebaut hat, und die Kennzeichnungsressourcen, die unsere Netzwerke füttern
Um all diesen Daten zu trainieren, brauchen wir eine große Menge an Rechenumscheinen, damit ich es an Pete und Ganesh weitergeben werde, um darüber zu sprechen
Die Dojo Supercomputing -Plattform danke [Applaus]
Danke, danke Katie
Vielen Dank an alle, danke, dass Sie dort gehängt sind. Wir sind fast da. Mein Name ist Pete Bannon Ich leite den Brauch
Silizium- und Niederspannungsteams bei Tesla und mein Name ist Ganesh Venkat Ich leite die
DOJI -Programm
[Applaus] Danke, ich werde häufig gefragt, warum ein Auto ist
Unternehmen bauen einen Super -Computer für Schulungen und diese Frage grundlegend
Missverständnis die Natur von Tesla im Herzen Tesla ist eine Hardcore -Technologie
Unternehmen in ganz Unternehmen arbeiten hart an Wissenschaft und Ingenieurwesen
Um das grundlegende Verständnis und die Methoden voranzutreiben, die wir zur Verfügung haben
Um Cars Energy Solutions Roboter und alles andere zu bauen
Verbessern Sie den menschlichen Zustand auf der ganzen Welt. Es ist eine super aufregende Sache, ein Teil davon zu sein, und es ist ein Privileg, eine sehr zu betreiben
Kleines Stück davon in der Semiconductor -Gruppe heute Abend werden wir ein wenig über Dojo sprechen und Ihnen eine geben
Update über das, was wir im letzten Jahr tun konnten, aber bevor wir das tun, wollte ich ein wenig geben
Hintergrund über das erste Design, das wir vor einigen Jahren begonnen haben, als wir anfingen, war das Ziel, eine zu liefern
erhebliche Verbesserung der Trainingslatenz für unser Autopilot -Team einige von
Die größten neuronalen Netze, die sie heute ausgebildet haben
Erkunden Sie Alternativen und bewerten Sie sie, damit Sie wissen
Wirklich schön, wenn wir es zu einem kostengünstigen und energiewettbewerbsfähigen Weg zur Verfügung stellen könnten
Dazu wollten wir einen Chip mit viel arithmetischer Arithmetik bauen
Einheiten, die wir zu einer sehr hohen Effizienz nutzen konnten, und wir haben viel Zeit damit verbracht, zu untersuchen, ob wir das tun könnten
Verwenden von DRM verschiedenen Verpackungsideen, die alle am Ende fehlgeschlagen sind
Es fühlte sich wie eine unnatürliche Handlung an, die wir beschlossen haben, Dram als primäres Speichermedium für dieses System abzulehnen und stattdessen zu konzentrieren
auf SRAM, eingebettet in den Chip SRAM, bietet leider bescheiden
Menge an Kapazität, aber extrem hohe Bandbreite und sehr geringe Latenz, und das ermöglicht es uns, eine hohe Nutzung zu erreichen
Mit den arithmetischen Einheiten diese Entscheidungen
Von dieser bestimmten Wahl führte beispielsweise zu einer ganzen Reihe anderer Entscheidungen, wenn Sie einen virtuellen Speicher haben möchten, den Sie benötigen
Seitentabellen, sie nehmen viel Platz ein, wir hatten keinen Platz, also haben wir auch keinen virtuellen Speicher
Accelerator ist ein bloßes Rob -Rob -Stück Hardware, das einem Compiler präsentiert wird
im Compiler ist dafür verantwortlich, alles zu planen, was auf terministische Weise geschieht, sodass es keinen Bedarf gibt oder
Sogar den Wunsch nach Interrupts im System, wir haben uns auch für das Modell entschieden
Parallelität als Trainingsmethodik, die nicht die typische Situation am meisten ist
Die meisten Maschinen verwenden heute Datenparallelität, die zusätzliche Speicherkapazität konsumieren, die wir offensichtlich nicht haben
Alle diese Entscheidungen haben uns also dazu geführt, eine Maschine zu bauen, die ziemlich radikal ist
Anders als das, was heute verfügbar ist
Grenzen, also wollten wir einen Berechnungstoff bauen, der größtenteils auf unbegrenzte Weise skalieren würde, meine ich natürlich offensichtlich
Ab und zu gibt es körperliche Grenzen, aber Sie wissen ziemlich genau, ob Ihr Modell war
Zu groß für den Computer, den Sie nur für einen größeren Computer kaufen mussten, das ist das, wonach wir heute wie Paket gesucht haben
Maschinen werden verpackt. Es gibt ein ziemlich festes Verhältnis von beispielsweise GPU -CPUs und
und DRAM -Kapazität und Netzwerkkapazität und wir wollten das alles wirklich disaggregieren, damit sich die Modelle entwickelten
variieren die Verhältnisse dieser verschiedenen Elemente und machen das System flexibler, um die Bedürfnisse der
Autopilot -Team Ja und es ist so wahr, dass keine Grenzen unser Leitstar war
all unsere Entscheidungen drehten sich um das und und auf die
Zeigen Sie, dass wir nicht wollten, dass die herkömmliche Rechenzentrumsinfrastruktur unsere begrenzt
Fähigkeit, diese Programme mit Geschwindigkeit auszuführen, daher ist wir deshalb
Deshalb tut es mir leid, deshalb haben wir uns integriert
Das gesamte gesamte Rechenzentrum unseres Rechenzentrums durch eine vertikale
Integration des Rechenzentrums Wir könnten neue Effizienzniveaus extrahieren. Wir könnten die Stromversorgung optimieren
Lieferkühlung und sowie Systemmanagement durch
Der gesamte Rechenzentrumsstack, anstatt Box durch Box zu machen und das zu integrieren
Diese Boxen in Rechenzentren und um dies zu tun, wollten wir auch
frühzeitig integrieren, um Grenzen der Skalierung für unsere herauszufinden
Software Workloads, sodass wir die DOJO -Umgebung sehr früh in unsere Autopilot -Software integriert haben und viel gelernt haben
Lektionen und heute werden Bill Chang sowohl unser Hardware -Update als auch einige durchgehen
der Herausforderungen, denen wir auf dem Weg konfrontiert waren, und Rajiv Kurian wird Ihnen eine geben
Blick auf unsere Compiler -Technologie sowie einige unserer coolen Ergebnisse durchgehen
Genau da gehen Sie
Danke Pete Danke Ganesh ähm Ich werde heute Abend mit einem hohen Niveau anfangen
Vision unseres Systems, die dazu beitragen wird, die Voraussetzungen für die Herausforderungen und die Probleme zu schaffen, die wir sind
Lösen und dann auch, wie Software dies dann für die Leistung nutzt
Jetzt ist unsere Vision für Dojo, eine einzelne einheitliche zu bauen, die eine sehr große beschleunigt
Eine Software würde eine nahtlose Berechnungebene mit global adressierbar sehen
sehr schneller Speicher und alle mit einheitlicher Hochbandbreite und verbunden
Niedrige Latenz, um dies zu erkennen, die wir verwenden müssen
Dichte, um Leistung zu erzielen. Jetzt nutzen wir die Technologie, um diese Dichte zu erhalten, um die Ebenen von zu brechen
Hierarchie vom Chip zum Skala -System
Jetzt hat die Siliziumtechnologie dies verwendet, die dies seit Jahrzehnten Chips hat
verfolgte Moores Gesetz für Dichte und Integration, um die Leistungsskalierung zu erhalten
Jetzt ist ein wichtiger Schritt, um zu erkennen, dass Vision unsere Trainingskacheln nicht nur integrieren können.
Extrem hohe Bandbreite, aber wir können dies auf eine beliebige Anzahl zusätzlicher Kacheln skalieren, indem wir sie einfach miteinander verbinden
Jetzt letztes Jahr haben wir unsere erste funktionale Trainingskachel vorgestellt und zu dieser Zeit wurden bereits Workloads ausgeführt
Es und seitdem hat das Team hier hart und fleißig am Einsatz gearbeitet
Dies in Skala jetzt haben wir erstaunliche Fortschritte gemacht und viele Meilensteine auf dem Weg und von hatten
Natürlich hatten wir viele unerwartete Herausforderungen, aber hier scheitert unser Scheitern schnell
Die Philosophie hat es uns ermöglicht, unsere Grenzen zu überschreiten
Die Dichte der Leistung für die Leistung stellt alle neuen Herausforderungen vor, die ein Bereich für die Stromversorgung ist
Hier müssen wir die Kraft für unsere Berechnung sterben, und dies wirkt sich direkt aus
Unsere Top -Line -Berechnung Leistung, aber wir müssen dies bei beispiellose Dichte tun. Wir müssen in der Lage sein, mit unserer zusammenzuarbeiten
Die Tonhöhe mit einer Kraftdichte von fast einem Amp pro Millimeter quadratisch
und aufgrund der extremen Integration muss dies eine mehrstufige vertikale sein
Leistungslösung und weil es einen komplexen heterogenen Materialstapel gibt
Wir müssen den materiellen Übergang vor allem CTE sorgfältig verwalten
Warum ist der Koeffizient der thermischen Expansionsmaterie in diesem Fall CTE eine grundlegende materielle Eigenschaft
Und wenn es nicht sorgfältig verwaltet wird, würde sich der Stapel buchstäblich auseinander reißen
Also haben wir diese Bemühungen begonnen, indem wir mit Anbietern zusammengearbeitet haben, um dies zu entwickeln, um dies zu entwickeln
Power-Lösung, aber wir haben festgestellt, dass wir dieses interne entwickeln mussten
Um den Zeitplan und das Risiko auszugleichen, haben wir schnelle Iterationen zur Unterstützung erstellt
Sowohl unser System bringen und Softwareentwicklung und auch das optimale Design und das optimale Design und das Finden
Stapel, das unsere endgültigen Produktionsziele erreichen würde, und am Ende konnten wir CTE über 50 Prozent reduzieren
und treffen Sie unsere Leistung um 3x über unsere erste Version
Jetzt nun nun zu sagen
Die Leistung bei Dichte ist äußerst schwierig
Jetzt hatten wir auf dem Weg unerwartete Herausforderungen hier hier ein Beispiel, in dem wir das vorantreiben
Integrationsgrenzen, die zu Komponentenfehlern führten
Dies begann, als wir uns auf größere und längere Workloads und dann zeitweise mittelschweren mussten.
Die Website auf einer Fliese würde jetzt scheitern, sie begannen als wiederherstellbare Ausfälle, aber als wir einige viel vorantreiben
Häufiger und höhere Leistung Diese würden zu dauerhaften Misserfolge werden
Um diesen Fehler zu verstehen, müssen Sie verstehen, warum und wie wir unsere bauen
Leistungsmodule, die die Dichte auf jeder Ebene lösen, ist die IS
ist der Eckpfeiler, unsere Systemleistung jetzt tatsächlich zu erreichen, weil unsere X Y -Ebene für verwendet wird
Kommunikation mit hoher Bandbreite alles andere muss vertikal gestapelt werden
Dies bedeutet, dass alle anderen Komponenten als unser Würfel in unsere Leistungsmodule integriert werden müssen
Dies schließt jetzt unsere Uhr und unsere Netzteile sowie unsere Systemcontroller ein
In diesem Fall waren die Fehler auf den Verlust der Taktausgabe unserer Oszillatoren zurückzuführen
Und nach einem umfangreichen Debuggen stellten wir fest, dass die Grundursache auf Vibrationen auf dem Modul von zurückzuführen war
piezoelektrische Effekte in unseren nahe gelegenen Kondensatoren
Jetzt sind singende Kappen kein neues Phänomen und tatsächlich sehr häufig im Power Design sehr häufig
Aber normalerweise werden Uhrenchips in einem sehr ruhigen Bereich des Bretts und oft platziert
Nicht von Stromkreisen beeinflusst, sondern weil wir diese Integrationsniveau erreichen mussten
in unmittelbarer Nähe platziert werden, da unsere Schaltfrequenz und
Dann verursachte die Vibrationsresonanz, die sie erzeugt hat
Oszillator, der dazu führte, dass es jetzt die Lösung für dieses Problem knackte, ist a
Multi-Prong-Ansatz Wir können die Schwingung durch Verwendung von Weichkappen reduzieren
Wir können unseren MEMS -Teil mit einem niedrigeren Q -Faktor für die Richtung der Außenebene aktualisieren
und wir können auch unsere Schaltfrequenzfrequenz aktualisieren, um die Resonanz weiter von diesen zu entfernen
sensitive Bänder jetzt zu der Dichte bei der Dichte bei
Die Systemebene haben wir auf Infrastrukturebene viel Fortschritte gemacht
Wir wussten, dass wir jeden Aspekt der Rechenzentrumsinfrastruktur erneut prüfen mussten
Um unsere beispiellose Kraft und Kühldichte zu unterstützen
Wir haben eine vollständig benutzerdefinierte CDU mitgebracht, um die dichte Kühlung von Dojo zu unterstützen
Anforderungen und das Erstaunliche daran ist, dass wir dies zu einem Bruchteil der Kosten tun können, anstatt das Regal abzukaufen und
Modifizieren Sie es und da unser Dojo -Kabinett genügend Strom und Kühlung integriert, um sie zu entsprechen
gesamte Reihe von Standard -IT -Racks, die wir benötigen, um unseren Schrank sorgfältig zu entwerfen und
Infrastruktur zusammen und wir haben bereits mehrere Iterationen dieses Kabinetts durchlaufen, um zu optimieren
Dies und früher in diesem Jahr haben wir mit dem Ladungstest unsere Leistung und Kühlung begonnen
Infrastruktur und wir konnten es über zwei Megawatt schieben, bevor wir unseren Umspannwerk stolperten und einen Anruf von der
City yeah jetzt letztes Jahr haben wir nur eine eingeführt
Ein paar Komponenten unseres Systems Die benutzerdefinierte D1 -Sterbe und die Trainingskacheln aber
Wir neckten den Ausgang Pod als unser Endziel
Aus diesem Exit -Pod jetzt ist das Systemfach ein wichtiger Teil von
Wenn wir unsere Vision eines einzelnen Beschleunigers erkennen, ermöglicht es uns, nahtlos nahtlos
Schließen Sie Kacheln nicht nur innerhalb des Schranks, sondern zwischen den Schränken zusammen
Wir können diese Kacheln im sehr engen Abstand über den gesamten Gaspedal anschließen
Und so erreichen wir unsere einheitliche Kommunikation. Dies ist eine laminierte Bushaltestelle, die es erlaubt
USA, um sehr hohe Leistungsmechanik und thermische Unterstützung in eine extrem dichte Integration zu integrieren
Es sind 75 Millimeter hoch und unterstützt sechs Kacheln bei 135 Kilogramm
Dies ist das Äquivalent von drei bis vier voll beladenen Hochleistungsregalen
Als nächstes müssen wir Daten an die Trainingskacheln füttern. Hier haben wir den DOJO -Schnittstellenprozessor entwickelt
Es bietet unserem System mit hoher Bandbreitendram, um unsere Trainingsdaten zu inszenieren
und es bietet unsere Trainingsfliesen mit TTP unserem Custom die vollständige Speicherbandbreite für unsere Trainingsfliesen
Protokoll, mit dem wir über unseren gesamten Beschleuniger kommunizieren können, hat es auch Hochgeschwindigkeits-Ethernet, das
Hilft uns bei der Erweiterung dieses benutzerdefinierten Protokolls über Standard -Ethernet und wir bieten native Hardwareunterstützung
dafür mit wenig bis gar keiner Software -Overhead und schließlich können wir eine Verbindung dazu herstellen
Über eine Standard -PCIe -Schnittstelle von Gen 4
Jetzt kombinieren wir 20 dieser Karten pro Tablett, und das gibt uns 640 Gigabyte von Hoch
Bandbreite Dram und dies bietet unsere disaggregierte Speicherschicht für unsere Trainingsfliesen
Diese Karten sind eine hohe Bandbreite, die sowohl durch PCIe als auch über Ethernet aufgenommen wird
Sie bieten auch einen hohen Ratex-Z-Connectivity-Pfad, der Abkürzungen in unserem großen Dojo ermöglicht
Beschleuniger jetzt integrieren wir den Host tatsächlich
Direkt unter unserem Systemfach, die diese Hosts unsere Einnahmeverarbeitung und eine Verbindung zu unserer Schnittstelle anbieten
Prozessoren über PCIe Diese Hosts können Hardware -Video bereitstellen
Decoder -Unterstützung für Video -basierte Schulungen und unsere Benutzeranwendungen landen darauf
Hosts, die wir damit mit der Standard X86 Linux -Umgebung zur Verfügung stellen können
Jetzt können wir zwei dieser Baugruppen in einen Schrank einsetzen und es mit redundanten Stromversorgungen kombinieren, die direkt sind
Umwandlung von drei Phase 480 Volt Wechselstrom in 52 Volt DC -Leistung
Indem wir uns nun auf die Dichte auf jeder Ebene konzentrieren, können wir die Vision einer einzigen erkennen
Beschleuniger beginnt jetzt mit den gleichmäßigen Knoten auf unserem benutzerdefinierten D1 -Die
Wir können sie mit unserem vollständig integrierten Trainingskacheln miteinander verbinden und uns dann schließlich nahtlos verbinden
sie über die Kabinettsgrenzen hinweg, um unseren Dojo -Beschleuniger zu bilden
Und alle zusammen können wir zwei volle Beschleuniger in unserem Ausstiegspod für a unterbringen
kombiniert einen Exaflop ML Compute jetzt können diese Menge von dieser Menge von insgesamt können
Technologie und Integration wurde immer nur ein paar Mal in der durchgeführt
In der Geschichte des Computers werden wir als nächstes sehen, wie Software dies nutzen kann, um ihre Leistung zu beschleunigen
[Beifall]
Danke Bill, mein Name ist Rajiv und ich werde über einige Zahlen sprechen, damit unser Software -Stack mit dem PI beginnt
Fackelerweiterung, die unser Engagement für eine Standard -Pytorch -Modelle aus dem Schachtel ausspricht
Wir werden mehr über unseren JIT -Compiler und die Einnahmepipeline sprechen, die die Hardware mit Daten füttert
Abstrakte Leistungen Tops Times Nutzungszeiten Beschleuniger Belegung
Wir haben gesehen, wie die Hardware eine Spitzenleistung liefert
Hardware, während Code ausgeführt wird, und es ist die Aufgabe der Einnahmepipeline, um sicherzustellen
Bei Durchsatz hoch genug, damit die Hardware niemals verhungern kann. Lassen Sie uns darüber sprechen, warum Kommunikation
Gebundene Modelle sind schwierig zu skalieren, aber davor schauen wir uns an, warum resnet 50 -Modelle Sie einfacher zu skalieren sind
Beginnen Sie mit einem einzigen Gaspedal -Gasped
Wenn Sie dies skalieren, führen Sie mehrere Kopien davon auf mehreren Beschleunigern aus und während der Gradient von produziert wird von
Der Rückwärtspass muss reduziert werden, und dies führt zu einer Kommunikation. Dies kann Pipeline mit dem durchgeführt werden
Rückwärts passieren dieses Setup -Skalen fast gut
Linear für Modelle mit viel größeren Aktivierungen
Wir stoßen auf ein Problem
Der Beschleuniger ist oft kleiner als die Batch -Normoberfläche
Beschleuniger im Sync -Batch -Norm -Modus Dies führt zu einer latenzgebundenen Kommunikation zum kritischen Pfad von
Der Vorwärtspass und wir haben bereits einen Kommunikations Engpass und obwohl es Möglichkeiten gibt, umherzukommen
Dies beinhalten normalerweise eine mühsame Handarbeit, die am besten für einen Compiler geeignet ist, und letztendlich gibt es keine Übertreppen
Um die Tatsache, dass, wenn Ihr Staat nicht in einen einzigen Beschleuniger passt
Und selbst mit erheblichen Anstrengungen unserer ML -Ingenieure sehen wir, dass solche Modelle nicht linear skalieren
Das DOJO -System wurde entwickelt, damit solche Modelle bei hoher Auslastung die hohen Funktionsweise bewirken,
Die Dichteintegration wurde gebaut, um nicht nur die berechnungsgebundenen Teile eines Modells zu beschleunigen, sondern auch die Latenz
gebundene Teile wie eine Stapelnorm oder die Bandbreite gebundene Teile wie ein Gradient
Alle reduzierten oder ein Parameter sammeln alle ein Stück des Dojo -Netzes, kann geschnitzt werden
Um ein Modell auszuführen
Badezimmeroberfläche für ihr bestimmtes Modell danach präsentiert sich die Partition selbst
Als eine große Beschleunigerin, die die Benutzer davon befreien muss, sich um die internen Details der Ausführung zu kümmern
und als Aufgabe des Compilers, diese Abstraktionsfeinkornsynchronisation Primitive in beizubehalten
Einheitliche geringe Latenz erleichtert es einfach, alle Formen der Parallelität über Integrationsgrenzen hinweg zu beschleunigen
werden in der Regel in SRAM geschützt und genau rechtzeitig zur Ausführung der Ebenen repliziert. Wir sind vom hohen Dojo abhängig
Bandbreite, um diese Replikationszeit -Tensor -Replikation zu verbergen, und andere Datenübertragungen werden mit Compute überlappt
Und der Compiler kann auch Schichten neu berechnen, wenn es rentabel ist, dies zu tun
Wir erwarten, dass die meisten Modelle als Beispiel für das kürzlich freigegebene stabile Diffusionsmodell übernommen und bekommen haben
Es lief in Dojo in Minuten außerhalb des Box
Hier sind einige Bilder eines Cyber -Lastwagens auf dem Mars, der durch stabile Diffusion auf Dojo erzeugt wird
sieht [Applaus] aus]
Es sieht so aus, als hätte es noch einige Möglichkeiten vor sich, bevor Sie das Tesla Design Studio -Team entsprechen
Wir haben also darüber gesprochen, wie Kommunikations Engpässe die Skalierbarkeit behindern können, vielleicht einen Säuretest eines Compilers und
Die zugrunde liegende Hardware führt eine Cross-Diabash-Formschicht aus, wie bereits erwähnt. Dies kann ein serieller Engpass sein
Die Kommunikationsphase eines Bachelor beginnt mit Knoten, die den lokalen Mittelwert und die Standardabweichungen berechnen
Koordinieren, um diese Werte zu reduzieren und diese Werte zurückzustrahlen, und dann ihre Arbeit parallel wieder aufnehmen
Wie würde eine ideale Chargenform auf 25 Dojo -Punkten aussehen, sagen wir die vorherigen weniger Aktivierungen?
sind bereits über Würfel geteilt, wir würden erwarten, dass jeweils 350 Knoten auf
sterben, um zu koordinieren und zu produzieren. Die lokalen Mittelwert- und Standardteilungswerte idealerweise würden diese weiterbekommen
reduziert mit dem endgültigen Ende irgendwo und in Richtung der Mitte der Fliese würden wir dann hoffen, eine Sendung von zu sehen
Dieser Wert, der aus dem Zentrum strahlt
über 25 Würfel wurden die Kommunikationsbäume aus dem Compiler und der
Das Timing stammt von einer echten Hardware, die wir gleich sehen, um 8750 Knoten auf 25 Stämmen zu sehen
Koordinierung, um die Bastrum -Mittelwert- und Standardabweichungsventile zu reduzieren und dann zu senden
Wählen Sie die lokale Reduktion, gefolgt von der globalen Reduzierung in die Mitte des Unentschieden
dann der reduzierte Wert aus dem Rundfunk, der von der Hardware -Sendung ausstrahlt wird
Einrichtung Dieser Betrieb dauert nur fünf
Mikrosekunden auf 25 Dojo -Würfeln Der gleiche Betrieb dauert 150 Mikrosekunden auf 24
GPUs Dies ist eine Größenverbesserung gegenüber GPUs
Und während wir über eine reduzierte Operation im Kontext einer Stapelnorm sprachen, ist es wichtig zu wiederholen, dass die
Die gleichen Vorteile gelten für alle anderen Kommunikationsprimitive, und diese Primitiven sind für große Skala unerlässlich
Training also wie wäre es mit der vollen Modellleistung, während wir denken, dass Resonant 50 ist
Keine gute Darstellung von Tesla -Workloads der realen Welt Es ist ein Standard -Benchmark. Beginnen wir also dorthin
Wir sind bereits in der Lage, die 100 -sterben für den Stempel zu erreichen, aber vielleicht einen Hauch von Dojo's
Fähigkeiten ist, dass wir diese Zahl mit nur einer Charge von 8 pro Stempel treffen können
Aber Dojo war wirklich gebaut, um größere komplexe Modelle anzugehen.
Workloads Wir haben uns die Nutzungsmuster unseres aktuellen GPU -Clusters angesehen und zwei Modelle standen auf der Auto -Kennzeichnung auf
Netzwerke Eine Klasse von Offline -Modellen, die zur Erzeugung von Grundwahrheit und den Belegungsnetzwerken verwendet werden, die Sie gehört haben
Über die Automatikmarkierungsnetzwerke sind große Modelle mit hoher arithmetischer Intensität, während die Belegungsnetzwerke
Kann in Lustbound diese Modelle ausgewählt werden, weil sie gemeinsam einen großen Teil unserer aktuellen GPU -Cluster ausmachen
Nutzung und sie würden das System auf unterschiedliche Weise herausfordern
Wie machen wir es in diesen beiden Netzwerken, die Ergebnisse, die wir sehen, wurden an Multi-Die-Systemen für beide gemessen?
Die GPU und das Dojo sind jedoch normalisiert, um die Zahlen in unserem Auto -Kennzeichnungsnetzwerk zu erhalten
Bereits in der Lage, die Leistung eines A100 zu übertreffen, wobei unsere aktuelle Hardware auf unseren VRMs der älteren Generation ausgeführt wird
Unsere Produktionshardware mit unseren neueren VRAMs, die dazu führen, dass der Durchsatz eines A100 verdoppelt wird
Und unser Modell zeigte, dass wir mit einigen wichtigen Compiler -Optimierungen mehr als drei zusätzliche Leistung von einem erreichen könnten
A100 Wir sehen noch größere Sprünge im Belegungsnetzwerk
Fast 3x mit unserer Produktionshardware mit Platz für mehr
Fremd [Applaus]
Die Leistungsstufe der Compiler -Leistung können den ML -Berechnung von einem Two Three Four Five und sechs GPU ersetzen
Boxen mit nur einer einzigen Dojo -Fliese [Applaus]
und diese Dojo -Fliesen kostet weniger als eine dieser GPU -Boxen WHOA
Ja, was es wirklich bedeutet, ist das Netzwerke
Das Training dauerte mehr als einen Monat, um mehr als eine Woche zu trainieren
Leider, wenn wir Dinge messen, die es auf der Tortenpastor -Fackelebene nicht so gut entwickelte, haben wir nicht gesehen
Unsere erwartete Leistung aus dem Git und diese Timeline -Tabelle zeigt unser Problem, die winzigen kleinen grünen Bars, das ist
Der Kompiliercode, der auf dem Gaspedal ausgeführt wird, ist meistens Weißraum, in dem die
Hardware wartet nur auf Daten mit unseren dichten ML Compute Dojo -Hosts
Effektiv haben 10x mehr ML -Computer als der GPU -Host, der auf diesem einen Host ausgeführt wird
Halten Sie mit all dieser ML -Hardware Schritt, um unsere Datenloaderskalierbarkeit zu lösen
Aus Them
nahtlos über Wirtsfliesen und Einnahmeprozessoren, sodass wir die Tesla erweitert haben
Transportprotokoll in die Arbeit über Ethernet
Ethernet Dies ermöglicht jedem Host mit einer DNIC -Karte, es zu und dm dm zu sein
Von anderen TTP -Endpunkten aus, damit wir mit dem Dojo -Netz begonnen haben
Dann fügten wir eine Stufe von Datenladen -Hosts hinzu, die mit der DNIC -Karte ausgestattet sind
Wir haben diese Hosts über einen Ethernet -Switch an das Netz verbunden. Jetzt ist jeder Host in dieser Datenladestufe in der Lage
Erreichen Sie alle TTP -Endpunkte im Dojo -Netz über hardware beschleunigte DMA
Nachdem diese Optimierungen in unsere Belegung verließen
auf 97 Prozent, sodass sich die Datenbelastungsabschnitte verringert haben
Daten Die Datenladenabschnitte haben sich drastisch reduziert und die ML -Hardware ist beschäftigt. Wir erwarten dies tatsächlich
Die Nummer, um kurz nach dem Einlegen dieser Änderungen 100 zu 100 zu gehen
Layer und wir waren wieder im Geschäft
bricht traditionelle Integrationsgrenzen im Dienst unserer Vision eines einzelnen Riesenbeschleunigers durch
Wir haben gesehen, wie der Compiler und einfach Schichten auf dieser Hardware aufbauen. Nach dem Nachweis Ihrer Leistung
Diese komplexen realen Netzwerke wussten wir, was unsere erste groß angelegte Bereitstellung auf unser Hoch abzielen würde
AUITHMETIC INTORTY AUTO KREISE -NETWORKS HEUTE, DIE HEUTE 4000 GPUS über 72 belegen
GPU -Racks mit unserem dichten Computer und unserer hohen Leistung erwarten wir die Bereitstellung der
Der gleiche Durchsatz mit nur vier Dojo -Schränken
[Beifall]
und diese vier Dojo -Schränke werden Teil unseres ersten Exopod
Dies ist mehr als die automatische Kennzeichnung von Tesla von Tesla
[Applaus] Der erste zusätzliche Teil ist Teil einer Gesamtsumme
von sieben zusätzlichen Teilen, die wir in Palo Alto hier über der Wand bauen möchten
[Applaus] und wir haben einen Displayschrank von einem dieser Exopoden, die jeder betrachten kann
Sechs Kacheln dicht auf ein Tablett 54 Petaflops von 640 Gigabyte von Petaflops
Hochbandbreite Speicher mit Leistung und Host, um es zu füttern
Viele und wir bauen neue Versionen von auf
Alle unsere Clusterkomponenten und die ständiger Verbesserung unserer Software, um neue Fähigkeiten zu erreichen, glauben wir, dass wir uns
kann eine weitere 10 -fache Verbesserung mit unserer Hardware der nächsten Generation erhalten
Und um ihre ehrgeizigen Ziele zu erkennen, brauchen wir die besten Software- und Hardware -Ingenieure. Bitte sprechen Sie mit uns oder
Besuchen Sie Tesla.com AI Danke [Applaus]
Alles klar, lass es mich wissen
Alles klar, wir hoffentlich waren wir das detaillierte Details
Und jetzt können wir zu Fragen wechseln, um und jungs, wie ich denke, das Team denke
kam zurück auf die Bühne und wir wollten wirklich die Tiefe zeigen
und Breite von Tesla in der künstlichen Intelligenz
Berechnen Sie Hardware -Robotik -Aktuatoren und [Musik]
und versuchen Sie, die Wahrnehmung des Unternehmens von äh zu verändern, Sie wissen a
Viele Leute denken, wir sind nur eine Autofirma oder wir machen cool
Sie haben nicht die meisten Menschen haben keine Ahnung, dass Tesla wohl der Führer in der Innenstadt ist
AI -Hardware und Software realer Welt und das bauen wir auf
ähm, was ist wohl der erste der radikalsten
Computerarchitektur seit dem Crayon Supercomputer und ich denke, wenn Sie interessiert sind
Entwicklung einiger der fortschrittlichsten Technologien der Welt, die die Welt in einem wirklich beeinflussen wird
Positiver Weg uh sagt uns, der Ort, an dem wir so sein können, lass uns mit etwas abfeuern
Fragen, die ich denke, es gibt ein Mikrofon vorne und a
Mikrofon hinten ähm
Vielen Dank, ich war hier beeindruckt. Ja, ich war sehr beeindruckt von
Optimus, aber ich frage mich, warum sie die Jagd nicht getrieben haben, warum Sie sich für eine ausgewählt haben
zartgetriebener Ansatz für die Jagd, weil Sehnen nicht sehr langlebig sind und
Warum Frühling gut geladen hat das ist ziemlich cool, fantastisch ja
Das ist eine großartige Frage, die Sie wissen, wenn es um jede Art von Betätigungsschema geht. Es gibt Kompromisse
Zwischen Ihnen wissen, ob es sich um ein Sehnenurinsystem oder eine Art von Verknüpfungssystem handelt, die ich nur dabei halte
Machen Sie sich in der Nähe Ihres Mund
Für ein sehnenbasiertes System ist, dass Sie zuerst wissen, dass wir tatsächlich einige synthetische Sehnen untersucht haben, aber wir haben das gefunden
Metallische Bootskabel wissen Sie viel stärker um einen der Vorteile dieser Kabel
ähm ist, dass es sehr gut für die Teilreduzierung ist, wir wollen viele dieser Hände machen, also haben wir ein paar Teile a
Eine Menge kleiner Verknüpfungen ist, dass Sie ein Problem kennen, wenn Sie eine der großen Gründe machen
Sie wissen, dass Sehnen in gewissem Sinne besser sind als Verknüpfungen, dass Sie Anti-Rückenlash sein können
Antibacklash ermöglicht es Ihnen im Wesentlichen, dass Sie keine Lücken haben oder Sie
Kennen Sie die stotternde Bewegung in Ihren Fingern, die vor allem die Federbelastung federbelastet haben
Ermöglicht es uns, eine aktive Öffnung zu haben, also anstatt zu müssen, anstatt zu müssen
Lassen Sie zwei Aktuatoren die Finger geschlossen und dann können wir wissen, dass Sie wissen, dass die Sehnen sie fahren lassen
geschlossen und dann sich die Quellen passiv aus und das ist auch etwas, das auch in unseren Händen zu sehen ist, wir haben die
Fähigkeit, sich aktiv zu beugen, und dann haben wir auch die Fähigkeit, ja zu verlängern
Ich meine, unser Ziel mit Optimus ist es, einen Roboter zu haben, der maximal nützlich ist als
schnell wie möglich, so dass es viele Möglichkeiten gibt, die verschiedenen Probleme eines humanoiden Roboters zu lösen
ähm und ähm wir sind wahrscheinlich nicht den richtigen Baum auf all der technischen
Lösungen und ich sollte sagen, dass wir offen für die Weiterentwicklung der technischen Lösungen, die Sie hier im Laufe der Zeit sehen
Wir sind nicht in Stein, aber wir müssen etwas auswählen
ähm in und wir wollen etwas auswählen, das es uns ermöglicht, den Roboter so schnell wie möglich zu produzieren
Und lassen Sie es so schnell nützlich sein, so schnell wie möglich nützlich zu sein, wir versuchen, dem Ziel des schnellsten Weges zu a zu folgen
Nützlicher Roboter, der mit Volumen hergestellt werden kann, und wir werden den Roboter intern bei Tesla in unserer Fabrik testen
und ähm und sehen Sie einfach, wie nützlich es ist, weil Sie ein Sie haben müssen
Die Realität schließen, um zu bestätigen, dass der Roboter tatsächlich nützlich ist
ähm und äh ja, wir werden es einfach benutzen, um Dinge zu bauen, und ähm wir sind
Zuversichtlich, dass wir das mit der Hand machen können, die wir derzeit entworfen haben, aber ich bin sicher, dass sie Version zwei haben werden
Version drei und wir können die Architektur im Laufe der Zeit erheblich verändern
Entschuldigung, Hallo, du bist der Optimus -Roboter, ist wirklich beeindruckend, dass du einen tollen Job gemacht hast
ähmbipedale Roboter sind wirklich schwierig, aber was mir aufgenommen wurde, könnte es in Ihrem Plan fehlen, ist, das anzuerkennen
Nützlichkeit des menschlichen Geistes und ich frage mich, ob Optimus jemals eine Persönlichkeit bekommen und über unsere lachen kann
Witze, während sie gut unsere Kleidung falten, ja absolut
Ich denke, wir wollen wirklich lustige Versionen von Optimus haben
ähm und so dass Optimisten sowohl nützlich sein als auch Aufgaben erledigen, aber auch sein können
Ein bisschen wie ein Freund um und ein Kumpel und und um, um mitzuhängen
Sie und ich bin sicher, dass die Leute an alle möglichen kreativen Verwendungen für diesen Roboter denken werden
ähm und ähm Sie kennen das Ding
herausgefunden, dann können Sie tatsächlich wissen, dass alle möglichen Arten von gestellt werden
Kostüme, denke ich auf dem Roboter, ich meine, Sie können den Roboter aussehen lassen, uh
Sie können den Roboter auf viele verschiedene Arten scannen.
Sehr interessante Möglichkeiten, um ah yeah -Versionen von Optimus so
Vielen Dank für die großartige Präsentation. Ich wollte wissen, ob es ein Äquivalent zu Eingriffen in Optimus gab
Es scheint, als ob die Kennzeichnung durch Momente, in denen der Mensch nicht mit dem, was vor sich geht, nicht einverstanden ist, ist wichtig und in einem humanoiden Roboter
Das könnte auch eine wünschenswerte Informationsquelle sein
Ja, es hat gesagt, ähm Ja, ich denke wir, wir werden Wege haben
Fernbedienung betreiben den Roboter und greift ein, wenn er etwas Schlimmes tut, besonders wenn wir den Roboter trainieren und
Erhöhen Sie es und hoffentlich wissen wir, dass wir es so entwerfen, dass wir den Roboter abhalten können
Wenn es etwas treffen wird, können wir es einfach halten und es wird aufhören, es mag nicht, dass Sie Ihre Hand zerquetschen oder so, und das sind alles Intervention
Daten ähm ja und wir können auch viel aus unseren Simulationssystemen lernen, wo wir können
Überprüfen Sie auf Kollisionen und überwachen Sie, dass dies schlechte Aktionen sind. Ja, ich meine, so optimus, dass wir im Laufe der Zeit wollen
Um es zu sein, wissen Sie eine Android-Art von Android, die Sie in Science-Fiction-Filmen wie gesehen haben
Star Trek Die nächste Generation wie Daten, aber offensichtlich könnten wir den Roboter als weniger roboterartig und freundlicher programmieren
Und und du weißt, dass du offensichtlich lernen kannst, den Menschen nachzuahmen und sich sehr natürlich zu fühlen
Also, wie KI im Allgemeinen verbessert, können wir das dem Roboter hinzufügen und
ähm Sie wissen, dass es offensichtlich in der Lage sein sollte, einfache Anweisungen oder sogar einfache Anweisungen zu erstellen
In das, was Sie wollen, können Sie ihm eine hohe Anweisung geben, und dann kann es das brechen
runter in eine Reihe von Aktionen und und diese Aktionen ergreifen
Hallo, ja, es ist aufregend zu denken, dass du mit dem Optimus das denken wirst
Sie können Größenordnungen und wirtschaftlicher Produktion erreichen
ähm das ist wirklich aufregend ähm und als Tesla begann, war die Mission, den Aufkommen von zu beschleunigen
erneuerbare Energien oder nachhaltige Transport
Sehen Sie immer noch, dass Mission dieses Leitbild von Tesla ist oder wird sie mit Ihnen wissen, wie Sie wissen
Mission zur Beschleunigung des Aufkommens von Ich kenne nicht unendliche Fülle oder
Grenzenlose grenzenlose Wirtschaft Ja, ich meine, es ist nicht streng streng
Um optimus zu sprechen, ist nicht streng genommen, ähm
direkt im Einklang mit der nachhaltigen Energie, die Sie kennen, die Sie kennen
In dem Maße, in dem es effizienter ist, Dinge zu erledigen als eine Person, die ich denke, wenn Sie es wissen
Nachhaltige Energie, aber ich denke, die Mission tut effektiv, um sich mit dem Aufkommen von Optimus UH um etwas zu erweitern
Äh, du weißt, ich weiß nicht, dass ich die Zukunft großartig macht, damit du weißt, dass ich dich denke
Schauen Sie sich Optimisten an und ähm, ich weiß über dich, aber ich bin gespannt, was Optimisten werden werden
Und Sie wissen, dass dies so ist, als ob Sie wissen, ob Sie könnten, ich meine, Sie können wie eine bestimmte Technologie erkennen können
Wenn Sie möchten, möchten Sie sehen, wie es in einem Jahr zwei Jahre drei Jahre ist, vier Jahre fünf Jahre zehn
Ich würde sicher sagen, dass Sie auf jeden Fall sehen möchten, was mit Optimus um ist, während Sie ein paar andere kennen
Technologien sind Sie kennen, dass Sie eine Art von Plateaug über Namensnamen hier aber ähm kennengelernt haben
[Gelächter] Ähm, du weißt es so
Ich denke
Interessiert zu sehen, dass das passiert. Ich hoffe, Sie sind zu oh, ich denke, ich denke
Ich habe eine kurze Frage hier, ich bin Justin und ich habe mich gefragt wie du bist du
Planen Sie, sich wie Konversationsfähigkeiten für den Roboter und meinen zweiten zu verlängern
Follow-up-Frage dazu ist das, was das Endziel ist, was das Endziel mit Optimus ist
uh yeah optimists hätten definitiv Gesprächsfähigkeiten so
ähm ich ich du könntest mit ihm sprechen und ein Gespräch führen, und es würde sich ganz anfühlen
Natürlich also vom Ende des Anrufs bin ich nicht. Ich weiß nicht, dass ich denke, dass es sich behalten wird
sich weiterentwickeln und ich bin mir nicht sicher, wo es endet, aber
Einige andere ist mit Sicherheit interessant, um zu wissen, dass wir immer vorsichtig sein müssen
Über die du weißt nicht den Terminator -Pfad, das ist ein du weißt ich ich ich
Ich dachte vielleicht, wir sollten mit einem Video von dem Terminator beginnen, der damit beginnt, Sie kennen den Schädel
zerquetschen, aber oh das könnte sein, ich weiß nicht, ob du das zu ernst nehmen willst.
Seien Sie in Sicherheit
Stoppen Sie den Roboter um und ähm Sie wissen wie im Grunde genommen eine lokale
Kontrollieren Sie ROM, das Sie nicht über das Internet aktualisieren können, was meiner Meinung nach sehr wichtig ist
ähm, ehrlich gesagt, so
ähm wie ein lokalisierter Stop -Taste um Fernbedienung steuern so etwas wie
das kann nicht geändert werden um
Aber ich meine, es wird definitiv interessant sein, es wird also nicht langweilig sein
Okay ja, ich sehe dich heute, du hast ein sehr attraktives Produkt mit Dojo und seinen Anwendungen, also frage ich mich, was das ist
Zukunft für die DOJO -Plattform möchten wir wie eine Infrastrukturinfrastruktur und einen Dienst wie AWS oder eine Infrastrukturinfrastruktur und einen Dienst anbieten
Sie werden wie ein Verkauf ein Chip wie die Nvidia sein. Im Grunde genommen ist die Zukunft, weil ich sage, dass Sie eine sieben verwenden
Nanometer, damit die Kosten für Entwickler leicht über 10 Millionen US-Dollar sind, wie machen Sie den Penis wie ein Geschäft?
Ja, ich meine, um Dojo ist ein sehr großer Computer, und tatsächlich werden wir viel benutzen
Kraft und braucht viel Kühlung, also denke ich, dass es wahrscheinlich sinnvoller ist, Dojo wie uh in Betrieb zu haben
Amazon Web Services Art, als zu versuchen, es an jemand anderen zu verkaufen
ähm, das meiste wäre die effizienteste Möglichkeit, Dojo zu bedienen, darin, es nur ein Service zu haben, den Sie
kann uh verwenden, das online verfügbar ist und dass Sie Ihre Modelle aus trainieren können
schneller und für weniger Geld und das als die
UM World wechselt zu Software 2.0
Und das ist auf der Bingo -Karte, von der ich weiß, dass sie wissen muss, wie man fünf Tequilas trinkt
ähm also sehen wir UM Software 2.0 sehen
[Gelächter] Ja, wir werden viel neuronales Netz verwenden
Training Also ähm Sie wissen, dass es irgendwie sinnvoll ist, dass im Laufe der Zeit, da es mehr Neural gibt
Netto -Sachen, die die Leute benutzen wollen, und sind die am schnellsten kostengünstigsten Nerven
Netto -Trainingssystem also denke ich, dass es in dieser Richtung viel Chancen gibt
Hallo, mein Name ist Ali Jahanian, danke für diese Veranstaltung, es ist sehr inspirierend mein
Frage ist, dass ich mich frage, was Ihre Vision für uh ist
Humanit -Roboter, die unsere Emotionen und Kunst verstehen und dazu beitragen können
Unsere Kreativität na ja, ich denke, es gibt das, ähm, du bist
bereits Roboter sehen, die zumindest in der Lage sind, sehr interessant zu erzeugen
Kunst mit wie Dali um und Dali 2. ähm
Und ich denke, wir werden KI sehen, die tatsächlich sogar Filme mit einer Kohärenz erzeugen können
Wie interessante Filme und erzählen Sie Witze, also ist es ziemlich bemerkenswert, wie schnell KI ist
ähm, um UM in vielen Unternehmen neben Tesla voranzutreiben
Wir sind auf dem Weg zu einer sehr interessanten Zukunft und ähm ja, so
Ihr möchte dazu kommentieren, ja, ich denke, der optimistische Roboter kann mit physischer Kunst nicht nur digitale Kunst entwickeln
Sie können wissen, dass Sie nach Tanzbewegungen in Text oder Stimme fragen können, und dann können Sie diese in Zukunft so produzieren
Es ist viel wie physisches Herz, nicht nur digitale Kunst Oh ja, Computer können absolut
Machen Sie eine physische Kunst, ja, 100 Ja, wie tanzen Sie sicher, um Fußball zu spielen oder was auch immer Sie
ähm ich meine, es muss agiler werden, aber im Laufe der Zeit mit Sicherheit
Vielen Dank für die Präsentation für die Tesla Autopilot -Folien, die ich bemerkte
Dass die Modelle, die Sie verwendet haben
war und wie viel Verbesserung es gab, dachte ich, dass das eine wirklich interessante merkwürdige Wahl war, um sie zu verwenden
Sprachmodelle für den Spurübergang, sodass es zwei Aspekte dafür gibt, warum wir in die Sprachmodellierung umgestiegen sind
Das erste Talk spricht laut und schließt, okay, okay, verstanden es
Ja, die Sprachmodelle helfen uns auf zwei Weise, dass wir die Gassen vorhersagen können, die wir nicht haben konnten
Andernfalls können Sie wie ein früher erwähnter Shok im Grunde genommen, als wir die Fahrspuren in einer dichten 3D -Mode vorhergesagt haben, nur Sie können
Model bestimmte Arten von Gassen, aber wir möchten diese kreuzenden Verbindungen innerhalb von Kreuzungen bekommen. Es ist einfach nicht möglich, dies zu tun, ohne sie zu machen
Diagrammvorhersage Wenn Sie versuchen, dies mit einer dichten Segmentierung zu tun, funktioniert es einfach nicht, und auch die Spurvorhersage ist multimodal
Problem Manchmal haben Sie einfach nicht genügend visuelle Informationen, um genau zu wissen, wie die Dinge auf dem anderen aussehen
Seite der Kreuzung, so
Ich möchte nicht zwei Fahrspuren in drei Fahrspuren vorhersagen, während Sie sich zu einem in einem generativen Modell wie diesen Sprachmodellen festlegen möchten
Hallo oh Hallo, mein Name ist Giovanni um ja, danke für die Präsentation
Das ist wirklich schön, ich habe eine Frage an unser FSD -Team, also für die neuronalen Netze, wie geht es Ihnen
Testen Sie wie, wie Sie Unit -Test -Software -Unit -Tests durchführen, wie Sie es wie ein Haufen haben oder ich weiß nicht mittel?
Tausende oder uh ja ähs Fälle, in denen
Das neuronale Netzwerk, das Sie nach dem Trainen haben, müssen Sie es bestehen, bevor Sie es als Produkt richtig veröffentlichen, ah ja
Was ist Ihre Software -Unit -Teststrategien dafür im Grunde genommen Ja, ich bin froh, dass Sie gefragt haben, wie eine Reihe von Tests vorhanden sind?
dass wir uh beginnend von Ihnen wissen, wissen Sie den Unit -Test für die Software selbst, aber für die neuronalen Netzwerkmodelle haben wir VIP -Sets definiert, wo
Sie wissen
Raffinierte UH -VIP
Produkt so sind wir im Laufe der Jahre wie Hunderttausende von Beispielen, bei denen wir in der Vergangenheit versagt haben
dass wir kuratiert haben und so für jedes neue Modell, das wir gegen die gesamte Geschichte dieser Fehler testen, und dann
Fügen Sie diesen Testset weiter hinzu. Wir haben Schattenmodi, in denen wir diese Modelle in Silent versenden
Das Auto und wir erhalten Daten wieder, wo sie versagen oder erfolgreich sind, und es gibt ein umfangreiches QA -Programm, es ist sehr
Es ist schwer, eine Regression zu versenden, es gibt neun Filterstufen, bevor sie Kunden trifft, aber dann haben wir wirklich gut
Infra, um dies alles effizient zu machen, und ich bin einer der QA -Tester, also i QA
Das Auto Ja, wie ein Schöpfer ja, also bin ich ständig im Auto, nur um es zu sein
Warten Sie an der Warteschlange wie das, was der neueste UH Alpha -Build ist, der nicht vollständig abstürzt
Findet viele Fehler, und ich habe eine tolle Veranstaltung, ich habe eine Frage
Über uhes fundierte Modelle für uh habe ich alle gesehen, dass große Modelle das
Wirklich, wenn Sie mit dem Daten- und Modellparameter direkt von GT3 bis mit dem Parameter des Daten und des Modells skalieren
Palm Es kann jetzt tatsächlich argumentieren, sehen Sie, dass es essentiell ist, ähm zu häuten
up upscode -Modelle mit Daten und Größe und dann können Sie zumindest eine erhalten
Lehrermodell Recht, das möglicherweise alle Probleme lösen kann, und dann destillieren Sie zu einem Schülermodell, wie wie wie
Sie sehen grundlegende Modelle, die für bei 100 relevant sind. Ich meine, das ist unserem Auto -Kennzeichnungsmodell ziemlich ähnlich, damit wir nicht tun
Ich habe nur Modelle, die im Auto laufen. Wir trainieren Modelle, die völlig offline sind und extrem groß sind, die nicht können
Laufen Sie in Echtzeit im Auto, damit wir diese Offline auf den Servern laufen lassen, die wirklich gute Etiketten produzieren
Das kann dann die Online -Netzwerke trainieren, sodass eine Form der Destillation von ist
Diese Lehrer -Schülermodelle in Bezug auf Grundmodelle bauen wir einige wirklich sehr groß auf
Datensätze, von denen Sie wissen, dass sie mehrere Petabyte sind, und wir sehen, dass einige dieser Aufgaben sehr gut funktionieren, wenn wir
Halten Sie diese großen Datensätze wie die Kinematik, wie ich in allen Kinematiken aus allen Objekten Video erwähnt habe
und bis zum vierten Derivat und die Leute dachten, wir könnten keine Erkennung mit Kameras -Erkennungstiefengeschwindigkeit durchführen
Beschleunigung und Stellen Sie sich vor, genau diese müssen, damit diese Derivate höherer Ordnung genau sind
stammt aus solchen großen Datensätzen und großen Modellen, sodass wir das Äquivalent von Fundamentmodellen auf unsere eigen
Geometrie und Kinematik und Dinge wie die, die Sie hinzufügen möchten, John
Ja, ich werde es im Grunde genommen kurz halten, wenn wir einen größeren Datensatz trainieren. Wir sehen im Grunde genommen, wenn wir
trainieren mit einem größeren Datensatz Wir sehen große Verbesserungen in unserer Modellleistung und im Grunde genommen, wenn wir unsere initialisieren
Netzwerke mit Ihnen kennen einige Voraussetzungen aus einer anderen Hilfsaufgabe, die wir im Grunde genommen Verbesserungen sehen können
Selbstübersicht oder beaufsichtigt mit großen Datensätzen, die beide sehr helfen
Hey, also sagte Elon zu Beginn, dass Tesla möglicherweise daran interessiert war, künstliche allgemeine Intelligenz aufzubauen
Systeme angesichts der potenziell transformativen Auswirkungen der Technologie wie diese erscheint es ratsam, in zu investieren
Technische AGI -Sicherheit ähs Fachkenntnis speziell Ich weiß, dass Tesla viel tut
Technische schmale KI -Sicherheitsforschung Ich war neugierig, ob Tesla beabsichtigt hatte
Versuchen Sie, Fachwissen in der technischen künstlichen allgemeinen Intelligenzsicherheit speziell aufzubauen
Nun, wenn ich meine, wenn es so aussieht, als würden wir einen bedeutenden Beitrag zur künstlichen
Allgemeine Intelligenz dann werden wir dann in die Sicherheit in UH investieren.
sollte eine Art Regulierungsbehörde auf staatlicher Ebene sein, genau wie es eine gibt
Regulierungsbehörde für uH alles, was sich auf die öffentliche Sicherheit auswirkt, so haben wir eine Regulierungsbehörde für Flugzeuge und
Autos und uH -Art von Nahrungsmitteln und Drogen und weil sie die öffentliche Sicherheit und KI beeinflussen
Beeinflusst auch die öffentliche Sicherheit, also denke ich, ähm und das ist nicht wirklich etwas, von dem die Regierung ich noch versteht, aber ich
Ich denke, ich denke, es sollte einen Schiedsrichter geben, der ah dafür sorgt oder versucht, die Öffentlichkeit zu gewährleisten
Sicherheit für Uh agi um und Sie denken an das, was was sind
Die Elemente, die erforderlich sind, um AGI wie uH zu erstellen, ist extrem
Wichtig und wenn Sie eine große Anzahl von Autos und humanoiden Robotern haben, ähm
Verarbeitung Sie kennen Petabyte von Videodaten und
Audiodaten aus der realen Welt, genau wie Menschen, dass das das sein könnte
Der größte Datensatz ist wahrscheinlich der größte Datensatz UM, da Sie außerdem können
Scannen Sie offensichtlich inkrementell das Internet -UM, aber was das Internet nicht ganz tun kann, ist
hat Millionen oder Hunderte Millionen Kameras in der realen Welt
Wie ich bereits mit Audio und UH und anderen Sensoren sagte, also denke ich, wir denke wir
wahrscheinlich wird die meisten Daten und wahrscheinlich die meisten TRs von TR haben
Trainingskraft deshalb werden wir wahrscheinlich eine machen
Beitrag zu Agi
Hey ähm, ich habe bemerkt, dass das Semi wieder da war, aber wir haben nicht allzu viel darüber gesprochen, dass ich mich nur über den Semi -Truck gefragt habe
Was sind die uh -Veränderungen, über die Sie aus Sicht der Erkennung nachdenken? Ich stelle mir vor, dass es sehr unterschiedlich gibt
Anforderungen offensichtlich als nur ein Auto, wenn und wenn Sie nicht glauben, dass das wahr ist, warum so wahr ist
Ich denke, im Grunde können Sie ein Auto fahren.
neuronales Netz uh mit uh mit Augen mit Kameras im Wesentlichen also, wenn ähm und wirklich
Was sind Ihre primären Sensoren?
Langsam Gimbal ähm das ist äh das ist dein Kopf, also wenn
Wenn Sie wissen, ob ein biologisches neuronales Netz mit zwei Kameras auf einem langsamen Gimbal einen Semi -LKW fahren kann
ähm, wenn Sie acht Kameras mit kontinuierlicher 360 -Grad -Vision haben ähm
mit einer höheren Bildrate und einer viel höheren Reaktionsrate arbeiten, dann ist es offensichtlich, dass Sie in der Lage sein sollten, ein Semi oder jedes Fahrzeug viel zu fahren
Besser als ein Mensch Hallo, mein Name ist Akshay, danke für die
Ereignis ug uh unter der Annahme, dass Sie wissen, dass Optimus für verschiedene Anwendungsfälle verwendet wird und
würde sich für diese Anwendungsfälle an einem anderen Stück entwickeln, wäre es möglich
Um verschiedene Software- und Hardwarekomponenten unabhängig voneinander zu entwickeln, bereitzustellen
im in optimus, so dass die Gesamtentwicklung der Feature -Entwicklung schneller ist
Optimus Verweis auf die Fragen
Okay, in Ordnung, wir haben UH nicht verstanden, dass unser neuronales Netz die Frage nicht verstanden hat
Äh ja, so gut nächste Frage
Ich möchte eine Ausrüstung auf den Autopiloten schalten, also ähm, wenn ihr vorhat, das auszurollen
FSD Beta in andere Länder als die USA und Kanada, und auch meine nächste Frage ist
Was ist der größte Engpass oder die technologische Barriere, die Sie in der aktuellen Reihenfolge eines Teils des Stacks denken und wie
Sie stellen sich vor, dies zu lösen, damit der Autopilot in Bezug auf eine Leistungsmatrix erheblich besser ist als Menschen
Sicherheitssicherung und das menschliche Selbstvertrauen, ich denke, Sie stimmen auch mit 4V FSTB zusammen
Oder was auch immer ihr die Autobahn und die Stadt als einzelne Stapel und ein architektonisches UH kombinieren werden
Große Verbesserung Kannst du vielleicht ein bisschen darüber experimentieren, danke, das ist eine ganze Reihe von
Fragen gut wir wir wir hoffnungsvoll, ich denke, ich denke
Aus technischer Sicht sollte die FSD -Beta sein, dass es möglich sein sollte, diese SFSD -Beta -UH zu rollen
weltweit bis Ende dieses Jahres, ähm, aber wir wissen von viel von viel von
Länder, die wir auf regulatorische Zulassung benötigen, und daher sind wir durch die regulatorische Zulassung in anderen Ländern etwas ausgeschaltet
ähm aber ich weißt ich ich, aber ich denke vom technischen Standpunkt aus wird es bereit sein
Geh zu einer weltweiten Beta bis Ende dieses Jahres zu einer weltweiten Beta und es gibt eine ziemlich große
Verbesserung, die wir im nächsten Monat veröffentlichen, das wird immer besonders gut in UH sein
Bewertung der Geschwindigkeit des sich schnell bewegenden Querverkehrs und einer Reihe anderer Dinge, damit jeder ausarbeitet
Für die Objekte ja, ich denke, so gab es früher viele Unterschiede zwischen der Produktion
Autopilot und die vollständige selbstfahrende Beta, aber diese Unterschiede wurden im Laufe der Zeit immer kleiner, denke ich
Noch vor wenigen Monaten verwenden wir jetzt den gleichen Sehvermögen nur in der FSD und in der Produktion
Autopilot über alle Fahrzeuge, ähm, es gibt noch einige Unterschiede, die primäre ist die Art und Weise, wie wir
Vorhersagen Sie im Moment die Gassen
Produktionsautopiloten Wir verwenden immer noch ein einfacheres Spurmodell, aber wir erweitern unsere aktuellen FSD -Beta -Modelle, um in der Arbeit zu arbeiten
Alle Arten von Autobahnszenarien auch und die Version von uh fst
Beta, die ich treibe, hat tatsächlich den integrierten Stapel
FSD -Stack äh sowohl in den Straßen der Stadt als auch in der Autobahn und äh es funktioniert für mich recht gut, aber wir müssen es validieren
Alle möglichen Wetter
Ich arbeite als besser als der Produktionsstapel, in dem Sie in einer weiten Reichweite kennen
von UH -Umgebungen, aber wir sind dem ziemlich nah an dem, ähm, ich meine, ich denke, ich weiß es vielleicht nicht
Ich werde definitiv vor Ende des Jahres sein und und vielleicht November, ja in unseren persönlichen Antrieben der FSD
Stack on Highway -Laufwerke bereits viel besser als der Produktionsstapel, den wir haben, und wir erwarten, dass wir auch die enthalten
Parkplatzstapel als Teil des FSC -Stacks vor Ende dieses Jahres, damit uns im Grunde genommen zu Ihnen führt
Sitzen Sie im Auto auf dem Parkplatz und fahren Sie bis zum Ende des Parkplatzes an einem Parkplatz vor dem Ende
Jahr ja und und in Bezug auf das die grundlegenden grundlegenden Metrik, gegen die man optimieren muss, ist IS
ähm wie viele Meilen pro zwischen einer notwendigen Intervention so
ähm, nur massiv die Anzahl der Kilometer zu verbessern, die das Auto vollständig fahren kann
Autonomie vor einer Intervention ist erforderlich, die sicherlich kritisch ist, um so
Ja, das ist, das ist die grundlegende Metrik, die wir jede Woche messen, und machen radikal
Verbesserungen zu diesem Hallo, danke Hallo, vielen Dank für Sie
Die Präsentation sehr inspirierend, mein Name ist Daisy Ich habe tatsächlich eine nicht-technische
Frage an Sie, ich bin neugierig, wenn Sie wieder zu Ihren 20ern sind, was sind einige davon
Die Dinge, die Sie sich damals gewusst haben, welche Ratschläge würden Sie Ihrem jüngeren Selbst geben
Nun, ich versuche etwas Nützliches herauszufinden, um zu sagen
Ja, ja, ich bin zu Tesla gekommen, wäre eine Sache, um
ähm ja, ich denke, ich versuche im Allgemeinen einfach, dich so vielen klugen Menschen auszusetzen
wie möglich und ich habe viele Bücher gelesen
Sie wissen, dass ich das tat, obwohl
Also ähm, ich denke, es gibt auch ein gewisses Verdienst, nur zu tun
Ich mag es, nicht unbedingt zu intensiv zu sein und und gerne zu genießen
Moment ein bisschen mehr würde ich zu 20 oder 20 etwas sagen, nur ich, nur um dich zu wissen, ähm
Stoppen Sie und riechen die Rosen gelegentlich wahrscheinlich eine gute Idee
ähm Sie wissen, dass es so ist, als ob wir die The Falcon One Rocket entwickeln
und äh auf dem Quadrilin -Atoll und wir hatten diese schöne kleine Insel das
Wir entwickeln die Rakete an und nicht ein einziges Mal, dass ich in dieser Zeit sogar etwas trinken habe
Strand Ich bin wie gut, ich hätte am Strand etwas trinken sollen, das in Ordnung gewesen wäre
Vielen Dank, und ich denke, Sie haben alle Robotik -Leute begeistert
Mit Optimus uh fühlt sich das sehr wie vor 10 Jahren beim Fahren an, aber wie uh
Das Fahren hat sich als schwieriger erwiesen als vor 10 Jahren, was wissen wir jetzt, wo wir vor 10 Jahren nicht getan haben
Das würde zum Beispiel Agi auf einem Humanoiden schneller kommen
Nun, ich meine, es scheint mir, dass Hei sehr schnell voranschreitet, um
kaum eine Woche vergeht ohne bedeutende Ankündigung und äh ja, ich meine
Zu diesem Zeitpunkt scheint KI in fast jedem regelbasierten Spiel gewinnen zu können
Äh, es ist in der Lage, extrem beeindruckende Kunst zu schaffen, um
In Gespräche führen, die sehr raffiniert sind, wissen Sie
Schreiben Sie Essays und diese verbessern sich einfach weiter
ähm und es gibt so viel mehr so viele weitere talentierte Menschen, die arbeiten
Auf KI und der Hardware wird es besser, ich denke, es ist eine KI, die auf einem Super ist
Wie eine starke exponentielle Kurve der Verbesserung unabhängig von dem, was wir tun
Tesla um und offensichtlich profitieren wir etwas von dieser exponentiellen Kurve von
Verbesserung mit AI UM -zugänglich ist auch sehr sehr sehr sehr
Gut bei Aktuatoren, die Motoren kennen, die Sie Motoren Getriebe Controller betreiben
ähm Sensoren und ähm, du weißt wirklich, wie ich sage, dass du es weißt
Der größte Unterschied zwischen dem Roboter auf vier Rädern und dem Roboter mit Armen und Beinen besteht darin, die Aktuatoren zu bekommen
Richtig, eigentlich ist es ein Aktuatoren- und Sensorsproblem, und offensichtlich wissen Sie, wie Sie
Kontrollieren Sie diese Aktuatoren und Sensoren, aber es ist ein Yeah -Aktuatoren und Sensoren und wie Sie
Kontrollieren Sie die Aktuatoren. Ich weiß, wo Sie wie die Zutaten haben müssen, die erforderlich sind, um eine zu erstellen
überzeugender Roboter und wir machen es so
Hallo Elan, du bringst die Menschheit tatsächlich auf die nächste Stufe, buchstäblich Tesla und
Sie bringen die Menschheit auf die nächste Stufe, also sagten Sie Optimus Prime UH
Optimus wird in der nächsten Tesla -Fabrik verwendet. Meine Frage ist ein neuer Tesla
Die Fabrik wird vollständig vom Optimus -Programm ausgeführt und
Und wann kann die Öffentlichkeit eine Humanoid ordnen, ja, ich denke, es wird du wissen, dass wir es sind
Starten Sie Optimisten mit sehr einfachen Aufgaben in der Fabrik, um Sie kennen, vielleicht wie das Laden
Abgesehen davon, wie Sie im Video gesehen haben, das einen Teil für Sie kennen, wenn Sie von einem getragen werden
zu einem anderen geben oder einen Teil in einen unserer konventionelleren Roboter in einen Teil beladen
Zellen, die Sie kennen, die den Körper zusammenschweißen, damit wir anfangen, Sie wissen
Ich versuche nur, wie wir es überhaupt nützlich machen und dann die Anzahl der Situationen, in denen es geht, nach und nach allmählich erweitern
nützlich ähm und ich denke, dass die Anzahl der Situationen, in denen Optimus
ist nützlich, wird es exponentiell wie sehr schnell wachsen
ähm, wenn Leute einen bestellen können, weiß ich nicht, dass ich denke, es ist nicht so weit
weg, ähm gut, ich denke du meinst, wann können Menschen einen erhalten
ähm, also weiß ich nicht, dass ich so sagen würde, dass ich wahrscheinlich innerhalb von drei Jahren sagen würde, ich bin nicht mehr
als fünf Jahre innerhalb von drei bis fünf Jahren könnten Sie wahrscheinlich einen Optimus erhalten
Ich habe den besten Weg, um die Fortschritte für AGIs zu machen, um so viele kluge Menschen auf der ganzen Welt wie möglich einzubeziehen und gegeben zu haben
Die Größe und Ressource von Tesla im Vergleich zu Roboterunternehmen und momentan den Stand der Menschheitforschung
würde für die Art von Tesla keinen Sinn machen, einige der Open Source einige der
Simulation Hardware -Teile Ich denke, Tesla kann immer noch der dominierende Plattformer sein
wo es so etwas wie Android OS oder wie iOS -Sachen für den gesamten Menschen oder die Forschung sein kann, wäre das
etwas, das den Optimus nur für Tesla -Forscher oder die behalten, oder die
Die Fabrik selbst kann es öffnen und die ganze Welt die menschliche Forschung erforschen lassen
Ich denke, wir müssen vorsichtig sein, wenn Optimus potenziell UH in einer Weise verwendet wird, die schlecht ist, denn das ist eins
Von den möglichen Dingen, die zu tun sind, denke ich, würden Sie es wissen würden
Geben Sie Optimisten an, wo Sie Optimisten Anweisungen zur Verfügung stellen können, aber diese Anweisungen
Sie wissen, dass Sie den Robotikgesetzen geregelt haben, die Sie nicht überwinden können?
Sie wissen also, dass sie anderen und anderen nicht Schaden zufügen und nicht
Ich denke, ich denke, wahrscheinlich einige sicherheitsrelevante Dinge mit Optimus Ja, also gut wir uns gut
Nehmen Sie einfach noch ein paar Fragen und dann und dann, und dann danke Ihnen alle, dass Sie gekommen sind
Fragen, um ein tiefes und ein breit in der Tiefe für Optimus, was die ist
aktuell und was ist die ideale Controller -Bandbreite und dann in der breiteren Frage, ah, gibt es so groß
Werbung für die Tiefe und Breite des Unternehmens, worum geht es in einzigartiger Weise
Tesla, die es ermöglicht, dass jemand die Bandbreite angehen möchte
Frage ja ja also die technische Bandbreite des Kostüms
Okay für die Bandbreitenfrage, die Sie verstehen oder oder herausfinden müssen, was die ist
Aufgabe, die Sie tun wollten und was ist der freie, wenn Sie eine Frequenzveränderung dieser Aufgabe übernommen haben, was ist das?
Sie möchten, dass Ihre Gliedmaßen dies tun, und dort erhalten Sie Ihre Bandbreite von ihrer Nummer, die Sie speziell nur sagen können, dass Sie Ihre Verwendung verstehen müssen
Fall und das ist dort, wo die Bandbreite von uh kommt, okay, was ist die breite Frage
Ich erinnere mich nicht ganz an die Breite und Tiefe, die ich mit Breite und Tiefe beantworten kann, aber ja
Ich war auf der Rückseite der Frage interessant. Ich denke, wir werden wahrscheinlich nur die Bandbreite oder Sie erhöhen
wissen, was die Wirkung der Geschicklichkeit und der Reaktionszeit des Roboters bedeutet
ähm, als könntest du Staaten retten, es ist kein Hertz um und vielleicht musst du nicht gehen
bis zu 100 Hertz, aber ich weiß vielleicht nicht 10 25, ich weiß nicht
Im Laufe der Zeit denke ich, dass die Bandbreite viel zunehmen oder in die Geschicklichkeit und Latenz übersetzt oder übersetzt wird
ähm, du würdest minimieren, dass im Laufe der Zeit ah ja minimieren Sie die Latenz maximieren die Geschicklichkeit maximieren
ähm ich meine in Bezug auf breit und tiefe ähm ich denke du weißt du, dass wir haben
Wir sind zu diesem Zeitpunkt ein ziemlich großes Unternehmen, also haben wir viele verschiedene Fachgebiete, die wir unbedingt müssen
Entwickeln Sie, um autonom zu machen oder Elektroautos herzustellen und dann autonome Elektro zu machen
Autos ähm wir haben nur ich meine, Tesla ist wie eine ganze Reihe von Startups im Grunde genommen und
ähm bisher waren sie fast alle ziemlich erfolgreich, also müssen wir etwas richtig machen
ähm und ich weißt du, ich betrachte eine meiner UH -Kernaufgaben, und das iranische Unternehmen ist es, ein Umfeld zu haben, in dem
Äh großartige Ingenieure können gedeihen und und ich denke in vielen Unternehmen
Ich weiß nicht, dass die meisten Unternehmen, wenn jemand ein wirklich talentierter Ingenieur ist
Ihre Talente sind bei vielen Unternehmen unterdrückt, und Sie wissen es
und und einige der Unternehmen, dass das technische Talent auf eine Weise unterdrückt wird, die vielleicht nicht offensichtlich schlecht ist
Aber wo es einfach so bequem ist und Sie so viel Geld bezahlt haben und Sie aber Sie sind die Ausgabe, die Sie tatsächlich müssen
produzieren ist so niedrig, dass es wie eine Honigfalle ist, die Sie kennen, so wie es einige gibt
Honigfalle ähs Orte im Silicon Valley uh, wo sie nicht unbedingt für Ingenieure schlechte Orte scheinen, sondern für Ingenieure nicht unbedingt
Sie haben gesagt, wie ein guter Ingenieur ging hinein und was sind sie rausgekommen
Und die Ausgabe dieses technischen Talents scheint sehr niedrig zu sein
Auch wenn es sich anscheinend amüsieren soll, nenne ich es deshalb ein paar Honey -Trap -Unternehmen in
Silicon Valley Uh Tesla ist keine Honigfalle, die wir fordern, und es ist, als würden Sie viel fertig machen
Ähm und es wird wirklich cool, und du weißt, dass du nicht einfach sein wirst
Aber wenn Sie ein super talentierter Ingenieur sind, werden Ihre Talente verwendet.
Denken Sie in größerem Maße nach als irgendwo anders
Sie kennen SpaceX auch so, so Highline, und ich habe zwei Fragen so
Sowohl zum Autopilot -Team ist das Ding so, als ob ich in den letzten Jahren Ihre Fortschritte verfolgt habe
Sie haben Änderungen an der mageren Erkennung vorgenommen, wie Sie gesagt haben, dass Sie wie zuvor eine sofortige semantische Segmentierung durchführen, jetzt seid ihr jetzt
BAURTETS -Transfermodelle für den Aufbau der Gassen also, was ist ein anderer einige andere gemeinsame Herausforderungen, die ihr habt
sind im Moment gegenübersteht, wie Sie es in Zukunft als neugieriger Ingenieur lösen, damit wie wir als Forscher arbeiten können
Bei diesen arbeiten an diesen und die zweite Frage ist, als wäre ich wirklich neugierig auf die Data Engine wie Sie
Jungs haben wie ein Fall erzählt, in dem das Auto gestoppt wird. Wie finden Sie Fälle, was sehr ähnlich ist
Aus den Daten, die Sie so wenig mehr in der Data Engine haben, wäre großartig, also ist es in Ordnung, dass es in Ordnung ist
ähm, ich werde die erste Frage beantworten, wenn ich als Beispiel das Belegungsnetz verwendest, also, was du in der Präsentation gesehen hast
Vor einem Jahr gab
Netzwerk und Sie haben ein einheitliches Modell, um das gesamte zu repräsentieren
physische Welt überall herum und Sie immer der Zustand ist wirklich wirklich wirklich
Wirklich herausfordernd, so dass wir erst über ein Jahr so etwas wie ein 2D fahren, wo, wenn es einen Krieg gibt und
Es heißt Kurve, wir repräsentieren mit derselben statischen Kante, die offensichtlich nicht wissen, dass es nicht genau es gibt, da ist eine
großer Unterschied zwischen einer Kurve und einer Wand, wenn Sie fahren, treffen Sie unterschiedliche Auswahlmöglichkeiten. Nachdem wir das erkannt haben, treffen wir
Wir müssen zu 3D gehen, wir müssen das gesamte Problem im Grunde neu synchronisieren und darüber nachdenken, wie wir das ansprechen, damit dies wird
Sei wie ein Beispiel für Herausforderungen, die wir haben, und wir haben im vergangenen Jahr eine Eroberung
Ja, um die Frage zu beantworten, wie wir tatsächlich Beispiele für die kniffligen, angehaltenen Autos beziehen. Es gibt ein paar Möglichkeiten, um zu gehen
Darüber hinaus können wir zwei Beispiele für Meinungsverschiedenheiten in unseren Signalen auslösen.
Flackern zwischen geparktem und Fahren auslösen diesen Rücken und die zweite ist, dass wir mehr vom Schattenmodus nutzen können
Logik also, wenn der Kunde das Auto ignoriert, aber wir denken
Anders wie verschiedene Triggerlogik, die es uns ermöglichen, diese Datenkampagnen zurückzubekommen
Hallo, danke für die tolle Präsentation, vielen Dank, also da
sind viele Unternehmen, die sich auf das AGI -Problem konzentrieren, und einer der Gründe, warum es ein so schwieriges Problem ist, ist
Weil das Problem selbst so schwer ist, mehrere Unternehmen zu definieren, haben verschiedene Definitionen, auf die sie sich konzentrieren
Verschiedene Dinge also, was ist Tesla Wie definiert Tesla das ATI -Problem und worauf konzentrieren Sie sich speziell?
Nun, wir konzentrieren uns nicht speziell auf Agi, ich bin einfach einfach
zu sagen, dass HGI so ist, scheint es wahrscheinlich, dass es eine aufstrebende Eigenschaft von dem ist, was wir sind
Machen Sie, weil wir all diese autonomen Autos und autonomen Humanoide schaffen
ähm, die tatsächlich in einem wirklich gigantischen Datenstrom sind, der hereinkommt
und und werden verarbeitet, um bei weitem die meisten Daten und und Daten in der realen Welt, die Sie nicht erhalten können
Nur im Internet suchen, weil Sie da draußen in der Welt sein und mit Menschen interagieren und mit den Straßen und nur mit Ihnen interagieren müssen
Wissen Erde ist ein großer Ort und die Realität ist unordentlich und kompliziert, und ich denke, es ist so etwas wie uh
Wahrscheinlich scheint es einfach nur eine aufstrebende Eigenschaft zu sein, wenn Sie haben, dass Sie Zehns oder Hunderte von Millionen von wissen
Autonome Fahrzeuge und und vielleicht sogar eine vergleichbare Anzahl von Humanoiden, vielleicht mehr als das an der humanoiden Front
ähm, das ist nur die meiste Datenmenge, und wenn dieses Video verarbeitet wird
Es ist wahrscheinlich, dass Sie wissen, dass die Autos definitiv viel besser werden werden als Menschen
Fahrer und die humanoiden Roboter werden zunehmend
vielleicht nicht von Menschen zu unterscheiden und so und so, wie Sie sagten, Sie haben eine
Emergentes Eigentum von Agi UM
Und wohl die Sie wissen, dass Sie gemeinsam auch eine Art Super -Intelligenz sind, insbesondere als wir
Verbessern Sie die Datenrate zwischen Menschen. Ich meine, ich denke, so scheint das in den frühen Tagen, in denen das Internet war
Wie das Internet war wie um die Menschheit, die ein Nervensystem erlangte, in dem jetzt plötzlich jemand
Das Element der Menschheit konnte alle Kenntnisse des Menschen durch Verbinden kennenlernen
ins Internet fast das gesamte Wissen oder sicherlich großer Teil davon, während wir zuvor austauschen würden
Informationen von Osmose von Ihnen wissen, dass wir uns mögen müssen, um Daten zu übertragen, damit Sie einen Brief schreiben müssen
Jemand müsste den Brief von Person an eine andere Person und dann eine ganze Reihe von Dingen dazwischen tragen
Dann war es wie diese Position ja, ich meine, es ist wahnsinnig langsam, wenn Sie darüber nachdenken
Es ähm und selbst wenn Sie in der Kongressbibliothek waren, hatten Sie immer noch keinen Zugriff auf alle Informationen der Welt und Sie
Sicherlich konnte es nicht suchen und ich weiß, dass offensichtlich nur sehr wenige Menschen in der Bibliothek des Kongresses sind
ähm, ich meine eine der großen ähm eine Art Gleichheitselemente
Wie das Internet war der größte Ausgleich in der Geschichte in der Geschichte
Nutzungsbedingungen für Informationen oder Wissen in jedem Schüler der Geschichte denke ich
würde dem zustimmen, weil Sie wissen, dass Sie tausend Jahre zurückgehen, es gab nur sehr wenige Bücher wie
Wie und Bücher wären unglaublich teuer, aber nur wenige Leute wussten, wie man liest und nur wenn eine noch kleiner
Die Anzahl der Leute hatte sogar ein Buch, das jetzt jetzt so betrachtet wird, als ob Sie sofort auf jedes Buch zugreifen können, das Sie lernen können
alles für grundsätzlich kostenlos ist es ziemlich unglaublich
Sie wissen, dass ich kürzlich gefragt wurde, welche Zeit der Geschichte ich lieber sein würde
am meisten und meine Antwort war gerade jetzt
Dies ist die interessanteste Zeit in der Geschichte und ich habe viel Geschichte gelesen
Also lass uns oh ja, lass uns unser Bestes geben, um das am Laufen zu halten, ja
Und um zu einer der frühen Fragen zurückzukehren, die ich beantworten würde, wie Sie es können, was im Laufe der Zeit passiert ist
In Bezug auf Tesla Autopilot sind wir nur die
Die neuronalen Netze haben sich allmählich immer mehr Software und natürlich in der Grenze absorbiert
Könnte sagen, dass sie einfach die Videos nehmen, wie sie vom Auto gesehen werden, und vergleichen Sie diese mit diesen
Die Lenkeingänge aus dem Lenkrad und Pedalen, die sehr einfache Eingaben sind, und im Prinzip könnten Sie
trainieren mit nichts dazwischen, denn das ist es, was Menschen mit einem biologischen neuronalen Netz tun, das man trainieren kann
Basierend auf Video und UH und und was das Video trainiert, ist das Umzug von
Das Lenkrad und die Pedale ohne andere Software dazwischen sind noch nicht da, aber es ist allmählich
Gehen Sie in diese Richtung, und in Ordnung warten Sie letzte Frage
Gehst du, ich denke, wir haben hier eine Frage vorne, und hallo, ich werde zwei machen, ich werde zwei machen
Fragen gut dort drüben ähm Hallo, danke für eine so tolle Präsentation gut die alte Frage zuletzt
ähm mit FSD wird von so vielen Menschen verwendet.
Toleranz in Bezug auf Leistungsstatistiken und denken Sie, dass es von Dritten mehr Transparenz oder Regulierung geben muss, wie gut es gut ist
genug und um die Definition wie Schwellenwerte für die Leistung UH durch
Einige viele Meilen, genau das, was du kennst ich
Das Design der Nummer eins bei Tesla ist Sicherheit, so umgegangen und das
Überall auf dem Vorstand, so haben wir im Hinblick auf die mechanische Sicherheit des Autos die niedrigste Wahrscheinlichkeit einer Verletzung von Autos
Im Wesentlichen von der Regierung auf nur eine passive mechanische Sicherheit getestet
Crash -Struktur und Airbags und so nicht, dass wir das Beste am höchsten haben
Bewertung für aktive Sicherheit und ähm, ich denke, es wird auf den Punkt kommen
Wo Sie der Sicherheitsakt so lächerlich gut sind, ist es es ist wie absurd besser als ein Mensch
ähm und dann in Bezug auf UH Autopilot um, veröffentlichen wir dies allgemein
Sprechen Sie die Statistiken über Meilen mit Autos, die keine haben
Autonomie oder Tesla -Autos ohne Autonomie mit einer Art Hardware One Hardware Two
Hardware drei um und dann diejenigen, die in der FSD Beta sind
ähm und wir sehen stetige Verbesserungen auf dem Weg, um und Sie wissen manchmal, dass es dies gibt
Dichotomie von Ihnen wissen, falls Sie warten, bis das Auto so ist, wie ich es nicht weiß, ähm
Dreimal sicherer als eine Person, bevor sie eine Technologie einsetzen, aber ich denke, das ist tatsächlich moralisch falsch
ähm an dem Punkt, an dem Sie glauben, dass das Hinzufügen von Autonomie uh reduziert äh
Verletzung und Tod, ich denke, Sie haben eine moralische Verpflichtung, es einzusetzen, obwohl Sie es tun möchten
werden von vielen Menschen verklagt und beschuldigt, weil die Menschen, deren Leben Sie gerettet haben
gerettet und die Menschen, die die Menschen, die gelegentlich sterben oder verletzt werden
dass Sie wissen, was ein Problem mit Autopilot ähm ist, deshalb müssen Sie sich das an ansehen
Die Zahlen in einer Art Meilen, die angetrieben wurden, wie viele Unfälle traten, wie viele Unfälle ernst waren wie viele
Todesfälle und Sie wissen
Jeden Tag wird es nicht perfekt sein, aber was zählt es, ist, dass es sehr deutlich sicherer ist als nicht
Bereitstellen, ähm ja, also denke ich, ähm letzte Frage
Ich denke ja, also danke, was ist die letzte Frage hier
Okay, ähm ja, ich habe es okay, und hallo so
ähm, ich arbeite nicht mit Hardware, also vielleicht das Hardware -Team und ihr können
Erklären Sie mich, warum ist es erforderlich, dass es Symmetrie gibt
ähm im Design von Optimus, weil der Menschen wir haben, dass wir es richtig haben, wir haben wir richtig
Verwenden wir im Laufe der Zeit einige Muskeln mehr als andere
ähm recht, vielleicht sehen Sie einige gemeinsame Ausfälle oder einen Aktuator
Misserfolge mehr im Laufe der Zeit verstehe ich, dass dies extrem vor der Stufe ist
ähm auch wir als Menschen haben so viel Fantasie und Fiktion über Super Human gestützt
Fähigkeiten wie wir alle wollen nicht direkt dort drüben gehen. Wir wollen unsere Arme ausdehnen und wie wir alle haben
Diese kennen Sie viele Fantasy -fantastische Designs, die so berücksichtigt werden
Alles andere, was in Bezug auf Batterien und Intensität von vorgeht
Berechnen Sie vielleicht können Sie all diese Aspekte dazu nutzen, etwas zu finden
Nun, ich weiß nicht mehr interessanter in Bezug auf deinen Roboter, den du bist
Bauen und ich hoffe, Sie können diese Richtungen erkunden. Ja, ich meine, ich denke, es wäre cool für
Haben Sie wie Sie wissen, dass Inspector Gadget real ist, das wäre ziemlich süß, also ja, ich meine, Sie wissen gerade, wir wissen wir
Ich möchte nur einen grundlegenden humanoid machen, was gut funktioniert und unser Ziel ist der schnellste Weg
Zu einem nützlichen ähen humanoiden Roboter denke ich, dass dies uns in Wirklichkeit in der Realität begründen wird
buchstäblich ähm und sicherstellen, dass wir es tun, wenn wir es tun
Etwas Nützliches wie eines der schwierigsten Dinge, die man tun kann, ist, nützlich zu sein, um zu nützlich zu sein
Eigentlich und dann und dann, um hohe Nützlichkeit unter der Kurve zu haben, wie viele Menschen, die Sie mit der Zeit geholfen haben, die Sie kennen und
Wie viel Hilfe haben Sie im Durchschnitt jeder Person zur Verfügung gestellt?
Und wie viele Leute haben Sie dem gesamten Dienstprogramm geholfen, wie es versucht, nützliches Produkt tatsächlich zu versenden
Dass Menschen eine große Anzahl von Menschen gerne ist, ist so wahnsinnig schwer, dass es verwirrt ist
Der Geist, ähm Sie wissen, deshalb könnte ich sagen, wie Mann, es gibt einen verdammten Unterschied zwischen einem Unternehmen mit Verschiebungsprodukt und man hat sich nicht sicher, dass es ein Produkt ist, uh es ist ein
Spiel Dies ist Tag und Tag um, und selbst wenn Sie Produkte versenden können, können Sie den Wert des Werts des Kosten
Ausgabe mehr als die Kosten für die Eingabe, die insbesondere mit Hardware wieder wahnsinnig schwierig ist
Ähm aber ich denke, im Laufe der Zeit denke ich, dass wir cool sind, kreative Dinge zu tun und acht Arme und was auch immer zu haben
ähm und haben verschiedene Versionen, und vielleicht wissen Sie, dass es etwas Hardware geben wird
wie Unternehmen, die in der Lage sind, einen Optimisten wie wir vielleicht einen Optimisten hinzuzufügen können
Sie wissen
Optimist, wie Sie sie zu Ihrem Telefon hinzufügen können.
sein vielleicht ein Ökosystem kleiner Unternehmen, die oder Unternehmen, die Add-Ons für
Optimus, so dass ich dem Team für ihre harte Arbeit dankt
ähm ihr seid großartig und äh ja und danke, danke
Sie und uh Vielen Dank für Sie, dass Sie gekommen sind und für alle online danke, dass Sie sich eingestellt haben
ähm und ich denke, das wird eines dieser großartigen Videos sein, in denen Sie gefallen können, wenn Sie sich schnell auf die Bits vorantreiben können
Das finden Sie am interessantesten, aber wir versuchen, Ihnen eine enorme Menge an Details zu geben, wörtlich, damit Sie sich ansehen können
Das Video in Ihrer Freizeit und Sie können sich auf die Teile konzentrieren, die Sie interessant finden, und die anderen Teile überspringen UH
Also danke Ihnen alles, was es ist und wir werden dies jedes Jahr tun und wir könnten sogar einen Teil pro monatlicher Podcast machen
ähm also so ähm, aber ich denke es wird es sein, du weißt und großartig zu irgendwie
Bringen Sie Sie für die Fahrt und zeigen Sie Ihnen, was coole Dinge passiert, und ähm ja, danke