Tesla CEO Elon Musk heeft onlangs de Tesla Bot van het bedrijf onthuld. De robotcode-genoemde Optimus schuifelde over een podium, zwaaide met zijn hand en pompte zijn armen in een lowy-speed dansbeweging. Musk voorspelt dat de robot binnen drie tot vijf jaar $ 20.000 zou kunnen kosten als alles volgens plan verloopt. Maar de vraag is, wat kan het voor ons doen. Maar voordat we daarop ingaan, laten we kijken naar de hoofdapparaten die de Tesla Bot aansturen.
Tesla Bot Actuators
De Actuators zijn het belangrijkste aandrijfsysteem voor elke robot. Je zou kunnen zeggen dat een robot niets meer is dan een pc met bewegende delen, of met andere woorden, een robot is een pc met actuatoren en sensoren. Tesla heeft zijn eigen actuatoren voor de bot ontwikkeld, het gebruikt 3 soorten roterende actuatoren en 3 soorten Lineaire actuators.
![Tesla Bot Actuators](https://cdn.shopify.com/s/files/1/0615/2193/files/tesla_bot_actuator_3_480x480.jpg?v=1665004218)
Als je je afvraagt waarom Tesla geen gestandaardiseerde lineaire actuatoren zoals de FIRGELLI Actuator is omdat ze verschillende beperkingen hebben, wat betekent dat ze hun eigen systemen moeten ontwikkelen om de robots uiteindelijk lichtgewicht, krachtefficiënte, hoge vermogensdichtheid en lage kosten te laten zijn. Tesla heeft beweerd dat ze de BOT voor $ 20.000 per stuk willen verkopen. Dit is op zichzelf een grote volgorde voor iets dat gong is om 23 actuatoren en krachtige pc, veel sensoren en een batterij te vereisen om het meer dan een paar uur te laten duren, plus een sterk skelet om alles bij elkaar te houden.
Tesla Bot Linear Actuators
![Tesla Bot Linear Actuators](https://cdn.shopify.com/s/files/1/0615/2193/files/tesla_bot_actuator_2_480x480.jpg?v=1665004006)
De lineaire actuatoren die Tesla ontwikkelde zijn zeer specifiek voor een specifieke rol, dit betekent dat ze niet echt van gebruik zouden zijn voor een andere applicatie dan een robot. Hun actuatoren gebruiken een planetair rollensysteem en Tesla noemt het, maar dit is in feite code voor ballscrew leadschrew -ontwerp, en in plaats van een traditionele magnetische ankerspoel in het midden van de motor besloten ze een borstelloos kernmotorontwerp te gebruiken. Dit betekent dat het ontwerp van de balkleadschroef zeer efficiënt is en minder vermogen gebruikt, maar ook duurder. En ze gebruiken een borstelloos stroomsysteem, wat betekent dat de live spanwijdte aanzienlijk sneller zal zijn en zeer specifieke aandrijfmodi door de software mogelijk maakt.
![Tesla Bot Linear Actuators](https://cdn.shopify.com/s/files/1/0615/2193/files/tesla_bot_actuator_1_480x480.jpg?v=1665003997)
De lengte van de reis is slechts ongeveer 2 "lang, en zoals de foto liet zien dat ze een piano op 500 kg tillen, is dit veel gewicht. Je vraagt je misschien af waarom het zoveel gewicht moet verhogen?, Nou dat is omdat wanneer geïnstalleerd in een Metalen skelet, de actuatoren reizen, moeten de stoke versterken van wat het beweegt. Dus als het het been van een robot beweegt, moet het been ongeveer 150 graden kunnen bewegen, of over een lengte van 2 voet waar het been van moet slingeren ongeveer nul tot een 3-voet boog. Het HUMA-lichaam dat meer dan 100.000 jaren is geëvolueerd, stelt ons mensen in staat om dit te doen met behulp van onze beenspieren, maar het krijgen van een lineaire actuator is geen gemakkelijke taak. Dus het punt ik ' M maken is dat, hoewel de actuator 500 kg gewicht kan tillen over 2-inch, zodra die actuatoren verbonden zijn met een hendel, de kracht aanzienlijk wordt verminderd, afhankelijk van de hefboomratio, en de snelheid neemt toe, wat zorgt voor een mooie handel -uit.
Tesla BOT -presentatie.
Dit is wat Tesla zelf te zeggen had over de nieuwste botpresentatie die ze op 30 september 2022 gaven
Elon Musk presenteert: WIk heb een aantal echt spannende dingen om je te laten zien, ik denk dat je behoorlijk onder de indruk zult zijn. Ik wil wel wat verwachtingen stellen met betrekking tot onze Optimus -robot, zoals je vorig jaar weet, het was gewoon een persoon in een robotpak, maar we hebben niet een lange weg afgelegd en ik denk dat je het weet in vergelijking met dat is het zal erg indrukwekkend zijn. En we gaan het hebben over de vooruitgang in AI voor volledig zelfrijden en hoe ze zich van toepassing hebben op meerOver het algemeen naar echte AI -problemen zoals een humanoïde robot en zelfs verder gaan dan dat. Ik denk dat er een potentieel is dat wat we hier bij Tesla doen een zinvolle bijdrage aan AGI zou kunnen leveren, en ik denk dat we ons eigenlijk een goede entiteit vertel om het vanuit een bestuursstandpunt te doen, omdat we een beursgenoteerd bedrijf zijn dat we er een hebben Klasse van aandelen en dat betekent dat het publiekcontroleert Tesla en ik denk dat dat eigenlijk een goede zaak is, dus als ik gek word, kun je me dit ontslaanis belangrijk, misschien ben ik niet gek, ik weet het niet. Dus ja dus we gaan veel praten over onze vooruitgang in AI Autopilot en de vooruitgang met Dojo, en dan gaan we het team eruit halen en een lange Q&A doen zodat je het moeilijk kunt vragen vragen. Wat je ook wilt, technische vragen van existentiële vragen als het zoveel mogelijk tijd voor Q&A zou willen hebben, dus laten we eens kijken wat je dagelijks raadt.
Hey jongens, ik ben Milaan, ik werk aan de stuurautomaat en het is rubber, ik ben een mechanisch ingenieur van Lizzy ook in het project, dus mochten we de bot ter sprake brengen voordat we de eerste keer doorsturen dat we deze robot proberen zonder back -upondersteuning kranen
mechanische mechanismen geen kabels niets ja ik wil meedoen met jullie
Vanavond, maar het was de eerste keer dat we je klaar heb, laten we gaan, laten we gaanZelfrijdende computer die in je Tesla-auto's draait, wat dit is dat het letterlijk de eerste keer is dat de robot zonder een ketting op het podium was, dat is het, dus de robot kan eigenlijk veel meer doen dan we je net hebben laten zien Ik wilde gewoon niet dat het op zijn gezicht zou vallen, dus we zullen je nu wat video's laten zien van de robot die een heleboel andere dingen doet um ja, wat minder riskant is.
Ja, we wilden een beetje meer laten zien wat we de afgelopen maanden hebben gedaanmet apart en gewoon rondlopen en op het podium dansen en gewoon een bescheiden begin, maar je kunt de neurale netwerken van de stuurautomaat zien draaien als
is net voor de knop rechtstreeks op dat nieuwe platform voor de budEen weergave die de robot is, wat is de wereld die de robot ziet, dus het is heel duidelijk dat het zoals deze objecten identificeert, is het object dat het zou moeten oppakken. We gebruiken hetzelfde proces als voor Autopilot om gegevens te verzamelen in het trainen van uw netwerken die we vervolgens inzetten op de
Robot dat is een voorbeeld dat het bovenlichaam een beetje meer illustreert
Iets dat we de komende maanden proberen over een paar maanden te kunnen vastpakkenDit is echt een echt station in de Fremont -fabriek waar het werkt.
Dat is niet het enige dat we vandaag moeten laten zien, zodat wat je zag was wat we Bumble C noemen, dat is onze soort ruwe ontwikkelingsrobot die semi-off-the-shelf actuatoren gebruikt, maar we hebben eigenlijk een stap verder gegaan dan dat Het team is ongelooflijk werk verricht en we hebben eigenlijk een optimistische bot met een
Volledig Tesla ontworpen op beide actuators batterijbesturingssysteemAlles was niet helemaal klaar om te lopen, maar ik denk dat het over een paar weken zal lopen, maar we wilden je de robot laten zien en iets dat eigenlijk redelijk dichtbij is wat in productie zal gaan, en je alles te laten zien dat het kan Doe dit, laten we het naar buiten brengen
We verwachten in optimus productie -eenheid één te hebben, wat het vermogen is
Om alle vingers onafhankelijk te verplaatsen, beweeg de duim, hebben er twee
vrijheidsgraden, dus het heeft tegengestelde duimen en zowel links als rechterhand dus
Het is in staat om tools te bedienen en nuttige dingen te doen, ons doel is om nuttig te maken
humanoïde robot zo snel mogelijk en we hebben het ook ontworpen met behulp van de
dezelfde discipline die we gebruiken bij het ontwerpen van de auto, dat wil zeggen om deze te ontwerpen voor de productie zodat het mogelijk isMaak de robot in hoog volume tegen lage kosten met hoge betrouwbaarheid, dus dat is ongelooflijk belangrijk, ik bedoel, jullie hebben allemaal zeer indrukwekkende humanoïde robotdemonstraties gezien en dat dat is geweldig, maar wat missen ze?, ze missen een brein, ze missen niet ' t hebben de intelligentie
Navigeer alleen door de wereld en ze zijn ook erg duur,en gemaakt in een laag volume, terwijl dit dit de optimistische samenleving en extreem capabele robot is, maar in een zeer hoog volume is gemaakt, waarschijnlijk uiteindelijk miljoenen eenheden en wordt verwacht dat het veel minder kost dan een auto.
Ik zou zeggen dat waarschijnlijk minder dan twintigduizend dollar mijn gok zou zijn
Het potentieel voor optimistisch is ik denk dat ik door zeer effectief wordt gewaardeerd
mensen hey zoals gewoonlijk komt Tesla -demo's in hotDus oké, dat is goed, dat is goed um ja de teams hebben ingezet en het team heeft een ongelooflijke hoeveelheid werk gesteld, het is uh werkdagen dat je zeven dagen per week weet dat de 3 uur olie naar de demonstratie gaat om vandaag de demonstratie te krijgen, ik ben vandaag Super trots op wat ze hebben gedaan, is dat ze het echt geweldig hebben gedaan, ik vind het gewoon leuk om de hele optie van dit team te geven, zodat je weet dat er nu nog veel werk is om Optimus te verfijnen en Verbeter het natuurlijk is dit gewoon Optimus -versie één en dat is echt waarom we dit evenement houden, namelijk om enkele van de meest getalenteerde mensen ter wereld te overtuigen zoals jullie om lid te worden Schaal zodanig dat het miljoenen mensen kan helpen en de en het potentieel dat het leuk vindt, is echt verbijsteren, omdat je moet zeggen zoals wat een economie is, een economie is een soort productieve entiteiten maal de productiviteit UH Capital Times Output Productiviteit per hoofd van de bevolking op het punt waarop er geen beperking is voor kapitaal, is het niet duidelijk wat een economie zelfs betekent op dat moment dat een economie quasiaal oneindig wordt, dus wat je weet tot bloei in het hopelijk goedaardige scenario um Het betekent een toekomst van overvloed een toekomst waarin er geen armoede is waar mensen u
kan hebben wat u wilt in termen van producten en dienstenHet is echt een fundamentele transformatie van de beschaving zoals we het kennen, we willen er natuurlijk voor zorgen dat transformatie positief en veilig is, maar daarom denk ik ook Het publiek is erg belangrijk en moet niet over het hoofd worden gezien, ik denk dat dit essentieel is, want als het publiek dan niet leuk vindt wat Tesla's doen, kan het publiek aandelen kopen in Tesla en anders stemmen.
Dit is een probleem alsof het heel belangrijk is dat ik niet alleen kan doen wat ik wil dat je weetSoms denken mensen dat niet, maar het is niet waar, dus je weet dat het heel belangrijk is dat de bedrijfsentiteit die dit laat gebeuren, iets is dat het publiek goed kan beïnvloeden en dus denk ik dat de Tesla -structuur ideaal is voor dat en like Ik zei dat je weet dat zelfrijdende auto's zeker een enorme impact zullen hebben op de wereld eh. Ik denk dat ze de
Productiviteit van transport met ten minste een halve orde van grootte, misschien eenorde van grootte, misschien meer um -optimisten waarvan ik denk dat het misschien een potentiële verbetering van twee orde van grootte heeft in de economische output, alsof het niet duidelijk is dat het niet duidelijk is wat de limiet eigenlijk zelfs is, maar we moeten dit op de juiste manier doen Het zorgt zorgvuldig en veilig en zorgt ervoor dat de uitkomst er een is die gunstig is voor de beschaving en en een die de mensheid als ik het niet kan, is het ook uiterst belangrijk, dus en ik hoop dat je zult overwegen om bij Tesla te komen om die doelen bij Tesla te bereiken geef er echt om om het juiste te doen hier altijd streven om het juiste te doen en en echt niet de weg naar de hel te betalen met goede bedoelingen en ik denk dat de weg naar de hel meestal geplaveid is met slechte bedoelingen, maar zo nu en dan is er een goede intentie in Daar, dus we willen het doen, doe het juiste u eh, dus je weet te overwegen om bij ons te komen en te helpen het te laten gebeuren met die laten we verder gaan naar de volgende fase, bedank je Elon
Oké, dus je hebt vandaag een paar robots gezien, laten we een snelle tijdlijn samenvatten, dus vorig jaar hebben we de Tesla Bot onthuld
concept maar een concept brengt ons niet ver, we wisten dat we een echt ontwikkelings- en integratieplatform nodig hadden
Krijg zo snel mogelijk in de praktijk, zodat robot die uitkwam en de kleine routine voor jullie deed
Had dat binnen zes maanden gebouwd werken aan software -integratiehardware -upgrades in de loop van de maanden sindsdien, maar
Tegelijkertijd hebben we hier ook de volgende generatie aan het ontwerpen
Dus deze kerel is geworteld in de basis van het soort voertuigontwerpproces waarvan u weet dat we het allemaal gebruiken
Die lessen die we al hebben, er is duidelijk veel veranderd sinds vorig jaar, maar er zijn een paar dingen
die nog steeds hetzelfde zijn, zul je merken dat we nog steeds deze echt gedetailleerde focus hebben op de ware menselijke vorm die we denken
Het is om een paar redenen belangrijk, maar het is leuk dat we veel tijd besteden aan het nadenken over hoe geweldig het menselijk lichaam is dat we hebben
Dit ongelooflijke bewegingsbereik is doorgaans echt geweldige kracht een plezier
Oefening is dat als u uw vingertop op de stoel voor u plaatst, u zult merken dat er een enorm bewegingsbereik is dat
Je hebt bijvoorbeeld in je schouder en je elleboog zonder je vingertop te verplaatsen, je kunt die gewrichten allemaal verplaatsen
over de plaats um maar de robot weet je de belangrijkste functie om echt nuttig werk te doen en
Het is misschien niet noodzakelijkerwijs meteen al die vrijheidsgraden nodig, dus we hebben het tot een minimum geraakt
van 28 fundamentele vrijheidsgraden en daarna natuurlijk onze handen daarnaast
Mensen zijn ook vrij efficiënt in sommige dingen en niet zo efficiënt in andere momenten, zodat we bijvoorbeeld een kleine kunnen eten
hoeveelheid voedsel om onszelf enkele uren te onderhouden, is dat geweldig uh, maar als we gewoon een beetje rond zitten
aanval, maar we zijn een beetje inefficiënt, we zijn gewoon een soort brandende energie, dus op het robotplatform wat we zijn
gaan doen is dat we dat inactieve stroomverbruik het zo laag mogelijk laten vallen en op die manier kunnen we gewoon
Draai een schakelaar om en onmiddellijk verandert de robot in iets dat nuttig werk doet
Dus laten we het hebben over deze nieuwste generatie in enig detail zullen we zo op het scherm hier zien
Oranje zijn actuatoren waar we een klein beetje op zullen krijgen en in blauw ons elektrische systeem
Dus nu we ons soort op mensen gebaseerd onderzoek hebben en we hebben ons eerste ontwikkelingsplatform dat we beide hebben
Onderzoek en uitvoering om opnieuw uit te putten voor dit ontwerp, gebruiken we dat voertuigontwerp
Foundation dus we nemen het van concept door ontwerp en analyse en
Bouw en validatie dan onderweg gaan we optimaliseren voor dingen als kosten en efficiëntie
Omdat dat cruciale statistieken zijn om dit product te nemen om uiteindelijk op te schalen, hoe gaan we dat goed doen
Gaan onze deeltelling en ons stroomverbruik van elk mogelijk element verminderen, gaan we dingen doen zoals
Verminder de detectie en de bedrading aan onze extremiteiten, u kunt zich veel massa in uw handen en voeten voorstellen
Wees vrij moeilijk en macht consumptief om te bewegen en we gaan beide centraliseren
stroomverdeling en onze berekening naar het fysieke centrum van het platform
Dus in het midden van onze torso is het eigenlijk de romp die we hebben dat we ons batterij hebben, dit is een grootte van 2,3 kilowatt uren
Dat is perfect voor ongeveer een volledige dag werk wat echt uniek is aan deze batterij
pack is er heeft alle batterij -elektronica geïntegreerd in een enkele PCB in het pakket, dus dat betekent alles
van het detecteren tot het fuseren van ladingsbeheer en stroomverdeling is allemaal op één allemaal
Op één plek maken we ook gebruik van zowel onze voertuigproducten als onze energieproducten om te rollen
Al die belangrijke functies in deze batterij, dus dat is gestroomlijnd productie echt efficiënt en
Eenvoudige koelmethoden Batterijbeheer en ook veiligheid en natuurlijk kunnen we gebruik maken van Tesla's
Bestaande infrastructuur en supply chain om het zo te maken dat we onze hersenen zijn
Niet in het hoofd, maar het is vrij dichtbij, ook in onze romp hebben we onze centrale computer, zoals u weet dat Tesla al is
Schepen volledige zelfrijdende computers in elk voertuig dat we produceren, willen we zowel de Autopilot-hardware als
De software voor het humanoïde platform, maar omdat het anders is in vereisten en in vormfactor zijn we
Ik ga eerst een paar dingen veranderen, dus we gaan nog steeds alles doen wat een menselijk brein doet
Vision -gegevens verwerken Beslissingen nemen op basis van meerdere sensorische inputs en ook communicatie
Dus om communicatie te ondersteunen is het uitgerust met draadloze connectiviteit en audio -ondersteuning
En dan heeft het ook veiligheidsfuncties op hardwareniveau die belangrijk zijn om zowel de robot als de mensen te beschermen
rond de robot, dus nu we onze soort kern hebben
We hebben wat ledematen aan deze kerel nodig en we willen je graag een beetje laten zien over onze actuatoren en onze volledig
Ook functionele handen, maar voordat we dat doen, zou ik Malcolm willen introduceren die er een beetje over gaat spreken
Onze structurele basis voor de robot [applaus]
Bedankt
Tesla heeft de mogelijkheid om zeer complexe systemen te voltooien, het wordt veel complexer dan een crash die je kunt zien
Hier een gesimuleerde crash op Model 3 bovenop de werkelijke fysieke crash
Het is eigenlijk ongelooflijk hoe eh hoe nauwkeurig het is om je een idee te geven van de complexiteit van dit model
Het omvat elke knoop Bolton -wasmachine elke pleklas en het heeft 35 miljoen vrijheidsgraden, het is vrij verbazingwekkend
En het is waar om te zeggen dat als we geen dergelijke modellen hadden, we de veiligste auto's ter wereld niet zouden kunnen maken
Dus kunnen we onze mogelijkheden en onze methoden van de auto -kant gebruiken om een robot te beïnvloeden
Nou, we kunnen een model maken en omdat we crashsoftware hadden, hebben we hier dezelfde software gebruikt, kunnen we het laten vallen
Het doel hiervan is om ervoor te zorgen dat als het daalt, idealiter niet is, maar het is oppervlakkige schade
We willen bijvoorbeeld niet zijn versnellingsbak aan zijn armen breken die equivalent is van een ontwrichte schouder van een robot
Moeilijk en duur om op te lossen, dus we wilden zichzelf afstappen met een baan die is gegeven
Als we ook hetzelfde model kunnen nemen en we de actuatoren kunnen besturen met behulp van de invoer van een eerder opgelost model
Het tot leven brengen, dus dit produceert de bewegingen voor de taken die we willen dat de robot deze doet
Taken zijn het oppakken van dozen die worden gehurkt, bovenaan lopen, ongeacht de set taken die we kunnen spelen voor de
Model Dit toont gewoon eenvoudig lopen. We kunnen de spanningen creëren in alle componenten die ons helpen
optimaliseer de componenten, dit zijn geen dansende robots, deze zijn deze niet
Eigenlijk het modale gedrag De eerste vijf modi van de robot en meestal wanneer mensen robots maken, zorgen ze er voor
De eerste modus is rond de bovenste enkele cijfers omhoog naar 10 Hertz
Wie is het, dit is om de controles van lopen gemakkelijker te maken, het is erg moeilijk om te lopen als je niet kunt garanderen
waar je voet rondwiegelen, dat is oké om één robot te maken, we willen duizenden misschien miljoenen maken
We hebben niet de luxe om ze te maken van koolstofvezel titanium dat we ze willen maken op plastic dingen zijn dat niet
Vrij stijf, dus we kunnen deze hoge doelen niet hebben, ik noem ze domme doelen
We moeten ze bij lagere doelen laten werken, dus dat is dat goed gaan werken als je erover nadenkt, sorry voor
Dit, maar we zijn slechts zakken met vochtige gelei en botten die zijn gegooid, we zijn niet hoogfrequent als ik aan sta
Mijn been Ik tril niet op 10 Hertz Wij mensen werken op een lage frequentie, dus wij
weet dat de robot eigenlijk kan worden, maakt het controles gewoon moeilijker, dus nemen we de informatie van dit de modale gegevens en
De stijfheid en voeden die in het besturingssysteem waarmee het kan lopen
Gewoon de belasting veranderen enigszins kijken naar de knie waar we wat inspiratie door kunnen halen
Biologie en we kunnen kijken om te zien wat de mechanische voordelen van de knie zijn, het blijkt dat het eigenlijk best vertegenwoordigt
Vergelijkbaar met de Link met vier bar en dat is vrij niet-lineair dat is niet verwonderlijk, want als
je denkt dat wanneer je je been neerbuigt, het koppel op je knie veel meer is als het gebogen is dan wanneer het is
rechtdoor dus je zou een niet-lineaire functie verwachten en in feite is de biologie niet-lineair
Dit komt het behoorlijk nauwkeurig overeen, dus dat is de weergave de vier door
Link is duidelijk niet fysiek Four Bar Link zoals ik zei dat de kenmerken vergelijkbaar zijn, maar ik wedden dat dat is
Niet erg wetenschappelijk laten we een beetje wetenschappelijker zijn, we hebben alle taken gespeeld via de via deze grafiek, maar dit
toont piketten om te hurken met de taken die ik zei dat we hebben gedaan op de stress en dat is de uh het gesprek een scène bij
de knie tegen de kniebocht op de horizontale as, dit toont de eis voor de knie om al deze te doen
Taken en vervolgens een curve erdoorheen zetten om over de top van de pieken te surfen en dat zegt
Laat de robot deze taken uitvoeren
Dus als we kijken naar de vier-bar-link die eigenlijk de groene curve is en het zegt dat de niet-lineariteit van de
Vier door link is eigenlijk gelineariseerd het kenmerk van de kracht wat dat echt zegt, is dat de Force heeft verlaagd
Dat is wat de actuator de laagst mogelijke kracht heeft, die de meest efficiënte is die we langzaam willen verbranden
Wat is de blauwe curve goed, de blauwe curve is eigenlijk als we geen vierbalkslink hadden, we net een arm hadden
Hier uit mijn been steken met een met een actuator erop Een eenvoudige tweepalige link
Dat is het beste wat je zou kunnen doen met een eenvoudige tweeperslink en het laat zien dat dat veel meer kracht zou creëren in de
Actuator die niet efficiënt zou zijn, dus hoe ziet dat in de praktijk eruit
Zoals je zult zien, maar het is erg strak verpakt in de knie, je ziet een goed
transparant in een seconde zul je de volledige bar -link daar zien, deze werkt op de actuator. Dit wordt bepaald
kracht en de verplaatsingen op de actuator en geven je nu over aan Concertina
Dus ik ben ik zou graag met je willen praten over het ontwerpproces en de actuator
portfolio uh in onze robot, dus er zijn veel overeenkomsten tussen een
Auto en de robot als het gaat om aandrijfontwerp, het belangrijkste dat hier belangrijk is, zijn energiemassa en kosten
We dragen het grootste deel van onze ontwerpervaring van de auto naar de robot over
Dus in het specifieke geval ziet u een auto met twee aandrijfeenheden en de aandrijfeenheden
worden gebruikt om de auto 0 tot 60 mijl per uur te versnellen of een
steden rijden de site terwijl de robot met 28 actuators heeft en
Het is niet duidelijk wat de taken zijn op actuatorniveau, dus we hebben taken dat
zijn hoger niveau zoals wandelen of klimt trappen of het dragen van een zwaar object dat moet worden vertaald
gewricht in gezamenlijke specificaties, daarom gebruiken we ons model
Dat genereert de koppelsnelheidstrajecten voor onze gewrichten die
Vervolgens zal worden gevoed in ons optimalisatiemodel en doorlopen
het optimalisatieproces Dit is een van de scenario's dat de
Robot is in staat om te doen wat draait en loopt, dus als we deze koppelsnelheid hebben
traject dat we hebben gelegd over een efficiëntiekaart van een actuator en we zijn in staat
het traject om het stroomverbruik en de energieophoping te genereren
Energie voor de taak versus tijd, dus hierdoor kunnen we het systeem definiëren
kosten voor de specifieke actuator en plaats een eenvoudig punt in de wolk dan we doen
Dit voor honderdduizenden actuatoren door op te lossen in onze cluster en de rode lijn geeft het Pareto -front aan
dat is het voorkeursgebied waar we op zoek gaan naar optimaal, dus de X geeft aan
het gewenste actuatorontwerp dat we hebben gekozen voor dit specifieke gewricht, dus nu moeten we dit doen voor elke gewricht wij
hebben 28 gewrichten om te optimaliseren en we ontleden onze wolk, we ontleden onze wolk opnieuw voor elke joint
spec en de rode as duidt deze keer de op maat gemaakte actuator -ontwerpen aan voor elk
Het probleem hier verbindt is dat we te veel unieke actuatorontwerpen hebben en
Zelfs als we profiteren van de symmetrie, zijn er nog steeds teveel om iets massa te maken
Fabrikanten We moeten de hoeveelheid unieke actuatorontwerpen kunnen verminderen, daarom runnen we iets
genaamd gemeenschappelijke studie waar we onze wolk opnieuw parseren op deze keer kijken
Actuatoren die tegelijkertijd tegelijkertijd aan de gezamenlijke prestatie -eisen voldoen
resulterende portfolio is zes actuatoren en ze tonen in een kleurenkaart het middelste figuur
Um en de actuatoren kunnen ook in deze dia worden bekeken, we hebben drie roterende en
Drie lineaire actuatoren hebben allemaal een grote uitgangskracht of koppel per massa
Vooral de roterende actuator heeft een mechanische koppeling die is geïntegreerd op het hoekige hoekcontact met hoge snelheid zijde
kogellager en aan de hoge snelheid en aan de lage snelheid zijde een kruisroller
Lager en de tandwieltrein is een spanningsgolfwiel en er zijn drie geïntegreerde sensoren
hier en de op maat gemaakte permanente magneetmachine de lineaire actuator
Het spijt me dat de lineaire actuator planetaire rollen en een omgekeerde planetaire schroef heeft
Als een tandwieltrein die efficiëntie en verdichting en duurzaamheid mogelijk maakt
Dus om het krachtvermogen van onze lineaire actuatoren aan te tonen
hebben een experiment opgezet om het onder de grenzen te testen
en ik zal je laten genieten van de video
Dus onze actuator kan optillen
een halve toon negen voet concert grand piano
En
Dit is een vereiste, het is niet iets leuks om te hebben, omdat onze spieren kunnen doen
hetzelfde wanneer ze direct worden aangedreven wanneer ze direct worden aangedreven of quadricep -spieren hetzelfde kunnen doen
Het is gewoon zo dat de knie een UP -versnellingsbindingssysteem is dat de kracht omzet
in snelheid aan de eindeffector van onze heuvels om te geven aan de
behendigheid van het menselijk lichaam, dus dit is een van de belangrijkste dingen die verbazingwekkend zijn aan het menselijk lichaam en ik ben
Op dit moment mijn deel afsluiten en ik zou mijn collega Mike willen verwelkomen die met je gaat praten over de hand
Ontwerp Heel erg bedankt, bedankt Constantinos
Dus we zagen gewoon hoe krachtig een mens en een humanoïde actuator kan zijn
Mensen zijn ook ongelooflijk behendig, de menselijke hand heeft het vermogen om te bewegen
Met 300 graden per seconde heeft het tienduizenden tactiele sensoren
En het heeft de mogelijkheid om bijna elk object in ons dagelijks leven te begrijpen en te manipuleren
Voor ons robotachtige handontwerp waren we geïnspireerd door de biologie, we hebben vijf vingers een tegenstander
Onze vingers worden aangedreven door metalen pezen die zowel flexibel als sterk zijn, we hebben het vermogen om breed te voltooien
Apertuurvermogen grijpt terwijl ook wordt geoptimaliseerd voor precisie aangrijpend van kleine dunne en delicate objecten
Dus waarom een mens als robotachtige hand goed de belangrijkste reden is dat onze fabrieken en de wereld om ons heen zijn
ontworpen om ergonomisch te zijn, dus wat dat betekent is dat het ervoor zorgt dat objecten in onze fabriek te begrijpen zijn
Maar het zorgt er ook voor dat nieuwe objecten die we misschien nog nooit eerder hebben gezien, kunnen worden begrepen door de menselijke hand en door onze
Robotachtige hand en het omgekeerde is behoorlijk interessant omdat het zegt dat deze objecten voor onze hand zijn ontworpen
In plaats van wijzigingen in onze hand aan te brengen om een nieuw object te vergezellen
Enkele basisstatistieken over onze hand zijn dat zes actuatoren en 11 vrijheidsgraden een in de hand controller hebben die
Drijft de vingers aan en ontvangt feedback van sensorfeedbacksensor erg belangrijk voor
Leer een beetje meer over de objecten die we grijpen en ook voor proprioceptie en dat is de mogelijkheid voor ons om te herkennen waar
Onze hand is in de ruimte. Een van de belangrijke aspecten van onze hand is dat het aanpassingsvermogen is aanpassingsvermogen
is in wezen betrokken als complexe mechanismen waarmee de hand zich kan aanpassen aan de objecten die worden begrepen
Een ander belangrijk onderdeel is dat we een niet-terug aandrijfbare vingeraandrijving hebben, dit koppelingsmechanisme stelt ons in staat om vast te houden
en vervoer objecten zonder de handmotoren aan te zetten, je hebt zojuist gehoord hoe we zijn gegaan
We hebben de Tesla Bot -hardware ontwerpen, nu zullen we deze overhandigen aan Milaan en ons autonomie -team om dit te brengen
Robot tot leven bedankt Mike
Oké um dus al die coole dingen die we eerder in de video hebben getoond, zijn gepost
mogelijk slechts in een paar maanden dankzij het verbazingwekkende woord dat we de afgelopen jaren automatisch worden gedaan
De meeste van die componenten hebben vrij gemakkelijk naar de botsomgeving geplaatst als je erover nadenkt, we gaan gewoon in beweging
Van een robot op wielen tot een robot op benen, dus sommige van die componenten zijn vrij vergelijkbaar en een andere vereisen
zwaarder tillen dus bijvoorbeeld onze computer vision neurale netwerken
Rechtstreeks gerapporteerd van de stuurautomaat naar de BOTS -situatie is het exact hetzelfde bezettingsnetwerk
Dat we later met het Autopilot -team met het Autopilot -team praten dat nu op de bot hier binnenkomt
Deze video Het enige dat echt veranderde, zijn de trainingsgegevens die we ons moesten herinneren
We proberen ook manieren te vinden om die bezettingswerken te verbeteren met behulp van werk dat op uw stralingsvelden is gemaakt om te krijgen
Echt een geweldige volumetrische weergave van de botsomgevingen bijvoorbeeld hier sommigen
machine lees dat de bot mogelijk moet communiceren
Een ander interessant probleem om over na te denken is in binnenomgevingen, vooral met dat gevoel van GPS -signaal hoe doe je dat
Ga bijvoorbeeld naar de bestemming navigeren, zeg bijvoorbeeld om het dichtstbijzijnde laadstation te vinden, dus we hebben getraind
meer neurale netwerken om hoogfrequente functies te identificeren belangrijke punten binnen de
BOTS -camera streamt en volg ze over de frames in de loop van de tijd terwijl de bot naar zijn omgeving navigeert
En we gebruiken die punten om een betere schatting te krijgen van de bots pose en traject in zijn omgeving als
het is lopen, we hebben ook behoorlijk wat werk gedaan aan de
Simulatiezijde en dit is letterlijk de Autopilot Simulator UH waaraan we de voortbeweging van de robot hebben geïntegreerd
code en dit is een video van de bewegingsbesturingscode die wordt uitgevoerd in de operator simulator simulator die de
Evolutie van de robots loopt in de loop van de tijd en, zoals je kunt zien, zijn we in april vrij langzaam begonnen en beginnen we te versnellen
Naarmate we meer gewrichten en dieper geavanceerdere technieken ontgrendelen, zoals armen die de afgelopen maanden balanceren
En dus is de voortbeweging specifiek een component die heel anders is, omdat we van de auto naar de bots gaan
Milieu en dus denk ik dat het een beetje meer diepte rechtvaardigt en ik wil graag dat mijn collega's hierover beginnen te praten
nu vreemd
Hallo allemaal, ik ben Felix, ik ben een robotica -ingenieur in het project en ik ga het hebben over wandelen
Lijkt gemakkelijk goed, mensen doen het elke dag dat je er niet eens over hoeft na te denken
Maar er zijn enkele aspecten van wandelen die bijvoorbeeld een uitdaging zijn vanuit engineeringperspectief
fysiek zelfbewustzijn dat betekent dat een goede weergave van jezelf is wat de lengte van je ledematen is wat is
de massa van je ledematen wat is de grootte van je voeten, het enige dat ertoe doet, heeft ook een energiezuinige poort die je hebt
kan zich voorstellen dat er verschillende stijlen van wandelen zijn en ze zijn allemaal even efficiënt
De belangrijkste houdingsbalans vallen niet en coördineer natuurlijk ook de beweging
van al je ledematen samen, dus nu doen mensen dit allemaal van nature, maar als ingenieurs of roboticisten die we hebben
om na te denken over deze problemen en als ik je ga laten zien hoe we ze aanpakken in onze voortbewegingsplanning en -controle
Stapel dus we beginnen met de planning van de voortbeweging en onze weergave van de band die
betekent het model van de kinematische dynamiek van de robot en de contactigenschappen en het gebruik van dat model en de gewenste
pad voor de bots die onze voortbewegingsplanner referentietrajecten voor het hele systeem genereert
Dit betekent haalbare trajecten met betrekking tot de veronderstellingen van ons model
De planner werkt momenteel in drie fasen. Het begint voetstappen te plannen en eindigt met het hele motion fotosysteem
En laten we een beetje dieper duiken in hoe dit werkt, dus in deze video zien we voetstappen die worden gepland over de planning
Horizon volgt het gewenste pad en we beginnen hiervan en voegen dan toe voor
Trajecten die deze voetstappen verbinden met behulp van teen en een staking op te leveren, net zoals de mensen net zoals mensen doen
En dit geeft ons een grotere pas en minder kniebocht voor een hoge efficiëntie van het systeem
De laatste fase is vervolgens het vinden van een centrum van massatraject dat ons een dynamisch haalbare beweging van de vergoeding geeft van de
Het hele systeem om evenwicht te houden, zoals we allemaal weten dat plannen goed zijn, maar wij
We moeten ze ook in werkelijkheid realiseren, laten we zeggen dat je weet hoe we dit kunnen doen
[Applaus] Dank je Felix Hallo allemaal mijn naam
is anand en ik ga met je praten over bedieningselementen, dus laten we het bewegingsplan nemen dat Felix
Ik heb net gesproken en het in de echte wereld gezet op een echte robot, laten we eens kijken wat er gebeurt
Het duurt een paar stappen en valt goed, dat is een beetje teleurstellend
Maar we missen hier een paar belangrijke stukken waardoor het werkt
Nu, zoals Felix zei dat de motion planner een geïdealiseerde versie van gebruikt van
zelf en een versie van de realiteit eromheen is dit niet bepaald correct
het drukt ook zijn intentie uit door trajecten en sleutels takken van
Krachten en knooppunten die het op de wereld wil uitoefenen om te locomoteren
De realiteit is veel complexer dan enig soortgelijk model, ook de robot is dat niet
vereenvoudigd dat het trillingen en modi -nalevingsensorgeluid en in en door heeft
en zo wat doet dat met de echte wereld wanneer je de bot in de echte wereld plaatst
Welnu, de onverwachte krachten veroorzaken niet gemodelleerde dynamiek die in wezen de planner niet weet en dat
veroorzaakt destabilisatie, vooral voor een systeem dat dynamisch stabiel is zoals tweevoetige voortbeweging
Dus wat kunnen we er goed aan doen, we meten de realiteit die we sensoren gebruiken en ons begrip van
De wereld om hier de staatsschatting en status te doen, zie je de houding en bekken pose die is
In wezen wordt het vestibulaire systeem in een mens samen met het centrum van massatraject gevolgd wanneer de robot loopt
In de kantooromgeving hebben we nu alle stukken die we nodig hebben
Om de lus te sluiten, zodat we ons betere botmodel gebruiken, gebruiken we het begrip van de realiteit dat
We hebben gewonnen door schatting van de staat en we vergelijken wat we willen versus wat we verwachten de realiteit die we verwachten
De realiteit doet ons aan om correcties toe te voegen aan het gedrag van de
Robot hier de robot waardeert zeker niet geprikt, maar dat doet het niet
bewonderenswaardige taak om rechtop te blijven. Het laatste punt hier is een robot die
Wandelingen is niet genoeg dat we de handen en armen moesten gebruiken
Wees nuttig, laten we het hebben over manipulatie
[Applaus]
Hallo allemaal, mijn naam is Eric Robotics Engineer op Teslabot en ik wil praten
over hoe we de robot dingen hebben gemaakt in de echte wereld die we objecten wilden manipuleren
Ziet er zo natuurlijk mogelijk uit en kom er ook snel aan, dus wat we hebben gedaan is
We hebben dit proces eerst in twee stappen opgebroken, is het genereren van een bibliotheek met natuurlijke bewegingsreferenties of dat zouden we kunnen
Noem ze demonstraties en dan hebben we deze bewegingsreferenties online aangepast aan de huidige situatie in de echte wereld
Dus laten we zeggen dat we een menselijke demonstratie hebben om een object op te pakken dat we daarvan een bewegingsopname kunnen krijgen
Demonstratie die hier wordt gevisualiseerd als een stel keyframes die de locaties van de handen vertegenwoordigen
de ellebogen de romp kunnen we dat toewijzen aan de robot met behulp van inverse kinematica en als we een
Veel van deze nu hebben we een bibliotheek waarmee we kunnen werken, maar een enkele demonstratie is dat niet
generaliseerbaar voor de variatie in de echte wereld, bijvoorbeeld, dit zou alleen werken voor een doos in een zeer bijzondere
locatie dus wat we ook hebben gedaan, is deze referentietrajecten uitvoeren via een
Traject -optimalisatieprogramma dat oplost voor waar de hand moet zijn hoe de robot zou moeten balanceren
tijdens uh wanneer het de beweging moet aanpassen aan de echte wereld, dus bijvoorbeeld
Als de doos zich op deze locatie bevindt, zal onze optimizer dit maken
Traject in plaats daarvan gaat Milaan over uh praten
wat is de volgende stap voor de optimus uh tesla y bedankt bedankt larry
goed dus hopelijk hebben jullie nu een goed idee van wat we de afgelopen maanden hebben gedaan
Eh we zijn begonnen iets te doen dat bruikbaar is, maar het is verre van nuttig. Er is nog steeds een lange en opwindende weg
voor ons eh ik denk dat het eerste in de komende weken is om Optimus tenminste te krijgen
Par met Bumble C het andere bug -prototype dat je eerder zag en waarschijnlijk verder gaan we ook beginnen
Focus op de echte use -case in een van onze fabrieken en ga echt proberen dit te proberen te bepalen en ik raak allemaal op
De elementen die nodig zijn om dit product in te zetten in de echte wereld die ik eerder noemde
um, weet je binnen navigatie sierlijk voor management of zelfs het onderhouden van alles
Componenten moesten dit product opschalen, maar ik weet niet dat je het niet meer weet maar daarna
Zien wat we vanavond hebben getoond, ik ben er vrij zeker van dat we dit de komende maanden of jaren voor elkaar kunnen krijgen en ik maak
Dit product is realiteit en verandert de hele economie, dus ik wil het hele Optimus -team bedanken voor de harde
werk de afgelopen maanden, ik denk dat het best verbazingwekkend is dat dit alles is gedaan in amper zes of acht maanden, bedankt
Heel veel [applaus]
Dank je wel, iedereen
Hallo, ik ben Ashok, ik leid het stuurautomaat team naast Milan God, het komt zo moeilijk om dat te overtreffen
Optimus sectie die hij toch zal proberen
eh elke Tesla die de afgelopen jaren is gebouwd
hardware om de auto te laten rijden zelf waar we aan de software hebben gewerkt
Voeg deze keer hoger en hoger autonomie toe dat we vorig jaar hadden
Ongeveer 2.000 auto's die onze FSD -bèta -software sindsdien hebben die we aanzienlijk hebben
Verbeterde de software als robuustheid en mogelijkheden die we nu naar 160.000 klanten hebben verzonden vanaf vandaag
ja [applaus]
Dit is niet gratis gekomen, het kwam het afgelopen jaar uit het zweet en het bloed van het engineeringteam
We hebben bijvoorbeeld 75.000 neurale netwerkmodellen getraind, net een jaar dat is
Ongeveer een model om de acht minuten waarvan je weet dat je uit het team komt en dan evalueren we ze op ons grote
Clusters en dan verzenden we 281 van die modellen die de prestaties van de auto daadwerkelijk verbeteren
en deze ruimte van innovatie gebeurt in de hele stapel de planningssoftware de
Infrastructuur De tools die zelfs inhuurt, gaat verder naar het volgende niveau
De FSG Beta -software is best in staat om de auto te besturen waar hij van moet navigeren
Parkeerplaats naar parkeerplaatsbehandeling CDC Rijding stoppen voor verkeerslichten en stopborden
Onderhandelen met objecten op kruispunten die beurten maken, enzovoort
Dit alles komt van de camerastreams die door onze neurale netwerken gaan die op de auto zelf lopen
Niet terugkomen naar de server of iets dat het op de auto draait en alle outputs produceert om het wereldmodel te vormen
rond de auto en de planningssoftware drijft de auto op basis daarvan
Vandaag gaan we naar veel van de componenten die het systeem vormen dat het bezettingsnetwerk als basis fungeert
geometrielaag van het systeem Dit is een multi-camera video neuraal
netwerk dat uit de afbeeldingen de volledige fysieke bezetting van de wereld voorspelt
de robot dus alles wat fysiek aanwezig is bomen muren gebouwen auto's muren wat
Wil je het voorspellen of het specifiek aanwezig is, voorspelt het hen samen met hun toekomstige beweging
Bovenop dit basisniveau van geometrie hebben we meer semantische lagen om
Navigeer de wegen die we natuurlijk de lens nodig hebben, maar dan hebben de wegen veel
verschillende rijstroken en ze maken op allerlei manieren verbinding, dus het is eigenlijk een heel moeilijk probleem voor typische computer
Visietechnieken om de set vliegtuigen en hun connectiviteiten te voorspellen, dus we bereikten helemaal in taal
Technologieën en vervolgens de stand van de kunst uit andere domeinen getrokken en niet alleen computer vision om deze taak te maken
mogelijk voor voertuigen hebben we hun volledige kinematische toestand nodig om voor hen te controleren
Dit alles komt rechtstreeks uit neurale netwerken Video streams ruwe videostreams komen in de netwerken die veel doorgaan
van verwerking en voert vervolgens de volledige kinematische toestand uit die de snelheden positioneert, versnelt dat allemaal
Komt direct uit de netwerken met minimale post -verwerking die voor mij echt fascinerend is, want hoe is hoe is
Dit is zelfs mogelijk in welke wereld we leven dat deze magie mogelijk is dat deze netwerken vierde voorspellen
derivaten van deze posities toen mensen dachten dat we deze objecten niet eens konden detecteren
Mijn mening is dat het niet gratis kwam, het vereiste tonnen gegevens, dus we hadden een beetje geavanceerde auto -etikettering
systemen die door ruwe sensorgegevens schenen, lopen een heleboel offline reken op de
Servers Het kan een paar uur duren om dure neurale netwerken te runnen de informatie de informatie in labels die onze trainen
Neurale netwerken in de auto hierop gebruiken we ons simulatiesysteem ook om synthetisch te worden
Maak afbeeldingen en omdat het een simulatie is, hebben we triviaal alle labels
Dit alles gaat door een goed geoliede pijplijn voor data engine waar we eerst
Train een baseline model met sommige gegevens die naar de auto worden verzonden, kijk wat de mislukkingen zijn en zodra u de mislukkingen kent
We ontginnen de vloot voor de gevallen waarin het faalt, bieden de juiste labels en voegen de gegevens toe aan de trainingsset
Dit proces lost systematisch de problemen op en we doen dit voor elke taak die in de auto loopt
Ja en om deze nieuwe enorme neurale netwerken dit jaar te trainen, hebben we onze trainingsinfrastructuur ongeveer uitgebreid
40 tot 50 procent zodat we vandaag ongeveer 14.000 GPU's op meerdere meerdere zijn op meerdere
Trainingsclusters in de Verenigde Staten hebben we ook gewerkt aan onze AI -compiler die
ondersteunt nu nieuwe bewerkingen die nodig zijn voor die neurale netwerken en wijzen ze toe aan de beste van onze onderliggende
Hardwarebronnen en onze inferentiemotor vandaag kunnen de uitvoering van
Een enkel neuraal netwerk in twee onafhankelijk systeem op schepen in wezen twee onafhankelijke computers met elkaar verbonden
Binnen de eenvoudige zelfrijdende computer en om dit mogelijk te maken, moeten we de end-to-end strakke controle houden
Latentie van dit nieuwe systeem, dus we hebben meer geavanceerde planningscode ingezet in het volledige FSD -platform
Al deze neurale netwerken die samen in de auto lopen, produceren de vectorruimte die opnieuw het model is van de
Wereld rond de robot of de auto en dan werkt het planningssysteem bovenop dit bedenken met trajecten dat
Vermijd botsingen of soepel maken de voortgang naar de bestemming met behulp van een combinatie van modelgebaseerde optimalisatie
plus neuraal netwerk dat helpt het te optimaliseren om echt snel te zijn
Vandaag zijn we erg enthousiast om vooruitgang te presenteren op al deze gebieden waar we de technische leads voor hebben
Kom binnen en leg deze verschillende blokken uit en deze kracht niet alleen de auto, maar dezelfde componenten worden ook op de optimus uitgevoerd
Robot die Milaan eerder liet zien dat ik het paneel welkom heb om te beginnen met praten over het planningsgedeelte
Hallo allemaal, ik ben parel joint laten we dit kruispunt scenario gebruiken
Duik rechtstreeks in hoe we de planning en besluitvorming in de stuurautomaat doen, zodat we dit kruispunt benaderen
Van een zijstraat en we moeten overgeven aan alle goedheid van de kruisende voertuigen terwijl we op het punt staan de
kruising De voetganger aan de andere kant van het kruispunt besluit de weg over te steken
Zonder een zebrapad nu moeten we overgeven aan deze voetgangersopbrengst aan de voertuigen van rechts en
Begrijp ook de relatie tussen de voetganger en het voertuig aan de andere kant van het kruispunt
Dus veel van deze intra-object-afhankelijkheden die we in een snelle blik moeten oplossen
En mensen zijn hier echt goed in, we kijken naar een scène die alle mogelijke interacties begrijpen, evalueren het meest
veelbelovende en kiest over het algemeen een redelijke
Dus laten we eens kijken naar enkele van deze interacties die het stuurautomaatsysteem hebben geëvalueerd, hadden we hiervoor kunnen gaan
voetganger met een zeer agressieve lancering in een lateraal profiel nu zijn we duidelijk een eikel voor de
Voetgangers en we zouden de voetganger en zijn schattige huisdier laten schrikken, we hadden langzaam naar voren kunnen gaan
Voor een opening tussen de voetganger of het voertuig van rechts zijn we een eikel naar het voertuig
Vanaf het recht, maar u moet deze interactie niet ronduit afwijzen voor het geval dit alleen een veilige interactie beschikbaar is
Ten slotte de interactie die we uiteindelijk koos, blijven langzaam de redelijke vinden
Gap en beëindig de manoeuvre na alle agenten voorbij
Nu is de evaluatie van al deze interacties niet triviaal, vooral als u om modellering geeft
De hogere orde derivaten voor andere agenten bijvoorbeeld wat de longitudinale is
eiken vereist door het voertuig dat van rechts komt wanneer u er voor beweert dat het puur afhankelijk is van botsingscontroles met
Modulaire voorspellingen brengen je alleen tot nu toe omdat je veel geldige interacties zult missen
Dit komt in feite neer op het oplossen van een multi-agent gezamenlijk trajectplanningsprobleem over de trajecten van ego en
Alle andere agenten nu hoeveel u ooit optimaliseert dat er een limiet zal zijn voor hoe snel u kunt
Voer dit optimalisatieprobleem uit. Het zal dicht bij de orde van 10 milliseconden zijn, zelfs na veel incrementele benaderingen
Nu voor een typisch drukke onvoorspelbare links, zegt u dat u elk meer dan 20 objecten heeft
Object met meerdere verschillende toekomstige modi Het aantal relevante interactiecombinaties zal opblazen
Wij de planner moet om de 50 milliseconden een beslissing nemen, dus hoe lossen we dit in realtime op
We vertrouwen op een raamwerk wat we noemen als interactieonderzoek, wat in feite een parallel onderzoek is over een stel
Manoeuvreerstrajecten De staatsruimte hier komt overeen met de kinematische toestand van het ego van de kinematische
Staat van andere agenten de nominale toekomstige meerdere multimodale voorspellingen en alle statische entiteiten in de scène
De actieruimte is waar dingen interessant worden, we gebruiken een set manoeuvreertraject
kandidaten om een aantal interactionele beslissingen te vertakken en ook incrementele doelen voor een langer
Horizon manoeuvre laten we heel snel door dit onderzoek lopen om een idee te krijgen van hoe het werkt
We beginnen met een reeks visie -metingen, namelijk Lanes bezetting bewegende objecten Deze worden weergegeven als
schaarse extracties en latente functies die we dit gebruiken om een set doelstelling te maken
Kandidaten banen opnieuw van het Lanes -netwerk of ongestructureerde regio's die overeenkomen met
een waarschijnlijkheidsmasker afgeleid van menselijke demonstraties zodra we een stel van deze goud hebben
Kandidaten We creëren zaadtrajecten met behulp van een combinatie van klassieke optimalisatiebenaderingen en onze
Netwerkplanner is nu opnieuw getraind op gegevens van de klantfeed zodra we een aantal van deze gratis krijgen
Trajecten die we gebruiken om te beginnen met vertakking van de interacties. We vinden de meest kritische interactie
In ons geval zou dit de interactie zijn met betrekking tot de voetganger, of we er voor beweren of erover toegeven
Het is duidelijk dat de optie aan de linkerkant een hoge boete -optie is die waarschijnlijk niet wordt geprioriteerd, dus we vertakken ons verder
De optie aan de rechterkant en dat is waar we steeds complexere interacties binnenbrengen die deze optimalisatie opbouwen
Probleem stapsgewijs met meer en meer beperkingen en dat onderzoek blijft stromende vertakken op meer interacties vertakken
Op meer doelen liggen nu veel trucs hier in de evaluatie van elk van deze knooppunten
Van het onderzoek binnen elk knooppunt zijn we in eerste instantie begonnen met creëren
Trajecten met behulp van klassieke optimalisatiebenaderingen waarbij de beperkingen zoals ik beschreven zouden worden toegevoegd
En dit zou nu bijna een tot vijf milliseconden per actie duren, hoewel dit redelijk goed is
Nummer Als u meer dan 100 interacties wilt evalueren, schaalt dit niet
Dus hebben we lichtgewicht querybare netwerken gebouwd die u kunt uitvoeren op de lus van de planner
Deze netwerken zijn getraind op menselijke demonstraties van de vloot en offline oplossers met ontspannen tijdslimieten
Hiermee konden we de rundown runtime naar beneden halen om 200 microseconden per actie te sluiten
Nu alleen doen is niet genoeg omdat je nog steeds dit enorme onderzoek hebt dat je moet doen
door en u moet de zoekruimte efficiënt snoeien, zodat u op elk een do -score moet doen
Van deze trajecten zijn weinigen van deze redelijk standaard, je doet een aantal botsingscontroles. Je doet een heleboel comfortanalyse Wat is de eikel en
Eigenlijk vereist voor een bepaalde manoeuvre De klantvlootgegevens spelen hier weer een belangrijke rol
We hebben twee sets opnieuw lichtgewicht variabele netwerken die beide echt een van hen hebben uitgebreid
Interventies van de FST Beta -vloot die een score geven over hoe waarschijnlijk een gegeven manoeuvre is om in te resulteren
Interventies in de komende seconden en tweede, die puur zijn op menselijke demonstraties die menselijk aangedreven gegevens geven
Een score over hoe dichtbij is uw gegeven geselecteerde actie naar een door mensen gedreven traject
Het scoren helpt ons om de zoekruimte te snoeien, blijft de interacties verder vertakken en concentreren de berekeningen op
de meest veelbelovende resultaten het coole deel hierover
Architectuur is dat het ons in staat stelt een coole mix te creëren tussen UH -gegevensgestuurde benaderingen waar u
hoef niet te vertrouwen op veel met de hand ontworpen kosten, maar grondig in werkelijkheid met natuurkunde-gebaseerde cheques
Nu was veel van wat ik beschreef met betrekking tot de agenten die we in de scène konden observeren, maar hetzelfde
Framework strekt zich uit tot objecten achter occlusies. We gebruiken de videofeed van acht camera's
Om de 3D -bezetting van de wereld te genereren, komt het blauwe masker hier overeen met de
Zichtbaarheidsregio We noemen het het in principe wordt geblokkeerd bij het eerste
Occlusie die je ziet in de scène die we dit zichtbaarheidsmasker consumeren om te genereren wat we noemen als spookobjecten die je
kan nu linksboven zien als u de spawn -regio's en de statusovergangen van deze geest modelleert
objecten correct als u uw controle -reactie afstemt als een
Functie van dat bestaan waarschijnlijkheid kunt u een aantal echt leuk mensachtig gedrag extraheren
Nu zal ik het doorgeven om te vullen om meer te beschrijven over hoe we deze bezettingswerken genereren
hey jongens, mijn naam is Phil uh, ik zal de details delen van het bezettingsnetwerk dat we het afgelopen jaar bouwen
Dit netwerk is onze oplossing om het fysieke werk in 3D rond onze auto's te modelleren en het wordt momenteel niet getoond in onze
Klant geconfronteerd met visualisatie en wat we hier zullen zien, is de output van het wegennetwerk van onze interne dev tool
Het bezettingsnetwerk neemt videostreams van al onze 80 camera's als input een enkele uniforme volumetrisch produceert
bezetting in vectorruimte rechtstreeks voor elke 3D -locatie rond onze auto het
voorspelt dat de kans dat die locatie veel wordt bezet, omdat deze video -contacten heeft
in staat om obstakels te voorspellen die onmiddellijk worden afgesloten
Voor elke locatie produceert het ook een set semantiek zoals Curb Car voetganger
en lage puin zoals hier kleur gecodeerd
De bezettingsstroom wordt ook voorspeld voor beweging, omdat het model een algemeen netwerk is
het vertelt statische en dynamische objecten niet expliciet dat het in staat is om te produceren en
Modelleer de willekeurige bewegingen zoals de zwervende trainer hier
Dit netwerk wordt momenteel uitgevoerd in alle Teslas met FSD -computers en dat is het
Ongelooflijk efficiënte loopt ongeveer elke 10 milliseconden met onze neurale versneller
Dus hoe werkt dit werk, laten we eerst naar de architectuur kijken, we richten elke camerabeelden met
De camerakalibratie en de afbeeldingen werden hier getoond aan het netwerk, het is eigenlijk niet
De typische 8-bit RGB-afbeelding zoals je kunt zien in de eerste afbeeldingen bovenop zijn we
Het 12 -bit RAW -foto -accountafbeelding aan het netwerk geven, omdat het er vier heeft
bits meer informatie Het heeft een 16 keer beter dynamisch bereik en verminderd
latentie Aangezien we niet meer de verkeerde ISP in Adobe hebben, gebruiken we een set records en terug met
FPS als een ruggengraat om afbeeldingen te extraheren Space -functies Vervolgens construeren we een set 3D -positie
Vraag samen met de IMG -ruimtefuncties als toetsen en waarden in een aandachtsmodule passen
De uitgang van de aandachtsmodule is hoge dimensionale ruimtelijke kenmerken
Deze speciale functies zijn tijdelijk uitgelijnd met behulp van voertuig odometrie
Om beweging af te leiden, gaan deze ruimtelijke tijdelijke kenmerken
door een set van D -convolutie om de uiteindelijke bezetting en bezettingsstroomuitgang te produceren
Ze worden gevormd als bokser met een vaste grootte die mogelijk niet precies genoeg is om te plannen
Om een hogere resolutie te krijgen, produceren we ook per voxel -functiekaarten die MLP met 3D -ruimtelijk zullen voeden
Puntquery's om positie en semantiek te krijgen op elke willekeurige locatie
Nadat we het model beter hebben geweten, laten we eens kijken naar een ander voorbeeld hier, hebben we een articulaire bus geparkeerd met rechts
zijrij gemarkeerd als een L-vormige bokser hier als we naderen, begint de bus
beweeg het blauw dat de voorkant van de kar wordt en eerst blauw wordt, wat aangeeft dat het model voorspelt dat de frontale bus een down nul heeft
bezettingsstroom en de S-bus blijft bewegen de hele bus wordt blauw
En u kunt ook zien dat het netwerk de precieze kromming van de bus voorspelt
Nou, dit is een zeer ingewikkeld probleem voor het traditionele objectdetectienetwerk, omdat je moet zien of ik dat ga
Gebruik één kubus of misschien een twee die bij de kromming passen, maar voor het beroepsnetwerk
Omdat het enige waar we om geven de bezetting in de zichtbare ruimte is en we de kromming precies kunnen modelleren
Naast het voxel -cijfer produceert het bezettingsnetwerk ook een drivable oppervlak
Het drivible oppervlak heeft zowel 3D -geometrie als semantiek. Ze zijn erg nuttig voor controle, vooral bij genezing
en curvy wegen het oppervlak en het voxelgrijs worden niet onafhankelijk voorspeld in plaats daarvan de
Voxel -rooster komt eigenlijk in overeenstemming met het oppervlak impliciet hier zijn we bij een heldenmissie waar jij
kan zien dat de 3D -geometrie van het oppervlak mooi wordt voorspeld
Planner kan deze informatie gebruiken om te beslissen, misschien moeten we meer vertragen voor de Hillcrest en zoals u ook kunt
Zie de voxel -grade consequent uitlijnen met het oppervlak
Naast de doosbron en het oppervlak zijn we ook erg enthousiast over de recente doorbraak in het veld Neurale lezingen of
Nerf, we onderzoeken beide wat van de lichte kleurfuncties in
bezettingsnetwerktraining en het gebruik van onze netwerkuitvoer als de invoerstatus voor NERF
Ashok is trouwens erg enthousiast hierover dit is zijn UH Personal Weekend Project al een tijdje
over deze zenuwen omdat ik denk dat de academische wereld veel van deze bouwt
Foundation -modellen uh voor taal met behulp van tonnen grote gegevenssets voor taal, maar ik denk voor visiezenuwen
gaan de funderingsmodellen voor computer vision bieden omdat ze zijn gebaseerd op geometrie en geometrie
Geeft ons een leuke manier om toezicht te houden op deze netwerken en bevriezingen van de vereiste om een ontologie te definiëren en de
Supervisie is in wezen gratis omdat je gewoon deze afbeeldingen moet maken, dus ik denk dat ik in de toekomst dit
bezettingsnetwerk idee waar je weet dat afbeeldingen binnenkomen en dan produceert het netwerk een consistente
Volumetrische weergave van de scène die vervolgens differentieel kan worden weergegeven in elk beeld dat werd waargenomen
Persoonlijk denkt dat een toekomst van computer vision uh is en je weet dat we er nu wat eerste werk aan doen, maar ik
Denk in de toekomst zowel bij Tesla als in de academische wereld te zien dat deze deze zullen zien
combinatie van one-shot voorspelling van volumetrische bezetting zal dat zijn
mijn persoonlijke weddenschap seksueel, dus hier is een voorbeeld van een vroeg resultaat van een
3D -reconstructie van onze vrije gegevens in plaats van zich te concentreren op het verkrijgen van perfecte RGB -reprojectie in beeldruimte onze
Primair doel hier is om de waarschuwingen 3D -ruimte voor het rijden nauwkeurig weer te geven en we willen dit voor iedereen doen
Onze gratis gegevens over de hele wereld in alle weersomstandigheden en lichtomstandigheden en dit is duidelijk een zeer uitdaging
Probleem en we zijn op zoek naar jullie om eindelijk het bezettingsnetwerk te helpen is getraind
met een groot gegevensset op auto -niveau zonder een mens in de lus en daarmee ga ik naar Tim om te praten
over wat er nodig is om dit netwerk te trainen, bedankt Phil
[Applaus] Oké, iedereen, laten we het hebben over wat training
infrastructuur dus we hebben een paar video's gezien die je kent vier of vijf uh denk ik en zorg
Meer en maak je meer zorgen over nog veel meer clips daarover, dus we hebben gekeken
De bezettingswerken, gewoon van Phil, vult gewoon video's in die 1,4 miljard duurt
frames om dat netwerk te trainen wat je net zag en als je honderdduizend GPU's hebt, zou het een uur duren
Maar als je UH één GPU hebt, zou het honderdduizend uur duren, dus dat is dat niet
Een humane periode die u kunt wachten tot uw trainingsbaan goed loopt, willen we sneller verzenden dan dat, dus dat
betekent dat je parallel moet gaan, zodat je daarvoor een meer berekening nodig hebt, wat betekent dat je een nodig hebt
Supercomputer dus daarom hebben we in eigen huis drie supercomputers gebouwd die bestaande
van 14.000 GPU's waar we 10.000 GPU's gebruiken voor training en ongeveer vierduizend
GPU's voor automatisch etikettering Al deze video's worden opgeslagen in 30 petabytes van een gedistribueerde beheerde video
Cache, je zou niet moeten denken aan onze gegevenssets zoals vast
imagenet of iets dat je weet, zoals een miljoen frames, zou je het als een heel vloeiend ding moeten beschouwen, dus we hebben een
Een half miljoen van deze video's die deze clusters in en uit deze clusters vloeien, elke dag
En we volgen elke seconde 400.000 van dit soort python -video -instantiaties
Dus dat is dat veel telefoontjes zijn die we nodig hebben om dat te vangen om het bewaarbeleid hiervan te regelen
Gedistribueerde videocache die dit alles zo ten grondslag ligt, is een enorme hoeveelheid infra die we allemaal bouwen en beheren
In eigen huis, dus je kunt je niet alleen kopen, weet 40.000
GPU's en vervolgens een 30 petabytes flash mvme en het gewoon in elkaar zetten en laten we gaan trainen
Werk en ik ga daar een beetje op ingaan wat je eigenlijk meestal wilt doen, is dat je je gaspedaal zo wilt nemen
dat het de GPU of Dojo zou kunnen zijn waar we later over zullen praten en omdat dat het duurst is
component dat is waar u uw knelpunt wilt plaatsen en dat betekent dus dat elk deel van uw systeem is
Gaat om dit versneller te overtreffen en dus is dat echt ingewikkeld dat
betekent dat uw opslag de grootte en de bandbreedte moet hebben om alle gegevens in de knooppunten te leveren
Deze knooppunten moeten de juiste hoeveelheid CPU- en geheugenmogelijkheden hebben om uw machine -leren te voeden
raamwerk Dit machine learning -framework moet het vervolgens aan uw GPU overhandigen en dan kunt u beginnen met trainen, maar dan jij
moet dit op een betrouwbare manier in honderden of duizenden GPU doen
LogStap en op een manier die ook snel is, dus je hebt ook een interconnect nodig extreem ingewikkeld.
over dojo in een seconde, dus eerst wil ik je naar een paar brengen
Optimalisaties die we op ons cluster hebben gedaan, dus we krijgen veel video's en
Video is heel erg anders dan laten we zeggen dat training over afbeeldingen of tekst waarvan ik denk dat het heel goed gevestigde video is
Letterlijk een dimensieer gecompliceerder um en daarom moesten we eindigen
Om te eindigen van de opslaglaag tot het versneller en elk stuk daarvan optimaliseren, omdat we trainen op het aantal fotonen
Video's die rechtstreeks uit onze vloot komen, we trainen rechtstreeks op die
De manier waarop het zojuist is gedaan, is dat we precies zoeken naar de frames die we kiezen voor onze batch die we laden die erin zijn, inclusief de
frames waar ze van afhankelijk zijn, dus dit zijn je iframes of je sleutelhang
geheugen verplaats ze naar een dubbele balk van de GPU en gebruik vervolgens de hardwarecoder die alleen maar is versneld
Decodeer de video, dus dat doen we op de GPU native en dit is allemaal in een zeer mooie Python Pytorch -extensie
Dit ontgrendelde meer dan 30 trainingssnelheidstijging voor de bezettingsnetwerken en in principe een geheel vrijgemaakt
CPU om iets anders te doen um, je kunt niet zomaar trainen met alleen
Video's natuurlijk heb je een soort van een grondwaarheid nodig, uh en uh dat is eigenlijk een interessant probleem
Doelstelling voor het opslaan van uw grondwaarheid is dat u ervoor wilt zorgen
Minimale hoeveelheid bestandssysteembewerkingen en belasting in de minimale grootte van wat u nodig hebt om te optimaliseren voor aggregaat
Cross Cluster -doorvoer omdat u een rekencluster zou moeten zien als één groot apparaat dat intern is opgelost
beperkingen en drempels dus hiervoor hebben we een formaat uitgerold dat
is inheems voor ons dat klein wordt genoemd, we gebruiken dit voor onze grondwaarheid onze functiecache en eventuele inferentie -uitgangen
Dus veel tensoren die daar zijn en dus alleen de cartoon hier laten we zeggen
Wil je opslaan, zo zou dat eruit zien als je op schijf uitrolt, dus wat je doet is dat je iets neemt wat je zou doen
Wil je indexeren, dus bijvoorbeeld videostempels die je allemaal in de koptekst plaatst, zodat in je eerste koptekst
Lees je weet precies waar je op schijf kunt gaan, dan als je een tensoren hebt, ga je proberen de
Afmetingen om een andere dimensie als laatste als de aangrenzende dimensie te plaatsen en vervolgens ook verschillende soorten te proberen
Compressie dan bekijk je welke het meest optimaal was en bewaar die dan die dit eigenlijk een enorme stap is als je dat doet
functie caching onverstaanbare uitvoer van het machine learning -netwerk roteert rond de
afmetingen een beetje u kunt tot 20 toename van de efficiëntie van de opslag krijgen, dan wanneer u dat ook opslaat
bestelde de kolommen op maat zodat al uw kleine kolommen en kleine waarden samen zijn, zodat wanneer u op zoek bent naar een
enkele waarde die u waarschijnlijk overlapt met een lees over meer waarden die u later gebruikt, zodat u het niet hoeft te doen
Nog een bestandssysteembewerking, zodat ik door kon gaan en ik ging gewoon verder
bij aanraking met twee projecten die we intern hebben, maar dit maakt eigenlijk deel uit van een enorme voortdurende inspanning om de
Bereken dat we in eigen huis zo accumuleren en verzamelen door al deze optimalisaties die we nu onze trainen
bezettingsnetwerken twee keer zo snel alleen omdat het twee keer zo efficiënt is en nu als we meer berekenen en gaan toevoegen
Parallel kunnen we dit niet in uren trainen in plaats van dagen en daarmee zou ik het graag willen overhandigen
De grootste gebruiker van Compute John
Hallo allemaal, mijn naam is John Emmons Ik leid het Autopilot Vision -team. Ik ga twee onderwerpen met je behandelen
Tegenwoordig is de eerste hoe we rijstroken voorspellen en de tweede is hoe we het toekomstige gedrag van andere agenten op de weg voorspellen
In de begindagen van de stuurautomaat hebben we het rijstrookdetectieprobleem gemodelleerd als een beeldruimte onmiddellijke segmentatietaak
Ons netwerk was super eenvoudig, hoewel het in feite alleen in staat was om rijstroken af te drukken van een paar verschillende soorten
Geometrieën specifiek zou het de adelaarstrook segmenteren die het aangrenzend zou kunnen segmenteren
Lanen en toen had het een speciale behuizing voor vorken en combineert deze simplistische modellering van het probleem
werkte voor zeer gestructureerde wegen zoals snelwegen, maar vandaag proberen we een systeem te bouwen
Dat is in staat tot veel complexere manoeuvres, met name die we naar links en rechterbeurten willen maken op kruispunten
waar de wegtopologie een beetje complexer en diverser kan zijn wanneer we proberen deze simplistische modellering van de
Probleem hier, het gaat gewoon volledig uiteenzetten om even een stap terug te doen
We proberen hier te doen, is om de vonk set lame instanties in hun connectiviteit te voorspellen en wat we willen doen is een
neuraal netwerk dat in feite deze grafiek voorspelt waar de knooppunten de rijstrooksegmenten zijn en de randen coderen voor de
Connectiviteiten tussen deze rijstroken, dus we hebben onze rijstrookdetectie
neuraal netwerk Het bestaat uit drie componenten in de eerste component waar we een set van hebben
Convolutionele lagen aandachtslagen en andere neurale netwerklagen die coderen voor de videostreams van onze acht
camera's op het voertuig en produceren een rijke visuele weergave
Vervolgens verbeteren we deze digitale weergave met een grove routekaartniveau -kaartgegevens waarmee we coderen
Een set extra neurale netwerklagen die we de Lane Guidance -module noemen. Deze kaart is geen HD -kaart, maar het is
Biedt veel nuttige hints over de topologie van lanen in kruispunten die de rijstrook op verschillende wegen telt en een reeks andere attributen die
Help ons de eerste twee componenten hier produceren een
dichte tensor die de wereld codeert, maar wat we echt willen doen, is deze dichte tensor omzetten in een
Slimme reeks rijstroken in hun connectiviteiten We benaderen dit probleem als een beeld
Bijschrifttaak waarbij de invoer deze dichte tensor is en de uitvoertekst wordt voorspeld in een speciale taal die
We ontwikkelden ons bij Tesla voor het coderen van rijstroken in hun verbindingen in deze taal van rijstroken de woorden en
Tokens zijn de rijstrookposities in 3D -ruimte bij het ordenen van de tokens geïntroduceerde modificaties in de tokens
Codeer de verbindende relaties tussen deze banen door de taak als een taal te modelleren
Probleem dat we kunnen profiteren van recente autoregressieve architecturen en technieken van de taalgemeenschap voor het omgaan met de meerdere
Modaliteit van het probleem We zijn niet alleen het probleem van de computer vision op de automatische pilot oplossen, we passen ook de state-of-the-art toe en
Taalmodellering en machine learning Meer in het algemeen ga ik nu een beetje meer in detail deze taalcomponent duiken
Wat ik hier op het scherm heb afgebeeld, is de satellietafbeelding die het lokale gebied rond de
Voertuig De set van de Nosering Randen is wat we de Lane -grafiek noemen en het is uiteindelijk wat we uit deze neurale willen komen
Netwerk We beginnen met een lege lei die we onze eerste willen maken
Voorspelling hier op deze groene stip is deze groene stippenpositie gecodeerd als
Een index in een cursusrooster dat de 3D -wereld discretiseert nu we deze index niet rechtstreeks voorspellen
Omdat het te computationeel duur zou zijn om dit te doen, zijn er gewoon te veel rasterpunten en het voorspellen van een categorisch
Distributie hierover heeft zowel implicaties tijdens trainingstijd als testtijd, dus in plaats daarvan doen we dat we de
Wereld grof eerst voorspellen we een warmtekaart over de mogelijke locaties en dan vergrendelen we op de meest waarschijnlijke locatie
Hierop verfijnen we de voorspelling en krijgen we het precieze punt
Nu weten we waar de positie van dit token is dat we het type het type in dit geval niet kennen, hoewel het het begin is van een nieuwe
Lane dus we benaderen het als een starttoken en omdat het een sterrentoken is, is er geen
Extra attributen in onze taal nemen we vervolgens de voorspellingen van deze eerste voorwaartse pas en we coderen ze
met behulp van een geleerde extra inbedding die een reeks tensoren produceert die we samen combineren
Dat is eigenlijk het eerste woord in onze taal van rijstroken, we voegen dit toe aan de eerste positie in onze zin hier
Vervolgens gaan we door met dit proces door het volgende rijstrook op een vergelijkbare manier af te drukken
Nu is dit Lane -punt niet het begin van een nieuwe rijstrook, het is eigenlijk een voortzetting van de vorige rijstrook
Dus het is een type voortzettingstoken, nu is het niet genoeg om dat te weten
Deze baan is verbonden met het eerder beschermde vlak dat we de precieze geometrie willen coderen die we doen
Als we een set spline -coëfficiënten regresseren, nemen we deze rijstrook aan die we coderen
Nogmaals en voeg het toe als het volgende woord in de zin, we blijven deze voortzettingstrookjes voorspellen totdat we bij de
Einde van het voorspellingsraster We gaan dan verder naar een ander rijstrooksegment, zodat je die cyaanstip daar nu kunt zien
Het is niet topologisch verbonden met dat roze punt, het is eigenlijk afgesproken van dat blauw, sorry dat groen
wijs daar, dus het heeft een vorktype en vorktokens
wijs eigenlijk terug naar vorige tokens waaruit de vork voortkomt, dus jij
kan hier zien dat de vorkpunt voorspeller eigenlijk de index nul is, dus het verwijst eigenlijk naar tokens dat het al wordt voorspeld zoals je zou doen
taal We zetten dit proces steeds weer door totdat we alle
Tokens in de Ling -grafiek en vervolgens het netwerk voorspelt het einde van het zinstoken
Ja, ik wil gewoon opmerken dat de reden dat we dit doen niet alleen is omdat we iets ingewikkeld willen bouwen
Voelt echter bijna als een turing complete machine hier met neurale netwerken, echter is dat we eenvoudige benaderingen hebben geprobeerd voor
Voorbeeld UH probeert gewoon de rijstroken langs de weg te segmenteren of iets dergelijks, maar het probleem is wanneer
Er is onzekerheid, zegt dat je de weg niet duidelijk kunt zien en er kunnen twee rijstroken of drie rijstroken zijn en je kunt het niet zeggen
Een eenvoudige op segmentatie gebaseerde aanpak zou ze alleen maar een soort van 2,5 rijstrokensituatie zijn en de
Post -verwerkingsalgoritme zou hilarisch falen als de voorspellingen zo zijn
U moet deze verbindende omstandigheden zoals deze verbindingsbanen voorspellen in kruispunten die het gewoon niet mogelijk is met de aanpak dat
Ashok vermeldt dat waarom we moesten upgraden naar dit soort overlappingen zoals deze segmentatie zou gewoon in de war raken, maar zelfs als je heel hard probeert
je weet dat ze op aparte lagen worden geplaatst, het is gewoon een heel moeilijk probleem welke taal gewoon een heel mooi kader biedt voor modern krijgen een
Voorbeeld van een posterior in tegenstelling tot u weet dat u dit allemaal in de nabewerking probeert te doen
Maar dit stopt eigenlijk niet voor alleen de automatische pilot JOW JOHN Dit kan opnieuw worden gebruikt voor optimus, weet je, ik denk dat ze dat niet zouden zijn
Lanen genoemd, maar je zou je kunnen voorstellen dat je een soort van hierin weet, weet je hier dat je misschien soort paden hebt die soort van je weten dat het mogelijke codert
Plaatsen die mensen zouden kunnen lopen, ja, het is eigenlijk als je in een fabriek bent of in een je kent thuisomgeving
U kunt de robot gewoon vragen, oké, laat me alsjeblieft met de keuken praten of ga naar een locatie in de fabriek
En dan voorspellen we een reeks paden waarvan je zou weten dat je door de gangpaden gaat, neem de robot en zeg oké dit
is hoe je naar de keuken komt, het geeft ons gewoon echt een mooi kader om deze verschillende paden te modelleren die het navigatieprobleem of de
stroomafwaartse planner in orde dus uiteindelijk wat we halen uit
Dit rijstrookdetectienetwerk is een reeks rijstroken in hun connectiviteiten die rechtstreeks van het netwerk komen
Geen extra stap hier voor het vereenvoudigen van deze, je kent dichte voorspellingen in een ingescheiden
Dit is slechts een directe ongefilterde uitvoer van het netwerk
Oké, dus ik heb een beetje gesproken over rijstroken, ik ga kort aanraken hoe we de toekomstige paden modelleren en voorspellen
andere semantiek op objecten, dus ik ga gewoon heel snel door twee voorbeelden van de video over de
Hier hebben we een auto die eigenlijk een rood licht runt en voor ons draait wat we doen om te hanteren
Situaties zoals deze is dat we een reeks korte tijdshorizon toekomstige trajecten voorspellen op alle objecten die we kunnen gebruiken
Deze om te anticiperen op de gevaarlijke situatie hier en toe te passen wat u weet remmen en stuuractie vereist is om een botsing te voorkomen
In de video rechts zijn er twee voertuigen voor ons.
Geladen geladen, weet ik niet waarom de bestuurder besloot daar te parkeren, maar het belangrijkste is dat ons neurale netwerk voorspelde dat het werd gestopt
dat is de rode kleur daar eh.
Uiteraard wachten tot dat rode licht groen wordt, dus hoewel beide objecten stationair zijn en nul snelheid hebben, is het de semantiek die is
Echt belangrijk hier zodat we niet vastlopen achter die onhandige geparkeerde auto
Het voorspellen van al deze agentattributen levert enkele praktische problemen op bij het proberen een realtime systeem op te bouwen
We moeten de framesnelheid van de stapel van onze objectsectie maximaliseren, zodat de stuurautomaat snel kan reageren op de veranderende omgeving
Elke milliseconde is hier echt belangrijk om de inferentielatentie te minimaliseren. Ons neurale netwerk is opgesplitst in twee fasen
In de eerste fase hebben we locaties geïdentificeerd in 3D -ruimte waar agenten bestaan
In de tweede fase halen we vervolgens tensoren uit op die 3D -locaties die het toevoegen met extra gegevens die op de
Voertuig en dan weet we dat u de rest van de verwerking van deze specificatiestap doet
Neuraal netwerk om te focussen op de gebieden die er het meest toe doen, wat ons superieure prestaties geeft voor een fractie van de latentiekosten
Dus het samenstellen van de Autopilot Vision Stack voorspelt meer dan alleen de geometrie en kinematica van
De wereld voorspelt ook een rijke set semantiek die veilig en menselijk rijden mogelijk maakt
Ik ga dingen niet aan de straat overhandigen, we vertellen ons hoe we al deze coole neurale netwerken op onze FSD -computer laten werken, bedankt
[Applaus]
Hallo allemaal, ik ben Sri vandaag, ik ga een glimp geven van wat er nodig is om deze FSC -netwerken in de
auto en hoe optimaliseren we voor de inferentie latentie uh vandaag ga ik me alleen richten op de
FSG Lanes Network waar John net over sprak
Dus toen je aan dit nummer begon, wilden we weten of we dit FSC Lanes -netwerk native op de Trip Engine kunnen uitvoeren
dat is ons interne neurale netwerkversneller dat we in de FSD-computer hebben gebouwd
Wanneer we deze hardware bouwen, hielden we het simpel en hebben we ervoor gezorgd dat het er een kan doen
ding belachelijk snel dichte puntproducten, maar deze architectuur is auto
regressief en iteratief waar het door meerdere aandachtsonthoogblokken in de binnenlus kraakt
Bij elke stap rechtstreeks schaarse punten produceren, dus de uitdaging hier was hoe
Kunnen we deze Parse Point -voorspelling en schaarse berekening doen op een dichte DOT -productmotor, laten we eens kijken hoe we dit hebben gedaan
op de reis, dus het netwerk voorspelt de warmtekaart van
meest waarschijnlijke ruimtelijke locaties van het punt nu doen we een boog max en een
hartoperatie die de enige harde codering van de index van de ruimtelijke locatie geeft
Nu moeten we de inbeddding selecteren die aan deze index is gekoppeld uit een inbeddingstabel die tijdens
Training om dit op reis te doen, hebben we eigenlijk een opzoektafel in SRAM gebouwd en we hebben ontworpen
De afmetingen van deze inbedding zodanig dat we al dit ding konden bereiken met alleen matrixvermenigvuldiging
Niet alleen dat we deze inbedding ook wilden opslaan in een token -cache dus
dat we dit niet voor elke iteratie opnieuw berekenen
Trucs hier waar we al deze operaties alleen op de DOT -productmotor hebben gedaan, het is eigenlijk cool dat ons team
Vond creatieve manieren om al deze bewerkingen op de reismotor op manieren in kaart te brengen
die niet eens werden gedacht wanneer deze hardware werd ontworpen, maar dat is niet het enige dat we moeten
Doe om dit werk te maken, hebben we eigenlijk heel veel bewerkingen en functies geïmplementeerd om dit model te maken
compileerbaar om de inlaatnauwkeurigheid te verbeteren en om de prestaties te optimaliseren
Al deze dingen hebben ons geholpen om het 75 miljoen parametermodel iets minder dan 10 uit te voeren
Milliseconde van latentie die slechts 8 watt macht verbruikt
Maar dit is niet de enige architectuur die in de auto draait. Er zijn zoveel andere architecturenmodules en -netwerken
We moeten in de auto rennen om een gevoel van schaal te geven, er zijn ongeveer een miljard parameters van alle netwerken
gecombineerd met het produceren van ongeveer 1000 neurale netwerksignalen, dus we moeten er zeker van zijn
We optimaliseren ze gezamenlijk en zodanig dat we de berekening maximaliseren
gebruiksdoorvoer en minimaliseer de latentie, dus we hebben een compiler gebouwd alleen voor neural
Netwerken die de structuur deelt op traditionele compilers zoals je kunt zien, kost het enorm
Grafiek van neurale netten met 150k knooppunten en 375K -verbinding neemt dit ding
Partitioneert ze in onafhankelijke subgraphs en Com dwingt elk van die
Subgraphs native voor de inferentieapparaten dan hebben we een neuraal netwerk
Linker die de structuur deelt naar traditionele linker waar we deze linktijd -optimalisatie uitvoeren
Daar lossen we een offline optimalisatieprobleem op uh voor met rekengeheugen en geheugen
Bandbreedtebeperkingen zodat het wordt geleverd met een geoptimaliseerd schema dat in de auto wordt uitgevoerd
Tijdens de runtime hebben we een hybride planningssysteem ontworpen dat in feite doet
Heterogene planning op één SOC en gedistribueerde planning in beide SOC's om deze netwerken in een model te laten werken
parallelle mode om 100 druppels rekengebruik te krijgen die we nodig hebben om te optimaliseren voor alle
lagen software rechtstreeks van het afstemmen van de netwerkarchitectuur de compiler allemaal
De manier om een lage latentie high bandbreedte RDMA -link te implementeren over beide SRC's en in feite nog dieper naar
Inzicht in en optimaliseren van de cache coherente en niet-coherente datapaden van het versneller in de SOC Dit is veel
van optimalisatie op elk niveau om ervoor te zorgen dat we de hoogste framesnelheid krijgen en zoals elke milliseconde telt
hier en dit is dit is gewoon de dit is de
Visualisatie van de neurale netwerken die in de auto draaien, dit is in wezen onze digitale hersenen zoals u kunt zien
Deze bewerkingen zijn niets anders dan alleen de convolutie van de matrixvermenigvuldiging om een paar echte bewerkingen in de auto te noemen
Om dit netwerk te trainen of te trainen met een miljard parameters, heb je veel gelabelde gegevens nodig, dus Aegon gaat praten
over hoe we dit bereiken met de pijplijn voor automatische labels
Dank je wel, bedankt sherry
uh hoi iedereen, ik ben jurgen zhang en ik leid een geometrische visie bij de stuurautomaat
Dus ja, laten we het hebben over Auto Labeling
Dus we hebben verschillende soorten van alle labelskaders om verschillende soorten netwerken te ondersteunen, maar vandaag zou ik dat willen
Focus hier op het Awesome Lanes Net hier om met succes te trainen en te generaliseren
Dit netwerk naar overal waar we denken dat we tientallen miljoenen reizen zijn gegaan
waarschijnlijk een miljoen kruispunt of zelfs meer
Hoe dan te doen, dus het is zeker haalbaar uh om voldoende te vinden
hoeveelheid reizen omdat we al eerder hebben uitgelegd, hebben we al 500.000 reizen per dag contant tarief
Um is echter een zeer uitdagend technisch probleem om te zetten in een trainingsformulier in een trainingsformulier
Om deze uitdaging op te lossen, hebben we verschillende manieren van handmatige en automatische etikettering geprobeerd
De eerste kolom tot de tweede van de tweede tot de derde elke opmars gaf ons bijna 100x verbetering in
doorvoer maar nog steeds uh we hebben een nog betere auto -etiketteringsmachine gewonnen die kan bieden
Zorg voor providers van goede kwaliteit diversiteit en schaalbaarheid
Om aan al deze vereisten te voldoen uh ondanks de enorme hoeveelheid technische inspanningen die hier nodig zijn, hebben we een
Nieuwe bestelling etikettingsmachine aangedreven door multi-tribreconstructie, dus dit kan 5 miljoen uren vervangen
Handmatige etikettering met slechts 12 uur op cluster voor het labelen van 10.000 reizen
Dus hoe we we hebben opgelost, zijn drie grote stappen De eerste stap is een hoog precisietraject en structuurherstel door
Visuele inertiële odometrie met meerdere camera, dus hier worden alle functies inclusief grondoppervlak afgeleid uit video's
door neurale netwerken die vervolgens worden gevolgd en gereconstrueerd in de vectorruimte
Dus de typische driftsnelheid van dit traject in de auto is als 1,3 centimeter
per meter en 0,45 milli radia per meter, wat behoorlijk fatsoenlijk is, gezien zijn compacte berekening
vereiste dan de herstelservice en onbewerkte details worden ook als een sterk gebruikt
Richtlijnen voor de latere handmatige verificatiestap Dit is ook ingeschakeld in elke FSD
Voertuig, dus we krijgen voorbewerkte trajecten en structuren samen met de reisgegevens
De tweede stap is multi-2 reconstructie, het grote en kernstuk van deze machine
Dus de video laat zien hoe de eerder getoonde reis wordt gereconstrueerd en uitgelijnd
met andere reizen in principe andere reizen van verschillende mensen, niet hetzelfde voertuig, dus dit wordt gedaan door meerdere
Internetstappen zoals cursusuitlijning paarsgewijze bijpassende gewrichtsoptimalisatie dan verdere oppervlakte -verfijning
Uiteindelijk komt de menselijke analist binnen en voltooit het label
Dus elke gelukkige stappen zijn al volledig parallel op het cluster, dus de
Het hele proces duurt meestal slechts een paar uur
De laatste stap is eigenlijk automatisch de nieuwe reizen te labelen
Hier gebruiken we dezelfde multi-trip-uitlijningsmotor, maar alleen tussen vooraf gebouwde reconstructie en elk nieuw
Trip dus het is veel veel eenvoudiger dan het volledig reconstrueren van alle clips helemaal
Daarom duurt het slechts 30 minuten per reis naar een ander label in plaats van handleiding
Enkele uren handmatige etikettering en dit is ook de sleutel van schaalbaarheid
Van deze machine schaalt deze machine gemakkelijk zolang we als wij
Beschikbare compute- en reisgegevens beschikbaar, dus ongeveer 50 bomen waren nieuw bestelling
Label uit deze scène en sommige worden hier dus 53 uit verschillende voertuigen getoond
Dus dit is hoe we de ruimtetijd plakjes van de wereld vangen en transformeren in
Het netwerk toezicht ja, een ding dat ik graag opmerkt, is dat weer gewoon sprak over hoe we automatisch zijn
Label onze rijstroken, maar we hebben automatische arbeiders voor bijna elke taak die we doen, inclusief onze planner en veel van
Deze zijn volledig automatisch, zoals geen mensen die bijvoorbeeld betrokken zijn voor objecten of andere kinematica, de vormen hun
Futures Alles komt gewoon uit automatische etikettering en hetzelfde geldt ook voor de bezetting en we hebben echt gewoon
heeft een machine rond dit ja gebouwd, dus als je nog een dia kunt teruggaan
Het staat paralleliseerd op cluster, dus dat klinkt vrij eenvoudig maar
Het was echt niet eh, misschien is het leuk om te delen hoe zoiets tot stand komt, dus een tijdje geleden hadden we er geen
Auto -etikettering überhaupt en dan maakt iemand een script dat het begint te werken, het begint beter te werken totdat we een
volume dat behoorlijk hoog is en we hebben duidelijk een oplossing nodig en dus waren er twee andere ingenieurs in
Ons team dat was zoals je weet dat dat interessant is, weet je, wat we moesten doen, was een hele grafiek bouwen
in wezen Python -functies die we nodig hebben om de ene na de andere eerst aan de clip te gaan, dan doe je wat schoonmaken dan je doet
wat netwerkinferentie dan een andere netwerkinferentie totdat je dit eindelijk krijgt, maar dus moet je dit doen als een
Grootschalig dus ik vertel ze dus dat we waarschijnlijk moeten schieten voor je weet 100.000 clips per dag of van 100.000 items
dat lijkt een goede um en dus zeggen de ingenieurs goed dat we je kunnen doen, ken je een beetje postgres en een beetje
van elleboogvet kunnen we het ondertussen wat later doen en we doen er 20
Million van deze functies elke dag weer trekken we ongeveer een half miljoen binnen
Clips en op die van mensen werken we een heleboel functies die elk van deze op een streaming -manier zijn en dus dat is een beetje van de achterkant
Eind infra dat ook nodig is om niet alleen training te volgen, maar ook automatisch labelen, ja, het is echt als een fabriek
produceert labels en zoals productielijnen leveren kwaliteit van inventaris op, zoals alle dezelfde concepten die hierop worden toegepast
Label Factory Uh die van toepassing is voor u kent de fabriek voor onze auto's, dat klopt
oke uh bedankt uh dus ja, dus concluderen
In dit gedeelte zou ik zeker nog een paar uitdagende en interessante voorbeelden voor netwerk willen delen en zelfs
voor mensen waarschijnlijk uh dus van bovenaf zijn er voorbeelden voor een soortgelijk leugens geval of mistige nacht of rotonde
en occlusies door zware occlusies door geparkeerde auto's en zelfs regenachtige nacht met hun regendruppels op cameralenzen uh
Deze zijn uitdagend, maar zodra hun originele scènes volledig zijn gereconstrueerd door andere clips die ze allemaal kunnen zijn
Auto gelabeld zodat onze kaarten nog beter kunnen rijden door deze uitdagende scenario's
Dus laat me nu de microfoon doorgeven aan David om meer te leren over hoe SIM de nieuwe wereld bovenop deze labels creëert, bedankt
Jij
Nogmaals bedankt, mijn naam is David en ik ga het hebben over simulatie, dus simulatie speelt een cruciale rol in
Gegevens verstrekken die moeilijk te vinden zijn en of moeilijk te labelen is, maar 3D -scènes zijn notoir traag
om te produceren, bijvoorbeeld de gesimuleerde scène die achter me speelt a
complexe kruising van Market Street in San Francisco zou het twee weken duren
kunstenaars om te voltooien en voor ons is dat pijnlijk traag, maar ik ga het hebben over gebruiken
Jaandan's geautomatiseerde labels van grondwaarheid, samen met een aantal gloednieuwe tooling waarmee we dit procedureel kunnen genereren
scène en velen vinden het leuk in slechts vijf minuten, dat is een verbazingwekkende duizend keer sneller dan voorheen
Dus laten we in onze scène duiken zoals deze is gemaakt, we beginnen met het geleid van de geautomatiseerde grond
Waarheidslabels in onze gesimuleerde World Creator Tooling in de software Houdini beginnend met weggrens
Labels We kunnen een solide weggerecht genereren en het opnieuw topologiseren met de Lane Graph-labels. Dit helpt een belangrijke weg te informeren
Details zoals Crossroads Slope en gedetailleerd materiaalmixen
Vervolgens kunnen we de lijngegevens gebruiken en geometrie over het oppervlak vegen en naar de weg projecteren en rijstrookjes maken
stickers vervolgens met behulp van mediane randen kunnen we voortgebracht zijn
Eilandgeometrie en vul het met gerandomiseerd gebladerte, dit verandert de zichtbaarheid van de scène drastisch
Nu kan de buitenwereld worden gegenereerd door een reeks gerandomiseerde heuristieken, een modulaire gebouwgenerators
Maak visuele obstakels, terwijl willekeurig geplaatste objecten zoals hydranten de kleur van de curven kunnen veranderen terwijl
Bomen kunnen bladeren onder de verdoezelende lijnen of randen laten vallen
Vervolgens kunnen we kaartgegevens binnenbrengen om posities te informeren over dingen zoals verkeerslichten of stopborden die we kunnen volgen
Het is normaal om belangrijke informatie te verzamelen, zoals het aantal rijstroken en zelfs nauwkeurige straatnamen te krijgen op de
Tekens zelf Volgende met behulp van Lane Graph kunnen we rijstrookconnectiviteit bepalen en de directionele spawnen
Wegmarkeringen op de weg en ze begeleiden de verkeersborden en uiteindelijk met Lane Graph zelf zelf
Kan rijstrooklaan en andere nuttige statistieken bepalen om gerandomiseerde verkeerspermutaties insider simulator te spawnen
En nogmaals, dit is allemaal automatisch, geen artiesten in de lus en gebeuren binnen enkele minuten en nu maakt dit ons op
Een aantal behoorlijk coole dingen, omdat alles gebaseerd is op gegevens en heuristieken die we kunnen beginnen te fuzz
Parameters om visuele variaties van de enkele grondwaarheid te creëren, kan het zo subtiel zijn als plaatsing van het object en willekeurig
Materiaalwisseling naar meer drastische veranderingen zoals geheel nieuwe biomen of locaties van de omgeving zoals Urban
Voorsteden of landelijk hiermee kunnen we oneindige gerichte permutaties creëren voor specifiek
grondwaarheden waar we meer grondwaarheid voor nodig hebben en dit gebeurt allemaal binnen een klik van een
knop en we kunnen deze zelfs nog een stap verder gaan door onze grondwaarheid te wijzigen
Zelf zegt dat John wil dat zijn netwerk meer aandacht besteedt aan de directionele wegmarkeringen
Om een aankomende bochtstrook in de gevangenis beter te detecteren, kunnen we onze rijstrookgrafiek in procedureel veranderen
de simulator om mensen te helpen om volledig nieuwe stromen door dit kruispunt te creëren om te helpen
Richt de aandacht van het netwerk op de wegmarkeringen om nauwkeurigere voorspellingen te creëren en dit is een goed voorbeeld van hoe dit
Tooling stelt ons in staat om nieuwe gegevens te maken die nooit uit de echte wereld kunnen worden verzameld
En de ware kracht van deze tool is in zijn architectuur en hoe we alle taken parallel aan oneindig kunnen uitvoeren
Schaal zodat je de Tile Creator -tool zag in actie om de grondwaarheid om te zetten
Labels in hun tegenhangers Vervolgens kunnen we onze Tile Extractor Tool gebruiken
Om deze gegevens te verdelen in geohash -tegels van ongeveer 150 meter vierkant in grootte
We besparen die gegevens vervolgens in afzonderlijke geometrie- en instantiebestanden. Dit geeft ons een schone gegevensbron die gemakkelijk is
laden en stelt ons in staat om de motor agnostisch te maken voor de toekomst
Vervolgens kunnen we met een tegelladergereedschap een willekeurig aantal van die cachetegels oproepen met een geohash -ID
ongeveer deze vijf bij vijf tegels of drie bij drie meestal gecentreerd rond vloot hotspots of interessante landgrafiek
Locaties in de tegellader zetten deze tegelsets ook om in U -activa voor consumptie
door de Unreal Engine en geeft u een afgewerkt projectproduct van wat u in de eerste dia zag
En dit maakt ons echt op voor maat en schaal, zoals u kunt zien op de kaart achter ons
We kunnen gemakkelijk het grootste deel van de straten van de stad San Francisco genereren en dit duurde niet jaren of zelfs maanden werk, maar
eerder twee weken door één persoon kunnen we blijven beheren en laten groeien
Deze gegevens met ons PDG -netwerk binnen de tooling hiermee kunnen we gooien
Bereken erop en regenereer al deze tegelsets 's nachts, dit zorgt ervoor dat alle omgevingen van zijn
Consistente kwaliteit en functies die super belangrijk zijn voor training, omdat nieuwe ontologieën en signalen constant zijn
uitgebracht en nu om de cirkel te komen omdat we
Al deze tegelsets gegenereerd van grondwaarheidsgegevens die alle rare ingewikkeldheden van de echte wereld bevatten
En we kunnen dat combineren met de procedurele visuele en verkeersvariatie om onbeperkte gerichte gegevens te maken voor de
Netwerk om van te leren en dat sluit de sim -sectie af, ik zal het doorgeven aan Kate om te praten over hoe we kunnen
Gebruik al deze gegevens om de stuurautomaat te verbeteren, bedankt
Bedankt David Hallo allemaal, mijn naam is Kate Park en ik ben hier om te praten over de datamotor die het proces is waarmee we
Verbeter onze neurale netwerken via gegevens, we gaan u laten zien hoe we deterministisch interventies oplossen
Via data en loop je door het leven van deze specifieke clip in dit scenario
Autopilot nadert een beurt en voorspelt dat het kruisende voertuig ten onrechte is gestopt voor verkeer en dus
Een voertuig waar we in werkelijkheid voor zouden vertragen, er is niemand in de auto, het is gewoon onhandig geparkeerd, we hebben dit gebouwd
Tooling om de verkeerde uitvoeringen te identificeren, corrigeren het label en categoriseren dit
Clip in een evaluatieset Deze specifieke clip is toevallig een van de 126
dat we hierdoor de diagnose van de diagnose van geparkeerde auto's hebben gediagnosticeerd
Infra We kunnen deze evaluatieset samenstellen zonder engineeringbronnen op maat
naar deze specifieke uitdaging om die uitdagingszaak daadwerkelijk op te lossen
Vereist duizenden voorbeelden zoals deze en het is iets dat Tesla triviaal kan doen, we gebruiken gewoon onze gegevens
Infra -aanvraaggegevens inzuren en de eerder getoonde tooling gebruiken om de
Labels door chirurgisch te richten
Voorbeelden van onze trainingsset die we chirurgisch 13 900 clips en uh repareren
Omdat dat voorbeelden waren waarbij het huidige model worstelt, hoeven we de modelarchitectuur niet eens te wijzigen
Eenvoudige manier update met deze nieuwe waardevolle gegevens is voldoende om de uitdaging van de uitdaging op te lossen, zodat u ziet dat we niet langer voorspellen
dat kruisende voertuig zoals gestopt zoals getoond in oranje maar geparkeerd zoals getoond in rood
In de academische wereld zien we vaak dat mensen gegevens constant houden, maar bij Tesla het is
Het tegenovergestelde zien we het keer op keer dat gegevens een van de beste, zo niet de meest deterministische hendel zijn
Om deze interventies op te lossen, hebben we u net de datemotorlus laten zien
Voor een uitdaging, namelijk deze geparkeerde auto's om de beurt, maar er zijn veel uitdagingsgevallen, zelfs voor één signaal van
Voertuigbeweging We passen deze datemotorlus toe op elke uitdaging van een enkele uitdaging.
Curvy Roads stopten voertuigen parkeerplaatsen en we voegen niet alleen gegevens toe zodra we
Doe dit steeds opnieuw om de semantic in feite te perfectioneren dit jaar hebben we ons voertuigbewegingssignaal vijf keer bijgewerkt
En met elke gewichtsupdate die zijn getraind op de nieuwe gegevens, duwen we onze voertuigbewegingsnauwkeurigheid omhoog en omhoog
Dit datamotorraamwerk is van toepassing op al onze signalen of ze 3D zijn
Video met meerdere cam of de gegevens of de gegevens zijn gelabeld met de automatische wijze gelabeld of gesimuleerd, of het nu een offline model is of een
Online modelmodel en Tesla kan dit op schaal doen vanwege de vloot
Voordeel van de infra die ons motorteam heeft gebouwd en de etiketteringsbronnen die onze netwerken voeden
Om op al deze gegevens te trainen, hebben we een enorme hoeveelheid reken nodig, dus ik zal het overhandigen aan Pete en Ganesh om over te praten
Het Dojo Supercomputing -platform Dank u [applaus]
Bedankt bedankt Katie
Bedankt iedereen, bedankt dat je daar hebt gehangen, we zijn er bijna mijn naam is Pete Bannon, ik run de gewoonte
Silicium- en laagspanningsteams bij Tesla en mijn naam is Ganesh Venkat Ik run
Doji -programma
[Applaus] Dank u, mij wordt vaak gevraagd waarom een auto is
Bedrijf bouwen een supercomputer voor training en deze vraag fundamenteel
Begrijp de aard van Tesla in het hart dat Tesla een hardcore technologie verkeerd is
Bedrijf overal in het bedrijf werken mensen hard in wetenschap en engineering
om het fundamentele begrip en en methoden te bevorderen die we beschikbaar hebben
om auto's te bouwen energie -oplossingen robots en al het andere, dus kunnen we dat doen
Verbeter de menselijke conditie over de hele wereld, het is een super opwindende zaak om deel van uit te maken en het is een voorrecht om een zeer te lopen
klein stukje ervan in de halfgeleidergroep vanavond gaan we een beetje over Dojo praten en je een
Update over wat we het afgelopen jaar hebben kunnen doen, maar voordat we dat doen, wilde ik een beetje geven
Achtergrond over het eerste ontwerp dat we een paar jaar geleden begonnen, toen we begonnen, was het doel om een
substantiële verbetering van de trainingslatentie voor ons stuurautomaat team sommigen
De grootste neurale netwerken die ze vandaag hebben getraind, lopen meer dan een maand, waardoor hun vermogen om snel te worden belemmerd
verken alternatieven en evalueer ze zodat u weet dat een 30x -versnelling zou zijn
Echt leuk als we het zouden kunnen bieden op een kostenconcurrerende en energie -concurrerende manier
Om dat te doen wilden we een chip bouwen met veel rekenkundige rekenkunde
eenheden die we konden gebruiken bij een zeer hoge efficiëntie en we hebben veel tijd besteed aan het bestuderen of we dat konden doen
gebruik van DRM verschillende verpakkingsideeën die allemaal mislukten en uiteindelijk ook
Het voelde als een onnatuurlijke daad dat we besloten om DRAM te verwerpen als het primaire opslagmedium voor dit systeem en in plaats daarvan focussen
Op SRAM ingebed in de chip SRAM biedt helaas een bescheiden
hoeveelheid capaciteit maar extreem hoge bandbreedte en zeer lage latentie en dat stelt ons in staat om een hoog gebruik te bereiken
met de rekenkundige eenheden die keuzes
van die specifieke keuze heeft geleid tot een hele reeks andere keuzes, bijvoorbeeld als u een virtueel geheugen wilt hebben dat u nodig hebt
paginatabellen Ze nemen veel ruimte in beslag.
Accelerator is een kale bindingen die een stuk hardware berooft dat aan een compiler wordt gepresenteerd
In de compiler is verantwoordelijk voor het plannen van alles wat op een terministische manier gebeurt, dus er is geen behoefte of
Zelfs het verlangen naar onderbrekingen in het systeem hebben we er ook voor gekozen om model na te streven
Parallellisme als een trainingsmethode die niet de typische situatie is
De meeste machines gebruiken tegenwoordig data -parallellisme die extra geheugencapaciteit verbruikt die we duidelijk niet hebben
Dus al die keuzes hebben ons ertoe gebracht een machine te bouwen die vrij radicaal is
Anders dan wat vandaag beschikbaar is, hadden we ook een hele reeks andere doelen die een van de belangrijkste was, was nee
limieten, dus we wilden een rekenstof bouwen die voor het grootste deel op een onbeperkte manier zou opschalen
Er zijn af en toe fysieke limieten, maar je weet vrijwel als je model was
Te groot voor de computer, je moest gewoon een grotere computer kopen, dat is wat we vandaag zochten het pakket
Machines zijn verpakt, er is een behoorlijk vaste verhouding van bijvoorbeeld GPU CPU's en
en DRAM -capaciteit en netwerkcapaciteit en we wilden echt dat allemaal uitsplitsen, zodat naarmate modellen evolueerden, we konden
variëren de verhoudingen van die verschillende elementen en maak het systeem flexibeler om aan de behoeften van de
Autopilot -team ja en het is zo waar met als geen limieten. Filosofie was onze leidende ster
helemaal onze keuzes waren daarheen gecentreerd en en naar de
wijs aan dat we niet wilden dat traditionele datacenter -infrastructuur onze beperken
Capaciteit om deze programma's op snelheid uit te voeren, dus daarom zijn we
Daarom sorry daarvoor daarom zijn we geïntegreerd
verticaal ons hele datacenter gehele datacenter door een verticaal te doen
Integratie van het datacenter kunnen we nieuwe niveaus van efficiëntie extraheren. We kunnen het vermogen optimaliseren
Levering koeling en evenals systeembeheer over
de hele datacenterstapel in plaats van doos voor doos te doen en dat te integreren
Die vakken in datacenters en om dit te doen wilden we dat ook
Integreer vroeg om limieten van schaalgrenzen te achterhalen uh voor onze
Software -workloads, dus we hebben de Dojo -omgeving heel vroeg in onze stuurautomaatsoftware geïntegreerd en we hebben veel geleerd
Lessen en vandaag zal uh Bill Chang onze hardware -update en sommige doorlopen
van de uitdagingen waarmee we onderweg werden geconfronteerd en Rajiv Kurian zal je een
Een glimp van onze compilertechnologie en beweeg enkele van onze coole resultaten
daar ga je
bedankt pete bedankt ganesh eh ik zal vanavond beginnen met een hoog niveau
Visie op ons systeem dat zal helpen het toneel te bepalen voor de uitdagingen en de problemen die we zijn
Oplossen en vervolgens ook hoe software dit vervolgens zal gebruiken voor prestaties
Nu is onze visie voor Dojo om een enkele uniform te bouwen, een zeer grote versnelling
Eén software zou een naadloos rekenvlak zien met wereldwijd adresseerbaar
Zeer snel geheugen en allemaal verbonden samen met uniforme hoge bandbreedte en
Lage latentie nu om dit te realiseren, moeten we gebruiken
dichtheid om prestaties te bereiken Nu gebruiken we technologie om deze dichtheid te krijgen om de niveaus van te breken
Hiërarchie helemaal van de chip naar de schaaluitschakelssystemen
Nu heeft Silicon Technology dit gebruikt, dit heeft dit al tientallen jaren gedaan. Chips hebben
volgde de wet van Moore tot voor dichtheid en integratie om prestatieschaling te krijgen
Nu kunnen we een belangrijke stap in het realiseren van dat visie onze trainingstegel niet alleen 25 sterft integreren bij
extreem hoge bandbreedte, maar we kunnen dat op een willekeurig aantal extra tegels schalen door ze gewoon met elkaar te verbinden
Nu vorig jaar hebben we onze eerste functionele trainingstegel getoond en op dat moment hadden we al werklast doorlopen
Het en sindsdien heeft het team hier hard en ijverig gewerkt om in te zetten
Dit op schaal hebben we nu geweldige vooruitgang geboekt en hebben we veel mijlpalen onderweg en van
Natuurlijk hebben we veel onverwachte uitdagingen gehad, maar dit is waar onze falen snel
Filosofie heeft ons in staat gesteld om onze grenzen te verleggen
Nu de dichtheid pushen voor prestaties presenteert alle nieuwe uitdagingen. Een gebied is stroomafgifte
Hier moeten we de kracht leveren aan onze Compute Die en deze direct gevolgen
Onze topprestatieprestaties, maar we moeten dit doen met een ongekende dichtheid die we nodig hebben om ons te kunnen matchen
Die toonhoogte met een vermogensdichtheid van bijna één versterker per millimeter in het kwadraat
En vanwege de extreme integratie moet dit een multi-laged verticaal zijn
Power -oplossing en omdat er een complex heterogeen materiaal is stapel omhoog
We moeten de materiële overgang zorgvuldig beheren, vooral CTE
Waarom is de coëfficiënt van thermische expansie in dit geval CTE een fundamenteel materiaaleigenschap
en als het niet zorgvuldig wordt beheerd, zou dat stapel zich letterlijk uit elkaar scheuren
Dus begonnen we deze inspanning door samen te werken met leveranciers om te leveren om dit te ontwikkelen
Power-oplossing maar we realiseerden ons dat we dit in eigen huis moesten ontwikkelen
Nu om het schema en het risico in evenwicht te brengen, hebben we snelle iteraties opgebouwd om te ondersteunen
Zowel ons systeem brengen ter sprake en softwareontwikkeling en ook om het optimale ontwerp te vinden en
Stapel op dat onze uiteindelijke productiedoelen zou bereiken en uiteindelijk konden we CTE meer dan 50 procent verminderen
en ontmoet onze prestaties met 3x over onze eerste versie
Onnodig te zeggen dat het vinden van dit optimale materiaalstapel terwijl u maximaliseert terwijl u maximaliseert
Prestaties bij dichtheid zijn extreem moeilijk
Nu hebben we onderweg onverwachte uitdagingen gehad, hier is een voorbeeld waar we de
Grenzen van integratie die leidden tot fouten van componenten
Dit begon toen we opschalen naar grotere en langere workloads en vervolgens tussenliggende een enkele single
Site op een tegel zou falen nu ze begonnen als herstelbare mislukkingen, maar omdat we wat veel duwden
hoger en hoger vermogen deze zouden permanente mislukkingen worden
Nu om dit falen te begrijpen, moet je begrijpen waarom en hoe we onze bouwen
vermogensmodules die dichtheid oplossen op elk niveau is de IS
is de hoeksteen van het daadwerkelijk bereiken van onze systeemprestaties nu omdat ons x y -vlak wordt gebruikt
Hoge bandbreedte communicatie al het andere moet verticaal worden gestapeld
Dit betekent dat alle andere componenten anders dan onze dobbelsteen moeten worden geïntegreerd in onze vermogensmodules
Dat omvat nu onze klok en onze voedingen en ook onze systeemcontrollers
Nu waren de storingen in dit geval te wijten aan het verliezen van klokuitgang van onze oscillators
En na een uitgebreide foutopsporing ontdekten we dat de oorzaak te wijten was aan trillingen op de module van
Piëzo -elektrische effecten onze nabijgelegen condensatoren
Nu is het zingen van caps geen nieuw fenomeen en in feite veel gebruikelijk in machtsontwerp
Maar normaal gesproken worden klokchips in een zeer rustige deel van het bord geplaatst en vaak
niet beïnvloed door stroomcircuits, maar omdat we dit integratieniveau moesten bereiken, moeten deze oscillators
nu in de buurt van de nabijheid worden geplaatst vanwege onze schakelfrequentie en
Vervolgens veroorzaakte de gecreëerde trillingsresonantie het op onze MEMS -trillingen op onze MEMS
oscillator die ervoor zorgde dat het nu kraakte. De oplossing voor dit probleem is een
Multi-prug-aanpak We kunnen de trillingen verminderen door zachte terminale doppen te gebruiken
We kunnen ons MEMS -gedeelte bijwerken met een lagere Q -factor voor de buitenste vlakrichting
En we kunnen ook onze schakelfrequentiefrequentie bijwerken om de resonantie verder weg te duwen
gevoelige banden die nu toevoegen aan de tot de dichtheid uh bij
het systeemniveau dat we veel vooruitgang hebben geboekt op infrastructuurniveau
We wisten dat we elk aspect van de datacenter-infrastructuur opnieuw moesten onderzoeken
Om onze ongekende kracht en koeldichtheid te ondersteunen
We hebben een volledig op maat ontworpen CDU binnengebracht om Dojo's dichte koeling te ondersteunen
Vereisten en het verbazingwekkende is dat we dit kunnen doen tegen een fractie van de kosten versus het kopen van de plank en
het wijzigen en omdat onze Dojo -kast voldoende kracht en koeling integreert om te matchen
hele rij standaard IT -rekken die we nodig hebben om onze kast zorgvuldig te ontwerpen en
Infrastructuur samen en we hebben al verschillende iteraties van dit kabinet doorlopen om te optimaliseren
Dit en eerder in dit jaar begonnen we met het testen van onze kracht en koeling te testen
infrastructuur en we konden het over twee megawatt duwen voordat we ons onderstation struikelden en een telefoontje kregen van de
stad ja nu vorig jaar hebben we slechts een
Een paar componenten van ons systeem De aangepaste D1 Die en de trainingstegel maar
We plaagden de exit -pod als ons einddoel dat we door de resterende delen van ons systeem lopen die nodig zijn om te bouwen
Uit deze exit -pod nu is de systeemlade een belangrijk onderdeel van
Door onze visie op een enkele versneller te realiseren, kan het ons naadloos naadloos naadloos zijn
Verbind tegels niet alleen met elkaar in de kast maar tussen kasten
We kunnen deze tegels aansluiten op een zeer strakke afstand over de hele versneller
En dit is hoe we onze uniforme communicatie bereiken, dit is een gelamineerde busbalk die het toelaat
ons om mechanische en thermische ondersteuning van zeer hoog vermogen te integreren in een extreem dichte integratie
Het is 75 millimeter hoog en ondersteunt zes tegels bij 135 kilogram
Dit is het equivalent van drie tot vier volledig geladen high -performance rekken
Vervolgens moeten we gegevens voeden met de trainingstegels, hier hebben we de Dojo -interface -processor ontwikkeld
Het biedt ons systeem met hoge bandbreedte DRAM om onze trainingsgegevens te organiseren
En het biedt volledige geheugenbandbreedte aan onze trainingstegels met behulp van TTP onze gewoonte
protocol dat we kunnen gebruiken om over ons hele versneller te communiceren, het heeft ook een snelle ethernet
helpt ons dit aangepaste protocol uit te breiden boven standaard Ethernet en we bieden native hardware -ondersteuning
hiervoor met weinig tot geen software -overhead en ten slotte kunnen we verbinding maken
via een standaard Gen 4 PCIE -interface
Nu koppelen we 20 van deze kaarten per lade en dat geeft ons 640 gigabytes high
Bandbreedte DRAM en dit biedt onze uitgesplitste geheugenlaag voor onze trainingstegels
Deze kaarten zijn een high bandbreedte inname -pad zowel via PCIE als Ethernet
Ze bieden ook een hoog ratex z-connectiviteitspad dat snelkoppelingen in onze grote dojo mogelijk maakt
Accelerator nu integreren we de host daadwerkelijk
Direct onder onze systeemlade bieden deze hosts onze inname -verwerking en maken ze verbinding met onze interface
Processors via PCIe Deze hosts kunnen hardwarevideo bieden
Decoderondersteuning voor op video gebaseerde training en onze gebruikerstoepassingen landen hierop
Gastheren die we zodat we ze de standaard X86 Linux -omgeving kunnen geven
Nu kunnen we twee van deze assemblages in één kast plaatsen en het combineren met overbodige voedingen die het direct doen
Conversie van driefasige 480 volt AC -vermogen naar 52 volt DC -vermogen
Nu door ons te concentreren op de dichtheid op elk niveau, kunnen we de visie van een enkele realiseren
Accelerator begint nu met de uniforme knooppunten op onze aangepaste D1 Die
We kunnen ze met elkaar verbinden in onze volledig geïntegreerde trainingstegel en vervolgens eindelijk naadloos verbinding maken
ze over kabinetsgrenzen om onze dojo -versneller te vormen
En allemaal samen kunnen we twee volledige versnellers in onze exit -pod huisvesten voor een
gecombineerd één exaflop van ML Compute nu kan allemaal deze hoeveelheid van
Technologie en integratie zijn slechts een paar keer gedaan in de
Geschiedenis van Compute Vervolgens zullen we zien hoe software dit kan benutten om hun prestaties te versnellen
[Applaus]
Bedankt Bill, mijn naam is Rajiv en ik ga het hebben over een paar nummers, zodat onze softwarestapel begint met de PI
Torch Extension die spreekt over onze toewijding aan één standaard Pytorch -modellen buiten de doos
We gaan meer praten over onze JIT -compiler en de inname -pijplijn die de hardware met gegevens voedt
Samenvatting Performulaties Tops Times Times Utilisation Times Accelerator bezetting
We hebben gezien hoe de hardware piekprestaties biedt, de taak van de compiler is om het gebruik te extraheren uit de
Hardware terwijl de code erop wordt uitgevoerd en het is de taak van de inname -pijplijn om ervoor te zorgen dat gegevens kunnen worden belegd
bij doorvoer hoog genoeg voor de hardware om nooit te verhongeren, dus laten we het hebben over waarom communicatie
Gebonden modellen zijn moeilijk op te schalen, maar laten we eens kijken waarom ResNet 50 -achtige modellen gemakkelijker u opscherpen
Begin met een enkele versneller Run de voorwaartse en achterwaartse passen gevolgd door de optimizer
dan om dit op te schalen, voert u meerdere kopieën hiervan uit op multiple versnellers en terwijl de gradiënt wordt geproduceerd door
De achterwaartse pass moet worden verminderd en dit introduceert enige communicatie Dit kan pijplijn met de
Achteruit passeren deze setup -schalen bijna redelijk goed
lineair voor modellen met veel grotere activeringen
We komen een probleem tegen zodra we de voorwaartse pass -pass willen uitvoeren, de batchgrootte die in een enkele past
Accelerator is vaak kleiner dan het batchnormoppervlak, dus om deze onderzoekers te omzeilen, voert u deze setup meestal uit op meerdere
versnellers in synchronisatie -batchnorm -modus Dit introduceert latentie gebonden communicatie naar het kritieke pad van
de voorwaartse pas en we hebben al een communicatiebottleneck en hoewel er manieren zijn om rond te komen
Dit betreft ze meestal saai handmatig werk dat het meest geschikt is voor een compiler en uiteindelijk is er geen plinten
Rond het feit dat als uw staat niet in een enkel versneller past, kunt u communicatie -gebonden zijn
En zelfs met aanzienlijke inspanningen van onze ML -ingenieurs zien we dergelijke modellen niet lineair schalen
Het dojo -systeem is gebouwd om dergelijke modellen bij hoog gebruik te laten werken, de high
Dichtheidsintegratie is gebouwd om niet alleen de rekengebonden delen van een model te versnellen, maar ook de latentie
Gebonden delen zoals een batchnorm of de bandbreedte gebonden delen als een gradiënt
Alle verminderde of een parameter verzamelen allemaal een plakje van het dojo -mesh kan worden uitgehouwen
Uit om elk model uit te voeren wat gebruikers moeten doen, is het plakje groot genoeg maken om een
badkameroppervlak voor hun specifieke model daarna dat de scheidingswand zich voordoet
Als een grote versneller die de gebruikers vrijmaakt om zich zorgen te maken over de interne details van de uitvoering
en als de taak van de compiler om deze abstractie fijn korrelsynchronisatie primitieven in te handhaven
Uniforme lage latentie maakt het gemakkelijk om alle vormen van parallellisme te versnellen over integratiegrenzen Tensoren
worden meestal in SRAM geschaard en net op tijd gerepliceerd voor de uitvoering van de lagen We zijn afhankelijk van de hoge dojo
Bandbreedte om deze replicatietijd Tensor -replicatie te verbergen en andere gegevensoverdrachten worden overlapt met reken
en de compiler kan ook lagen opnieuw berekenen wanneer het winstgevend is om dit te doen
We verwachten dat de meeste modellen uit de doos werken als een voorbeeld dat we het onlangs uitgebrachte stabiele diffusiemodel hebben genomen en hebben gekregen
Het draaide op Dojo binnen enkele minuten uit de doos, de Kampala kon het op een model parallelle manier in kaart brengen op 25 dojo sterft
Hier zijn enkele foto's van een cybertruck op Mars gegenereerd door stabiele diffusie die op Dojo draait
Ziet eruit [applaus]
Het lijkt erop dat het nog steeds een aantal manieren heeft om te gaan voordat je het Tesla Design Studio -team matcht
Dus we hebben gesproken over hoe communicatie knelpunten de schaalbaarheid kunnen belemmeren, misschien een zure test van een compiler en
De onderliggende hardware is het uitvoeren van een cross-diabash-vormlaag zoals eerder vermeld, dit kan een serieel knelpunt zijn
De communicatiefase van een bachelor begint met knooppunten die het lokale gemiddelde en standaardafwijkingen berekenen dan
Coördineren om deze waarden te verminderen, en deze waarden vervolgens terug uitzenden en vervolgens hervatten ze hun werk parallel
Dus hoe zou een ideale batchvorm eruit zien op 25 dojo -stippen laten we zeggen de vorige minder activeringen
zijn al verdeeld over dobbelstenen, we zouden verwachten dat 350 knooppunten op elk
sterven om te coördineren en te produceren Lokaal gemiddelde en standaard divisiewaarden Idealiter zouden deze verder krijgen
verminderd met de uiteindelijke waarde die ergens eindigt en tegen het midden van de tegel, zouden we dan hopen een uitzending van te zien
Deze waarde die uit het midden straalt, laten we eens kijken hoe de compiler daadwerkelijk een echte vrijgezellenbewerking uitvoert
over 25 dobbelstenen werden de communicatiebomen uit de compiler en de
Timing is van een echte hardware, we gaan 8750 knooppunten zien op 25 sterft
Coördineren om het bakkengemiddelde en de standaardafwijkingskleppen te verminderen en vervolgens uit te zenden
Dial Local Reduction gevolgd door wereldwijde reductie naar het midden van de gelijkspel
Vervolgens wordt de verkleinde waarde uitgezonden die uit het midden wordt versneld door de uitzending van de hardware
faciliteit Deze operatie duurt slechts vijf
Microseconden op 25 dojo dobbelstenen dezelfde bewerking duurt 150 microseconden op 24
GPU's Dit is een grootte van grootte -verbetering ten opzichte van GPU's
En terwijl we het hebben over een volledig verminderde operatie in de context van een batchnorm, is het belangrijk om te herhalen dat de
Dezelfde voordelen zijn van toepassing op alle andere communicatieprimitieven en deze primitieven zijn essentieel voor grote schaal
training dus hoe zit het met volledige modelprestaties, dus terwijl we denken dat resonant 50 is
Geen goede weergave van de echte wereld Tesla -workloads Het is een standaard benchmark, dus laten we daar beginnen
We zijn al in staat om de 100 -dobbelsteen voor Die te matchen, maar misschien wel een vleugje Dojo's
Mogelijkheden is dat we dit nummer kunnen raken met slechts een batch van 8 per dobbelsteen
Maar Dojo was echt gebouwd om grotere complexe modellen aan te pakken, dus toen we de echte wereld wil aanpakken
Workloads We hebben gekeken naar de gebruikspatronen van onze huidige GPU -cluster en twee modellen stonden op de auto -labeling
Netwerken Een klasse offline modellen die worden gebruikt om grondwaarheid te genereren en de bezettingswerken die u heeft gehoord
Over de automatische labelsetwerken zijn grote modellen die een hoge rekenintensiteit hebben, terwijl de bezettingswerken
kunnen in justbound zijn, hebben we deze modellen gekozen omdat ze samen een groot deel van onze huidige GPU -cluster zijn
gebruik en ze zouden het systeem op verschillende manieren uitdagen
Dus hoe doen we op deze twee netwerken de resultaten die we op het punt staan te zien, werden voor beide gemeten op multi-Die-systemen
De GPU en Dojo maar genormaliseerd tot per die getallen op ons Auto Labeling Network zijn we
Al in staat om de prestaties van een A100 te overtreffen met onze huidige hardware die wordt uitgevoerd op onze oudere generatie VRM's op
Onze productiehardware met onze nieuwere VRAM's die zich vertalen in het verdubbelen van de doorvoer van een A100
En ons model toonde aan dat we met enkele belangrijke compiler -optimalisaties meer dan drie extra prestaties van een kunnen krijgen
A100 We zien nog grotere sprongen op het bezettingsnetwerk
bijna 3x met onze productiehardware met ruimte voor meer
Buitenlands [applaus]
Niveau van compilerprestaties We kunnen de ML -berekening van één twee drie vier vijf en zes GPU vervangen
dozen met slechts één Dojo -tegel [applaus]
En deze Dojo -tegel kost minder dan een van deze GPU -dozen whoa
ja wat het echt betekent, is dat netwerken
dat duurde meer dan een maand om te trainen, duurt nu minder dan een week
Helaas, wanneer we dingen meten, is het niet zo goed verlopen op het taart -fakkelniveau dat we niet hebben gezien
Onze verwachte prestaties uit de git en deze tijdlijndiagram toont ons probleem de kleine kleine kleine groene repen die dat zijn
De compilatiecode die op de versneller wordt uitgevoerd. De rij is meestal de witte ruimte waar de
Hardware wacht gewoon op gegevens met onze dichte ML Compute Dojo -hosts
hebben effectief 10x meer ML -reken dan de GPU -host De gegevenslader draait op deze ene host
Blijf op de hoogte van al die ML -hardware om onze schaalbaarheid van de gegevenslader op te lossen
Kwesties die we wisten dat we de limiet van deze enkele host moesten bereiken Het Tesla Transport Protocol beweegt gegevens
naadloos over hosttegels en inname -processors, dus hebben we de Tesla uitgebreid
Transportprotocol om te werken via Ethernet, we hebben vervolgens de Dojo -netwerkinterface gebouwd genaamd de DNIC om TTP te benutten
Ethernet Hiermee kan elke host met een Dnic -kaart het naar en
Van andere TTP -eindpunten, dus begonnen we met het Dojo -gaas
Vervolgens hebben we een niveau van gegevens voor het laden van gegevens toegevoegd die zijn uitgerust met de DNIC -kaart
We hebben deze hosts aangesloten op het gaas via een Ethernet -schakelaar nu elke host in deze gegevenslaadlaag kan
het bereiken van alle TTP -eindpunten in het Dojo -gaas via hardware versnelde DMA
Nadat deze optimalisaties in onze bezetting gingen, ging van vier procent
tot 97 procent, zodat de gegevenslaadsecties zijn verminderd
Gegevens De gegevenslaadsecties zijn drastisch verminderd en de ML -hardware wordt druk gehouden, we verwachten dit eigenlijk
Nummer om vrij snel naar 100 te gaan nadat deze veranderingen waren binnengegaan, zagen we de volledige verwachte snelheid van de Pytorch
laag en we waren terug in het bedrijfsleven, dus begonnen we met hardware -ontwerp dat
doorbreekt traditionele integratiegrenzen in dienst van onze visie op een enkele gigantische versneller
We hebben gezien hoe de compiler en alleen lagen bovenop die hardware bouwen, dus na het bewijzen van je prestaties
Deze complexe real-world netwerken wisten we wat onze eerste grootschalige implementatie zou richten op ons high
Autometische intensiteit Auto -etiketteringsnetwerken van rekenkundige intensiteit die vandaag 4000 GPU's meer dan 72 bezetten
GPU -rekken met onze dichte computer en onze hoge prestaties die we verwachten
Dezelfde doorvoer met slechts vier Dojo -kasten
[Applaus]
En deze vier Dojo -kasten zullen deel uitmaken van onze eerste exopod die we van plan zijn om te bouwen tegen kwartaal één van 2023
Deze is meer dan het dubbele van de auto -etiketteringscapaciteit van Tesla
[Applaus] Het eerste extra deel maakt deel uit van een totaal
van zeven extra delen die we van plan zijn om in Palo Alto te bouwen, hier over de muur
[Applaus] En we hebben een weergavekast van een van deze exopods voor iedereen om naar te kijken
Zes tegels dicht ingepakt op een dienblad 54 petaflops of Compute 640 gigabytes van
High bandbreedte geheugen met kracht en host om het te voeden
veel van en we bouwen nieuwe versies van
Al onze clustercomponenten en het constant verbeteren van onze software om nieuwe vaardighedenlimieten te bereiken, we geloven dat we
kan nog een 10x -verbetering krijgen met onze volgende generatie hardware
En om hun ambitieuze doelen te realiseren, hebben we de beste software- en hardware -ingenieurs nodig, dus kom alsjeblieft met ons praten of
Bezoek Tesla.com AI Dank u [applaus]
Oké, laat het me weten
Oké, dus we eh hopelijk was dat genoeg detail
en nu kunnen we naar vragen um en uh jongens uh zoals ik denk dat het team
Kwam terug op het podium en maar we wilden echt de diepte laten zien
en breedte van Tesla in um kunstmatige intelligentie
Bereken hardware -robotica -actuatoren en [muziek]
en probeer de perceptie van het bedrijf echt weg te verleggen van uh, weet u een
Veel mensen denken dat we alleen maar een autobedrijf zijn of dat we coole auto's maken, maar uh
Ze hebben niet dat de meeste mensen geen idee hebben dat Tesla misschien wel de leider is
AI -hardware en software in de echte wereld en dat we bouwen
wat is misschien wel de eerste UH enkele van de meest radicale
Computerarchitectuur sinds de Crayon Supercomputer en ik denk dat als je geïnteresseerd bent in
Een aantal van de meest geavanceerde technologie ter wereld ontwikkelen die de wereld echt zullen beïnvloeden in een
Positieve manier waarop uh ons vertelt de plek om te zijn, dus ja, laten we met wat wegschieten
Vragen die ik denk dat er een microfoon aan de voorkant is en een
microfoon aan de achterkant uh
heel erg bedankt, ik was hier onder de indruk, ja ik was heel erg onder de indruk van
Optimus maar ik vraag me af waarom ze niet op de jacht hebben gereden waarom heb je een
Tedere aangedreven aanpak voor de jacht omdat pezen niet erg duurzaam zijn en
Waarom goed wordt geladen, dit is best cool geweldig ja
Dat is een geweldige vraag, u weet als het gaat om elk type bedieningsschema, er zijn afwegingen
Tussen u weet of het een pees -urinesysteem is of niet een soort van links gebaseerd systeem waar ik gewoon in houd
geest dicht bij je mond een beetje dichterbij ja Jeremy cool um dus ja de belangrijkste reden waarom we gingen
Voor een peesgebaseerd systeem is dat je eerst weet dat we daadwerkelijk enkele synthetische pezen hebben onderzocht, maar dat hebben we gevonden
Metallic varenkabels zijn u een stuk sterker eh een van de voordelen van deze kabels
um is dat het erg goed is voor de deelreductie, we willen veel van deze handen maken, dus het hebben van een aantal delen a
Stelletje kleine banden is uiteindelijk dat je een probleem weet als je veel van de grote redenen maakt
dat u weet dat pezen beter zijn dan koppelingen in zekere zin is dat u anti-backlash kunt zijn
Dus anti-backlash in wezen weet je dat je geen gaten kunt hebben of jou
Ken stotterijbeweging in je vingers veer geladen, vooral wat er in de lente is geladen
Staat ons in staat te doen is dat we een actieve opening kunnen hebben, dus in plaats van dat te doen
hebben twee actuatoren om de vingers gesloten te besturen en dan open
gesloten en vervolgens strekken de veren passief uit en dit is iets dat ook in onze handen wordt gezien, we hebben de
Mogelijkheid om actief te buigen en dan hebben we ook de mogelijkheid om Yeah uit te breiden
Ik bedoel, ons doel met Optimus is om een robot te hebben die maximaal nuttig is als
Snel mogelijk, dus er zijn veel manieren om de verschillende problemen van een humanoïde robot op te lossen
um en uh, we zijn waarschijnlijk niet de juiste boom op alle technische
Oplossingen en ik zou moeten zeggen dat we open zijn voor het ontwikkelen van de technische oplossingen die u hier na verloop van tijd ziet
We zijn niet dat ze niet opgesloten zijn in stenen um, maar we moeten iets kiezen
Um in en we willen iets kiezen waarmee we de robot zo snel mogelijk kunnen produceren
en laat het zoals ik al zei, wees zo snel mogelijk nuttig, we proberen het doel van de snelste pad naar een te volgen
Handige robot die op volume kan worden gemaakt en we gaan de robot intern testen op Tesla Uh in onze fabriek
en uh en zie gewoon hoe nuttig het is omdat je een je moet hebben
Gaan om de lus op de realiteit te sluiten om te bevestigen dat de robot in feite nuttig is
um en uh ja, dus we gaan het gewoon gebruiken om dingen te bouwen en eh eh we zijn
zeker dat we dat kunnen doen met de hand die we momenteel hebben ontworpen, maar dit ben ik zeker dat ze versie twee hebben gehad
Versie drie en we kunnen de architectuur in de loop van de tijd vrij aanzienlijk veranderen
Sorry hoi um, je bent de optimus robot is echt indrukwekkend dat je het geweldig hebt gedaan
Bipedale robots zijn echt moeilijk eh, maar wat ik heb gemerkt dat in je plan zou ontbreken, is uh om de
nut van de menselijke geest en ik vraag me af of Optimus ooit een persoonlijkheid zal krijgen en in staat zal zijn om onze te lachen
grappen, terwijl ze goed hebben, vouwt het onze kleren, ja absoluut
eh ik denk dat we echt leuke versies van optimus willen hebben
zo um en zodat optimisten zowel utilitair kunnen zijn en taken kunnen doen, maar ook kunnen zijn
een beetje als een vriend um en een buddy en en um rondhangen met
jij en ik weet zeker dat mensen allerlei creatief gebruik zullen denken voor deze robot
um en uh weet je het ding als je eenmaal de kerninformatie en actuatoren hebt
bedacht dan dan kun je eigenlijk weten dat je allerlei
Kostuums denk ik op de robot, ik bedoel, je kunt de robot er uh uit laten zien
je kunt de robot op veel verschillende manieren scannen eh en eh ik weet zeker dat mensen uh zullen vinden
Zeer interessante manieren om uh ja versies van optimus dus zo te maken
Bedankt voor de geweldige presentatie, ik wilde weten of er een equivalent was aan interventies in optimus
Het lijkt erop te labelen door momenten waarop mensen het niet eens zijn met wat er aan de hand is, is belangrijk en in een humanoïde robot
Dat kan ook een wenselijke informatiebron zijn
Ja, het zei um ja ik denk dat we dat zullen hebben, we zullen manieren hebben
Remote bedienen de robot en interventie wanneer deze iets ergs doet, vooral als we de robot trainen en
Het ter sprake brengen van um en hopelijk weten we het op een manier waarop we de robot kunnen stoppen
Als het iets gaat raken, kunnen we het gewoon houden en het zal het stoppen, het zal niet zoals je weet dat je je hand verplettert of zoiets en dat zijn allemaal interventie
gegevens uh ja en we kunnen ook veel leren van onze simulatiesystemen waar we kunnen
Controleer op botsingen en begeleiden dat dat slechte acties zijn, ja ik bedoel zo optimus dat we in de loop van de tijd willen
voor het is dat je een Android-soort Android kent die je in sci-fi-films zoals hebt gezien
Star Trek, de volgende generatie, zoals gegevens, maar we kunnen de robot uiteraard programmeren om minder robotachtig en vriendelijker te zijn
En en uh weet je dat je duidelijk kunt leren mensen na te bootsen en je heel natuurlijk te voelen
Dus zoals AI in het algemeen verbetert, kunnen we dat toevoegen aan de robot en
um weet dat het duidelijk in staat zou moeten zijn om eenvoudige instructies te doen uh of zelfs
in het wat het is dat je wilt um zodat je het een UH -instructie op hoog niveau kunt geven en dan kan het dat breken
naar een reeks acties en en ondernemen die acties
hoi uh ja het is opwindend om te denken dat je met de optimus dat zult denken
U kunt orden van grootte van verbetering en economische output bereiken
eh dat is echt opwindend um en toen Tesla begon, was de missie om de komst van te versnellen
hernieuwbare energie of duurzaam transport dus met de optimus doe je
zie nog steeds die missie als deze missieverklaring van Tesla of wordt het bijgewerkt met jou, weet
missie om de komst van ik niet te versnellen, weet ik niet oneindige overvloed of
Onbeperkte onbeperkte economie ja, ik bedoel, het is niet strikt
Um Optimus spreken is niet strikt, uh
Direct in overeenstemming met uh versnellende duurzame energie die u kent
In de mate dat het efficiënter is om dingen voor elkaar te krijgen dan een persoon, denk ik dat ik helpt als je het weet
Duurzame energie, maar ik denk dat de missie effectief wel enigszins verbreedt met de komst van optimus uh
Uh weet je dat ik niet weet dat het geweldig maakt om de toekomst geweldig te maken, dus je weet dat ik denk dat je je denkt
Kijk naar optimisten en um ik weet over jou, maar ik ben opgewonden om te zien wat optimisten zullen worden
En je weet dat dit is zoals je weet als je zou kunnen, bedoel ik dat je het kunt zien zoals elke gegeven technologie
Als je het doet, wil je zien hoe het is in een jaar twee jaar drie jaar vijf jaar vijf jaar tien tien jaar
Ik zou zeker zeggen dat je zeker wilt zien wat er is gebeurd met Optimus UM, terwijl je een stel andere kent
Technologieën zijn u een soort van plateaed um over naamnamen hier, maar uh
[Gelach] um weet je dat
Ik denk dat Optimus over vijf jaar tien jaar ongelooflijk zal zijn, zoals verbluffend en ik ben echt
Geïnteresseerd om dat te zien gebeuren, ik hoop dat je het ook bent, oh denk ik
um, ik heb hier een korte vraag, ik ben Justin en ik vroeg me af of ben jij
Plan om te verlengen als conversatiemogelijkheden voor de robot en mijn tweede
Vervolgvraag daarop is wat het einddoel is, wat is het einddoel met Optimus
Uh ja optimisten zouden zeker conversatiemogelijkheden hebben
um ik ik, je zou ermee kunnen praten en een gesprek hebben en het zou helemaal aanvoelen
Natuurlijk dus vanuit een eindgesprekken Ik ben ik, ik weet het niet, ik denk dat het zal blijven
Blijf evolueren en ik weet niet zeker waar het terechtkomt, maar
sommigen een plek interessant, zeker, u weet zeker dat we altijd voorzichtig moeten zijn
over de u weet, ga niet naar het terminatorpad, dat is een weet je weet ik ik
Dacht dat we misschien moeten beginnen met een video van Like the Terminator die hiermee begint, weet je Skull
verpletterend, maar oh dat kan zijn, ik weet niet of je dat te serieus wilt nemen, dus ja, je weet dat we ons wel willen
Wees veilig, dus we zijn UH ontwerpen in UM -waarborgen waar u lokaal kunt
Stop de robot um en uh weet je dat het eigenlijk een gelokaliseerde
Control ROM die u niet kunt bijwerken via internet, waarvan ik denk dat dat best belangrijk is
um essentieel eerlijk gezegd um zo
uh zoals een gelokaliseerde stopknop um externe afstandsbediening zoiets als
dat dat niet kan worden veranderd um
Maar ik bedoel, het zal absoluut interessant worden, het zal niet saai zijn, dus
Oké ja, ik zie je vandaag, je hebt een heel aantrekkelijk product met dojo en de toepassingen, dus ik vraag me af wat de is
toekomst voor het Dojo -platform dat we graag willen bieden als een infrastructuurinfrastructuur en service zoals AWS of
Je zult als een verkoop een chip zoals de nvidia zijn, dus eigenlijk wat de toekomst is vanwege de ik zeg dat je een zeven gebruikt
nanometer dus de ontwikkelaarskosten zijn gemakkelijk meer dan 10 miljoen Amerikaanse dollar, hoe maak je de penis als een zakelijke
ja ik bedoel, um dojo is is een is een zeer grote computer eh en eigenlijk zullen we veel gebruiken
Power en heeft veel koeling nodig, dus ik denk dat het waarschijnlijk logischer zal zijn om Dojo te laten werken zoals uh
Amazon Web Services manier dan om het aan iemand anders te verkopen
um zo het meest dat de meest efficiënte manier zou zijn om Dojo te bedienen, is gewoon het zijn van een service die u
kan uh gebruiken die online beschikbaar is en dat waar u uw modellen kunt trainen manier
sneller en voor minder geld en dat als de
UM Wereldovergangen naar software 2.0
En dat is op de bingo -kaart iemand die ik ken, het moet weten hoe hij vijf tequilas moet drinken
Eh dus laten we kijken UM Software 2.0
[Gelach] Ja, we zullen veel neuraal net gebruiken
training dus uh weet je dat het een beetje logisch is dat er na verloop van tijd meer neuraal is
Netto dingen die mensen zullen willen gebruiken en uh de snelste laagste kosten neural
Netto trainingssysteem dus ik denk dat er veel kansen in die richting zijn
Hallo mijn naam is Ali Jahanian, bedankt voor dit evenement, het is erg inspirerend mijn
vraag is eh, ik vraag me af wat je visie is voor uh
Humanit -robots die onze emoties en kunst begrijpen en kunnen bijdragen
Onze creativiteit Nou, ik denk dat er een eh -um is
al robots zien die tenminste uh in staat zijn om zeer interessant te genereren
Kunst met zoals zoals Dali Um en Dali 2. Eh
En ik denk dat we we gaan zien AI die zelfs zelfs films kunnen genereren die een samenhang hebben
zoals interessante films en vertellen grappen, dus het is vrij opmerkelijk hoe snel AI is
UH bevorderen um bij veel bedrijven naast Tesla
We zijn op weg naar een zeer interessante toekomst en um ja dus
jullie willen daar commentaar op geven, ja ik denk dat de optimistische robot fysieke kunst kan bedenken, niet alleen digitale kunst
Je kunt je weten dat je om wat dansbewegingen in tekst of stem kunt vragen en dan kun je die in de toekomst produceren
Het is veel van fysiek hart, niet alleen digitale kunst oh ja ja, computers kunnen absoluut
Maak een fysieke kunst ja ja 100 ja zoals dans, ik speel zeker voetbal of wat je ook bent
eh ik bedoel, het moet wendbaarder worden, maar in de loop van de tijd zeker
Heel erg bedankt voor de presentatie voor de Tesla Autopilot -dia's die ik heb opgemerkt
dat de modellen die je gebruikte zwaar werd gemotiveerd door taalmodellen en ik vroeg me af wat de geschiedenis daarvan
was en hoeveel een verbetering het gaf, ik dacht dat dat een echt interessante nieuwsgierige keuze was om te gebruiken
Taalmodellen voor de overgang van de rijstrook, dus er zijn een soort van twee aspecten waarom we zo zijn overgestapt op taalmodellering
het eerste gesprek praat luid en dichtbij oké oké, ik heb het
Ja, dus de taalmodellen helpen ons op twee manieren op de eerste manier is dat het ons laat lanen voorspellen die we niet konden hebben
Anders zoals een eerder in principe vermeldde schade toen we rijstroken voorspelden op een soort dichte 3D -mode, kunt u alleen
Model bepaalde soorten rijstroken, maar we willen die crisscross -verbindingen binnenkruisingen krijgen, het is gewoon niet mogelijk om dat te doen zonder het een
Grafiekvoorspelling Als u dit met dichte segmentatie probeert te doen, werkt het gewoon niet, ook de Lane -voorspelling is een multimodaal
Probleem Soms heb je gewoon niet voldoende visuele informatie om precies te weten hoe dingen er op de andere uitzien
kant van de kruising, dus je hebt een methode nodig die kan generaliseren en produceren, je kent coherente voorspellingen je
Ik wil geen twee rijstroken voorspellen in drie rijstroken, tegelijkertijd die u wilt binden aan één in een generatief model zoals deze taalmodellen, biedt dat
hoi oh hoi uh mijn naam is giovanni um ja bedankt voor de presentatie
Dat is echt leuk, ik heb een vraag voor ons FSD -team, dus voor de neurale netwerken hoe doe je dat
test zoals hoe doe je eenheidstestsoftware -eenheidstests daarop zoals je hebt als een stel of ik weet het niet midden
duizenden of uh ja uh gevallen waar
Dus het neurale netwerk dat je het nadat je het hebt getraind, moet doorgeven voordat je het als een product goed uitgeeft, ja
Wat is de teststrategieën voor software -eenheid voor dit eigenlijk ja, blij dat je hebt gevraagd dat er een reeks tests is
dat we UH hebben gedefinieerd, beginnend bij u weet eenheidstest voor de software zelf, maar dan hebben we voor de neurale netwerkmodellen VIP -sets gedefinieerd waar
je weet dat je uh kunt definiëren als je gewoon een grote testset hebt die niet genoeg is wat we vinden, we hebben het nodig
geavanceerde UH VIP -sets voor verschillende faalmodi en vervolgens cureren we ze en laten ze groeien in de tijd van de
Product dus door de jaren heen hebben we honderdduizenden voorbeelden waar we in het verleden zijn falen
dat we hebben samengesteld en dus voor elk nieuw model dat we testen tegen de hele geschiedenis van deze mislukkingen uh en dan
Blijf toevoegen aan deze test die hierop is ingesteld, we hebben schaduwmodi waar we deze modellen in stil zijn
de auto en we krijgen gegevens terug over waar ze falen of slagen aan de UH en er is een uitgebreid QA -programma
Moeilijk om een regressie te verzenden, er zijn negen niveaus van filters voordat het klanten raakt, maar dan hebben we echt goed
Infra om dit allemaal efficiënt te maken en ik ben een van de QA -testers, dus ik QA
De auto ja, zoals een maker, ja, dus ik ben constant in de auto
In de wachtrij staan zoals de nieuwste Uh Alpha -build is dat niet helemaal crasht
vindt veel bugs uh hoi um geweldige gebeurtenis Ik heb een vraag
over UH -fundamentele modellen voor uh heb ik allemaal gezien dat uh grote modellen die
kan echt wanneer u opschaalt met gegevens en modelparameter direct van GT3 tot
Palm Het kan nu eigenlijk redeneren, zie je dat het essentieel is, skinning is
Fundamentele modellen met gegevens en grootte verhogen en dan kunt u tenminste een
Model van lerarenrecht dat mogelijk alle problemen kan oplossen en dan destilleer je tot een studentenmodel dat hoe is hoe
Je ziet fundamentele modellen die relevant zijn voor 100 Ik bedoel
Heb gewoon modellen die in de auto lopen, we trainen modellen die volledig offline zijn die extreem groot zijn dat niet kan
Ren in realtime op de auto, dus we lopen die offline op de servers die echt goede labels produceren
die vervolgens de online netwerken kan trainen, dus dat is een vorm van destillatie van
Deze leerkrachtstudentenmodellen in termen van funderingsmodellen, we bouwen een aantal echt heel groot
Data -sets waarvan u kent, zijn meerdere petabytes en we zien dat sommige van deze taken echt goed werken als we
Heb deze grote gegevenssets zoals de kinematica zoals ik noemde video in alle kinematica uit alle objecten
En tot de vierde afgeleide en mensen dachten dat we geen detectie konden doen met de dieptesnelheid van de camera's detectiedetectie
versnelling en stel je voor hoe nauwkeurig deze moeten zijn om deze hogere orde derivaten nauwkeurig te zijn en dit alles
komt uit dit soort grote gegevenssets en grote modellen, dus we zien het equivalent van funderingsmodellen op onze eigen manier voor
Geometrie en kinematica en dingen zoals die je wilt toevoegen, John
Ja, ik zal het in principe kort houden wanneer we trainen op een grotere gegevensset, we zien Big Oké, eigenlijk wanneer we
Train op een grotere gegevensset zien we grote verbeteringen in onze modelprestaties en eigenlijk wanneer we onze initialiseren
Netwerken met u kennen een pre-trainingsstap van een andere hulptaak We zien in feite verbeteringen
Zelfbewust of onder toezicht met grote gegevenssets, beide helpen veel veel
Hé, dus in het begin zei Elon dat Tesla mogelijk geïnteresseerd was in het bouwen van kunstmatige algemene intelligentie
Systemen gezien de potentieel transformerende impact van dergelijke technologie, lijkt het verstandig om in te investeren
Technische AGI -veiligheid UH -expertise In het bijzonder weet ik dat Tesla veel doet
Technisch smal AI Safety Research Ik was benieuwd of Tesla van plan was
Probeer specifiek expertise op te bouwen in technische kunstmatige algemene intelligentie -veiligheid
Nou als ik bedoel, als het begint te zien alsof we uh een belangrijke bijdrage leveren aan kunstmatige
Algemene intelligentie dan dan zullen we zeker investeren in UH -veiligheid, ik ben een groot voorstander van AI -veiligheid, denk ik daar
zou een soort regelgevende autoriteit moeten zijn op het niveau van de overheid, net zoals er een
Regulerende autoriteit voor uh alles dat de openbare veiligheid beïnvloedt, dus we hebben een regelgevende autoriteit voor vliegtuigen en
Auto's en uh soort voedsel en drugs en omdat ze de openbare veiligheid en AI beïnvloeden
heeft ook invloed op de openbare veiligheid, dus ik denk dat um en dit is niet echt iets dat ik denk dat het nog begrijpt, maar ik
denk dat ik denk dat er een scheidsrechter moet zijn die uh zorgt voor um of probeert te zorgen voor uh openbaar
Veiligheid voor uh agi um en je denkt er zo aan als wat zijn
de elementen die nodig zijn om AGI zoals UH te maken, de toegankelijke gegevensset is extreem
belangrijk en als je een groot aantal auto's en humanoïde robots hebt, uh
Verwerking kent u petabytes van videogegevens en
audiogegevens van de echte wereld, net als mensen, dat is dat zou kunnen zijn
De grootste gegevensset is waarschijnlijk de grootste gegevensset UM omdat je daarnaast kunt
Uiteraard scannen het internet -um stapsgewijs, maar wat internet niet helemaal kan doen, is
heeft miljoenen of honderden miljoenen camera's in de echte wereld
Zoals ik al zei met audio en en uh en andere sensoren, dus ik denk dat we
Waarschijnlijk zal de meeste gegevens um en waarschijnlijk de meeste tr.
trainingskracht daarom waarschijnlijk uh we zullen een
bijdrage aan Agi
hey um, ik heb gemerkt dat de semi daar was, maar we hebben er niet teveel over gesproken, ik vroeg me gewoon af voor de semi -vrachtwagen
Wat zijn de UH -veranderingen waar je aan denkt vanuit een senserend perspectief, ik stel me voor dat er heel anders is
Vereisten natuurlijk dan alleen een auto als en als je niet denkt dat dat waar is, waarom is dat dan
uh nee ik denk dat u in principe een auto kunt besturen Ik bedoel, denk na over wat een voertuig drijft, het is een biologisch
neurale net uh met uh met ogen met camera's in wezen dus als um en echt
wat is je je primaire sensoren zijn uh twee uh camera's op een langzaam gimbal a zeer
langzaam gimbal um dat is uh, dat is je hoofd uh dus als
Als u weet of een biologisch neuraal net met met twee camera's op een langzame gimbal een semi -vrachtwagen kan besturen
um als je acht camera's hebt met continue 360 graden visie uh
werken met een hogere framesnelheid en een veel hogere reactiesnelheid, dan denk ik dat het duidelijk is dat u een semi of een voertuig moet kunnen besturen.
beter dan een mens hallo mijn naam is akshay bedankt voor de
evenement uh ervan uitgaande dat u weet dat optimus zou worden gebruikt voor verschillende use cases en
zou in een ander stuk evolueren voor deze use cases uh zou het mogelijk zijn
Om verschillende software- en hardwarecomponenten onafhankelijk te ontwikkelen en te implementeren en te implementeren
In de in optimus zodat de algemene functieontwikkeling sneller is voor
Optimus verwijzing naar de vragen
oke goed, we hebben uh helaas niet begrepen, ons neurale net heeft de vraag niet begrepen
uh ja zo goed de volgende vraag
Ik wil een versnelling schakelen naar de stuurautomaat, dus um wanneer jullie van plan zijn om de
FSD -bèta naar andere landen dan de VS en Canada en ook mijn volgende vraag is
Wat is het grootste knelpunt of de technologische barrière die u denkt in de huidige volgorde deel van de stapel en hoe
U wilt dat u oplossen om de stuurautomaat te maken, is aanzienlijk beter dan de mens in termen van een prestatiematrix
Veiligheidsborging en het menselijk vertrouwen, ik denk dat je ook 4V UH FSTB matcht
Of wat jullie ook zijn, gaan de snelweg en de stad combineren als een enkele stapel en een aantal architecturale uh
Grote verbetering kun je misschien een beetje experimenteren, dank je wel, nou, dat is een hele reeks
vragen goed we we ik, we hopen dat ik het kan kunnen doen, denk ik
Vanuit technisch oogpunt zou um fsd bèta moeten zijn, het zou mogelijk moeten zijn om die sfsd bèta uh te rollen
Wereldwijd tegen het einde van dit jaar um um maar we weet het voor veel van veel
landen We hebben wettelijke goedkeuring nodig um en daarom zijn we enigszins verstreken door de wettelijke goedkeuring in andere landen
um maar ik weet het, maar ik denk dat het vanuit het technische standpunt klaar zal zijn
ga uh naar een wereldwijde bèta tegen het einde van dit jaar en er is een behoorlijk grote
Verbetering die we verwachten volgende maand uit te brengen UH die altijd bijzonder goed zal zijn in uh
het beoordelen van de snelheid van snel bewegend kruisverkeer en een heleboel andere dingen, zodat iedereen die wordt uitgebracht
Voor de objecten ja, denk ik, dus vroeger was er veel verschillen tussen de productie
Autopilot en de volledige zelfrijdende bèta, maar die verschillen zijn in de loop van de tijd kleiner en kleiner geworden, denk ik
Slechts een paar maanden geleden gebruiken we nu dezelfde visie alleen objectdetectiestapel in zowel FSD als in de productie
Autopilot op alle voertuigen Um Er zijn nog steeds enkele verschillen, de primaire is de manier waarop we
Voorspel lanen nu, dus we hebben de modellering van Lane geüpgraded zodat het deze meer complexe geometrieën aankan zoals ik in het gesprek heb genoemd
Productiezuigerot We gebruiken nog steeds een eenvoudiger rijstrookmodel, maar we breiden onze huidige FSD -bèta -modellen uit om in te werken
Alle soorten snelwegscenario's ook uh ja en de versie van uh fst
Beta die ik rijd, heeft eigenlijk de geïntegreerde stapel, dus deze uh gebruikt het
FSD Stack uh zowel in stadsstraten als snelweg als uh het werkt best goed voor mij, maar we moeten het valideren
allerlei weersomsten zoals zware regen sneeuwstof um en uh en zorg ervoor dat het dat is
UH werken als beter dan de productiestapel in u weet over een breed bereik
van UH -omgevingen, maar we zijn vrij dicht bij die eh. Ik bedoel, ik denk dat ik het misschien niet weet
Ik zal zeker voor het einde van het jaar zijn en misschien november ja in onze persoonlijke drives uh de FSD
Stapel op snelwegaandrijvingen al veel beter dan de productiestapel die we hebben en we verwachten ook de
Parkeerplaatsstapel als onderdeel van de FSC -stapel voor het einde van dit jaar, dus dat zal ons in feite naar u toe brengen
Ga voor het einde van dit op de auto op de parkeerplaats zitten en rijd tot het einde van de parkeerplaats op een parkeerplaats
jaar ja en en en in termen van de soortgelijke de fundamentele de fundamentele meetwaarde om tegen te optimaliseren is
eh hoeveel mijl per tussen een noodzakelijke interventie dus
um gewoon massaal verbeterd hoeveel mijl de auto volledig kan rijden
Autonomie vóór een interventie vereist is dat uh veiligheidskritieke um zo is
ja dat is uh, dat is de fundamentele statistiek die we elke week UH meten en we maken radicaal
verbeteringen op die hoi bedankt hoi heel erg bedankt voor
de presentatie erg inspirerend mijn naam is Daisy, ik heb eigenlijk een niet-technisch
vraag voor jou ben ik benieuwd, als je terug bent naar je twintig
De dingen die je wou dat je toen wist wat een advies was dat je aan je jongere zelf zou geven
Nou, ik probeer iets nuttigs te achterhalen uh om te zeggen
ja ja, ik ben lid geworden van Tesla zou één ding zijn um
um ja ik denk dat ik over het algemeen probeer om jezelf bloot te stellen aan zoveel slimme mensen
mogelijk en ik lees veel boeken
um weet je dat ik dat doe, maar uh
Dus eh, ik denk dat er ook enige verdienste is
uh houdt ervan niet niet noodzakelijkerwijs te intense uh te zijn en te genieten van de
Een moment een beetje meer, ik zou tegen 20 of 20 iets zeggen, ik weet gewoon dat je weet uh
Stop en ruik de rozen af en toe zou waarschijnlijk een goed idee zijn
Um weet je dat het is alsof we de Falcon One Rocket ontwikkelen
en uh op het quadiline -atol en we hadden dit prachtige kleine eiland dat
We ontwikkelen de raket aan en niet één keer dat ik in die hele tijd zelfs heb gedronken op de
Strand, ik ben zo goed, ik had iets op het strand moeten drinken dat goed zou zijn geweest
Heel erg bedankt uh, ik denk dat je alle robotica -mensen hebt enthousiast
Met optimus uh voelt dit ongeveer 10 jaar geleden aan bij het rijden, maar als uh
Rijden is moeilijker gebleken dan het er eigenlijk 10 jaar geleden uitzag, wat weten we nu dat we dat 10 jaar geleden niet hebben gedaan
dat zou bijvoorbeeld Agi op een humanoïde maken
Nou, ik bedoel, het lijkt mij dat Hei heel snel vooruitgaat um eh
Er gaat nauwelijks een week voorbij zonder een belangrijke aankondiging en uh ja ik bedoel
Op dit punt lijkt AI te kunnen winnen bij bijna elk op regels gebaseerde game
uh het is in staat om een extreem indrukwekkende kunst um te creëren
deelnam aan gesprekken die zeer verfijnd zijn, weet je
Schrijf essays en deze blijven gewoon verbeteren
Um en er is er zoveel meer, maar zoveel meer getalenteerde mensen die werken
op AI en de hardware wordt beter, ik denk dat het een is, het is een ai
als een sterke exponentiële curve van verbetering onafhankelijk van wat we doen
Tesla um en natuurlijk zullen we enigszins profiteren van die exponentiële curve van
Verbetering met AI UM -toegankelijk is toevallig ook erg erg
Goed in actuatoren die je kent, motors versnellingsbakken controllers power elektronica batterijen
um sensoren en um weet je echt zoals ik zeg dat je het weet
Het grootste verschil tussen de robot op vier wielen en de robot met armen en benen is het krijgen van de actuatoren
goed eigenlijk is het een probleem met actuators en sensoren en duidelijk weet je hoe je weet hoe je bent
Controleer die actuatoren en sensoren, maar het is een ja -actuators en sensoren en hoe jij
controle de actuators Het is een ik weet waar je de ingrediënten moet hebben die nodig zijn om een te maken
dwingende robot en we doen het zo
hoi elan uh je brengt de mensheid eigenlijk naar het volgende niveau letterlijk Tesla en
Je brengt de mensheid naar het volgende niveau, dus je zei optimus prime uh
Optimus zal worden gebruikt in de volgende Tesla -fabriek, mijn vraag is een nieuwe Tesla
Factory wordt volledig uitgevoerd door Optimus Program en
En wanneer kan algemene openbare orde een humanoïde ja ik denk dat het zal zijn, weet je dat we zijn
gaan beginnen met optimisten met zeer eenvoudige taken in de fabriek um, weet je, misschien net als laden
Afgezien zoals je zag in de video die een deel laadt uh voor u weet dat u afgezien van een
Plaats naar een ander of laad een deel in um een van onze meer conventionele robot
cellen uh voor u weet uh dat het lichaam bij elkaar lets, dus we zullen beginnen, weet je dat
Gewoon proberen hoe we het überhaupt nuttig maken en vervolgens en vervolgens geleidelijk het aantal situaties uitbreiden waarin het is
nuttig um en ik denk dat dat het aantal situaties waar optimus
is nuttig, zal het exponentieel groeien eh zoals echt heel snel
um in termen van wanneer mensen er een kunnen bestellen, weet ik niet dat ik denk dat het niet zo ver is
weg eh nou, ik denk dat je bedoelt wanneer mensen er een kunnen ontvangen
um dus ik weet niet dat ik niet zoals ik zou zeggen dat ik waarschijnlijk binnen drie jaar zou zeggen dat ik niet meer ben
dan vijf jaar binnen drie tot vijf jaar zou je waarschijnlijk een optimus kunnen ontvangen
Ik voel de beste manier om de vooruitgang te boeken voor AGIS om zoveel mogelijk slimme mensen over de hele wereld te betrekken en gegeven
De grootte en bron van Tesla in vergelijking met robotbedrijven en op dit moment de staat van de mensheidsonderzoek gegeven
zou niet logisch zijn voor het soort Tesla om een soort van de source een deel van de
Simulatiehardware -onderdelen Ik denk dat Tesla nog steeds de dominante platformer kan zijn
waar het zoiets kan zijn als Android OS of zoals iOS -dingen voor de hele mens of onderzoek zou dat zijn
iets dat in plaats van de optimus voor alleen Tesla -onderzoekers of de
Factory zelf kan het openen en de hele wereld menselijk onderzoek laten verkennen
eh ik denk dat we voorzichtig moeten zijn dat optimus potentieel uh uh gebruikt op manieren die slecht zijn, want dat is er een
Van de mogelijke dingen om te doen, denk ik dat we zouden weten dat je zou weten
Zorg voor optimisten waar u instructies kunt geven aan optimisten, maar waar die instructies
weet je dat je wordt geregeerd door sommige wetten van robotica die je niet kunt overwinnen
Dus je weet dat anderen geen kwaad doen aan anderen en uh
het zou hebben als ik denk dat waarschijnlijk nogal wat veiligheidsgerelateerde dingen met optimus ja dus goed
Neem misschien nog een paar vragen en dan en dan en dan bedankt allemaal voor het komen
Vragen um één diep en één breed op de diepte voor optimus wat is de
Huidige en wat is de ideale controller bandbreedte en dan in de bredere vraag UH is er zo groot
advertentie voor de diepte en breedte van het bedrijf waar het uniek over is
Tesla die het mogelijk maakt dat iedereen de bandbreedte wil aanpakken
Vraag ja ja dus de technische bandbreedte van het kostuum
oke voor de bandbreedte -vraag die je moet begrijpen of of of uitzoeken wat de
Taak die u wilde doen en wat de gratis is als u een frequentietransformatie van die taak hebt genomen, wat is het dan
U wilt dat uw ledematen doen en dat is waar u uw bandbreedte haalt, het is geen nummer dat u specifiek kunt zeggen dat u uw gebruik moet begrijpen
Case en dat is van dat is waar de bandbreedte komt van uh oke wat is de brede vraag
Ik herinner me niet helemaal het breedte en diepte dat ik de breedte en diepte kan beantwoorden, maar ja
Ik was interessant op de achterkant van de vraag, ik denk dat we waarschijnlijk gewoon de bandbreedte of jij zullen vergroten
weet wat zich vertaalt in het effect van UH behendigheid UM en reactietijd van de robot
um zoals je zou kunnen redden, staat dat het niet één hertz um is en het is misschien dat je niet hoeft te gaan
helemaal tot 100 Hertz uh, maar ik weet het misschien niet 10 25 Ik weet het niet
In de loop van de tijd denk ik dat de bandbreedte zal toenemen, wat uh of of vertaald zal worden in UH behendigheid en latentie
um uh, je zou dat in de loop van de tijd willen minimaliseren, ja minimaliseer de latentie maximaliseren behendigheid
eh ik bedoel in termen van breedte en diepte um, ik denk dat je weet dat we het hebben
We zijn op dit moment een behoorlijk groot bedrijf, dus we hebben veel verschillende expertisegebieden die we noodzakelijk moeten hebben
zich ontwikkelen om autonoom te maken of om elektrische auto's te maken en vervolgens om autonoom elektrisch te maken
auto's eh we hebben we gewoon ik bedoel, Tesla is als een hele reeks startups in principe en
Um tot nu toe zijn ze bijna allemaal behoorlijk succesvol geweest um, dus we moeten iets goed doen
um en ik weet dat ik een van mijn UH -kernverantwoordelijkheden beschouw, uh Iranian Company is om een omgeving te hebben waar
Uh geweldige ingenieurs kunnen floreren en en ik denk in veel bedrijven
Ik weet het misschien niet de meeste bedrijven, als iemand een echt getalenteerde gedreven ingenieur is, kunnen ze dat eigenlijk niet
uh hun hun talenten zijn onderdrukt bij veel bedrijven en het is je weet dat
en en sommige bedrijven die het engineering talent wordt onderdrukt op een manier die misschien niet duidelijk slecht is
Maar waar het gewoon zo comfortabel is en je hebt zoveel geld betaald en jij, maar jij bent de output die je echt moet doen
Producten is zo laag dat het als een honingval is, weet je, dus er zijn er een paar
Honingval uh plaatsen in Silicon Valley uh waar ze niet noodzakelijkerwijs geen slechte plaatsen voor ingenieurs lijken, maar
Je hebt gezegd dat een goede ingenieur naar binnen ging en wat zijn ze uitgekomen
en de output van dat engineering talent lijkt het erg laag
Hoewel er lijken te genieten van zichzelf, daarom ben ik het er een paar honingvalbedrijven in
Silicon Valley Uh Tesla is geen honingval die we eisen en het is alsof je veel gedaan krijgt
eh en het wordt echt coole eh en het is dat je weet dat het niet gemakkelijk wordt
Maar als je een super getalenteerde ingenieur bent, zullen je talenten uh worden gebruikt, ik
Denk in grotere mate dan ergens anders na
je kent SpaceX ook op die manier zo highline uh uh ik heb twee vragen dus
beide aan het Autopilot -team, dus het ding is als uh, ik heb de afgelopen jaren je voortgang gevolgd, dus vandaag
Je hebt wijzigingen aangebracht zoals de magere detectie zoals je zei dat je, net als voorheen, direct semantische segmentatie doet
Gebouwde overdrachtsmodellen voor het bouwen van de rijstroken, dus wat zijn een andere enkele andere veel voorkomende uitdagingen die jullie
worden nu geconfronteerd met zoals u in de toekomst oplost als nieuwsgierige ingenieur, zodat wij als onderzoeker kunnen werken
Over degenen die daaraan beginnen te werken en de tweede vraag is alsof ik echt nieuwsgierig ben naar de Data Engine zoals jij
Jongens hebben een geval verteld als waar de auto wordt gestopt, dus hoe vind je zaken die heel veel vergelijkbaar zijn
Tot dat van de gegevens die u zo weinig meer op de datamotor hebt, zou geweldig zijn, dus dat is het goed
eh ik zal beginnen met de eerste vraag die uh gebruikt met het gebruik van de bezettingsnetwerk als een voorbeeld dus uh wat u in de presentatie zag
bestond niet een jaar geleden, dus we brachten maar een jaar door met de tijd dat ik een relatie heb met meer dan 12 bezetting
Netwerk en u hebt een één funderingsmodel eigenlijk om de hele te vertegenwoordigen
fysieke wereld overal en jij altijd de aandoening is eigenlijk echt
Echt een uitdaging, dus pas meer dan een jaar geleden zijn we een beetje als een 2d rijden waar als er een oorlog is en
er staat curve die we een beetje vertegenwoordigen met dezelfde statische rand die duidelijk is dat je weet dat niet niet ideaal is, is er een
Groot verschil tussen een curve en een muur wanneer je rijdt, maak je verschillende keuzes goed, dus nadat we dat beseffen
We moeten naar 3D gaan, we moeten in feite het hele probleem opnieuw synchroniseren en nadenken over hoe we dat aanpakken, dus dit zal
wees als een voorbeeld van uitdagingen, we hebben uh uh, we hebben het afgelopen jaar een verovering
Ja om de vraag te beantwoorden over hoe we daadwerkelijk voorbeelden van de lastige gestopte auto's vinden, zijn er een paar manieren te gaan
hierover, maar twee voorbeelden zijn er een die we kunnen activeren voor meningsverschillen binnen onze signalen, dus laten we zeggen dat geparkeerd bit
Flikkers tussen geparkeerd en rijden zullen die terug activeren en de tweede is dat we meer van de schaduwmodus kunnen benutten
logica dus als de klant de auto negeert, maar we denken dat we ervoor moeten stoppen, krijgen we die gegevens ook terug, dus deze zijn gewoon
verschillend zoals verschillende trigger -logica waarmee we die gegevenscampagnes kunnen terugkrijgen
hoi uh bedankt voor de geweldige presentatie, heel erg bedankt uh dus daar
zijn veel bedrijven die zich richten op het AGI -probleem en een van de redenen waarom het zo'n moeilijk probleem is
Omdat het probleem zelf zo moeilijk is om te definiëren, hebben verschillende bedrijven verschillende definities waarop ze zich concentreren op
verschillende dingen dus wat is Tesla hoe is Tesla het ATI -probleem en waar je op specifiek op richt
Nou, we zijn niet echt specifiek gericht op Agi, ik ben gewoon
Zeggen dat HGI zo is, lijkt waarschijnlijk een opkomende eigenschap van wat we zijn
Um doen omdat we al deze autonome auto's en autonome humanoïden maken
um die eigenlijk uh zijn binnen een echt gigantische gegevensstroom die binnenkomt
en en verwerkt zijn, het is verreweg de meeste gegevens en gegevens van de echte wereld en gegevens waar u niet doorheen kunt
Gewoon op internet zoeken omdat je daar in de wereld moet zijn en met mensen moet communiceren en met de wegen omgaat en en alleen jij
weet dat de aarde een grote plaats is en de realiteit is rommelig en gecompliceerd um dus ik denk dat het een soort van uh is
waarschijnlijk lijkt het gewoon gewoon een opkomend eigendom van als je je tientallen of honderden miljoenen
Autonome voertuigen en en misschien zelfs een vergelijkbaar aantal humanoïden uh misschien meer dan dat op het humanoïde front
eh nou, dat is gewoon de meeste gegevens um en als die video wordt verwerkt
Het lijkt gewoon waarschijnlijk dat je weet dat de auto's zeker veel beter zullen worden dan de mens
stuurprogramma's en de humanoïde robots zullen steeds meer worden
misschien niet te onderscheiden van mensen misschien en dus en dus zoals je zei dat je een hebt
opkomende eigendom van van agi um
En misschien wel de u kent mensen die gezamenlijk zijn, zijn ook een soort super intelligentie, vooral als wij
Verbeter de gegevenssnelheid tussen mensen, ik bedoel, denk dat zo al in de vroege dagen het internet lijken te zijn
Alsof het internet was alsof um de mensheid een zenuwstelsel verwerfde waar nu ineens iemand
Element van de mensheid kan de kennis van mensen van mensen kennen door verbinding te maken
op internet bijna alle kennis of zeker een groot deel ervan, terwijl we voorheen zouden ruilen
Informatie door osmose door u weet dat we moeten leuk vinden om gegevens over te dragen, zodat u een brief moet schrijven
Iemand zou de brief door persoon naar een andere persoon moeten dragen en vervolgens een hele reeks dingen tussenin en
Toen was het als deze positie ja, ik bedoel, het is waanzinnig traag als je erover nadenkt
Het um en zelfs als je in de Library of Congress was, had je nog steeds geen toegang tot alle informatie van de wereld en jij
Kon het zeker niet doorzoeken en ik weet dat er duidelijk weinig mensen in de bibliotheek van het Congres zijn, dus
eh ik bedoel een van de grote um een soort gelijkheidselementen
zoals internet is de meest de grootste gelijkmaker in de geschiedenis in
Toegang van toegang tot informatie of kennis um in elke student van de geschiedenis denk ik
zou het hiermee eens zijn omdat je weet dat je duizend jaar teruggaat, er waren heel weinig boeken zoals
Zoals en boeken zouden ongelooflijk duur zijn, maar slechts een paar mensen wisten hoe ze moesten lezen en alleen als een nog kleiner
Aantal mensen hebben nu zelfs een boek gehad, kijk er nu naar zoals jij, je hebt meteen toegang tot elk boek dat je kunt leren
alles voor in principe gratis, het is behoorlijk ongelooflijk zo
weet je dat mij onlangs werd gevraagd welke periode van geschiedenis zou ik liever zijn
Het is maximaal en mijn antwoord was nu
Dit is de meest interessante tijd in de geschiedenis en ik heb veel geschiedenis gelezen
Dus laten we oh ja, laten we ons best doen om dat in stand te houden, ja
En om terug te gaan naar een van de vroege vragen die ik zou beantwoorden zoals je het ding kunt dat in de loop van de tijd is gebeurd
Met betrekking tot Tesla Autopilot is dat we alleen de
De neurale netten hebben geleidelijk meer en meer software geabsorbeerd en in de limiet natuurlijk jij
zou kunnen zeggen gewoon de video's te nemen zoals gezien door de auto uh en deze met deze vergelijken
De stuuringangen van het stuurwiel en de pedalen die zeer eenvoudige ingangen zijn en het zou in principe kunnen
Train met niets tussenin, want dat is wat mensen doen met een biologisch neuraal net dat je zou kunnen trainen
Gebaseerd op video en uh en en wat de video traint, is het verhuizen van
Het stuurwiel en de pedalen zonder andere software daartussenin zijn we er nog niet, maar het is geleidelijk
in die richting gaan oh oké, wacht de laatste vraag
Ga je je hind ik denk dat we hier een vraag hebben, uh hallo daar, ik zal er twee doen
Vragen prima daar, um hoi uh bedankt voor zo'n geweldige presentatie goed de oude vraag als laatste
Um met FSD die door zoveel mensen wordt gebruikt, uh denk dat wat de com is, hoe evalueert u het risico van het bedrijf
Tolerantie in termen van prestatiestatistieken en denkt u dat er meer transparantie of regulering van derden moet zijn over hoe goed is
genoeg en um definiërende drempels voor prestaties uh over
een paar kilometers zeker wel, weet je weet dat ik het weet
Het nummer één ontwerp UH -vereiste bij Tesla is veiligheid, zo um like en dat
gaat over de hele linie, dus in termen van de mechanische veiligheid van de auto hebben we de laagste kans op letsel van auto's
Ooit getest door de overheid op slechts een passieve mechanische veiligheid in wezen
Crashstructuur en airbags en wat dan ook, we hebben de beste uh uh de hoogste
Beoordeling voor actieve veiligheid ook en um Ik denk dat het op het punt zal komen
Waar u de veiligheid van veiligheid zo belachelijk goed is dat het is dat het is alsof het gewoon absurd beter is dan een mens
um en dan met betrekking tot uh stuutopilot um publiceren we deze uh breed
De statistieken spreken over um kilometers gereden met auto's die geen hebben
Autonomie of Tesla -auto's zonder autonomie met een soort hardware één hardware twee
Hardware drie um en dan uh degenen die zich in FSD Beta bevinden
Um en we zien altijd gestage verbeteringen onderweg eh en je weet dat er soms dit is
Dichotomie van je weet dat je moet wachten tot de auto is alsof ik het niet weet, uh
Drie keer veiliger dan een persoon voordat je technologie inzet, maar ik denk dat dat eigenlijk moreel mis is
um op het punt waarvan u gelooft dat het toevoegen van autonomie uh vermindert
letsel en dood eh ik denk dat je een morele verplichting hebt om het in te zetten, ook al ga je dat doen
worden aangeklaagd en de schuld door veel mensen omdat de mensen wiens leven je hebt gered niet weten dat hun leven dat is
gered en de mensen de mensen die af en toe sterven of gewond raken, weten ze zeker of hun nalatenschap doet uh
dat het was dat je weet waar een probleem mee is met de stuurautomaat, daarom moet je naar de AT kijken
de cijfers in een soort totale mijlen aangedreven hoeveel ongevallen plaatsvonden hoeveel ongevallen ernstig waren hoeveel
Dodelijke slachtoffers en je weet dat we ruim drie miljoen auto's op de weg hebben, dus dit is dat veel kilometers aangedreven
Elke dag zal het niet perfect zijn, maar het gaat erom dat het heel duidelijk veiliger is dan niet
het implementeren um ja dus ik denk dat de laatste vraag
Ik denk ja, dus bedankt wat de laatste vraag hier is
Oké um ja ik heb het oké, oh hoi dus
eh ik werk niet aan hardware, dus misschien het hardwareteam en jullie kunnen dat kunnen
Verlicht me uh waarom is het vereist dat er symmetrie is
um in het ontwerp van optimus omdat mensen uh hebben, hebben we goed
Zijn we een aantal spieren meer gebruiken dan andere in de loop van de tijd, er is slijtage
uh goed, dus misschien zul je wat gezamenlijke storingen of een actuator zien
falen Meer in de loop van de tijd begrijp ik dat dit extreem pre-fase is
Um ook als mensen hebben zoveel fantasie en fictie gebaseerd op Super Human
Mogelijkheden zoals we willen daar niet allemaal heen lopen, we willen onze armen uitbreiden en zoals we allemaal hebben
deze ken je veel fantasie fantastische ontwerpen dus overweeg
al het andere dat gaande is in termen van batterijen en intensiteit van
Bereken misschien kun je al die aspecten gebruiken om iets te bedenken
Nou, ik weet niet interessanter in termen van je de robot die je bent
bouwen en ik hoop dat je die aanwijzingen kunt verkennen, ja ik bedoel, ik denk dat het cool zou zijn
Heb je zoals je weet, maak inspecteur gadget echt dat zou best lieve um zijn, dus ja ik bedoel, je weet nu dat we nu
Ik wil gewoon een basis humanoïde maken wat goed werkt en ons doel is het snelste pad
Voor een nuttige uh humanoïde robot denk ik dat dit is dat dit ons in werkelijkheid zal gronden
Letterlijk um en zorg ervoor dat we het doen
Iets nuttigs als een van de moeilijkste dingen om te doen is nuttig te zijn
Eigenlijk en dan en dan om een hoog nut te hebben onder de curve, zoals hoeveel mensen u heeft geholpen de tijd die u kent en
Hoeveel hulp heeft u gemiddeld aan elke persoon geboden
En hoeveel mensen heb je geholpen het totale nut van de UH, graag proberen om nuttig product te verzenden
dat mensen graag een groot aantal mensen houden, is zo waanzinnig moeilijk dat het verbijstert
de geest ut, weet je dat daarom zou kunnen zeggen als de mens, er is een heel verschil tussen een bedrijf dat schakelproduct heeft en men heeft niet zeker van het product uh het is een
game Dit is dag en nacht um en dan zelfs als je eenmaal een product verzendt, kun je de kosten van de waarde van de
output meer dan de kosten van de input die opnieuw waanzinnig moeilijk is, vooral met hardware, dus
um maar ik denk dat ik na verloop van tijd cool vind om creatieve dingen te doen en acht armen hebben en wat dan ook
um en heb verschillende versies uh en misschien weet je dat er wat hardware zal zijn
zoals bedrijven die dingen kunnen toevoegen aan een optimist zoals misschien
je kent toegevoegd op een power -poort of iets dergelijks of bevestig je
Optimist zoals je ze aan je telefoon kunt toevoegen, het kan veel coole dingen zijn die na verloop van tijd kunnen worden gedaan en dat zou kunnen
misschien een ecosysteem zijn van kleine bedrijven waarvoor bedrijven die add-ons maken
Optimus dus met die uh uh bedank het team gewoon voor hun harde werk
uh jullie zijn geweldig en uh ja en uh bedankt
Jij en uh bedankt allemaal voor het komen en voor iedereen online bedankt voor het afstemmen
Um en ik denk dat dit een van die geweldige video's zal zijn waar je het leuk vindt als je snel kunt doorgaan naar de bits
dat je het meest interessant vindt, maar we proberen je een enorme hoeveelheid details letterlijk te geven, zodat je naar kunt kijken
De video op je gemak en je kunt je concentreren op de onderdelen die je interessant vindt en de andere delen overslaat
Dus bedankt allemaal, het is en we zullen dit proberen om dit elk jaar te doen en we kunnen zelfs een deel een maandelijkse podcast doen
um uh zo uh maar ik denk dat het zal zijn, weet je dat je geweldig bent
Breng je mee voor de rit en en laat je zien, wat wat coole dingen gebeuren en eh ja bedankt