Le PDG de Tesla, Elon Musk, a récemment dévoilé le bot Tesla de la société. Le robot nommé Optimus a traversé une scène, a agité sa main et a pompé ses bras dans un mouvement de danse à vitesse lente. Musk prédit que le robot pourrait coûter 20 000 $ dans les trois à cinq ans si tout se passe comme prévu. Mais la question est de savoir que peut faire pour nous. Mais avant d'y entrer, regardons les principaux appareils qui pilotent le bot Tesla.
Actionneurs Tesla Bot
Le Actionneurs sont le système d'entraînement principal pour tout robot. On pourrait dire qu'un robot n'est rien de plus qu'un PC avec des pièces mobiles, ou en d'autres termes, un robot est un PC avec des actionneurs et des capteurs. Tesla a développé ses propres actionneurs pour le bot, il utilise 3 types d'actionneurs rotatifs et 3 types de Actionneurs linéaires.
Si vous vous demandez pourquoi Tesla n'a pas utilisé des actionneurs linéaires standardisés comme le FIRGELLI Actionneur, c'est parce qu'ils ont plusieurs contraintes, ce qui signifie qu'ils doivent développer leurs propres systèmes pour faire en sorte que les robots soient finalement légers, éconergétiques, de densité de puissance élevée et à faible coût. Tesla a affirmé qu'ils voulaient que le bot vende 20 000 $ chacun. Il s'agit en soi un défi de taille pour quelque chose qui a besoin de 23 actionneurs, et de PC puissant, de nombreux capteurs et une batterie pour le faire durer plus de quelques heures, ainsi qu'un squelette fort pour le maintenir ensemble.
Actionneurs linéaires de Tesla Bot
Les actionneurs linéaires développés par Tesla sont très spécifiques pour un rôle spécifique, cela signifie qu'ils ne seraient pas vraiment très utiles pour une autre application autre qu'un robot. Leurs actionneurs utilisent un système de rouleaux planétaires et Tesla l'appelle, mais il s'agit essentiellement de code pour la cire de plomb à billes, et au lieu d'une bobine d'armature magnétique traditionnelle au milieu du moteur, ils ont décidé d'utiliser une conception de moteur de noyau sans balais. Cela signifie que la conception de vision de la balle est très efficace et utilise moins de puissance, mais aussi plus chère. Et ils utilisent un système d'alimentation sans pinceau qui signifie que la durée de vie sera nettement plus rapide et permet des modes de conduite très spécifiques contrôlés par le logiciel.
La durée du voyage ne mesure que 2 "de long, et comme l'image l'a montré soulevant un piano à 500 kg, c'est beaucoup de poids. Squelette en métal, les voyages des actionneurs doivent amplifier le Stoke de ce qu'il se déplaçant. Donc, si son mouvement de la jambe d'un robot, la jambe doit être en mesure de se déplacer d'environ 150 degrés, ou sur une longueur de 2 pieds, la jambe doit se balancer de Environ zéro à un arc de 3 pieds. Le corps humain qui a évolué plus de 100 000 années nous permet aux humains de le faire en utilisant nos muscles de la jambe, mais obtenir un actionneur linéaire pour le faire n'est pas une tâche facile. Donc, le point I ' La fabrication est que, même si l'actionneur peut soulever 500 kg de poids sur 2 pouces, une fois que les actionneurs connectés à un levier, la force est considérablement réduite, selon le rapport de levier, et mais la vitesse augmente, ce qui fait un bon échange -désactivé.
Présentation de Bot Tesla.
Voici ce que Tesla eux-mêmes avait à dire sur la dernière présentation de bot qu'ils ont donnée le 30 septembre 2022
Elon Musk présente: WJ'ai des choses vraiment excitantes à vous montrer, je pense que vous serez assez impressionné. Je veux définir quelques attentes en ce qui concerne notre robot Optimus comme vous le savez l'année dernière, c'était juste une personne dans un costume de robot, mais nous n'avons pas parcouru un long chemin et c'est je pense que vous savez par rapport à cela va être très impressionnant. Et nous allons parler des avancées en IA pour la pleine auto-conduite ainsi que la façon dont ils s'appliquent à plusGénéralement aux problèmes d'IA du monde réel comme un robot humanoïde et et même en dépassant cela. Je pense qu'il y a un potentiel que ce que nous faisons ici à Tesla pourrait apporter une contribution significative à AGI, et et je pense que nous dit en fait une bonne entité de le faire du point de vue de la gouvernance parce que nous sommes une entreprise cotée en bourse, nous en avons un classe de stock et cela signifie que le publiccontrôle Tesla et je pense que c'est en fait une bonne chose, donc si je deviens fou, tu peux me licencierest important peut-être que je ne suis pas fou, je ne sais pas. Alors oui, nous allons beaucoup parler de nos progrès dans le pilote automatique d'IA ainsi que des progrès avec Dojo, puis nous allons sortir l'équipe et faire une longue séance de questions-réponses pour que vous puissiez demander dur des questions. Quoi que vous souhaitiez des questions existentielles de questions techniques si elle voulait avoir autant de temps que possible pour les questions et réponses, alors voyons avec cela, vous devinez ce quotidiennement.
Hé les gars, je suis milan je travaille sur le pilote automatique et c'est le caoutchouc, je suis lizzy un ingénieur en mécanique sur le projet aussi ok, alors devrions-nous faire évoluer le bot avant de transmettre la première fois que nous essayons ce robot sans aucune grue de support de sauvegarde
Mécanismes mécaniques pas de câbles rien ouais je veux me joindre à vous les gars
Ce soir mais c'était la première fois que vous voyons vous prêterUn ordinateur autonome qui fonctionne dans vos voitures Tesla d'ici la façon dont c'est littéralement la première fois que le robot fonctionne sans qu'une attache était sur scène ce soir, donc le robot peut en fait faire beaucoup plus que nous Je ne voulais pas qu'il tombe sur son visage, donc nous allons vous montrer des vidéos maintenant du robot faisant un tas d'autres choses um ouais qui sont moins risquées.
Ouais, nous voulions montrer un peu plus ce que nous avons fait au cours des derniers moisavec des pas à part et juste en train de se promener et de danser sur scène et juste des débuts humbles, mais vous pouvez voir les réseaux de neurones de pilote automatique fonctionner comme
est juste recyclé pour le bourgeon directement sur cette nouvelle plate-forme qui est mon arrosage pouvez-vous voirUn point de vue rendu qui est le robot qui est le monde que le robot voit, donc c'est très clairement d'identification d'objets comme celui-ci est l'objet qu'il devrait ramasser. Nous utilisons le même processus que nous avons fait pour le pilote automatique afin de collecter des données dans Formation de vos réseaux que nous déploiez ensuite sur le
Robot c'est un exemple qui illustre un peu plus le haut du corps
Quelque chose que nous aimerons essayer de clouer dans quelques mois au cours des prochains mois, je dirais à la perfectionC'est vraiment une véritable station de l'usine de Fremont également à laquelle elle fonctionne.
Ce n'est pas la seule chose que nous devons montrer aujourd'hui afin que ce que vous avez vu soit ce que nous appelons Bumble C, c'est notre genre de robot de développement rugue L'équipe a fait un travail incroyable et nous avons en fait un bot optimiste avec un
Tesla entièrement conçu dans les deux actuateurs de contrôle de la batterie de batterie de batterie de batterieTout ce qu'il n'était pas tout à fait prêt à marcher, mais je pense qu'il marchera dans quelques semaines, mais nous voulions vous montrer le robot et quelque chose qui est en fait assez proche de ce qui va être en production, et vous montrer tout ce qu'il peut Faites-le, faisons-le ressortir
Nous nous attendons à avoir dans Optimus Production Unit One qui est la capacité
Pour déplacer tous les doigts de déplacer indépendamment le pouce, en avoir deux
degrés de liberté donc il a des pouces opposables et à la fois à gauche et à droite donc
Il est capable de faire fonctionner des outils et de faire des choses utiles, notre objectif est de faire un
Robot humanoïde le plus rapidement possible et nous l'avons également conçu en utilisant le
Même discipline que nous utilisons dans la conception de la voiture, c'est-à-dire à la concevoir pour la fabrication de telle sorte qu'il est possible deFaites le robot à un volume élevé à faible coût avec une forte fiabilité, donc c'est incroyablement important, je veux dire que vous avez tous vu des démonstrations de robot humanoïde très impressionnantes et que c'est génial, mais qu'est-ce qu'ils manquent ?, Ils manquent un cerveau, ils ne font pas T a l'intelligence de
naviguer dans le monde par eux-mêmes et ils sont également très chers,et fabriqué en faible volume alors qu'il s'agit de la société optimiste et du robot extrêmement capable, mais fabriqué en très haut volume, probablement en fin de compte des millions d'unités et il devrait coûter beaucoup moins qu'une voiture.
Je dirais probablement moins de vingt mille dollars
Le potentiel d'optimiste est que je pense apprécié par très efficace
Les gens Hé comme d'habitude, les démos de Tesla arrivent chaudsAlors d'accord, c'est bien c'est bien euh ouais les équipes mises en place et l'équipe a consacré une quantité incroyable de travail, c'est euh les jours de travail que vous savez sept jours par semaine à la course à 3 heures du matin pour arriver à la démonstration aujourd'hui je suis Super fier de ce qu'ils ont fait est qu'ils ont vraiment fait un excellent travail que j'aime juste donner une main à toute l'option de cette équipe, donc vous savez qu'il y a encore beaucoup de travail à faire pour affiner Optimus et Améliorez-le évidemment, c'est juste Optimus Version One et c'est vraiment pourquoi nous organisons cet événement qui est de convaincre certaines des personnes les plus talentueuses du monde comme vous pour rejoindre Tesla et aider à en faire une réalité et à se concrétiser à Échelle telle que cela peut aider des millions de personnes et le potentiel et le potentiel qu'il le aime est vraiment boggle l'esprit parce que vous devez dire comme ce qui est une économie une économie est une sorte d'entités productives fois la productivité Uh Capital Times Sortie La productivité par habitant au moment où il n'y a pas de limitation au capital, il n'est pas clair ce que une économie signifie même à ce moment-là qu'une économie devient quasiment infinie, donc ce que vous savez a pris pour se concrétiser dans le scénario espérons-le bénigne avenir de l'abondance un avenir où il n'y a pas de pauvreté où les gens vous
peut avoir ce que vous voulez en termes de produits et servicesC'est vraiment une transformation fondamentale de la civilisation car nous le savons, évidemment, nous voulons nous assurer que la transformation est positive et sûre et c'est aussi pourquoi je pense que Tesla en tant qu'entité faisant que ce soit une seule classe de stocks cotés publiquement appartenant à la Le public est très important et ne devrait pas être négligé, je pense que cela est essentiel, car alors si le public n'aime pas ce que Tesla fait, le public peut acheter des actions à Tesla et voter différemment.
C'est un gros problème comme s'il est très important que je ne puisse pas faire ce que je veux que tu sachesParfois, les gens pensent que non, mais ce n'est pas vrai, donc vous savez que c'est très important que l'entité d'entreprise qui a qui fait que cela se produise est quelque chose que le public peut correctement influencer et donc je pense que la structure Tesla est idéale pour cela et comme J'ai dit que vous savez que les voitures autonomes auront certainement un impact énorme sur le monde um, je pense qu'ils amélioreront le
Productivité du transport par au moins un demi-ordre de grandeurOrdre de grandeur peut-être plus d'optimistes UM, je pense, a peut-être une amélioration potentielle de deux ordres de grandeur de la production économique comme comme s'il n'était pas clair qu'il n'est pas clair quelle est la limite, mais nous devons le faire de la bonne manière que nous devons faire Il est soigneusement et en toute sécurité et s'assure que le résultat est bénéfique pour la civilisation et et celui que l'humanité une fois que je ne peux pas, c'est aussi extrêmement important, donc et j'espère que vous envisagerez de rejoindre Tesla pour atteindre ces objectifs à Tesla nous se soucie vraiment de faire la bonne chose ici aspire toujours à faire la bonne chose et à ne pas payer la route en enfer avec de bonnes intentions et je pense que la route de l'enfer est principalement pavée de mauvaises intentions, mais de temps en temps il y a une bonne intention dans Là, nous voulons le faire, faites la bonne chose um pour que vous sachiez envisager de nous rejoindre et aider à y arriver um avec ça, allons-y
Très bien, donc vous avez vu quelques robots aujourd'hui, faisons un récapitulatif de chronologie rapide, alors l'année dernière, nous avons dévoilé le bot Tesla
concept mais un concept ne nous amène pas très loin, nous savions que nous avions besoin d'une réelle plateforme de développement et d'intégration pour
Obtenez des apprentissages réels le plus rapidement possible afin que ce robot qui soit sorti et que nous fassions la petite routine pour vous les gars
avait cela dans les six mois construit en travaillant sur les mises à niveau du matériel d'intégration logicielle au cours des mois depuis lors mais
En parallèle, nous avons également conçu la prochaine génération celle-ci ici
donc ce gars est enraciné dans la base du type de processus de conception du véhicule que vous savez que nous tirons tout parti de
Ces apprentissages que nous avons déjà évidemment il y a beaucoup de choses qui ont changé depuis l'année dernière mais il y a quelques choses
qui sont toujours les mêmes que vous remarquerez que nous avons toujours cette concentration vraiment détaillée sur la vraie forme humaine que nous pensons que
compte pour plusieurs raisons, mais c'est amusant que nous passions beaucoup de temps à réfléchir à la façon dont nous avons incroyable le corps humain
Cette amplitude de mouvement incroyable est généralement très incroyable une force amusante
L'exercice est que si vous mettez le bout de votre doigt sur la chaise devant vous, vous remarquerez qu'il y a une vaste amplitude de mouvement qui
Vous avez dans votre épaule et votre coude par exemple sans déplacer le bout de votre doigt, vous pouvez déplacer ces articulations
sur place, mais le robot, vous savez, sa fonction principale est de faire un travail réel et utile et
Il n'a peut-être pas nécessairement besoin de tous ces degrés de liberté, nous l'avons donc dépouillé à un peu minimum
de 28 degrés de liberté fondamentaux et puis bien sûr nos mains en plus de cela
Les humains sont également assez efficaces dans certaines choses et pas si efficaces à d'autres moments, donc par exemple nous pouvons manger un petit
quantité de nourriture pour nous soutenir pendant plusieurs heures, c'est super euh mais quand nous sommes juste en quelque sorte assis non non
infraction mais nous sommes un peu inefficaces, nous sommes juste en quelque sorte de l'énergie brûlante, donc sur la plate-forme robot ce que nous sommes
Aller à faire, c'est que nous allons minimiser cette consommation d'énergie inactive la baisse aussi faible que possible et de cette façon, nous pouvons simplement
Retournez un interrupteur et immédiatement le robot se transforme en quelque chose qui fait un travail utile
Alors parlons de cette dernière génération en détail.
Les oranges sont des actionneurs auxquels nous arriverons dans un peu et en bleu notre système électrique
Alors maintenant que nous avons notre genre de recherche sur l'homme et que nous avons notre première plateforme de développement, nous avons les deux
Recherche et exécution pour dessiner à nouveau pour cette conception, nous utilisons cette conception de véhicule
Fondation donc nous le prenons du concept à la conception et à l'analyse et
puis construire et valider en cours de route, nous allons optimiser pour des choses comme le coût et l'efficacité
Parce que ce sont des mesures critiques pour que ce produit ait finalement évoluer comment allons-nous bien faire cela, nous
allons réduire notre nombre de pièces et notre consommation d'énergie de chaque élément possible, nous allons faire des choses comme
réduire la détection et le câblage à nos extrémités, vous pouvez imaginer beaucoup de masse dans vos mains et vos pieds
Soyez assez difficile et consommatrice de puissance pour se déplacer et nous allons centraliser nos
Distribution de puissance et notre calcul au centre physique de la plate-forme
Ainsi, au milieu de notre torse, c'est le torse, nous avons notre batterie, c'est la taille de 2,3 kilowattheures
Ce qui est parfait pour une journée complète de travail, ce qui est vraiment unique dans cette batterie
pack est qu'il a toute l'électronique de batterie intégrée dans un seul PCB dans le pack, ce qui signifie tout
De la détection à la gestion des charges et la distribution des charges est tout sur un seul
En un endroit, nous tirons également parti de nos produits de véhicule et de nos produits énergétiques à rouler
Toutes ces caractéristiques clés dans cette batterie afin que la fabrication rationalisée soit vraiment efficace et
Méthodes de refroidissement simples Gestion de la batterie et aussi la sécurité et bien sûr, nous pouvons tirer parti de Tesla
Infrastructure et chaîne d'approvisionnement existantes pour le faire en sorte que nous en quelque sorte à notre cerveau, c'est
Pas dans la tête mais c'est assez proche aussi dans notre torse, nous avons notre ordinateur central, donc comme vous le savez déjà Tesla
Expédie des ordinateurs autonomes complets dans chaque véhicule que nous produisons, nous voulons tirer parti du matériel du pilote automatique et
le logiciel pour la plate-forme humanoïde mais parce qu'il est différent dans les exigences et dans le facteur de forme, nous sommes
va changer quelques choses en premier donc nous allons toujours faire tout ce qu'un cerveau humain fait
Traitement des données de la vision Prise des décisions de fraction de fraction basées sur plusieurs entrées sensorielles et également des communications
Donc, pour prendre en charge les communications, il est équipé d'une connectivité sans fil ainsi que d'une prise en charge audio
Et puis il a également des fonctionnalités de sécurité au niveau du matériel qui sont importantes pour protéger à la fois le robot et les personnes
Autour du robot alors maintenant que nous avons notre genre de noyau
Nous allons avoir besoin de membres sur ce gars et nous serions ravis de vous montrer un peu nos actionneurs et notre entièrement
les mains fonctionnelles aussi, mais avant de le faire, j'aimerais présenter Malcolm qui va parler un peu
Notre base structurelle pour le robot [applaudissements]
merci
Tesla a la capacité de finaliser des systèmes très complexes, il devient beaucoup plus complexe qu'un crash que vous pouvez voir
Ici, un crash simulé sur le modèle 3 superposé au-dessus de l'accident physique réel
C'est en fait incroyable à quel point il est précis de vous donner une idée de la complexité de ce modèle
Il comprend chaque lave-linge de Bolton à chaque soudure et il a 35 millions de degrés de liberté, c'est assez incroyable
Et c'est vrai de dire que si nous n'avions pas de modèles comme celui-ci, nous ne pourrions pas faire les voitures les plus sûres du monde
On peut donc utiliser nos capacités et nos méthodes du côté automobile pour influencer un robot
Eh bien, nous pouvons faire un modèle et comme nous avions un logiciel Crash, nous avons utilisé le même logiciel ici, nous pouvons le faire tomber
Le but de cela est de s'assurer que si elle tombe idéalement, ce n'est pas le cas, mais ce sont des dégâts superficiels
Nous ne voulons pas par exemple briser sa boîte de vitesses à ses bras qui équivaut à une épaule luxée d'un robot
Difficile et coûteuse à réparer, nous voulions donc vous dépoussiérer avec un travail qui a été donné
Si nous pouvions également prendre le même modèle et que nous pouvons conduire les actionneurs en utilisant l'entrée d'un modèle précédemment résolu
la donner vie, donc cela produit les mouvements des tâches que nous voulons que le robot fasse ces
Les tâches ramassent des boîtes devenant accroupies en marchant à l'étage quel que soit l'ensemble des tâches, nous pouvons jouer au
Modèle Cela montre juste une marche simple, nous pouvons créer les contraintes dans tous les composants qui nous aident à
optimiser les composants ce ne sont pas des robots dansants ce sont
en fait le comportement modal les cinq premiers modes du robot et généralement lorsque les gens fabriquent des robots, ils s'assurent
Le premier mode est en place autour des chiffres simples en haut vers 10 Hertz
Qui est-ce que cela est pour faciliter les commandes de la marche, c'est très difficile à marcher si vous ne pouvez pas garantir
Où ton pied vacille qui est normal pour faire un robot, nous voulons faire des milliers peut-être des millions
Nous n'avons pas le luxe de les fabriquer à partir du titane en fibre de carbone que nous voulons les faire sur des choses en plastique ne sont pas
Assez si rigide donc nous ne pouvons pas avoir ces cibles élevées, je les appellerai des cibles stupides
Nous devons les faire fonctionner à des cibles plus bas
Ce mais nous ne sommes que des sacs de gelée détrempée et d'os jetées, nous ne sommes pas à haute fréquence si je me tiens
ma jambe je ne vibre pas à 10 hertz nous, les gens, opérons à basse fréquence, donc nous
savoir que le robot peut réellement rendre les contrôles plus difficiles afin que nous en prenons les informations sur les données modales et
la rigidité et le nourrir dans le système de contrôle qui lui permet de marcher
Changeant juste une taxe légèrement en regardant le genou dont nous pourrions nous inspirer
Biologie et nous pouvons chercher à voir ce que les avantages mécaniques du genou sont qu'il représente en fait tout à fait
Semblable au lien à quatre barreaux et c'est tout à fait non linéaire, ce n'est pas vraiment surprenant parce que si
Vous pensez que lorsque vous pliez votre jambe le long du couple sur votre genou, c'est beaucoup plus quand il est plié que quand il est
droit, vous vous attendez donc à une fonction non linéaire et en fait la biologie est non linéaire
Cela le correspond assez précisément, donc c'est la représentation les quatre par
Le lien n'est évidemment pas physiquement à quatre barreaux car j'ai dit que les caractéristiques sont similaires, mais je parie que c'est
Pas très scientifique, soyons un peu plus scientifiques, nous avons joué toutes les tâches à travers ce graphique, mais ce
montre des piquets de marche à la marche des tâches que j'ai dit que nous avons fait sur le stress et c'est le discours de la scène
Le genou contre le genou se plie sur l'axe horizontal, cela montre l'exigence pour le genou de faire tout cela
tâches puis mettez une courbe à travers le surfant sur le dessus des pics et cela dit que c'est ce qui est nécessaire pour
Faites faire le robot faire ces tâches
Donc, si nous regardons le lien à quatre barre qui est en fait la courbe verte et qu'elle dit que la non-linéarité du
Quatre By Link est en fait linéarisé la caractéristique de la force ce qui dit vraiment qui a abaissé la force
C'est ce qui fait que l'actionneur a la force la plus faible possible qui est la plus efficace que nous voulons brûler lentement l'énergie
Quelle est la courbe bleue bien que la courbe bleue est en fait si nous n'avions pas de lien à quatre bar
Se dépasser de ma jambe ici avec un avec un actionneur sur un simple lien à deux barres
C'est le meilleur que vous puissiez faire avec un simple lien à deux barres et cela montre que cela créerait beaucoup plus de force dans le
actionneur qui ne serait pas efficace, alors à quoi cela ressemble-t-il dans la pratique
Eh bien, comme vous le verrez, mais il est très étroitement emballé dans le genou, vous verrez un bon
transparent en une seconde, vous verrez le lien complet de la barre là-bas, il fonctionne sur l'actionneur qui est déterminé le
force et les déplacements de l'actionneur et vous transmettre maintenant à Concertina pour
Alors je suis, j'aimerais vous parler du processus de conception et de l'actionneur
portfolio euh dans notre robot, il existe donc de nombreuses similitudes entre un
La voiture et le robot en ce qui concerne la conception du groupe motopropulseur La chose la plus importante qui compte ici est la masse et le coût énergétiques
Nous reprenons la majeure partie de notre expérience de conception de la voiture au robot
Donc, dans le cas particulier, vous voyez une voiture avec deux unités de conduite et les unités de conduite
sont utilisés pour accélérer la voiture de 0 à 60 miles par heure ou conduire un
Les villes conduisent le site tandis que le robot qui compte 28 actionneurs et
Il n'est pas évident quelles sont les tâches au niveau de l'actionneur, donc nous avons des tâches qui
sont un niveau plus élevé comme la marche ou l'escalade des escaliers ou le transport d'un objet lourd qui doit être traduit en
Joint dans les spécifications articulaires donc nous utilisons notre modèle
qui génère les trajectoires de vitesse de couple pour nos articulations qui
va par la suite être alimenté dans notre modèle d'optimisation et à parcourir
le processus d'optimisation C'est l'un des scénarios que le
Le robot est capable de faire qui tourne et marche donc quand nous avons cette vitesse de couple
trajectoire que nous avons posé sur une carte d'efficacité d'un actionneur et nous sommes capables
la trajectoire pour générer la consommation d'énergie et l'énergie accumulée
énergie pour la tâche par rapport au temps, ce qui nous permet de définir le système
coût pour l'actionneur particulier et mettre un point simple dans le cloud, alors nous faisons
Ce pour des centaines de milliers d'actionneurs en résolvant dans notre cluster et la ligne rouge désigne le front de Pareto
qui est la zone préférée où nous rechercherons optimale afin que le X dénote
La conception de l'actionneur préféré que nous avons choisi pour cette articulation particulière, nous devons donc maintenant le faire pour chaque joint que nous
Avoir 28 articulations à optimiser et nous analysons notre nuage, nous analysons à nouveau notre nuage pour chaque joint
Spec et l'axe rouge cette fois désigne les conceptions d'actionneur sur mesure pour chaque
Joint Le problème ici est que nous avons trop de conceptions d'actionneur unique et
Même si nous profitons de la symétrie, il y en a encore trop pour faire quelque chose de masse
Fabrication, nous devons être en mesure de réduire la quantité de conceptions d'actionneur unique, donc nous exécutons quelque chose
Appelé l'étude de Commonnality que nous analysons à nouveau notre cloud à la recherche de cette fois
actionneurs qui répondent simultanément aux exigences de performance conjointe pour plus d'une articulation en même temps afin que le
Le portefeuille résultant est de six actionneurs et ils montrent dans une carte couleur la figure du milieu
Um et les actionneurs peuvent également être consultés dans cette diapositive, nous avons trois rotatifs et
Trois actionneurs linéaires qui ont tous une grande force de sortie ou couple par masse
L'actionneur rotatif en particulier a un embrayage mécanique intégré au contact angulaire à haute vitesse
Boule à billes et sur le côté à grande vitesse et sur le côté basse vitesse un rouleau transversal
Le roulement et le train de vitesses sont un engrenage d'onde de contrainte et il y a trois capteurs intégrés
Ici et la machine aimant permanente sur mesure l'actionneur linéaire
Je suis désolé que l'actionneur linéaire ait des rouleaux planétaires et une vis planétaire inversée
En tant que train d'équipement qui permet l'efficacité et le compactage et la durabilité
Donc, pour démontrer la capacité de force de nos actionneurs linéaires, nous
ont mis en place une expérience afin de la tester sous ses limites
Et je vous laisserai profiter de la vidéo
donc notre actionneur est capable de soulever
Piano à queue de concert à un demi-ton neuf pieds
et
C'est une exigence, ce n'est pas quelque chose de bien à avoir parce que nos muscles peuvent faire
La même chose lorsqu'ils sont entraînés directement lorsqu'ils sont directement entraînés ou que les muscles quadriceps peuvent faire la même chose
C'est juste que le genou est un système de liaison de création vers le haut qui convertit la force
en vitesse à l'effecteur final de nos collines à des fins de donner au
L'agilité du corps humain, c'est donc l'une des principales choses qui sont incroyables dans le corps humain et je suis
concluant ma part à ce stade et je voudrais accueillir mon collègue Mike qui va vous parler de la main
Conception merci beaucoup merci Constantinos
Nous venons donc de voir à quel point un actionneur humain et humanoïde peut être puissant
Les humains sont également incroyablement dexterous, la main humaine a la capacité de bouger
À 300 degrés par seconde, il dispose de dizaines de milliers de capteurs tactiles
Et il a la capacité de saisir et de manipuler presque tous les objets de notre vie quotidienne
Pour notre conception de main robotique, nous avons été inspirés par la biologie, nous avons cinq doigts un pouce opposable
Nos doigts sont entraînés par des tendons métalliques qui sont à la fois flexibles et forts, nous avons la capacité de terminer largement
La puissance de l'ouverture saisit tout en étant optimisé pour la précision de la précision des petits objets minces et délicats
Alors pourquoi un humain comme une main robotique la raison principale est que nos usines et le monde qui nous entoure est
conçu pour être ergonomique, ce que cela signifie, c'est qu'il garantit que les objets de notre usine sont saisissables
mais cela garantit également que de nouveaux objets que nous n'avons jamais vus auparavant peuvent être saisis par la main humaine et par notre
main robotique ainsi que la conversation est assez intéressante car elle dit que ces objets sont conçus à notre main
Au lieu d'avoir à apporter des modifications à notre main pour accompagner un nouvel objet
Certaines statistiques de base sur notre main sont qui ont six actionneurs et 11 degrés de liberté, il a un contrôleur en main qui
conduit les doigts et reçoit la rétroaction du capteur que la rétroaction du capteur est vraiment importante pour
Apprenez un peu plus sur les objets que nous saisissons et aussi pour la proprioception et c'est la capacité pour nous de reconnaître où
Notre main est dans l'espace l'un des aspects importants de notre main est qu'il est adaptatif cette adaptabilité
est impliqué essentiellement comme des mécanismes complexes qui permettent à la main de s'adapter aux objets qui sont saisis
Une autre partie importante est que nous avons un entraînement de doigt conduisable non-back Ce mécanisme d'embrayage nous permet de tenir
et transporter des objets sans avoir à allumer les moteurs de la main, vous venez d'entendre comment nous allions aller
Nous avons fait la conception du matériel Tesla Bot maintenant, nous allons le remettre à Milan et à notre équipe d'autonomie pour apporter ceci
Robot à la vie merci Mike
Très bien, donc toutes ces choses sympas que nous avons montrées plus tôt dans la vidéo ont été publiées
possible juste en quelques mois grâce au mot incroyable que nous avons fait le pilote au cours des dernières années
La plupart de ces composants se sont transportés assez facilement dans l'environnement des bots si vous y réfléchissez, nous nous déplaçons juste
d'un robot sur roues à un robot sur les jambes afin que certains de ces composants soient assez similaires et d'autres nécessitent
plus de charges lourds, par exemple, nos réseaux de neurones de vision informatique
Signalé directement du pilote automatique à la situation des bots, c'est exactement le même réseau d'occupation
auquel nous parlons un peu plus de détails plus tard avec l'équipe de pilote automatique qui fonctionne maintenant sur le bot ici
Cette vidéo La seule chose qui a changé est vraiment les données de formation que nous devions nous souvenir
Nous essayons également de trouver des moyens d'améliorer ces réseaux d'occupation en utilisant le travail effectué sur vos champs de radiance pour obtenir
Vraiment excellent rendu volumétrique des environnements de bots par exemple ici certains
Machine Lire que le bot pourrait avoir à interagir avec
Un autre problème intéressant à penser est dans les environnements intérieurs principalement avec ce sentiment de signalisation GPS comment faites-vous
Promenez-vous de naviguer vers sa destination, par exemple, pour trouver sa station de charge la plus proche, nous nous entraînons donc
Plus de réseaux de neurones pour identifier les fonctionnalités à haute fréquence des points clés dans le
Roots de caméra bots et les suivre à travers les cadres au fil du temps alors que le bot navigue vers son environnement
Et nous utilisons ces points pour obtenir une meilleure estimation de la pose et de la trajectoire des robots dans son environnement comme
C'est la marche, nous avons également fait un peu de travail sur le
côté simulation et c'est littéralement le simulateur de pilote automatique UH auquel nous avons intégré la locomotion du robot
code et il s'agit d'une vidéo du code de contrôle de mouvement exécuté dans le simulateur de simulateur d'opérateur affichant le
L'évolution des robots marchez au fil du temps et comme vous pouvez le voir, nous avons commencé assez lentement en avril et commencer à accélérer
Alors que nous déverrouillons plus d'articulations et des techniques plus profondes plus avancées comme l'équilibrage des bras au cours des derniers mois
Et donc la locomotion est spécifiquement un composant très différent alors que nous passons de la voiture aux bots
environnement et donc je pense que cela garantit un peu plus de profondeur et j'aimerais que mes collègues commencent à en parler
maintenant étranger
Salut à tous, je suis Felix, je suis ingénieur en robotique sur le projet et je vais parler de marche
semble facile, les gens le font chaque jour, vous n'avez même pas à y penser
Mais il y a certains aspects de la marche qui sont difficiles du point de vue de l'ingénierie par exemple
Conscience de soi physique qui signifie avoir une bonne représentation de vous-même quelle est la durée de vos membres ce qui est
La masse de vos membres est la taille de vos pieds tout ce qui compte aussi avoir une porte économe en énergie vous
Peut imaginer qu'il existe différents styles de marche et tous sont tout aussi efficaces
Le plus important Keep Balance ne tombe pas et bien sûr coordonner le mouvement
de tous vos membres ensemble, alors maintenant les humains font tout cela naturellement, mais en tant qu'ingénieurs ou roboticiens, nous avons
pour réfléchir à ces problèmes et si je vais vous montrer comment nous les abordons dans notre planification et notre contrôle de locomotion
Stack donc nous commençons par la planification de la locomotion et notre représentation du lien qui
signifie le modèle de la dynamique cinématique du robot et les propriétés de contact et l'utilisation de ce modèle et du souhaité
Chemin pour les bots notre planificateur de locomotion génère des trajectoires de référence pour l'ensemble du système
Cela signifie des trajectoires réalisables en ce qui concerne les hypothèses de notre modèle
Le planificateur fonctionne actuellement en trois étapes, il commence à planifier des pas et se termine par l'ensemble du système photo de mouvement
Et plongeons un peu plus dans la façon dont cela fonctionne, donc dans cette vidéo, nous voyons des traces prévues sur la planification
Horizon suivant le chemin souhaité et nous commençons de cela et ajoutez ensuite pour
des trajectoires qui relient ces pas à l'aide de l'orteil et de la frappe à la frappe tout comme les humains comme le font les humains
Et cela nous donne une plus grande foulée et moins de galerie de genou pour une grande efficacité du système
La dernière étape consiste ensuite à trouver un centre de trajectoire de masse qui nous donne un mouvement réalisable dynamiquement des frais du
un système entier pour garder l'équilibre car nous savons tous que les plans sont bons mais nous
doivent également les réaliser en réalité, disons que vous savez voir comment nous pouvons faire cela
[Applaudissements] Merci Felix Bonjour à tous mon nom
est Anand et je vais vous parler des contrôles, alors prenons le plan de mouvement que Felix
Je viens de parler et de le mettre dans le monde réel sur un vrai robot, voyons ce qui se passe
Il faut quelques pas et tombe bien, c'est un peu décevant
Mais il nous manque quelques pièces clés ici qui le feront fonctionner
Maintenant, comme Felix l'a mentionné, le planificateur de mouvement utilise une version idéalisée de
lui-même et une version de la réalité qui l'entoure, ce n'est pas exactement correct
Il exprime également son intention par des trajectoires et des branches de branches de
forces et couples qu'il veut exercer sur le monde à la locomote
La réalité est bien plus complexe que n'importe quel modèle similaire, le robot n'est pas non plus
Simplifié, il a des vibrations et des modes le bruit du capteur de conformité et encore et encore
Et sur, qu'est-ce que cela fait au monde réel lorsque vous mettez le bot dans le monde réel
Eh bien, les forces inattendues provoquent une dynamique non modélisée que le planificateur ne sait pas et que
provoque la déstabilisation spécialement pour un système stable dynamiquement comme la locomotion bipède
Alors que pouvons-nous bien faire à ce sujet, nous mesurons la réalité que nous utilisons des capteurs et notre compréhension de
Le monde à faire l'estimation et le statut d'état ici, vous pouvez voir l'attitude et la pose du bassin qui est
Essentiellement, le système vestibulaire dans un humain avec le centre de la trajectoire de masse est suivi lorsque le robot marche
Dans l'environnement de bureau maintenant, nous avons toutes les pièces dans lesquelles nous avons besoin
afin de fermer la boucle afin que nous utilisons notre meilleur modèle de bot, nous utilisons la compréhension de la réalité
Nous avons gagné grâce à l'estimation de l'État et nous comparons ce que nous voulons par rapport à ce que nous attendons de la réalité que nous nous attendons
La réalité nous fait pour ajouter des corrections au comportement du
Robot ici, le robot n'apprécie certainement pas d'être poké mais il ne le fait pas
un travail admirable de rester debout sur le point final ici est un robot qui
Walks ne suffit pas que nous devions utiliser ses mains et ses bras pour
Soyez utile, parlons de manipulation
[Applaudissements]
salut tout le monde, je m'appelle Eric Robotics Engineer sur Teslabot et je veux parler
sur la façon dont nous avons fait manipuler le robot dans le monde réel, nous voulions manipuler des objets pendant que
avoir l'air aussi naturel que possible et y arriver rapidement pour que ce que nous avons fait est
Nous avons divisé ce processus en deux étapes d'abord générer une bibliothèque de références de mouvement naturel ou nous pourrions
Appelez-les des manifestations, puis nous avons adapté ces références de mouvement en ligne à la situation actuelle du monde réel
Alors disons que nous avons une démonstration humaine de ramasser un objet, nous pouvons obtenir une capture de mouvement
Démonstration qui est visualisée ici comme un tas d'images clés représentant les emplacements des mains
Les coudes du torse, nous pouvons mapper cela au robot en utilisant la cinématique inverse et si nous collectons un
beaucoup d'entre eux maintenant nous avons une bibliothèque avec laquelle nous pouvons travailler mais une seule démonstration n'est pas
généralisable à la variation du monde réel, par exemple, cela ne fonctionnerait que pour une boîte dans un très particulier
l'emplacement donc ce que nous avons également fait, c'est exécuter ces trajectoires de référence via un
Programme d'optimisation de la trajectoire qui résout où la main devrait être la façon dont le robot devrait équilibrer
pendant euh quand il doit adapter le mouvement au monde réel, donc par exemple
Si la boîte est à cet endroit, notre optimiseur créera ceci
trajectoire à la place Milan va parler de euh
Quelle est la prochaine
Donc, j'espère que maintenant vous avez une bonne idée de ce que nous avons fait au cours des derniers mois
Um nous avons commencé à faire quelque chose qui est utilisable mais c'est loin d'être utile qu'il y a encore une route longue et excitante
devant nous um je pense que la première chose dans les prochaines semaines est d'obtenir Optimus au moins à
à égalité avec Bumble C L'autre prototype de bogue que vous avez vu plus tôt et probablement au-delà, nous allons également commencer
Se concentrer sur le véritable cas d'utilisation dans l'une de nos usines et j'essaierai vraiment d'essayer de clouer ceci et je m'épuise tout
Les éléments nécessaires pour déployer ce produit dans le monde réel que je mentionnais plus tôt
um tu sais la navigation intérieure gracieuse pour la gestion ou même l'entretien de tous
les composants devaient faire évoluer ce produit mais euh je ne sais pas pour vous mais après
Voir ce que nous avons montré ce soir, je suis presque sûr que nous pouvons le faire dans les prochains mois ou années et je fais
Ce produit est une réalité et changez toute l'économie, donc je tiens à remercier toute l'équipe Optimus pour le dur
Travailler au cours des derniers mois, je pense que c'est assez incroyable tout cela a été fait en six ou huit mois à peine merci
beaucoup [applaudissements]
Merci Hé à tous
Salut je suis Ashok, je dirige l'équipe de pilote automatique aux côtés de Milan God, il arrive si fort pour dépasser ça
Section Optimus Il essaiera néanmoins de toute façon
Um chaque Tesla qui a été construite au cours des dernières années, nous pensons avoir le
matériel pour faire la voiture de voiture elle-même, nous avons travaillé sur le logiciel pour
Ajouter des niveaux d'autonomie de plus en plus
Environ 2 000 voitures conduisant notre logiciel Beta FSD depuis lors, nous avons considérablement
Amélioration du logiciel comme robustesse et capacité que nous l'avons maintenant expédiée à 160 000 clients à partir d'aujourd'hui
oui [applaudissements]
Ce n'est pas venu gratuitement, il est venu de la sueur et du sang de l'équipe d'ingénierie au cours de la dernière année
Par exemple, nous avons formé 75 000 modèles de réseau neuronal durer juste un an
À peu près un modèle toutes les huit minutes, c'est que vous savez sortir de l'équipe, puis nous les évaluons sur notre grand
Clusters, puis nous expédions 281 de ces modèles qui améliorent réellement les performances de la voiture
Et cet espace d'innovation se produit tout au long de la pile le logiciel de planification
Infrastructure Les outils embauchent même tout progresse au niveau suivant
Le logiciel Beta FSG est tout à fait capable de conduire la voiture dont il devrait être en mesure de naviguer
parking au stationnement Traiter la conduite CDC Arrêt pour les feux de circulation et les panneaux d'arrêt
négocier avec des objets aux intersections qui font des virages et ainsi de suite
Tout cela vient des flux de caméras qui passent par nos réseaux de neurones qui fonctionnent sur la voiture elle-même
Ne pas revenir sur le serveur ou tout ce qu'il fonctionne sur la voiture et produit toutes les sorties pour former le modèle mondial
autour de la voiture et le logiciel de planification entraîne la voiture en fonction de cela
Aujourd'hui, nous allons entrer dans de nombreux composants qui composent le système que le réseau d'occupation agit comme la base
Couche de géométrie du système Il s'agit d'une vidéo multi-caméra neuronale
réseau qui des images prédit la pleine occupation physique du monde autour
le robot donc tout ce qui est physiquement présent arbres murs bâtiments
Avez-vous prévu s'il est spécifiquement présent, il les prédit avec leur futur mouvement
Au-dessus de ce niveau de géométrie de base, nous avons plus de couches sémantiques afin de
naviguer sur les routes, nous avons besoin de l'objectif bien sûr, mais ensuite les routes ont beaucoup de
Différentes voies et elles se connectent de toutes sortes de façons, donc c'est en fait un problème vraiment difficile pour l'ordinateur typique
Techniques de vision pour prédire l'ensemble des avions et leurs connectivités, nous avons donc atteint la langue
Technologies puis tiré l'état de l'art des autres domaines et pas seulement la vision informatique pour faire cette tâche
possible pour les véhicules, nous avons besoin de leur état cinématique complet pour les contrôler
Tout cela provient directement des flux vidéo de réseaux de neurones
de traitement puis produit l'état cinématique complet qui positionne les vitesses d'accélération secouer tout cela
sort directement des réseaux avec un post-traitement minimal qui m'est vraiment fascinant parce que comment ça va
Ce monde même possible dans quel monde vivons-nous en ce que cette magie est possible que ces réseaux prédisent quatrième
Dérivés de ces positions lorsque les gens pensaient que nous ne pouvions même pas détecter ces objets
Mon opinion est qu'il n'est pas venu gratuitement, il a nécessité des tonnes de données, nous avons donc eu un étiquetage automatique un peu sophistiqué
Les systèmes qui brillent à travers les données de capteurs brutes fonctionnent une tonne de calcul hors ligne sur le
Serveurs Il peut prendre quelques heures de réseaux de neurones coûteux distiller les informations sur les étiquettes qui forment notre
Réseaux de neurones en voiture En plus de cela, nous utilisons également notre système de simulation
Créer des images et comme c'est une simulation, nous avons toutes les étiquettes trivialement
Tout cela passe par un pipeline de moteur de données bien huilé où nous
Former un modèle de base avec certaines données en expédition à la voiture, voyez quels sont les échecs et une fois que vous connaissez les échecs
Nous exploit la flotte pour les cas où il échoue, fournit les étiquettes correctes et ajouter les données à l'ensemble de formation
Ce processus résout systématiquement les problèmes et nous le faisons pour chaque tâche qui s'exécute dans la voiture
Ouais et pour former ces nouveaux réseaux de neurones massifs cette année, nous avons élargi notre infrastructure de formation à peu près à peu près
40 à 50 pour cent, ce qui nous est assis à environ 14 000 GPU aujourd'hui à travers plusieurs
Clusters de formation aux États-Unis, nous avons également travaillé sur notre compilateur d'IA qui
soutient désormais les nouvelles opérations nécessaires à ces réseaux de neurones et les mappe à l'UH le meilleur de notre sous-jacent
Les ressources matérielles et notre moteur d'inférence aujourd'hui sont capables de distribuer l'exécution de
Un seul réseau de neurones sur deux systèmes indépendants sur les navires essentiellement deux ordinateurs indépendants interconnectés
Dans le simple ordinateur autonome et pour rendre cela possible, nous devons garder un contrôle étroit sur le bout à bout
latence de ce nouveau système, nous avons donc déployé un code de planification plus avancé sur la plate-forme FSD complète
Tous ces réseaux de neurones qui courent dans la voiture produisent ensemble l'espace vectoriel qui est à nouveau le modèle du
monde autour du robot ou de la voiture, puis le système de planification fonctionne en plus de cette projection de trajectoires qui
Évitez les collisions ou les progrès lisses vers la destination en utilisant une combinaison d'optimisation basée sur le modèle
Plus un réseau neuronal qui aide à l'optimiser pour être très rapide
Aujourd'hui, nous sommes vraiment ravis de présenter des progrès sur tous ces domaines, nous avons les pistes d'ingénierie
Entrez et expliquez ces différents blocs et ces puissances non seulement la voiture, mais les mêmes composants fonctionnent également sur l'Optimus
Robot que Milan a montré plus tôt avec ce panel de bienvenue pour commencer à parler de la section de planification
Salut à tous je suis pael joint utilisons ce scénario d'intersection pour
Plongez directement dans la façon dont nous faisons la planification et la prise de décision en pilote automatique afin que nous approchons de cette intersection
d'une rue latérale et nous devons céder à tous les véhicules de traversée, alors que nous allons entrer dans le
Intersection Le piéton de l'autre côté de l'intersection décide de traverser la route
Sans passage pour piétons maintenant, nous devons céder à ce rendement pour piétons aux véhicules de la droite et
Comprenez également la relation entre le piéton et le véhicule de l'autre côté de l'intersection
Donc, beaucoup de ces dépendances intra-objets que nous devons résoudre en un coup d'œil rapide
Et les humains sont vraiment bons dans ce domaine, nous regardons une scène comprendre toutes les interactions possibles évaluer le plus
prometteurs et finissent généralement par en choisir un raisonnable
Alors regardons quelques-unes de ces interactions que le système de pilote automatique a évalué, nous aurions pu aller devant cela
piéton avec un lancement très agressif dans un profil latéral maintenant, évidemment, nous sommes un imbécile pour le
Piéton et nous avons effrayé le piéton et son joli animal de compagnie, nous aurions pu avancer lentement court
Pour un écart entre le piéton ou le véhicule de la droite, nous sommes à nouveau un imbécile pour le véhicule
Venant de la droite, mais vous ne devriez pas rejeter carrément cette interaction au cas où ce n'est qu'une interaction sûre disponible
Enfin, l'interaction que nous avons fini par choisir de rester lentement trouver au départ le raisonnable
Écart puis terminez la manœuvre après que tous les agents passent
Maintenant, l'évaluation de toutes ces interactions n'est pas triviale, surtout lorsque vous vous souciez de la modélisation
les dérivés d'ordre supérieur pour d'autres agents, par exemple ce qu'est le longitudinal
Jerk requis par le véhicule venant de la droite lorsque vous affirmez devant lui en s'appuyant uniquement sur les chèques de collision avec
Les prédictions modulaires ne vous mèneront que si vous manquerez de nombreuses interactions valides
Cela se résume essentiellement à la résolution d'un problème de planification de trajectoire conjointe multi-agents sur les trajectoires de l'ego et
Tous les autres agents maintenant à quel point vous optimisez-vous qu'il y aura une limite à la vitesse
exécuter ce problème d'optimisation, il sera proche de l'ordre de 10 millisecondes même après de nombreuses approximations incrémentielles
Maintenant, pour une gauche imprévisible bondée typique, dites que vous avez plus de 20 objets chacun
objet ayant plusieurs modes futurs différents, le nombre de combinaisons d'interaction pertinentes explosera
Nous, le planificateur, doit prendre une décision toutes les 50 millisecondes alors comment résoudre ceci en temps réel
Nous comptons sur un cadre ce que nous appelons comme recherche d'interaction qui est essentiellement une recherche parallélisée sur un tas de
trajectoires de manœuvre L'espace de l'État correspond ici à l'état cinématique de l'ego la cinématique
État d'autres agents Les futurs prévisions multimodales futures nominales et toutes les entités statiques de la scène
L'espace d'action est l'endroit où les choses deviennent intéressantes, nous utilisons un ensemble de trajectoire de manœuvre
les candidats à se ramifier sur un tas de décisions interactionnelles et également des objectifs progressifs pour un
Horizon Manoeuver Passons à travers cette recherche très rapidement pour comprendre comment cela fonctionne
Nous commençons par un ensemble de mesures de vision à savoir les objets en mouvement d'occupation des voies ceux qui sont représentés comme
Des extractions clairsemées ainsi que des fonctionnalités latentes que nous utilisons pour créer un ensemble d'objectifs
Les candidats voient à nouveau du réseau LANES ou des régions non structurées qui correspondent à
Un masque de probabilité dérivé des démonstrations humaines une fois que nous avons un tas de ces or
candidats nous créons des trajectoires de semences en utilisant une combinaison d'approches d'optimisation classiques ainsi que de notre
Planificateur de réseau à nouveau formé sur les données du flux client maintenant une fois que nous aurons obtenu un tas de ces
trajectoires que nous les utilisons pour commencer à se ramifier sur les interactions que nous trouvons l'interaction la plus critique
Dans notre cas, ce serait l'interaction en ce qui concerne le piéton, que nous affirmons devant lui ou que nous y cédons
De toute évidence, l'option à gauche est une option de pénalité élevée, elle ne sera probablement pas priorisée, nous nous détendons donc plus loin
L'option à droite et c'est là que nous apportons des interactions de plus en plus complexes pour construire cette optimisation
Problème progressivement avec de plus en plus de contraintes et cette recherche continue de se ramifier sur plus d'interactions ramification
Sur plus d'objectifs maintenant, de nombreuses astuces se trouvent ici dans l'évaluation de chacun de ce nœud
de la recherche à l'intérieur de chaque nœud au départ, nous avons commencé par la création
Les trajectoires utilisant des approches d'optimisation classiques où les contraintes comme je l'ai décrites
Et cela prendrait près d'un à cinq millisecondes par action maintenant même si c'est assez bon
Numéro Lorsque vous souhaitez évaluer plus de 100 interactions, cela ne fait pas évoluer
Nous avons donc fini par construire des réseaux interrogables légers que vous pouvez exécuter dans la boucle du planificateur
Ces réseaux sont formés sur des démonstrations humaines de la flotte ainsi que des résolveurs hors ligne avec des limites de temps détendue
Avec cela, nous avons pu ramener le runtime délabrée pour fermer 200 microsecondes par action
Maintenant, faire cela seul ne suffit pas parce que vous avez toujours cette recherche massive que vous devez aller
à travers et vous devez tailler efficacement l'espace de recherche afin que vous deviez faire un score sur chaque
De ces trajectoires peu d'entre elles sont assez standard, vous faites un tas de vérifications de collision, vous faites un tas d'analyse de confort Qu'est-ce que le con et
en fait requis pour une manœuvre donnée, les données de la flotte client jouent à nouveau un rôle important ici
Nous exécutons deux ensembles de réseaux variables légers à nouveau en augmentant tous les deux l'un d'entre eux formé à partir de
Interventions de la flotte Beta FST qui donne un score sur la probabilité d'une manœuvre donnée pour entraîner
Interventions au cours des prochaines secondes et secondes qui sont purement sur les démonstrations humaines
Une score sur la proximité de votre action sélectionnée à une trajectoire entraînée par l'homme
Le score nous aide à tailler l'espace de recherche continue de se ramifier sur les interactions et de concentrer le calcul sur
les résultats les plus prometteurs la partie cool à ce sujet
L'architecture est qu'elle nous permet de créer un mélange cool entre les approches UH Data Docunts où vous
Je n'ai pas à compter sur de nombreux coûts d'origine, mais aussi à la fonder en réalité avec des chèques basés sur la physique
Maintenant, une grande partie de ce que j'ai décrit était en ce qui concerne les agents que nous pouvions observer dans la scène mais la même chose
Le cadre s'étend aux objets derrière des occlusions, nous utilisons le flux vidéo de huit caméras
Pour générer l'occupation 3D du monde, le masque bleu correspond ici au
région de visibilité que nous l'appelons, elle est essentiellement bloquée au premier
occlusion que vous voyez dans la scène que nous consommons ce masque de visibilité pour générer ce que nous appelons comme des objets fantômes que vous
Peut voir en haut à gauche maintenant si vous modélisez les régions de ponte et les transitions d'état de ce fantôme
objets correctement si vous réglez votre réponse de contrôle en tant que
fonction de cette existence probable, vous pouvez extraire de très beaux comportements humains
Maintenant, je vais le transmettre pour remplir pour décrire plus sur la façon dont nous générons ces réseaux d'occupation
Hé les gars, je m'appelle phil uh, je partagerai les détails du réseau d'occupation que nous construisons au cours de la dernière année
Ce réseau est notre solution pour modéliser le travail physique en 3D autour de nos voitures et il n'est actuellement pas montré dans notre
Visualisation face au client et ce que nous verrons ici est la sortie du réseau routier de notre outil de développement interne
Le réseau d'occupation prend des flux vidéo de toutes nos 80 caméras en entrée produit un seul volumétrique unifié
Occupation dans l'espace vectoriel directement pour chaque emplacement 3D autour de notre voiture
prédit la probabilité que cet emplacement soit beaucoup occupé car il a des contacts vidéo, il est
capable de prédire les obstacles qui sont occlus instantanément
Pour chaque emplacement, il produit également un ensemble de sémantiques telles que le piéton de la voiture à tronc
et les débris faibles comme codés en couleur ici
Le flux d'occupation est également prévu pour le mouvement car le modèle est un réseau généralisé
il ne dit pas explicitement aux objets statiques et dynamiques, il est capable de produire et
Modélisez les mouvements aléatoires tels que l'entraîneur de dérivation ici
Ce réseau s'exécute actuellement dans tous les Teslas avec des ordinateurs FSD et c'est
Des courses incroyablement efficaces environ tous les 10 millisecondes avec notre accélérateur neuronal
Alors, comment cela fonctionne-t-il en regardant d'abord l'architecture, nous rectifons chaque images de caméra avec
L'étalonnage de la caméra et les images ont été montrés ici ont été donnés au réseau, il n'est pas en fait
L'image RVB 8 bits typique comme vous pouvez le voir sur les premières images en haut, nous sommes
Donner l'image du compte photo brut 12 bits au réseau car il en a quatre
bits plus d'informations Il a 16 fois une meilleure gamme dynamique ainsi que réduite
latence puisque nous n'avons plus le mauvais FAI dans Adobe, nous utilisons un ensemble d'enregistrements et de retour avec
FPS en tant que colonne vertébrale pour extraire les images d'images Caractéristiques des espaces ensuite, nous construisons un ensemble de position 3D
requête avec les fonctionnalités d'espace IMG car les touches et les valeurs s'inscrivent dans un module d'attention
La sortie du module d'attention est des caractéristiques spatiales de haute dimension
Ces caractéristiques spéciales sont alignées temporairement en utilisant l'odométrie du véhicule
Pour dériver le mouvement en dernier ces caractéristiques temporelles spatiales vont
Grâce à un ensemble de D Convolution pour produire l'occupation finale et la sortie de flux d'occupation
Ils sont formés comme un gris boxeur de taille fixe qui pourrait ne pas être suffisamment précis pour planifier le contrôle
Afin d'obtenir une résolution plus élevée, nous produisons également des cartes de fonctions par voxel qui alimenteront MLP avec une spatiale 3D
Requêtes ponctuelles pour obtenir la position et la sémantique dans n'importe quel emplacement arbitraire
Après avoir connu le modèle mieux jetons un autre exemple ici, nous avons un bus articulaire garé à droite
ligne latérale mise en évidence comme un boxeur en forme de L alors que nous approchons du bus commence à
Déplacer le bleu à l'avant du chariot devient le bleu en premier, indiquant que le modèle prédit que le bus frontal a un zéro en duvet
Le flux d'occupation et le S-bus continue de déplacer l'ensemble du bus tourne bleu
Et vous pouvez également voir que le réseau prédit la courbure précise du bus
Eh bien, c'est un problème très compliqué pour le réseau traditionnel de détection d'objets car vous devez voir si je vais
Utilisez un cuboïde ou peut-être un deux pour s'adapter à la courbure mais pour le réseau d'occupation
Puisque nous nous soucions de l'occupation dans l'espace visible et nous pourrons modéliser la courbure précisément
Outre la note de voxel, le réseau d'occupation produit également une surface conduisable
La surface conduisable a à la fois une géométrie 3D et une sémantique, ils sont très utiles pour le contrôle, en particulier sur la guérison
et les routes sinueuses de la surface et du gris voxel ne sont pas prédits indépendamment
Voxel Grid s'aligne en fait avec la surface implicitement ici, nous sommes dans une quête de héros où vous
peut voir la géométrie 3D de la surface étant bien prédite
Planner peut utiliser ces informations pour décider peut-être que nous devons ralentir davantage pour le Hillcrest et comme vous pouvez également
Voir le grade de voxel s'aligne sur la surface de manière cohérente
Outre la source de la boîte et la surface, nous sommes également très enthousiasmés par la récente percée dans le champ de lectures neuronales ou
Nerf que nous envisageons à la fois d'incorporer certaines des caractéristiques des couleurs lumineuses dans
Formation du réseau d'occupation ainsi que l'utilisation de notre sortie de réseau comme état d'entrée pour NERF
En fait, Ashok est très excité à ce sujet, cela a été son projet de week-end personnel pendant un certain temps
sur ces nerfs parce que je pense que le monde universitaire en construit beaucoup
Modèles de fondation pour le langage en utilisant des tonnes de grands ensembles de données pour le langage, mais je pense pour les nerfs de la vision
vont fournir les modèles de fondation pour la vision par ordinateur car ils sont ancrés en géométrie et en géométrie
nous donne un bon moyen de superviser ces réseaux et gèles de l'exigence de définir une ontologie et la
La supervision est essentiellement gratuite parce que vous devez simplement rendre ces images de manière différente, donc je pense que dans le futur euh
idée du réseau d'occupation où vous savez que les images entrent et le réseau produit un
Représentation volumétrique de la scène qui peut ensuite être rendue différentiellement dans n'importe quelle image qui a été observée i i
Pensez personnellement être un avenir de vision par ordinateur et vous savez que nous faisons un travail initial là-dessus en ce moment mais je
Pensez à l'avenir à Tesla et dans le monde universitaire, nous verrons que ces
La combinaison de la prédiction à un coup de l'occupation volumétrique uh sera
mon pari personnel sexuel alors voici un exemple de résultat précoce d'un
Reconstruction 3D de nos données gratuites au lieu de se concentrer sur l'obtention de la reprojection RVB parfaite dans l'espace d'image
L'objectif principal ici est de représenter avec précision les avertissements Space 3D pour la conduite et nous voulons le faire pour tous
Nos données gratuites sur le monde dans toutes les conditions météorologiques et d'éclairage et évidemment c'est un très difficile
problème et nous vous recherchons pour aider enfin le réseau d'occupation
Avec un grand ensemble de données de niveau automatique sans aucun humain dans la boucle et avec cela, je passerai à Tim pour parler
sur ce qu'il faut pour former ce réseau merci Phil
[Applaudissements] Très bien, tout le monde parlons d'une formation
infrastructure donc nous avons vu quelques vidéos que vous connaissez quatre ou cinq ans je pense et nous soucient
plus et nous inquiéter davantage pour beaucoup plus de clips à ce sujet, donc nous avons regardé
Les réseaux d'occupation juste de Phil remplissent juste des vidéos.
Des cadres pour former ce réseau ce que vous venez de voir et si vous avez cent mille gpus euh, cela prendrait une heure
Mais si vous avez euh un GPU, cela prendrait cent mille heures pour ce n'est pas
Une période de temps humaine que vous pouvez attendre que votre travail de formation fonctionne à droite, nous voulons expédier plus rapidement que cela afin que
signifie que vous devrez aller parallèle, vous avez donc besoin d'un calcul plus calcul
Supercomputer donc c'est pourquoi nous avons construit trois superordinateurs en interne comprenant
sur 14 000 GPU où nous utilisons 10 000 GPU pour la formation et environ quatre mille
GPUS pour l'étiquetage automatique Toutes ces vidéos sont stockées dans 30 pétaoctets d'une vidéo gérée distribuée
Cache Vous ne devriez pas considérer nos ensembles de données comme fixes, disons que vous pensez à votre
ImageNet ou quelque chose que vous savez avec un million de trames, vous devriez le considérer comme une chose très fluide, donc nous avons un
Un demi-million de ces vidéos qui coulent dans et hors de ce cluster ces grappes chaque jour
Et nous suivons 400 000 de ce type d'instanciations vidéo Python chaque seconde
C'est donc beaucoup d'appels dont nous aurons besoin pour le capturer afin de gouverner les politiques de rétention de cela
Le cache vidéo distribué donc sous-jacent à tout cela est une énorme quantité d'infra que nous construisons et gérons
en interne pour que vous ne puissiez pas simplement acheter, vous connaissez 40 000
GPUS puis un 30 pétaoctets de Flash MVME et le mettez-le et allons-y à nous entraîner, il faut en fait beaucoup
Travaillez et je vais entrer dans un peu ce que vous voulez vraiment faire, c'est que vous voulez prendre votre accélérateur donc
Que ce pourrait être le GPU ou le dojo dont nous parlerons plus tard et parce que c'est le plus cher
Composant C'est là que vous souhaitez mettre votre goulot d'étranglement et cela signifie que chaque partie de votre système est
va devoir surpasser cet accélérateur et c'est donc vraiment compliqué
signifie que votre stockage devra avoir la taille et la bande passante pour fournir toutes les données dans les nœuds
Ces nœuds doivent avoir la bonne quantité de CPU et de capacités de mémoire pour alimenter votre apprentissage automatique
Framework Ce cadre d'apprentissage automatique doit ensuite le remettre à votre GPU, puis vous pouvez commencer à vous entraîner, mais vous
besoin de le faire sur des centaines ou des milliers de GPU d'une manière fiable
Logstap et d'une manière qui est également rapide, donc vous aurez également besoin d'une interconnexion extrêmement compliquée, nous parlerons plus
à propos du dojo dans une seconde alors je veux d'abord t'emmener à certains
Optimisations que nous avons faites sur notre cluster, nous obtenons donc beaucoup de vidéos et
La vidéo est très différente, disons que la formation sur les images ou le texte qui, je pense, est très bien établie, la vidéo est tout à fait
littéralement une dimension plus compliquée UM et c'est pourquoi nous devions aller se terminer
Pour se terminer de la couche de stockage jusqu'à l'accélérateur et optimiser chaque morceau de cela parce que nous nous entraînons sur le nombre de photons
Vidéos qui proviennent directement de notre flotte, nous nous entraînons directement sur ceux que nous ne publions pas du tout ceux
La façon dont cela est fait est que nous recherchons exactement les cadres que nous sélectionnons pour notre lot, nous les chargeons, y compris le
Des cadres sur lesquels ils dépendent, donc ce sont vos iframes ou vos images clés, nous les emballons, les déplacez-les dans partagés
La mémoire les déplace dans une double barre du GPU, puis utilisez le décodeur matériel qui n'est accéléré que pour
Décodez en fait la vidéo donc nous le faisons sur le GPU nativement et tout cela est dans une très belle extension Pytorch Python
Cela a débloqué plus de 30 augmentations de vitesse d'entraînement pour les réseaux d'occupation et libéré essentiellement un tout
CPU pour faire une autre chose, vous ne pouvez pas simplement faire de la formation avec
Vidéos Bien sûr, vous avez besoin d'une sorte de vérité au sol Euh et euh qui est en fait un problème intéressant aussi
Objectif pour stocker votre vérité sur le terrain est que vous voulez vous assurer que vous arrivez à votre vérité au sol que vous avez besoin dans le
quantité minimale d'opérations du système de fichiers et charge dans la taille minimale de ce dont vous avez besoin pour optimiser pour l'agrégat
traverser le débit du cluster parce que vous devriez voir un cluster de calcul comme un grand appareil qui a fixe en interne
contraintes et seuils donc pour cela, nous avons déployé un format qui
est originaire de nous qui s'appelle Small, nous utilisons ceci pour notre cache de fonctionnalité au sol notre cache de fonctionnalité et toutes les sorties d'inférence
Donc, beaucoup de tenseurs qui sont là-dedans et donc juste le dessin animé ici, disons que c'est votre euh est votre table que vous
Vous voulez stocker alors c'est ainsi que cela aurait l'air si vous vous déplacez sur le disque, alors ce que vous faites, c'est que vous prenez tout ce que vous
Vous voulez indexer, par exemple, les horodatages vidéo vous les mettez tous dans l'en-tête de sorte que dans votre en-tête initiale
Lisez vous savez exactement où aller sur le disque, alors si vous avez des tenseurs, vous allez essayer de transposer le
Dimensions pour mettre une dimension différente en dernier comme dimension contiguë, puis essayer également différents types de
Compression alors vous vérifiez lequel était le plus optimal, puis stockez celui-ci, c'est en fait une étape énorme si vous le faites
Caractéristique de mise en cache de sortie inintelligible du réseau d'apprentissage automatique tourne autour du
Dimensions un peu, vous pouvez obtenir jusqu'à 20 augmentation de l'efficacité du stockage, puis lorsque vous stockez, nous
a commandé les colonnes par taille afin que toutes vos petites colonnes et petites valeurs soient ensemble pour que lorsque vous cherchez un
Valeur unique, vous vous chevauchez avec une lecture sur plus de valeurs que vous utiliserez plus tard afin que vous n'ayez pas besoin de faire
Une autre opération du système de fichiers pour que je puisse continuer encore et encore, je viens de continuer
a abordé deux projets que nous avons en interne, mais cela fait en fait partie d'un énorme effort continu pour optimiser le
Calculez que nous avons en interne qui s'accumule et agrégait ainsi à travers toutes ces optimisations, nous entraînons maintenant notre
Les réseaux d'occupation deux fois plus vite juste parce qu'il est deux fois plus efficace et maintenant si nous ajoutons plus de calcul et d'allu
Parallèle, nous ne pouvons pas nous entraîner en quelques heures au lieu de jours et avec cela j'aimerais le remettre à
le plus grand utilisateur de calculer John
salut tout le monde, je m'appelle John Emmons, je dirige l'équipe de vision automatique, je vais couvrir deux sujets avec vous
Aujourd'hui, la première est la façon dont nous prédisons les voies et la seconde est la façon dont nous prédisons le comportement futur des autres agents sur la route
Dans les premiers jours du pilote automatique, nous avons modélisé le problème de détection de voie en tant que tâche de segmentation instantanée de l'espace d'image
Notre réseau était super simple, mais en fait, il était seulement capable d'imprimer des voies de quelques types différents de
Géométries spécifiquement, il segmenterait l'Eagle Lane qu'il pourrait segmenter adjacent
voies et ensuite il y avait un boîtier spécial pour les fourches et fusionne cette modélisation simpliste du problème
travaillé pour des routes très structurées comme les autoroutes, mais aujourd'hui, nous essayons de construire un système
C'est capable de manœuvres beaucoup plus complexes en particulier, nous voulons faire des virages gauche et à droite aux intersections
où la topologie de la route peut être un peu plus complexe et diversifiée lorsque nous essayons d'appliquer cette modélisation simpliste de la
Problème ici, il tombe totalement en panne en prenant du recul un instant quoi
Nous essayons de faire ici est de prédire l'ensemble d'étincelles des instances boiteuses dans leur connectivité et ce que nous voulons faire, c'est avoir un
réseau neuronal qui prédit essentiellement ce graphique où les nœuds sont les segments de voie et les bords codent
Connectivités entre ces voies donc ce que nous avons, c'est notre détection de voie
Réseau neuronal Il est composé de trois composants dans le premier composant, nous avons un ensemble de
couches convolutionnelles couches d'attention et autres couches de réseau neuronal qui codent les flux vidéo de nos huit
caméras sur le véhicule et produire une riche représentation visuelle
Nous améliorons ensuite cette représentation numérique avec des données de cartographie au niveau de la route de la feuille de route grossières avec lesquelles nous coderons
Un ensemble de couches de réseau de neurones supplémentaires que nous appelons le module de guidage de voie que cette carte n'est pas une carte HD mais elle
Fournit de nombreux conseils utiles sur la topologie des voies à l'intérieur des intersections, la voie compte sur diverses routes et un ensemble d'autres attributs qui
Aidez-nous les deux premiers composants ici ont produit un
Tensor dense qui code le monde, mais ce que nous voulons vraiment faire, c'est convertir ce tenseur dense en un
Ensemble intelligent de voies dans leurs connectivités, nous abordons ce problème comme une image
tâche de sous-titrage où l'entrée est ce tenseur dense et le texte de sortie est prédit dans un langage spécial qui
Nous avons développé à Tesla pour encoder des voies dans leurs connectivités dans cette langue de voies les mots et
Les jetons sont les positions de voie dans l'espace 3D dans l'ordre des jetons introduits modificateurs dans les jetons
Encoder les relations connectives entre ces voies en modélisant la tâche en tant que langue
Problème que nous pouvons capitaliser sur les récentes architectures et techniques autorégressives de la communauté linguistique pour gérer le multiple
Modalité du problème, nous ne résolvons pas seulement le problème de la vision de l'ordinateur au pilote automatique, nous appliquons également à l'état de l'art et
La modélisation des langues et l'apprentissage automatique plus généralement, je vais maintenant plonger dans un peu plus de détails ce composant linguistique
Ce que j'ai représenté à l'écran ici est l'image satellite qui représente en quelque sorte la zone locale autour du
Véhicule L'ensemble des bords de nez est ce que nous appelons le graphique de la voie et c'est finalement ce que nous voulons sortir de ce neural
Réseau Nous commençons par une ardoise vierge que nous allons vouloir faire notre premier
Prédiction ici à ce point vert, cette position de points verts est codé comme
Un index dans une grille de cours qui discrétise le monde 3D maintenant, nous ne prédisons pas directement cet indice
Parce que ce serait trop cher de le faire, il y a tout simplement trop de points de grille et de prédire une catégorielle
La distribution à ce sujet a à la fois des implications au moment de la formation et du temps de test, donc à la place ce que nous faisons, c'est que nous avons dérangé le
monde grossièrement, nous prédisons d'abord une carte de chaleur sur les emplacements possibles, puis nous verrouillons à l'endroit le plus probable
Nous avons ensuite affiné la prédiction et obtenons le point précis
Maintenant, nous savons où est la position de ce jeton, nous ne connaissons pas son type dans ce cas, bien que ce soit le début d'un nouveau
Lane donc nous l'approdons comme un jeton de début et parce que c'est un jeton d'étoile, il n'y a pas
Attributs supplémentaires dans notre langue, nous prenons ensuite les prédictions de cette première passe avant et nous les codant pour les
Utilisation d'une intégration supplémentaire apprise qui produit un ensemble de tenseurs que nous combinons ensemble
qui est en fait le premier mot de notre langue des voies, nous l'ajoutons à la première position que vous connaissez dans notre phrase ici
Nous continuons ensuite ce processus en imprimant le point de voie suivante de la même manière
Maintenant, ce point de voie n'est pas le début d'une nouvelle voie, c'est en fait une continuation de la voie précédente
C'est donc un type de jeton de continuation maintenant, ce n'est pas suffisant pour savoir que
Cette voie est connectée au plan précédemment protégé que nous voulons coder sa géométrie précise que nous faisons par
Régressant un ensemble de coefficients splines, nous prenons ensuite cette voie, nous l'encodons
encore et l'ajouter comme le mot suivant dans la phrase, nous continuons à prédire ces voies de continuation jusqu'à ce que nous arrivions à la
Fin de la grille de prédiction, nous passons ensuite à un segment de voie différent afin que vous puissiez voir que cyan dot là maintenant
c'est qu'il n'est pas topologiquement connecté à ce point rose, il s'épanouit en fait de ce bleu désolé ce vert
Poignez-vous donc il a un type de fourche et des jetons de fourche
pointer en fait vers les jetons précédents à partir desquels la fourche est originaire de donc vous
peut voir ici le prédicteur de point de fourche est en fait l'index zéro, donc il fait référence aux jetons qu'il est déjà prédit comme vous le feriez
langue que nous continuons ce processus encore et encore jusqu'à ce que nous ayons énuméré tout le
jetons dans le graphique Ling, puis le réseau prédit le jeton de fin de phrase
ouais je veux juste noter que la raison pour laquelle nous le faisons n'est pas seulement parce que nous voulons construire quelque chose de compliqué, c'est
Se sent presque comme une machine complète Turing ici avec des réseaux de neurones, c'est que nous avons essayé des approches simples pour
Exemple d'essayer de simplement segmenter les voies le long de la route ou quelque chose comme ça, mais le problème est quand
Il y a une incertitude dire que vous ne pouvez pas voir la route clairement et il pourrait y avoir deux voies ou trois voies et vous ne pouvez pas dire
Une approche simple basée sur la segmentation
L'algorithme post-traitement échouerait hilarante lorsque les prédictions sont telles que oui, les problèmes ne s'arrêtent pas là, je veux dire
Vous devez prédire ces conditions conjonctifs comme ces voies connectives à l'intérieur des intersections, ce qui n'est tout simplement pas possible avec l'approche que
Mention d'Ashok, c'est pourquoi nous avons dû passer à ce genre de chevauchements comme cette segmentation irait juste un détournement, mais même si vous essayez très fort de
Vous savez, les mettre sur des couches séparées, c'est juste un problème vraiment difficile quelle langue offre juste un très bon cadre pour l'obtention d'un
échantillon d'un postérieur plutôt que de vous, sachez essayer de faire tout cela en post-traitement
Mais cela ne s'arrête pas réellement pour le pilote automatique à droite John, cela peut être utilisé pour Optimus à nouveau, vous savez, je suppose qu'ils ne seraient pas
appelés voies, mais vous pouvez imaginer que vous connaissez en quelque sorte en cette étape, vous savez que vous pourriez avoir une sorte de chemins que vous connaissez en quelque sorte encodage le possible
des endroits où les gens pourraient marcher ouais c'est essentiellement si vous êtes dans une usine ou dans un cadre à domicile
Vous pouvez simplement demander au robot ok, laissez-moi parler à la cuisine ou s'il vous plaît acheminez vers un endroit dans l'usine
Et puis nous prédisons un ensemble de voies que vous savez que vous parcourez passer par les allées prendre le robot et dire bien
est comment vous arrivez à la cuisine, cela nous donne vraiment un joli cadre pour modéliser ces différents chemins qui simplifient le problème de navigation ou le
Planificateur en aval
Ce réseau de détection de voie est un ensemble de voies dans leurs connectivités qui proviennent directement du réseau
Aucune étape supplémentaire ici pour les simplifications pour les simple
Ceci est juste une sortie directe non filtrée du réseau
ok alors j'ai parlé un peu des voies
Autres sémantiques sur des objets, donc je vais juste aller très rapidement à travers deux exemples la vidéo sur le
Ici, nous avons une voiture qui monte en fait un feu rouge et se tourne devant nous ce que nous faisons pour gérer
Des situations comme celle-ci est que nous prédisons un ensemble de trajectoires futures à l'horizon court sur tous les objets que nous pouvons utiliser
Celles-ci anticipent la situation dangereuse ici et appliquez tout ce que vous savez, le freinage et l'action de direction sont nécessaires pour éviter une collision
Dans la vidéo à droite, il y a deux véhicules devant nous, celui sur la voie de gauche est garé apparemment c'est
Étant chargé de décharger, je ne sais pas pourquoi le conducteur a décidé de se garer là-bas, mais l'important est que notre réseau de neurones prédisait qu'il avait été arrêté
qui est la couleur rouge là-bas, le véhicule dans l'autre piste tel que vous le remarquez est également stationnaire mais
évidemment en attendant que ce feu rouge devienne vert, donc même si les deux objets sont stationnaires et ont une vitesse zéro, c'est la sémantique qui est
Vraiment important ici pour que nous ne nous retrouvions pas derrière cette voiture garée maladroite
La prévision de tous ces attributs d'agent présente des problèmes pratiques lorsque vous essayez de construire un système en temps réel
Nous devons maximiser la fréquence d'images de notre pile de section d'objet afin que le pilote automatique puisse réagir rapidement à l'environnement changeant
Chaque milliseconde compte vraiment ici pour minimiser la latence d'inférence que notre réseau neuronal est divisé en deux phases
Dans la première phase, nous avons identifié des emplacements dans l'espace 3D où les agents existent
Dans la deuxième étape, nous retirons ensuite les tenseurs à ces emplacements 3D, les ajoutez avec des données supplémentaires qui se trouvent sur le
véhicule, puis nous le savons faire le reste du traitement Cette étape de spécification permet au
Réseau neuronal pour se concentrer sur les domaines qui comptent le plus, ce qui nous donne des performances supérieures à une fraction du coût de latence
Ainsi, assembler le tout, la pile de vision du pilote automatique prédit plus que la géométrie et la cinématique de
le monde il prédit également un riche ensemble de sémantique qui permet une conduite sûre et humaine
Je ne vais pas remettre les choses dans la rue, nous nous disons comment nous gérons tous ces réseaux de neurones sympas sur notre ordinateur FSD merci
[Applaudissements]
salut tout le monde je suis sri aujourd'hui, je vais donner un aperçu de ce qu'il faut pour exécuter ces réseaux FSC dans le
voiture et comment optimiser pour la latence d'inférence uh aujourd'hui je vais me concentrer uniquement sur le
Réseau FSG LANES dont John vient de parler
Donc, quand vous avez commencé cette piste, nous voulions savoir si nous pouvons exécuter ce réseau FSC LANES nativement sur le moteur de voyage
qui est notre accélérateur de réseau neuronal interne que nous avons construit dans l'ordinateur FSD
Lorsque nous construisons ce matériel, nous avons gardé les choses simples et nous nous sommes assurés qu'il peut en faire un
chose des produits à points ridiculement rapides mais cette architecture est automatique
régressif et itératif là où il grimpe à travers de multiples blocs d'attention d'attention dans la boucle intérieure
produire des points clairsemés directement à chaque étape, donc le défi ici était de savoir comment
Pouvons-nous faire cette prédiction de point d'analyse et un calcul clairsemé sur un moteur de produit à points dense voyons comment nous avons fait cela
lors du voyage afin que le réseau prédit la carte thermique de
Les emplacements spatiaux les plus probables du point maintenant nous faisons un arc max et un
Opération cardiaque qui donne le seul codage dur de l'indice de l'emplacement spatial
Nous devons maintenant sélectionner l'incorporation associée à cet index à partir d'une table d'intégration qui est apprise pendant
Formation pour faire cela en voyage, nous avons en fait construit une table de recherche à SRAM et nous avons conçu
Les dimensions de cette incorporer de telle sorte que nous puissions réaliser toute cette chose avec une multiplication matricielle
Pas seulement que nous voulions aussi stocker cette intégration dans un cache de jeton donc
que nous ne récompensons pas cela pour chaque itération, réutilisez-le plutôt pour la prédiction de points futures, nous en avons tiré
Des trucs ici où nous avons fait toutes ces opérations juste sur le moteur de produit Dot, c'est cool que notre équipe
trouvé des moyens créatifs de cartographier toutes ces opérations sur le moteur de voyage de manière
qui n'étaient même pas imaginés lorsque ce matériel a été conçu, mais ce n'est pas la seule chose que nous devons
faire pour faire ce travail, nous avons réellement mis en œuvre beaucoup d'opérations et de fonctionnalités pour créer ce modèle
compilable pour améliorer la précision de l'apport ainsi que pour optimiser les performances
Toutes ces choses nous ont aidés à gérer le modèle de 75 millions de paramètres un peu moins de 10
millisecondes de latence ne consommant que 8 watts de puissance
Mais ce n'est pas la seule architecture qui fonctionne dans la voiture, il y a tellement d'autres modules et réseaux d'architectures
Nous devons courir dans la voiture pour donner un sentiment d'échelle Il y a environ un milliard de paramètres de tous les réseaux
combiné produisant environ 1000 signaux de réseau neuronal afin que nous devons nous assurer
Nous les optimisons conjointement et tels que nous maximions le calcul
Le débit d'utilisation et minimiser la latence afin que nous ayons construit un compilateur uniquement pour la neurones
réseaux qui partagent la structure des compilateurs traditionnels comme vous pouvez le voir
Graphique des filets neuronaux avec des nœuds de 150k et une connexion 375K prend cette chose
les partitions en sous-graphiques indépendants et com oblige chacun de ceux
Sous-graphiques nativement pour les dispositifs d'inférence, puis nous avons un réseau neuronal
Linker qui partage la structure de l'éditeur de liens traditionnels où nous effectuons cette optimisation de temps de lien
Là, nous résolvons un problème d'optimisation hors ligne pour avec une mémoire et une mémoire de calcul
contraintes de bande passante afin qu'elle soit livrée avec un calendrier optimisé qui est exécuté dans la voiture
Sur le temps d'exécution, nous avons conçu un système de planification hybride qui fait essentiellement
Planification hétérogène sur un SOC et planification distribuée sur les deux SOC pour exécuter ces réseaux dans un modèle
mode parallèle pour obtenir 100 gouttes d'utilisation de calcul, nous devons optimiser dans tous les
Couches de logiciels dès le réglage de l'architecture réseau le compilateur
La voie à la mise en œuvre d'un lien RDMA à bande haute à faible latence à la fois sur les SRC et en fait encore plus profondément
Comprendre et optimiser les chemins de données cohérents et non cohérents du cache de l'accélérateur dans le SOC C'est beaucoup
d'optimisation à tous les niveaux afin de s'assurer que nous obtenons la fréquence d'images la plus élevée et comme chaque milliseconde compte
Ici et c'est ce n'est que ceci est le
Visualisation des réseaux de neurones qui fonctionnent dans la voiture, c'est notre cerveau numérique essentiellement comme vous pouvez le voir
Ces opérations ne sont que la convolution de la multiplication matricielle pour nommer quelques opérations réelles fonctionnant dans la voiture
Pour former ou former ce réseau avec un milliard de paramètres, vous avez besoin de beaucoup de données étiquetées, donc Aegon va parler
À propos de notre réalisation avec le pipeline d'étiquetage automatique
Merci euh merci Sherry
euh salut tout le monde je suis Jurgen Zhang et je dirige une vision géométrique au pilote automatique
Alors oui, parlons de l'étiquetage automatique
Nous avons donc plusieurs types de tous les cadres d'étiquetage pour prendre en charge divers types de réseaux, mais aujourd'hui j'aimerais
Concentrez-vous sur le filet de voies impressionnantes ici afin de s'entraîner et de généraliser avec succès
Ce réseau à partout où nous pensons que nous avons fait des dizaines de millions de voyages
probablement un million d'intersection ou même plus
Ensuite, comment le faire pour que ce soit certainement réalisable de se procurer suffisamment
Montant des voyages parce que nous avons déjà comme Tim l'a expliqué plus tôt, nous avons déjà environ 500 000 voyages par jour
Um cependant convertir toutes ces données en formulaire de formation est un problème technique très difficile
Pour résoudre ce défi, nous avons essayé diverses manières d'étiquetage manuel et automatique, donc à partir de
La première colonne à la seconde de la deuxième à la troisième chaque avance nous a fourni une amélioration de près de 100 fois
débit mais encore euh, nous avons gagné une machine d'étiquetage automatique encore meilleure qui peut fournir
Fournir des fournisseurs de bonne qualité diversité et évolutivité
Pour répondre à toutes ces exigences, malgré l'énorme quantité d'efforts d'ingénierie requis ici, nous avons développé un
Machine d'étiquetage du nouvel ordre alimenté par reconstruction multi-thrib, afin que cela puisse remplacer 5 millions d'heures de
Étiquetage manuel avec seulement 12 heures en grappe pour étiqueter 10 000 voyages
Alors, comment nous avons résolu, il y a trois grandes étapes, la première étape est la trajectoire de haute précision et la récupération de la structure par
Odométrie inertielle visuelle multi-caméra donc ici toutes les caractéristiques, y compris la surface du sol, sont déduites des vidéos
par les réseaux de neurones puis suivis et reconstruits dans l'espace vectoriel
Ainsi, le taux de dérive typique de cette trajectoire en voiture est comme 1,3 centimètre
par mètre et 0,45 millian de radian par mètre, ce qui est assez décent, compte tenu de son calcul compact
exigence que le service de récupération et les détails bruts sont également utilisés comme solide
Conseils pour l'étape de vérification manuelle ultérieure Ceci est également activé dans chaque FSD
véhicule donc nous obtenons des trajectoires et des structures prétraitées ainsi que les données de voyage
La deuxième étape est la reconstruction multi-2 qui est le morceau grand et central de cette machine
La vidéo montre donc comment le voyage précédemment montré est reconstruit et aligné
avec d'autres voyages essentiellement d'autres voyages de personnes différentes pas le même véhicule, donc cela se fait par plusieurs
Étapes Internet comme l'alignement des cours Optimisation des joints correspondant à la paire, puis plus de raffinement de surface
En fin de compte, l'analyste humain entre et finalise l'étiquette
Ainsi, chaque étape heureuse est déjà entièrement parallélisée sur le cluster afin le
Le processus entier ne prend généralement que quelques heures
La dernière étape consiste en fait à étiqueter automatiquement les nouveaux voyages
Ici, nous utilisons le même moteur d'alignement multi-trip mais uniquement entre la reconstruction prédéfinie et chaque nouveau
Trip donc c'est beaucoup plus simple que de reconstruire complètement tous les clips
C'est pourquoi cela ne prend que 30 minutes par voyage vers un autre label au lieu de manuel
plusieurs heures d'étiquetage manuel et c'est aussi la clé de l'évolutivité
De cette machine, cette machine évolue facilement tant que nous
ont des données de calcul et de voyage disponibles, donc environ 50 arbres étaient nouvellement commandes
Étiqueté de cette scène et certains d'entre eux sont présentés ici, donc 53 de différents véhicules
C'est donc ainsi que nous capturons et transformons les tranches spatio-temps du monde en
La supervision du réseau ouais une chose que j'aime noter, c'est que encore une fois parlé de la façon dont nous
Étiquetez nos voies, mais nous avons des travailleurs automobiles pour presque toutes les tâches que nous faisons, y compris notre planificateur et beaucoup
Ceux-ci sont entièrement automatiques comme aucun humain impliqué par exemple pour des objets ou d'autres cinématiques, ils façonnent leur
Futures tout vient juste de l'étiquetage automatique et il en va de même pour l'occupation aussi et nous avons vraiment juste
construit une machine autour de celle-ci ouais donc si vous pouvez revenir en arrière une diapositive pas une de plus
Il est parallélisé sur un cluster donc cela semble assez simple mais
Ce n'était vraiment pas um peut-être c'est amusant de partager comment quelque chose comme ça se passe à propos de Um donc il y a quelque temps, nous n'en avions pas
Étiquetage automatique du tout, puis quelqu'un fait un script que cela commence à fonctionner, cela commence à mieux fonctionner jusqu'à ce que nous atteignions un
Volume qui est assez élevé et nous avons clairement besoin d'une solution et il y avait donc deux autres ingénieurs dans
Notre équipe qui était comme vous saviez que c'est une chose intéressante, vous savez, ce que nous devions faire était de construire tout un graphique de
Essentiellement fonctions Python que nous devons en exécuter une après l'autre d'abord vous tirez le clip puis vous faites un peu de nettoyage, alors vous faites
une certaine inférence du réseau puis une autre inférence du réseau jusqu'à ce que vous l'obteniez enfin, mais vous devez donc le faire en tant que
À grande échelle, donc je leur dis que nous devons probablement tirer pour vous connaître 100 000 clips par jour ou comme 100 000 articles
Cela semble bien euh et donc les ingénieurs disent bien que nous pouvons le faire, vous connaissez un peu de Postgres et un peu
de la graisse du coude, nous pouvons le faire en attendant que nous sommes un peu plus tard et nous en faisons 20
millions de ces fonctions chaque jour à nouveau, nous tirons environ un demi-million
clips et sur ceux que nous exécutons une tonne de fonctions chacune de ces éléments de streaming et c'est donc un peu le dos
finir infra qui est également nécessaire non seulement pour suivre l'entraînement, mais aussi l'étiquetage automatique ouais c'est vraiment comme une usine qui
produit des étiquettes et comme les lignes de production donnent une qualité d'inventaire de qualité comme tous les mêmes concepts appliqués à cela
Étiqueter uh uh qui s'applique à vous connaître l'usine de nos voitures qui est juste
ok uh merci euh alors ouais alors concluant
Cette sectionais j'aimerais partager quelques exemples plus difficiles et intéressants pour le réseau à coup sûr et même
pour les humains probablement euh, donc du haut, il y a des exemples comme un manque de mensonges ou une nuit brumeuse ou un rond-point
et des occlusions par de lourdes occlusions par des voitures garées et même une nuit pluvieuse avec leurs gouttes de pluie sur les lentilles
Ce sont difficiles, mais une fois que leurs scènes originales sont entièrement reconstruites par d'autres clips, ils peuvent tous être
Auto étiqueté pour que nos cartes puissent conduire encore mieux à travers ces scénarios difficiles
Alors maintenant, laissez-moi passer le micro à David pour en savoir plus sur la façon dont Sim crée le nouveau monde en plus de ces étiquettes merci
toi
Merci encore, je m'appelle David et je vais parler de la simulation, donc la simulation joue un rôle essentiel dans
Fournir des données difficiles à trouver et difficiles à étiqueter, mais les scènes 3D sont notoirement lentes
Pour produire, prendre par exemple la scène simulée jouant derrière moi
intersection complexe de Market Street à San Francisco Il faudrait deux semaines pour
artistes à compléter et pour nous qui est douloureusement lent, mais je vais parler de l'utilisation
Les étiquettes automatisées de vérité automatisées de Jaegan ainsi que de nouveaux outils qui nous permettent de générer de manière procédurale
scène et beaucoup l'aiment en seulement cinq minutes, c'est un incroyable mille fois plus rapide qu'avant
Alors, plongeons-nous dans notre scène comme celle-ci est créée, nous commençons par siter le terrain automatisé
Truth étique dans notre outil de créateur mondial simulé à l'intérieur du logiciel houdini en commençant par la limite de la route
Libellés Nous pouvons générer un maillage de route solide et le re-topologiser avec les étiquettes de graphique de voie, ce qui aide à informer la route importante
des détails comme la pente de carrefour et le mélange de matériaux détaillé
Ensuite, nous pouvons utiliser les données de ligne et balayer la géométrie sur sa surface et la projeter sur la route créant de la peinture de voie
décalcomanies ensuite en utilisant les bords médians que nous pouvons engendrer
Géométrie de l'île et peuples avec un feuillage randomisé qui change radicalement la visibilité de la scène
Maintenant, le monde extérieur peut être généré par une série d'heuristiques randomisées et des générateurs de construction modulaires
Créez des obstructions visuelles tandis que des objets placés au hasard comme les bornes d'incendie peuvent changer la couleur des courbes pendant
Les arbres peuvent laisser tomber les feuilles en dessous, les lignes ou les bords obscurcissent
Ensuite, nous pouvons apporter des données de carte pour éclairer les positions de choses comme les feux de trafic de trafic ou les panneaux d'arrêt que nous pouvons tracer
Il est normal de collecter des informations importantes comme le nombre de voies et même d'obtenir des noms de rue précis sur le
Signes eux-mêmes en utilisant le graphique de voie, nous pouvons déterminer la connectivité de la voie et le ponte directionnel
Marquages routiers sur la route et ils accompagnent les panneaux de signalisation et enfin avec un graphique de voie lui-même
Peut déterminer la contiguïté de la voie et d'autres mesures utiles pour engendrer un simulateur d'initié de permutations de trafic randomisé
Et encore une fois, tout cela est automatique sans artistes dans la boucle et se produit en quelques minutes et maintenant cela nous prépare à faire
Quelques choses assez cool car tout est basé sur les données et les heuristiques, nous pouvons commencer à fuzz
Paramètres pour créer des variations visuelles de la vérité au sol unique, il peut être aussi subtil que le placement d'objets et le hasard
L'échange de matériaux vers des changements plus drastiques comme des biomes ou des emplacements d'environnement entièrement nouveaux
Suburban ou rural Cela nous permet de créer des permutations ciblées infinies pour spécifique
Vérités au sol pour lesquelles nous avons besoin de plus de vérité au sol et tout cela se passe en un clic
bouton et nous pouvons même aller plus loin en modifiant notre vérité au sol
lui-même disent que John veut que son réseau accorde plus d'attention aux marques de route directionnelles
Pour mieux détecter une voie de virage à gauche captive à venir, nous pouvons commencer à modifier la procédure notre graphique de voie à l'intérieur
le simulateur pour aider les gens à créer entièrement de nouveaux flux à travers cette intersection pour aider
Concentrez l'attention du réseau sur les marques routières pour créer des prédictions plus précises et c'est un excellent exemple de la façon dont cela
L'outillage nous permet de créer de nouvelles données qui ne pourraient jamais être collectées dans le monde réel
Et la véritable puissance de cet outil est dans son architecture et comment nous pouvons exécuter toutes les tâches parallèles à l'infini
échelle, vous avez donc vu l'outil de créateur de carreaux en action convertissant la vérité du sol
Étiquettes dans leurs homologues Ensuite, nous pouvons utiliser notre outil d'extracteur de carreaux
Pour diviser ces données en tuiles GeoHash à environ 150 mètres carrés
Nous enregistrons ensuite ces données dans des fichiers séparés de géométrie et d'instance, cela nous donne une source propre de données faciles à
Charge et nous permet de rendre le moteur agnostique pour l'avenir
Ensuite, en utilisant un outil de chargeur de carreaux, nous pouvons convoquer n'importe quel nombre de ces carreaux de cache en utilisant un ID GeoHash actuellement que nous faisons actuellement
À propos de ces cinq carreaux par cinq ou trois par trois, généralement centrés autour des points chauds de flotte ou du graphique foncier intéressant
Les emplacements du chargeur de carreaux convertissent également ces ensembles de tuiles en actifs U pour la consommation
par le moteur Unreal et vous donne un produit de projet fini de ce que vous avez vu dans la première diapositive
Et cela nous prépare vraiment pour la taille et l'échelle comme vous pouvez le voir sur la carte derrière nous
Nous pouvons facilement générer la plupart des rues de la ville de San Francisco et cela n'a pas pris des années ni même des mois de travail mais
Plutôt deux semaines par une personne, nous pouvons continuer à gérer et à grandir
Ces données utilisant notre réseau PDG à l'intérieur de l'outillage cela nous permet de lancer
calculer dessus et régénérer tous ces ensembles de tuiles du jour au lendemain, cela garantit que tous les environnements sont de
une qualité et des fonctionnalités cohérentes qui sont super importantes pour la formation, car les nouvelles ontologies et signaux sont constamment
libéré et maintenant pour boucler la boucle parce que nous
généré tous ces ensembles de tuiles à partir de données de vérité au sol qui contiennent toutes les subtilités étranges du monde réel
Et nous pouvons combiner cela avec la variété visuelle et le trafic procédurale pour créer des données ciblées illimitées pour le
réseau pour apprendre et qui conclut la section SIM, je vais la transmettre à Kate pour parler de la façon dont nous pouvons
Utilisez toutes ces données pour améliorer le pilote automatique merci
merci david salut tout le monde, je m'appelle Kate Park et je suis là pour parler du moteur de données qui est le processus par lequel nous
Améliorer nos réseaux de neurones via des données, nous allons vous montrer comment nous résolvons de manière déterministe les interventions
via les données et vous guider à travers la vie de ce clip particulier dans ce scénario
Le pilote automatique s'approche d'un virage et prédit à tort que le véhicule traverse comme arrêté pour la circulation et donc
Un véhicule que nous ralentirions en réalité il n'y a personne dans la voiture, il est juste maladroitement garé, nous avons construit ceci
L'outillage pour identifier les erreurs de prédictions corrigez l'étiquette et catégorisez cela
Clip dans un ensemble d'évaluation Ce clip particulier se trouve être l'un des 126
que nous avons diagnostiqué comme des voitures garées difficiles à des virages à cause de cela
Infra nous pouvons organiser cet ensemble d'évaluation sans aucune ressource d'ingénierie personnalisée
à ce cas de défi particulier pour résoudre ce cas de défi
nécessite d'extraire des milliers d'exemples comme celui-ci et c'est quelque chose que Tesla peut trivialement faire, nous utilisons simplement nos données
Approvisionner les données de demande infra et utiliser l'outillage affiché précédemment pour corriger le
Libellés en ciblant chirurgicalement les erreurs erronées du modèle actuel, nous ajoutons seulement les plus précieux
Exemples à notre ensemble de formation, nous fixons chirurgicalement 13 900 clips et euh
Parce que ce sont des exemples où le modèle actuel lutte, nous n'avons même pas besoin de modifier l'architecture du modèle
La mise à jour de la manière simple avec ces nouvelles données précieuses est suffisante pour résoudre le cas de défi afin de voir que nous ne prédions plus
Ce véhicule traversant ce qui s'arrête comme indiqué en orange mais stationné comme indiqué en rouge
Dans le monde universitaire, nous voyons souvent que les gens gardent les données constantes, mais à Tesla, c'est
À l'opposé, nous voyons à maintes et maintes fois ces données sont l'une des meilleures sinon le levier le plus déterministe
Pour résoudre ces interventions, nous venons de vous montrer la boucle de moteur de données
Pour un cas de défi, à savoir ces voitures garées à des virages, mais il y a de nombreux cas de défi même pour un signal de
Mouvement du véhicule Nous appliquons cette boucle de moteur de données à chaque cas de défi que nous avons diagnostiqué s'il s'agit de bus
Les routes sinueuses ont arrêté les parkings des véhicules et nous n'ajouterons pas seulement des données une fois que nous
Faites-le encore et encore pour perfectionner le sémantique en fait cette année, nous avons mis à jour notre signal de mouvement de véhicule cinq fois
Et avec chaque mise à jour de poids formée sur les nouvelles données, nous poussons la précision de notre véhicule en haut et vers
Ce framework de moteur de données s'applique à tous nos signaux si ils sont 3D
Vidéo multi-came si les données sont étiquetées humaines étiquetées automatiquement ou simulées s'il s'agit d'un modèle hors ligne ou d'un
Le modèle de modèle en ligne et Tesla sont en mesure de le faire à grande échelle en raison de la flotte
Avantage l'infra que notre équipe moteur a construite et les ressources d'étiquetage qui alimentent nos réseaux
Pour s'entraîner sur toutes ces données, nous avons besoin d'une quantité massive de calcul, donc je vais le remettre à Pete et Ganesh pour parler de
La plate-forme de supercomputing dojo merci [applaudissements]
Merci merci Katie
Merci à tous merci d'avoir accroché là-bas, nous sommes presque là, je m'appelle Pete Bannon, je dirige la coutume
Des équipes en silicium et basse tension à Tesla et mon nom est Ganesh Venkat je dirige le
programme doji
[Applaudissements] Merci, on me demande souvent pourquoi une voiture
entreprise de construction d'un super ordinateur pour la formation et cette question fondamentalement
MisUnt comprend la nature de Tesla en son cœur, Tesla est une technologie hardcore
L'entreprise partout dans l'entreprise, les gens travaillent dur en science et en génie
Pour faire avancer la compréhension fondamentale et les méthodes dont nous disposons
Pour construire des robots de solutions énergétiques de voitures et toute autre chose que nous pouvons faire pour que nous puissions faire
Améliorer la condition humaine du monde
petit morceau de celui-ci dans le groupe semi-conducteur ce soir, nous allons parler un peu du dojo et vous donner un
Mise à jour sur ce que nous avons pu faire au cours de la dernière année, mais avant de le faire, je voulais donner un peu
Contexte sur la conception initiale que nous avons commencé il y a quelques années lorsque nous avons commencé l'objectif était de fournir un
Amélioration substantielle de la latence de formation pour notre équipe de pilote automatique
Les plus grands réseaux de neurones qu'ils ont formés aujourd'hui se déroulent pendant plus d'un mois, ce qui inhibe leur capacité à
Explorez des alternatives et évaluez-les afin que vous sachiez qu'une vitesse 30x serait
Vraiment sympa si nous pouvions le fournir d'une manière compétitive et compétitive en matière d'énergie
Pour ce faire, nous voulions construire une puce avec beaucoup d'arithmétique arithmétique
unités que nous pourrions utiliser à une efficacité très élevée et nous avons passé beaucoup de temps à étudier si nous pouvions faire cela
en utilisant DRM diverses idées d'emballage qui ont tous échoué et finalement même si
C'était comme un acte contre nature, nous avons décidé de rejeter DRAM comme support principal de stockage pour ce système et de nous concentrer plutôt
sur SRAM intégré dans la puce SRAM fournit malheureusement un modeste
quantité de capacité mais une bande passante extrêmement élevée et une latence très faible et cela nous permet d'obtenir une utilisation élevée
avec les unités arithmétiques ces choix
De ce choix particulier a conduit à tout un tas d'autres choix par exemple si vous voulez avoir une mémoire virtuelle dont vous avez besoin
tables de page qu'ils occupent beaucoup d'espace, nous n'avions pas d'espace, donc pas de mémoire virtuelle, nous n'avons pas non plus d'interruptions
Accelerator est un morceau de matériel Rob Bond qui est présenté à un compilateur
dans le compilateur est responsable de la planification de tout ce qui se passe de manière terministe, il n'y a donc pas besoin ou
Même le désir d'interruptions dans le système que nous avons également choisi de poursuivre le modèle
Le parallélisme comme méthodologie de formation qui n'est pas la situation typique
La plupart des machines utilisent aujourd'hui le parallélisme des données qui consomme une capacité de mémoire supplémentaire que nous n'avons évidemment pas
Ainsi, tous ces choix nous ont amenés à construire une machine assez radicalement
différent de ce qui est disponible aujourd'hui, nous avons également eu tout un tas d'autres objectifs l'un des plus importants était non
limites donc nous voulions construire un tissu de calcul qui évoluerait de manière illimité pour la plupart, je veux dire évidemment
Il y a des limites physiques de temps en temps mais vous savez à peu près si votre modèle était
Trop grand pour l'ordinateur, il suffit d'aller acheter un ordinateur plus grand, c'est ce que nous recherchions aujourd'hui comme le package
Les machines sont emballées, il y a un rapport assez fixe par exemple les processeurs GPU et
et la capacité de dram et la capacité du réseau et nous voulions vraiment désagréger tout cela afin que à mesure que les modèles évoluaient, nous pouvions
varier les ratios de ces différents éléments et rendre le système plus flexible pour répondre aux besoins du
Équipe du pilote automatique Ouais et c'est tellement vrai sans aucune limite la philosophie était notre étoile directrice
Tout le chemin tous nos choix étaient centrés autour de cela et et au
point que nous ne voulions pas que l'infrastructure de centre de données traditionnel limite notre
capacité à exécuter ces programmes à grande vitesse, c'est pourquoi nous
C'est pourquoi désolé c'est pourquoi nous avons intégré
verticalement notre centre de données centre de données entier en faisant une verticale
Intégration du centre de données Nous pourrions extraire de nouveaux niveaux d'efficacité que nous pourrions optimiser la puissance
refroidissement de la livraison et ainsi que la gestion du système à travers
L'ensemble du centre de données pile plutôt que de faire de la boîte par boîte et de l'intégrer
ces boîtes dans les centres de données et pour ce faire, nous voulions également
intégrer tôt pour déterminer les limites d'échelle pour notre
Téléphoniques de travail logiciels, nous avons donc intégré un environnement de dojo dans notre logiciel de pilote automatique très tôt et nous avons appris beaucoup de
Leçons et aujourd'hui, Bill Chang passera en revue notre mise à jour matérielle ainsi que certains
des défis auxquels nous avons été confrontés en cours de route et Rajiv Kurian vous donnera un
Avoir un aperçu de notre technologie de compilateur ainsi que de passer certains de nos résultats sympas
Juste là, tu pars
merci Pete merci ganesh um je vais commencer ce soir avec un haut niveau
Vision de notre système qui va aider à préparer le terrain pour les défis et les problèmes que nous
Résoudre et puis aussi comment les logiciels seront ensuite en tirer parti pour les performances
Maintenant, notre vision du dojo est de construire un seul accélération unifiée un très grand
Un logiciel verrait un plan de calcul transparent avec un plan mondial adressable
mémoire très rapide et tous connectés avec une bande passante élevée uniforme et
faible latence maintenant pour réaliser cela, nous devons utiliser
densité pour atteindre les performances maintenant, nous tirons parti de la technologie pour obtenir cette densité afin de rompre les niveaux de
hiérarchie de la puce aux systèmes d'échelle
Maintenant, la technologie du silicium a utilisé cela a fait cela depuis des décennies
a suivi la loi de Moore à la densité et à l'intégration pour obtenir une échelle de performance
Maintenant, une étape clé pour réaliser que la vision était notre carreau d'entraînement
bande passante extrêmement élevée, mais nous pouvons évoluer cela à un certain nombre de tuiles supplémentaires en les connectant simplement ensemble
L'année dernière, nous avons présenté notre première tuile d'entraînement fonctionnelle et à ce moment-là, nous avions déjà des charges de travail en cours d'exécution
et depuis lors, l'équipe ici a travaillé dur et avec diligence pour déployer
Ceci à grande échelle maintenant nous avons fait des progrès incroyables et avons eu beaucoup de jalons en cours de route et de
Bien sûr, nous avons eu beaucoup de défis inattendus, mais c'est là que notre échec rapidement
La philosophie nous a permis de repousser nos limites
Maintenant, poussant la densité des performances présente tous les nouveaux défis, un domaine est la livraison de puissance
Ici, nous devons fournir la puissance à notre dépécialité de calcul et cela a un impact direct
Nos performances de calcul de première ligne, mais nous devons le faire à une densité sans précédent, nous devons pouvoir correspondre à notre
pitt de mourir avec une densité de puissance de près d'un ampli par millimètre au carré
Et en raison de l'intégration extrême, cela doit être une verticale à plusieurs niveaux
Solution d'alimentation et parce qu'il y a une pile de matériaux hétérogènes complexes
Nous devons gérer soigneusement la transition matérielle, en particulier CTE
Maintenant, pourquoi le coefficient d'expansion thermique est-il important dans ce cas CTE est une propriété de matériau fondamental
Et si ce n'est pas soigneusement géré, cette pile se déchirerait littéralement
Nous avons donc commencé cet effort en travaillant avec des fournisseurs pour livrer pour développer ce
Solution d'énergie mais nous avons réalisé que nous devions réellement développer cette interne
Maintenant, pour équilibrer le calendrier et les risques, nous avons construit des itérations rapides pour soutenir
à la fois notre système évolue et le développement de logiciels et aussi pour trouver la conception optimale et
Empiler qui atteindrait nos objectifs de production finaux et à la fin, nous avons pu réduire le CTE plus de 50%
et rencontrer nos performances par 3x sur notre version initiale
Inutile de dire de trouver ce matériau optimal à empiler tout en maximisant
Les performances en densité sont extrêmement difficiles
Maintenant, nous avons eu des défis inattendus en cours de route, voici un exemple où nous poussons le
limites de l'intégration qui ont conduit à des défaillances des composants
Cela a commencé lorsque nous avons évolué vers des charges de travail plus grandes et plus longues, puis intermitètement un seul
Site sur une tuile échouerait maintenant, ils ont commencé comme des échecs récupérables, mais comme nous en poussons beaucoup
puissance supérieure et supérieure, ces échecs deviendraient permanents
Maintenant, pour comprendre cet échec, vous devez comprendre pourquoi et comment nous construisons notre
modules de puissance résolvant la densité à tous les niveaux
est la pierre angulaire de réellement atteindre les performances de notre système maintenant parce que notre plan X y est utilisé pour
communication de bande passante élevée tout le reste doit être empilé verticalement
Cela signifie que tous les autres composants autres que notre dé
Maintenant, cela comprend notre horloge et nos alimentations ainsi que nos contrôleurs de système
Maintenant, dans ce cas, les échecs étaient dus à perdre la production d'horloge de nos oscillateurs
Et après un débogage complet, nous avons constaté que la cause profonde était due à des vibrations sur le module de
Effets piézoélectriques de nos condensateurs à proximité
Maintenant, les bouchons de chant ne sont pas un phénomène nouveau et en fait très commun dans la conception de puissance
Mais normalement, les puces d'horloge sont placées dans un quartier très calme de la planche et souvent
non affecté par les circuits de puissance, mais parce que nous devions atteindre ce niveau d'intégration, ces oscillateurs ont besoin pour
être placé à proximité très proche en raison de notre fréquence de commutation et
Ensuite, la résonance des vibrations a créé, il a provoqué des vibrations de plan d'auto sur nos MEMS
L'oscillateur qui l'a fait craquer maintenant la solution à ce problème est un
Approche multipongue Nous pouvons réduire la vibration en utilisant des bouchons terminaux souples
Nous pouvons mettre à jour notre partie MEMS avec un facteur Q inférieur pour la direction du plan extérieur
Et nous pouvons également mettre à jour notre fréquence de fréquence de commutation pour repousser la résonance plus loin de ces
Bandes sensibles maintenant ajout à la densité euh à
Le niveau du système que nous avons fait beaucoup de progrès au niveau de l'infrastructure
Nous savions que nous devions réexaminer tous les aspects de l'infrastructure du centre de données
Afin de soutenir notre puissance et notre densité de refroidissement sans précédent
Nous avons apporté une CDU entièrement conçue sur mesure pour prendre en charge le refroidissement dense de Dojo
les exigences et la partie incroyable est que nous sommes en mesure de le faire à une fraction du coût par rapport à l'achat de l'étagère et
la modification et puisque notre armoire à dojo intègre suffisamment de puissance et de refroidissement pour correspondre à un
Rangée entière de standard IT Racks Nous devons concevoir soigneusement notre armoire et
infrastructure ensemble et nous avons déjà traversé plusieurs itérations de cette armoire pour optimiser
Ceci et plus tôt cette année, nous avons commencé à tester notre puissance et notre refroidissement
infrastructure et nous avons pu le pousser sur deux mégawatts avant de trébucher notre sous-station et de recevoir un appel de la
City ouais maintenant l'année dernière, nous n'avons introduit qu'un
Quelques composants de notre système la mort D1 personnalisée et la tuile de formation mais
Nous avons taquiné le pod de sortie comme notre objectif final, nous allons traverser les parties restantes de notre système qui sont nécessaires pour construire
Out ce pod de sortie maintenant, le plateau système est un élément clé de
Réalisant notre vision d'un seul accélérateur, cela nous permet de ne pas transporter en toute transparence
Connectez les carreaux ensemble non seulement dans l'armoire, mais entre les armoires
Nous pouvons connecter ces carreaux à un espacement très serré sur tout l'accélérateur
Et c'est ainsi que nous réalisons notre communication uniforme, c'est une barre de bus stratifiée qui permet
aux États-Unis pour intégrer le support mécanique et thermique à très haute puissance dans une intégration extrêmement dense
Il mesure 75 millimètres de hauteur et prend en charge six carreaux à 135 kilogrammes
Ceci est l'équivalent de trois à quatre racks à haute performance entièrement chargés
Ensuite, nous devons alimenter les données aux carreaux de formation, c'est là que nous avons développé le processeur d'interface Dojo
Il fournit à notre système une grande bande passante pour mettre en scène nos données de formation
Et il fournit une bande passante de mémoire complète à nos carreaux de formation en utilisant TTP notre personnalité
protocole que nous pouvons utiliser pour communiquer sur l'ensemble de notre accélérateur, il a également un Ethernet à grande vitesse qui
nous aide à étendre ce protocole personnalisé sur Ethernet standard et nous fournissons un support matériel natif
Pour cela avec peu ou pas de surcharge logicielle et enfin nous pouvons nous connecter
via une interface Gen 4 standard
Maintenant, nous coupons 20 de ces cartes par plateau et cela nous donne 640 gigaoctets de haut
DRAM de bande passante et cela fournit notre couche de mémoire désagrégée pour nos tuiles d'entraînement
Ces cartes sont une bande passante élevée ingérer à la fois via PCIe et Ethernet
Ils fournissent également un chemin de connectivité Z à taux Z élevé qui permet des raccourcis à travers notre gros dojo
accélérateur maintenant nous intégrons réellement l'hôte
Directement sous notre plateau système, ces hôtes fournissent notre traitement d'ingestion et se connectent à notre interface
Les processeurs via PCIe ces hôtes peuvent fournir une vidéo matérielle
Prise en charge du décodeur pour la formation en base vidéo et nos applications utilisateur atterrissent sur ces
hôtes que nous pouvons afin que nous puissions leur fournir l'environnement standard X86 Linux
Maintenant, nous pouvons mettre deux de ces assemblages dans une armoire et l'associer à des aliments redondants qui font directement
Conversion de la puissance de CA trois phase 480 volt en puissance CC 52 volts
Maintenant, en nous concentrant sur la densité à tous les niveaux, nous pouvons réaliser la vision d'un seul
Accelerator maintenant en commençant par les nœuds uniformes sur notre D1 DIM personnalisé
Nous pouvons les connecter ensemble dans notre carreau d'entraînement entièrement intégré, puis enfin nous connecter de manière transparente
eux à travers les limites de l'armoire pour former notre accélérateur de dojo
Et tous ensemble, nous pouvons abriter deux accélérateurs complets dans notre pod de sortie pour un
combinée une exaflop de calcul ML maintenant
La technologie et l'intégration n'ont jamais été effectuées que quelques fois dans le
Historique de calcul ensuite nous verrons comment les logiciels peuvent en tirer parti pour accélérer leurs performances
[Applaudissements]
Merci Bill, je m'appelle Rajiv et je vais parler de quelques chiffres, donc notre pile de logiciels commence par le PI
Extension de torche qui parle de notre engagement envers un modèle Pytorch standard hors de la boîte
Nous allons parler davantage de notre compilateur JIT et du pipeline Ingest qui alimente le matériel avec des données
Performances abstraitement Tops Times Utilisation Times Accélérateur Occupation
Nous avons vu comment le matériel fournit des performances de pointe est le travail du compilateur pour extraire l'utilisation du
matériel tandis que le code s'exécute dessus et c'est le travail du pipeline Ingest pour s'assurer que les données peuvent être entravées
Au débit suffisamment élevé pour que le matériel ne meure jamais de faim, alors parlons de pourquoi la communication
Les modèles liés sont difficiles à mettre à l'échelle, mais avant cela, voyons pourquoi les modèles Resnet 50 sont plus faciles à évoluer
Commencez avec un seul accélérateur exécutez les passes avant et vers l'arrière suivie de l'optimiseur
que pour évoluer cela, vous exécutez plusieurs copies de ceci sur plusieurs accélérateurs et bien que le gradient soit produit par
Le pass arrière doit être réduit et cela introduit une communication qui peut être effectuée avec le pipeline avec le
passer en arrière cette configuration évolue assez bien presque bien
linéaire pour les modèles avec des activations beaucoup plus grandes
Nous rencontrons un problème dès que nous voulons exécuter le pass en avant de la taille du lot qui tient en un seul
L'accélérateur est souvent plus petit que la surface de la norme par lots, donc pour contourner ces chercheurs exécutez généralement cette configuration sur plusieurs
accélérateurs en mode Norm de synchronisation, ce qui introduit la communication liée à la latence au chemin critique de
la passe avant et nous avons déjà un goulot d'étranglement de communication et bien qu'il existe des moyens de se déplacer
Ils impliquent généralement un travail manuel fastidieux le mieux adapté à un compilateur et, finalement, il n'y a pas de plinthe
autour du fait que si votre état ne rentre pas dans un seul accélérateur, vous pouvez être lié à la communication
Et même avec des efforts importants de nos ingénieurs ML, nous voyons que de tels modèles n'échellent pas linéairement
Le système Dojo a été conçu pour faire fonctionner ces modèles à une utilisation élevée
L'intégration de la densité est construite non seulement pour accélérer les parties liées à un modèle, mais aussi la latence
Des portions liées comme une norme par lots ou les parties liées à la bande passante comme un dégradé
Tous les paramètres réduits ou réduits tous une tranche de maille dojo peut être sculptée
Pour exécuter n'importe quel modèle, la seule chose que les utilisateurs doivent faire est de rendre la tranche suffisamment grande pour s'adapter à un
Surface de la salle de bain pour leur modèle particulier après cela la partition se présente
Comme un grand accélérateur libérant les utilisateurs de se soucier des détails internes de l'exécution
et comme le travail du compilateur pour maintenir cette abstraction primitives de synchronisation des grains fins
La latence faible uniforme facilite l'accélération de toutes les formes de parallélisme à travers les limites d'intégration Tenseurs
sont généralement des magasins francs dans SRAM et reproduits juste à temps pour l'exécution des couches, nous dépendons du dojo élevé
La bande passante pour masquer ce temps de réplication La réplication du tenseur et d'autres transferts de données se chevauchent avec du calcul
Et le compilateur peut également recomputer les couches lorsqu'il est rentable de le faire
Nous nous attendons à ce que la plupart des modèles fonctionnent hors de la boîte comme exemple, nous avons pris le modèle de diffusion stable récemment publié et obtenu
Il fonctionne sur le dojo en quelques minutes de la boîte, le kampala a pu le cartographier parallèlement à 25 dojo décédé
Voici quelques photos d'un cyber-camion sur Mars généré par une diffusion stable fonctionnant sur Dojo
semble [applaudissements]
On dirait qu'il a encore des moyens à parcourir avant de faire correspondre l'équipe Tesla Design Studio
Nous avons donc expliqué comment les goulots d'étranglement de la communication peuvent entraver l'évolutivité peut-être un test acide d'un compilateur et
Le matériel sous-jacent exécute une couche de formulaire croisé comme mentionné avant cela peut être un goulot d'étranglement en série
La phase de communication d'un baccalauréat commence par des nœuds calculant la moyenne locale et les écarts-types alors
coordination pour réduire ces valeurs puis diffuser ces valeurs, puis ils reprennent leur travail en parallèle
Alors, à quoi ressemblerait une forme de lot idéale sur 25 points de dojo disons que les activations moins précédentes
sont déjà divisés sur des dés, nous nous attendrions à ce que 350 nœuds sur chacun
mourir pour coordonner et produire des valeurs de moyenne locale et de division standard idéalement, elles obtiendraient plus loin
réduit avec la valeur finale se terminant quelque part et vers le milieu de la tuile, nous espérions alors voir une émission de
Cette valeur rayonnant du centre voyons comment le compilateur exécute réellement une véritable opération de baccalauréat
À travers 25 dés, les arbres de communication ont été extraits du compilateur et le
Le timing provient d'un véritable matériel, nous sommes sur le point de voir 8750 nœuds sur 25 matrices
coordination pour réduire puis diffuser la moyenne de Bastrum et les vannes d'écart type
composez la réduction locale suivie d'une réduction mondiale vers le milieu de la cravate
Ensuite, la diffusion de valeur réduite rayonnant du milieu accéléré par la diffusion du matériel
installation Cette opération ne prend que cinq
microsecondes sur 25 dés dojo La même opération prend 150 microsecondes sur 24
GPUS Il s'agit d'une amélioration des ordres d'ampleur par rapport aux GPU
Et bien que nous ayons parlé d'une opération entièrement réduite dans le contexte d'une norme par lots, il est important de réitérer que le
Les mêmes avantages s'appliquent à toutes les autres primitives de communication et ces primitives sont essentielles à grande échelle
formation ainsi que la performance complète du modèle, donc pendant que nous pensons que le résonant 50 est
Pas une bonne représentation des charges de travail Tesla du monde réel, c'est une référence standard alors commençons-y
Nous sommes déjà en mesure de faire correspondre le 100 Die pour Die mais peut-être un soupçon de dojo
Capacités est que nous sommes en mesure de frapper ce numéro avec juste un lot de 8 par mat
Mais Dojo a été vraiment construit pour s'attaquer aux modèles complexes plus grands, donc lorsque nous avons décidé de s'attaquer au monde réel
Les charges de travail que nous avons examinées les modèles d'utilisation de notre cluster GPU actuel et deux modèles se tenaient sur l'étiquetage automatique
réseaux une classe de modèles hors ligne qui sont utilisés pour générer la vérité au sol et les réseaux d'occupation que vous avez entendus
À propos des réseaux d'étiquetage automobile sont de grands modèles qui ont une intensité arithmétique élevée tandis que les réseaux d'occupation
Peut être dans JustBound, nous avons choisi ces modèles car ensemble, ils représentent une grande partie de notre cluster GPU actuel
usage et ils défieraient le système de différentes manières
Alors, comment faisons-nous sur ces deux réseaux Les résultats que nous sommes sur le point de voir ont été mesurés sur des systèmes multi-dies pour les deux
le GPU et le dojo mais normalisés à des numéros par matrice sur notre réseau d'étiquetage automobile, nous sommes
déjà capable de dépasser les performances d'un A100 avec notre matériel actuel fonctionnant sur nos VRM de génération plus ancienne
Notre matériel de production avec nos nouveaux VRAM qui se traduit par doubler le débit d'un A100
Et notre modèle a montré qu'avec certaines optimisations clés du compilateur, nous pourrions atteindre plus de trois performances supplémentaires d'un
A100 Nous voyons des sauts encore plus importants sur le réseau d'occupation
presque 3x avec notre matériel de production avec de la place pour plus
étranger [applaudissements]
Niveau de performances du compilateur Nous pourrions remplacer le calcul ML de One Two Two Four Five Five et Six GPU
Boîtes avec juste une seule tuile de dojo [applaudissements]
Et cette tuile de dojo coûte moins d'une de ces boîtes GPU whoa
Ouais ce que ça veut vraiment, c'est que les réseaux
Cela a pris plus d'un mois pour s'entraîner maintenant moins d'une semaine
Hélas, lorsque nous mesurons les choses, cela ne s'est pas si bien passé au niveau de la torche à tarte, nous n'avons pas vu
Notre performance attendue du Git et ce tableau de chronologie montre notre problème les minuscules petits bars verts qui
Le code de compilation fonctionnant sur l'accélérateur La ligne est principalement un espace blanc où le
Le matériel n'attend que des données avec nos hôtes Dense ML Compute Dojo
ont effectivement 10 fois plus de calcul ML que l'hôte GPU que le chargeur de données fonctionne sur cet hôte ne pouvait tout simplement pas
Suivez tout ce matériel ML afin de résoudre notre évolutivité de chargeur de données
Problèmes que nous savions que nous devions surmonter la limite de cet hôte unique Le protocole de transport Tesla déplace les données
sans couture à travers les carreaux d'hôte et ingérer des processeurs, nous avons donc étendu la Tesla
Protocole de transport pour travailler sur Ethernet, nous avons ensuite construit l'interface de réseau Dojo appelé le DNIC pour tirer parti de TTP sur
Ethernet cela permet à n'importe quel hôte avec une carte DNIC de pouvoir le dm et
à partir d'autres points de terminaison TTP, nous avons donc commencé avec le maillot dojo
Ensuite, nous avons ajouté un niveau d'hôtes de chargement de données équipés de la carte DNIC
Nous avons connecté ces hôtes au maillage via un commutateur Ethernet maintenant que chaque hôte de ce niveau de chargement de données est capable de
Atteindre tous les points de terminaison TTP dans le maillage du dojo via le matériel accéléré DMA
Après que ces optimisations soient passées dans notre occupation sont passées de quatre pour cent
à 97% afin que les sections de chargement des données aient réduit
Données Les sections de chargement des données ont considérablement réduit et le matériel ML est occupé, nous nous attendons en fait à ce
Numéro pour aller à 100 peu de temps après ces modifications, nous avons vu la pleine accélération attendue du pytorch
couche et nous étions de retour en affaires, nous avons donc commencé avec la conception matérielle qui
Brise les limites d'intégration traditionnelles au service de notre vision d'un seul accélérateur géant
Nous avons vu comment le compilateur et juste les calques se construisent au-dessus de ce matériel, donc après avoir prouvé vos performances
Ces réseaux complexes du monde réel, nous savions ce que notre premier déploiement à grande échelle ciblerait notre haut
Réseaux d'étiquetage automatique d'intensité arithmétique qui occupe 4000 GPU sur 72
GPU Racks avec notre ordinateur dense et nos performances élevées, nous nous attendons à fournir
Même débit avec seulement quatre armoires Dojo
[Applaudissements]
Et ces quatre armoires Dojo feront partie de notre premier exopode que nous prévoyons de construire au trimestre un de 2023
Celui-ci plus que la capacité d'étiquetage automatique de Double Tesla
[Applaudissements] La première partie supplémentaire fait partie d'un total
de sept pièces supplémentaires que nous prévoyons de construire à Palo Alto ici à travers le mur
[Applaudissements] Et nous avons une armoire d'affichage de l'un de ces exopodes pour que tout le monde puisse regarder
Six carreaux densément emballés sur un plateau 54 Petaflops de calcul 640 gigaoctets de
Mémoire de bande passante élevée avec puissance et hôte pour le nourrir
beaucoup et nous construisons de nouvelles versions de
Tous nos composants de cluster et améliorant constamment notre logiciel pour atteindre de nouvelles limites de compétence, nous croyons que nous
peut obtenir une autre amélioration 10X avec notre matériel de prochaine génération
Et pour réaliser leurs objectifs ambitieux, nous avons besoin des meilleurs logiciels et ingénieurs matériels, alors venez nous parler ou
Visitez Tesla.com AI Merci [Applaudissements]
Très bien, faites-le moi savoir
Très bien, donc nous espérons que c'était assez de détails
Et maintenant nous pouvons passer à des questions um et euh les gars comme je pense que l'équipe
Je suis revenu sur scène et mais nous voulions vraiment montrer la profondeur
et l'étendue de Tesla en intelligence artificielle UM
Calculez les actionneurs de robotique matérielle et [Music]
Et essayez de vraiment éloigner la perception de l'entreprise
Beaucoup de gens pensent que nous sommes comme une entreprise automobile ou nous faisons des voitures cool, mais euh
Ils n'ont pas la plupart des gens ne savent pas que Tesla est sans doute le leader
matériel et logiciel de l'IA réel du monde réel et que nous construisons
euh quelle est sans doute le premier euh certains des plus radicaux
Architecture informatique depuis le supercalculateur du crayon et je pense que si vous êtes intéressé
Développement de certaines des technologies les plus avancées du monde qui va vraiment affecter le monde dans un
façon positive, euh nous dit l'endroit où être alors oui, tissons-nous avec certains
Questions Je pense qu'il y a un micro à l'avant et un
micro à l'arrière euh
Merci beaucoup j'ai été impressionné ici ouais j'ai été beaucoup impressionné par
Optimus mais je me demande pourquoi ils n'ont pas chassé la chasse pourquoi avez-vous choisi un
Approche entraînée pour la chasse parce que les tendons ne sont pas très durables et
Pourquoi le ressort est bien chargé, c'est assez cool génial oui
C'est une excellente question, vous savez quand il s'agit de tout type de système d'actionnement, il y a des compromis
entre vous savez si c'est un système d'urine tendon ou un type de système basé sur la liaison, je continue
l'esprit près de la bouche un peu plus proche ouais Jeremy cool um alors ouais la principale raison pour laquelle nous sommes allés
Pour un système basé sur les tendons, c'est que vous savez d'abord que nous avons en fait étudié certains tendons synthétiques, mais nous avons constaté que
Les câbles de navigation métalliques êtes-vous beaucoup plus fort um l'un des avantages de ces câbles
Um est qu'il est très bon pour la réduction de parties, nous voulons faire beaucoup de ces mains, donc avoir un tas de parties A
Une tasse de petits liens finit par être un problème lorsque vous faites beaucoup de quelque chose l'une des grandes raisons
que vous savez que les tendons sont meilleurs que les liens dans un sens, c'est que vous pouvez être anti-backlash
Donc, anti-Backlash, vous savez, vous permet de ne pas avoir de lacunes ou vous
Connaître le mouvement bégaiement dans vos doigts à ressort principalement ce que le ressort est chargé
nous permet de faire est qu'il nous permet d'avoir une ouverture active afin de devoir
avoir deux actionneurs pour faire fermer les doigts puis ouvrir, nous avons la capacité de savoir que le tendon les conduise
fermé, puis les ressorts s'étendent passivement et c'est quelque chose qui est vu entre nos mains aussi à droite, nous avons le
Capacité à fléchir activement, puis nous avons également la capacité de prolonger oui
Je veux dire que notre objectif avec Optimus est d'avoir un robot qui est au maximum utile comme
rapidement que possible, il existe donc beaucoup de façons de résoudre les divers problèmes d'un robot humanoïde
Um et euh, nous ne rechignant probablement pas le bon arbre sur tous les techniques
Solutions et je devrais dire que nous sommes prêts à évoluer les solutions techniques que vous voyez ici au fil du temps
Nous ne sommes pas qu'ils ne sont pas enfermés dans la pierre um mais nous devons choisir quelque chose
Um et nous voulons choisir quelque chose qui va nous permettre de produire le robot le plus rapidement possible
et l'avoir comme je l'ai dit être utile le plus rapidement possible, nous essayons de suivre l'objectif du chemin le plus rapide vers un
Robot utile qui peut être fait en volume et nous allons tester le robot en interne à Tesla Uh dans notre usine
Et euh et voyez à quel point est-il utile parce que vous devez avoir un
va fermer la boucle sur la réalité pour confirmer que le robot est en fait utile
euh et euh ouais donc nous allons juste l'utiliser pour construire des choses et nous nous sommes
Confiant que nous puissions le faire avec la main que nous avons actuellement conçue, mais ce je suis sûr qu'ils seront eu une version deux
Version trois et nous pouvons modifier l'architecture de manière assez considérablement au fil du temps
Désolé salut um tu es le robot Optimus est vraiment impressionnant que tu aies fait un excellent travail
Um Bipedal Robots est vraiment difficile, mais ce que j'ai remarqué peut manquer de votre plan, c'est euh pour reconnaître le
utilité de l'esprit humain et je me demande si Optimus aura jamais une personnalité et pourra rire de notre
blagues pendant qu'ils ont bien, il plie nos vêtements ouais absolument
Um je pense que nous voulons avoir des versions vraiment amusantes d'Optimus
um et pour que les optimistes puissent tous deux être utilitaires et effectuer des tâches mais peuvent également être
Un peu comme un ami um et un copain et et um traîner avec
Vous et je suis sûr que les gens penseront à toutes sortes d'utilisations créatives pour ce robot
Um et euh vous connaissez la chose une fois que vous avez l'intelligence et les actionneurs de base
compris alors vous pouvez réellement que vous connaissez toutes sortes
Costumes je suppose sur le robot, je veux dire que vous pouvez faire en sorte que le robot ait paraître euh
vous pouvez scanner le robot de différentes manières um et um je suis sûr que les gens trouveront euh
façons très intéressantes de pour euh ouais des versions d'Optimus donc
Merci pour la grande présentation, je voulais savoir s'il y avait un équivalent aux interventions dans Optimus
Il semble que l'étiquetage à travers des moments où les humains sont en désaccord avec ce qui se passe est important et dans un robot humanoïde
Cela pourrait également être une source d'information souhaitable
oui ça disait euh ouais je pense que nous avons euh, nous aurons des moyens de
À distance, exploitez le robot et intervenant lorsqu'il fait quelque chose de mauvais, surtout lorsque nous formons le robot et
L'apporter um et j'espère que nous le savons de le concevoir d'une manière que nous pouvons empêcher le robot de
Si ça va frapper quelque chose, nous pouvons aimer le tenir et cela ne l'arrêtera pas que vous ne savez pas écraser votre main ou quelque chose et ce sont tous des interventions
Données euh ouais et nous pouvons également apprendre de nos systèmes de simulation où nous pouvons
Vérifiez les collisions et supervisez que ce sont de mauvaises actions ouais je veux dire si Optimus que nous voulons au fil du temps
Pour que ce soit um, vous connaissez un type Android Android que vous aviez vu dans des films de science-fiction comme
Star Trek la prochaine génération comme Data, mais nous pourrions évidemment programmer le robot comme moins de robot et plus sympathique
Et et euh vous savez que vous pouvez évidemment apprendre à imiter les humains et et à vous sentir très naturel
Donc, comme Ai en général améliore UH, nous pouvons ajouter cela au robot et
um tu sais qu'il devrait évidemment être capable de faire des instructions simples euh ou même
dans ce que c'est que vous voulez um pour que vous puissiez lui donner une instruction de haut niveau et puis il peut casser cela
dans une série d'actions et et prendre ces actions
salut uh ouais c'est excitant de penser qu'avec l'optimus tu vas penser que
Vous pouvez obtenir des ordres d'ampleur d'amélioration et de production économique
um c'est vraiment excitant um et quand Tesla a commencé, la mission était d'accélérer l'avènement de
énergie renouvelable ou transport durable donc avec l'Optimus
Voyez toujours cette mission étant cet énoncé de mission de Tesla ou va-t-il être mis à jour avec vous savez
mission d'accélérer l'avènement de je ne connais pas l'abondance infinie ou
Économie illimité sans limites ouais je veux dire que ce n'est pas strictement
Parler Um Optimus ne parlait pas à proprement dire euh
directement en ligne avec euh accélérer l'énergie durable que vous savez
Dans la mesure où il est plus efficace pour faire avancer les choses qu'une personne, je suppose, aidez-vous si vous savez
énergie durable mais je pense que la mission fait effectivement un peu élargir avec l'avènement d'Optimus uh à
Euh tu sais que je ne sais pas rendre le futur génial pour que tu saches que je pense que toi
Regardez les optimistes et um je sais à propos de vous mais je suis ravi de voir quels optimistes deviendront
Et vous savez que c'est comme si vous saviez si vous le pouviez, je veux dire que vous pouvez dire comme une technologie donnée
Si tu veux voir ce que c'est dans un an deux ans trois ans quatre ans cinq ans dix
Je dirais que tu veux vraiment voir ce qui s'est passé avec Optimus um alors que tu connais un tas d'autres
Technologies êtes-vous en quelque sorte en quelque sorte à la plate-forme des noms de noms ici mais euh
[Rires] um tu le sais
Je pense que Optimus va être incroyable dans cinq ans dix ans comme un souffle et je suis vraiment
Intéressé de voir ça se produire j'espère que tu es trop oh je pense
um j'ai une question rapide ici je suis Justin et je me demandais comme si tu es
planifier d'étendre comme des capacités de conversation pour le robot et mon deuxième
La question de suivi à cela est ce qui est comme l'objectif final Quel est l'objectif final avec Optimus
Euh ouais, les optimistes auraient certainement des capacités de conversation.
um je
naturel donc du point de vue de l'appel, je suis je ne sais pas, je pense que ça va continuer
Continuez à évoluer et je ne sais pas où se termine mais
un endroit intéressant à coup sûr, tu sais que nous devons toujours faire attention
À propos de vous, vous savez, ne descendez pas sur le chemin du terminateur, c'est un tu sais que je
pensé pour peut-être que nous devrions commencer par une vidéo de comme le terminateur commençant par ça, vous connaissez le crâne
écrasant mais oh ça pourrait être je ne sais pas si tu veux prendre ça trop au sérieux, alors oui tu sais que nous voulons que nous voulons Optimus
Soyez en sécurité donc nous concevons dans les garanties UM où vous pouvez euh localement
Arrêtez le robot um et euh vous savez avec comme un
Contrôlez la ROM que vous ne pouvez pas mettre à jour sur Internet qui, je pense, c'est assez important
um essentiel franchement um so
euh comme un bouton d'arrêt localisé um à distance télécommandée quelque chose comme
que cela ne peut pas être changé
Mais je veux dire que ça va certainement être intéressant que ce ne sera pas ennuyeux donc
ok ouais je te vois aujourd'hui que tu as un produit très attrayant avec le dojo et ses applications, donc je me demande quel est le
Future for Dojo Platform que nous aimerions fournir comme une infrastructure et un service d'infrastructure comme AWS ou
Vous serez comme une vende une puce comme le nvidia, donc fondamentalement ce qui est l'avenir à cause de je dis que vous utilisez un sept
nanomètre pour que le coût du développeur soit à plus de 10 millions de dollars américains comment faire du pénis comme un plan professionnel
ouais je veux dire que um dojo est un est un très grand ordinateur um et nous utiliserons en fait beaucoup de
puissance et a besoin de beaucoup de refroidissement, donc je pense que ça va probablement être plus logique que le dojo fonctionne comme euh
Amazon Web Services Way que d'essayer de le vendre à quelqu'un d'autre
um donc le plus qui serait le moyen le plus efficace de faire fonctionner le dojo est juste que ce soit un service que vous
peut utiliser euh qui est disponible en ligne et que où vous pouvez former vos modèles
plus rapide et pour moins d'argent et que comme le
Um World Transitions vers le logiciel 2.0
Et c'est sur la carte de bingo quelqu'un que je sais qu'il doit savoir comment boire cinq tequilas
Um alors voyons Um Software 2.0
[Rires] Ouais, nous utiliserons beaucoup de filet neuronal
la formation si euh vous savez que cela a du sens qu'au fil du temps, car il y a plus de neurones
des trucs nets que les gens voudront utiliser et euh le plus rapide à moindre coût neuronal
Système de formation net donc je pense qu'il y a beaucoup d'opportunités dans cette direction
salut mon nom est Ali Jahanian merci pour cet événement c'est très inspirant mon
La question est um je me demande quelle est votre vision pour euh
Des robots humanit qui comprennent nos émotions et nos arts et peuvent contribuer à
Notre créativité bien je pense qu'il y a ça
Voir déjà des robots qui, au moins, sont capables de générer très intéressant
Art avec comme Dali um et Dali 2. Um
Et je pense que nous allons commencer à voir l'IA qui peut réellement générer des films même qui ont une cohérence
Comme des films intéressants et raconter des blagues, il est tout à fait remarquable à quelle vitesse l'IA est
Euh avançant UM dans de nombreuses entreprises en plus de Tesla
Nous nous dirigeons vers un avenir très intéressant et euh ouais alors
Vous voulez commenter cela ouais je suppose que euh le robot optimiste peut proposer de l'art physique, pas seulement de l'art numérique
Vous pouvez savoir que vous pouvez demander des mouvements de danse dans du texte ou de la voix et ensuite vous pouvez les produire dans le futur donc
C'est beaucoup comme le cœur physique pas seulement l'art numérique oh ouais ouais les ordinateurs peuvent absolument
faire un art physique ouais ouais 100 ouais comme la danse sûre jouer au football ou tout ce que vous
um je veux dire qu'il doit devenir plus agile mais avec le temps à coup sûr
Merci beaucoup pour la présentation pour les diapositives de Tesla au pilote automatique que j'ai remarquées
que les modèles que vous utilisiez étaient fortement motivés par des modèles de langues et je me demandais de quoi l'histoire
Était et combien d'amélioration cela a donné, je pensais que c'était un choix curieux vraiment intéressant à utiliser
Modèles linguistiques pour la transition de la voie, il y a donc une sorte de deux aspects pour expliquer pourquoi nous sommes passés à la modélisation des langues donc
le premier discours de conversation fort et ferme bien ok,
Oui, donc les modèles de langue nous aident de deux manières de la première façon, c'est qu'il nous permet de prédire les voies que nous ne pouvions pas avoir
Sinon, en tant que tronçon mentionné mentionné plus tôt lorsque nous avons prédit des voies en quelque sorte d'une manière 3D dense que vous ne pouvez que
modéliser certains types de voies, mais nous voulons obtenir ces connexions sillonnantes à l'intérieur des intersections, il n'est tout simplement pas possible de le faire sans en faire un
Prédiction de graphique Si vous essayez de le faire avec une segmentation dense, cela ne fonctionne tout simplement pas, la prédiction de la voie est un multimodal
Problème Parfois, vous n'avez tout simplement pas suffisamment d'informations visuelles pour savoir précisément à quoi ressemblent les choses sur l'autre
côté de l'intersection afin que vous ayez besoin d'une méthode qui peut généraliser et produire UM vous connaissez des prédictions cohérentes vous
Je ne veux pas prédire deux voies dans trois voies en même temps que vous souhaitez vous engager dans un modèle génératif comme ces modèles de langage fournissent que
salut oh salut uh mon nom est giovanni um ouais merci pour la présentation
C'est vraiment sympa j'ai une question pour notre équipe FSD, donc pour les réseaux de neurones comment faites-vous
Tester comme comment effectuez-vous des tests d'unité logiciels de test unitaire
des milliers ou euh oui les cas où
Donc le réseau neuronal qu'après l'avoir entraîné, vous devez le passer avant de le publier en tant que produit bien euh ouais
Quelles sont vos stratégies de test d'unité logicielle pour cela fondamentalement ouais heureux que vous ayez demandé qu'il y ait comme une série de tests
que nous avons défini UH à partir de vous, le test unitaire du logiciel lui-même, mais pour les modèles de réseau neuronal, nous avons des ensembles VIP définis où
Vous savez que vous pouvez définir euh si vous avez juste un grand ensemble de tests qui ne suffit pas à ce que nous trouvons nous avons besoin comme
Les ensembles VIP UH sophistiqués pour différents modes de défaillance, puis nous les organisons et les grandissons pendant le temps de la
Produit donc au fil des ans, nous avons comme des centaines de milliers d'exemples où nous avons échoué dans le passé
que nous avons organisé et donc nous pour tout nouveau modèle que nous testons contre toute l'histoire de ces échecs et ensuite
Continuez à ajouter à ce test défini en haut de cela, nous avons des modes d'ombre où nous expédions ces modèles en silence
La voiture et nous récupérons des données sur l'endroit où ils échouent ou réussissent euh et il y a un vaste programme QA c'est très
Difficile d'expédier une régression, il y a comme neuf niveaux de filtres avant qu'il n'atteint les clients, mais nous avons très bien
infra pour rendre tout cela efficace et je suis l'un des testeurs de l'AQ. So QA
La voiture ouais comme un créateur ouais donc je suis constamment dans la voiture
Faire la queue comme la dernière version d'alpha uh est qui ne s'écrase pas totalement
trouve beaucoup de bugs uh salut um super événement j'ai une question
À propos des modèles fondamentaux pour euh, j'ai tous vu que les grands modèles
peut vraiment peut-être à l'échelle de données et de paramètre de modèle directement de GT3 à
Palmier il peut maintenant faire du raisonnement, voyez-vous que c'est essentiel uh skinning
des modèles fondamentaux avec des données et de la taille, puis au moins vous pouvez obtenir un
Modèle de l'enseignant à droite qui peut potentiellement résoudre tous les problèmes et ensuite vous distiller à un modèle d'élève est que comment
Vous voyez des modèles fondamentaux pertinents pour 100 Je veux dire que c'est assez similaire à notre modèle d'étiquetage automatique, donc nous ne le faisons pas
Il suffit de modèles qui fonctionnent dans la voiture, nous formons des modèles entièrement hors ligne qui sont comme extrêmement grands qui ne peuvent pas
Courez en temps réel sur la voiture, donc nous faisons juste l'exécution de ces serveurs sur les serveurs produisant de très bonnes étiquettes
qui peut ensuite former les réseaux en ligne afin que ce soit une forme de distillation de
Ces élèves-enseignants modèles en termes de modèles de fondation, nous construisons des très grands
Les ensembles de données que vous connaissez sont plusieurs pétaoctets et nous voyons que certaines de ces tâches fonctionnent très bien quand nous
Ayez ces grands ensembles de données comme la cinématique comme j'ai mentionné la vidéo dans toutes les cinématiques de tous les objets
Et jusqu'au quatrième dérivé et les gens pensaient que nous ne pouvions pas faire de détection avec la vitesse de profondeur de détection des caméras
accélération et imaginez à quel point ces dérivés d'ordre supérieur doivent être précis et tout cela
vient de ce type d'ensembles de données importants et de grands modèles, nous voyons donc l'équivalent des modèles de fondation à notre manière pour
géométrie et cinématique et des choses comme celles que vous voulez ajouter tout ce que je John
ouais je vais le garder bref fondamentalement chaque fois que nous nous entraînons sur un ensemble de données plus grand, nous voyons Big OK
Formation sur un ensemble de données plus large, nous constatons de grandes améliorations dans nos performances de modèle et en gros chaque fois que nous initialisons notre
les réseaux avec vous connaissez une étape avant la formation d'une autre tâche auxiliaire, nous voyons essentiellement des améliorations
auto-supervisé ou supervisé avec de grands ensembles de données aident beaucoup
Hé donc au début, Elon a dit que Tesla était potentiellement intéressée à construire une intelligence générale artificielle
Les systèmes étant donné l'impact potentiellement transformateur de la technologie comme celle-ci semble prudent d'investir dans
Expertise technique AGI Uh Expertise spécifiquement je sais que Tesla fait beaucoup de
Recherche technique de la sécurité en IA étroite J'étais curieux de savoir si Tesla avait l'intention de
Essayez de développer une expertise dans la sécurité technique de l'intelligence générale artificielle spécifiquement
Eh bien, si je veux dire si cela commence à ressembler à ce que nous allons faire une contribution significative à l'artificiel
Intelligence générale alors alors nous allons certainement investir dans Uh Safety Je suis un grand croyant dans la sécurité de l'IA Je pense là
devrait être une sorte d'autorité réglementaire AI au niveau du gouvernement, tout comme il y a un
Autorité de réglementation pour euh tout ce qui affecte la sécurité publique, nous avons donc une autorité de réglementation pour les avions et
voitures et une sorte de nourriture et de drogues et parce qu'elles affectent la sécurité publique et l'IA
affecte également la sécurité publique, donc je pense que euh et ce n'est pas vraiment quelque chose que le gouvernement que je pense comprend encore mais je
Je pense que je pense qu'il devrait y avoir un arbitre qui assure une UM ou de faire d'essayer de s'assurer que public
Sécurité pour euh agi um et vous pensez bien comme ce que sont
Les éléments nécessaires pour créer AGI comme euh l'ensemble de données accessible sont extrêmement
important et si vous avez un grand nombre de voitures et de robots humanoïdes euh
traitement que vous connaissez des pétaoctets de données vidéo et
Les données audio du monde réel euh, tout comme les humains, c'est ce qui pourrait être
Le plus gros ensemble de données est probablement le plus gros ensemble de données UM car en plus de ce que vous pouvez
Évidemment scanner progressivement sur Internet UM, mais ce que Internet ne peut pas tout à fait faire est
a des millions ou des centaines de millions de caméras dans le monde réel
Comme je l'ai dit avec l'audio et et euh et d'autres capteurs aussi
aura probablement le plus de données um et probablement le plus de TR de
pouvoir de formation donc probablement nous ferons un
Contribution à AGI
hey um j'ai remarqué que le semi était là-bas mais nous n'en avons pas trop parlé, je me demandais juste pour le semi-camion
Quels sont les changements euh auxquels vous pensez d'un point de vue de détection j'imagine qu'il y a très différent
exigences évidemment qu'une simple voiture si et si vous ne pensez pas que c'est vrai pourquoi est-ce vrai
Euh non je pense que euh fondamentalement, tu peux conduire une voiture, je veux dire, réfléchissez à ce qui entraîne un véhicule
neural net euh avec euh avec les yeux avec des caméras essentiellement donc si euh et vraiment
Quel est vos capteurs principaux sont euh deux caméras euh sur un cardan lent un très
lent gazon um c'est euh c'est ta tête euh donc si
Si um vous savez si un filet neuronal biologique avec deux caméras sur un cardan lent peut conduire un semi-camion alors
euh si vous avez comme huit caméras avec une vision continue à 360 degrés uh
fonctionnant à une fréquence d'images plus élevée et à un taux de réaction beaucoup plus élevé, alors je pense qu'il est évident que vous devriez être en mesure de conduire un semi ou n'importe quel véhicule
Mieux qu'un humain salut mon nom est akshay merci pour le
événement euh en supposant que vous savez que Optimus serait utilisé pour différents cas d'utilisation et
évoluerait à une pièce différente pour ces cas d'utilisation, euh serait possible
Pour développer et déployer différents composants logiciels et matériels indépendamment et les déployer, vous savez
dans l'Optimus afin que le développement global que vous connaissez les fonctionnalités soit plus rapide pour
Optimus référence aux questions
D'accord, nous n'avons pas compris euh malheureusement notre filet de neurones n'a pas compris la question
Euh ouais si bien question suivante
Je veux changer un équipement à l'autopilote, alors euh quand vous prévoyez de déployer le
FSD Beta à des pays autres que nous et Canada et ma prochaine question est
Quel est le plus grand goulot d'étranglement ou la barrière technologique que vous pensez dans la partie de l'ordre actuel de la pile et comment
Vous envisagez de résoudre cela pour que le pilote automatique soit considérable mieux que l'homme en termes de matrice de performance
Assurance de la sécurité et la confiance humaine Je pense que vous correspondez également à 4V UH FSTB
ou tout ce que vous êtes les gars qui vont combiner l'autoroute et la ville en tant que pile unique et un peu architectural uh
Grande amélioration pouvez-vous peut-être expérimenter un peu sur ce merci bien c'est tout un tas de
Questions bien nous, nous, nous espérons pouvoir pouvoir y penser
Du point de vue technique Um FSD Beta devrait être possible de rouler que SFSD Beta euh
Dans le monde
pays nous avons besoin d'approbation réglementaire UM et nous sommes donc quelque peu déclenchés par l'approbation réglementaire dans d'autres pays
euh mais je sais que moi mais je pense que du point de vue technique, il sera prêt à
aller à une version bêta mondiale d'ici la fin de cette année et il y a un assez grand
Amélioration que nous prévoyons de publier le mois prochain, euh, ce sera toujours particulièrement bon en euh
Évaluer la vitesse du trafic croisé à évolution rapide et un tas d'autres choses pour que quiconque élabore
Pour les objets ouais je suppose que donc il y avait beaucoup de différences entre la production
automatiquement et la version bêta complète de l'auto-conduite, mais ces différences sont devenues de plus en plus petites au fil du temps, je pense
Il y a quelques mois à peine, nous utilisons maintenant la même vision uniquement de la pile de détection d'objets dans le FSD et dans la production
pilote automatique sur tous les véhicules um il y a encore quelques différences le principal étant la façon dont nous
Prédire les voies en ce moment afin que nous ayons mis à niveau la modélisation de la voie afin qu'elle puisse gérer ces géométries plus complexes comme je l'ai mentionné dans le discours dans
pilote automatique de production, nous utilisons toujours un modèle de voie plus simple, mais nous étendons nos modèles bêta FSD actuels pour travailler dans
Toutes sortes de scénarios d'autoroute aussi euh ouais et la version de euh fst
La version bêta que je conduis a réellement la pile intégrée, donc celle il utilise le
FSD Stack euh dans les rues de la ville et l'autoroute et euh ça marche assez bien pour moi euh nous, mais nous devons le valider
Toutes sortes de temps comme une lourde poussière de neige de pluie um et euh et assurez-vous simplement
travailler euh comme meilleur que la pile de production euh en vous le savez à travers une large gamme
des environnements euh mais nous sommes assez proches de ça, je veux dire, je pense que c'est je ne sais pas peut-être
Je serai certainement avant la fin de l'année et et peut-être novembre ouais dans nos disques personnels Uh le FSD
Stack on Highway Drives déjà bien mieux que la pile de production que nous avons et nous nous attendons également à inclure le
Pile de stationnement en tant que partie de la pile FSC avant la fin de cette année, ce qui nous amènera essentiellement à vous
Asseyez-vous dans la voiture dans le parking et conduisez jusqu'à la fin du parking dans une place de parking avant la fin de cette
année ouais et et en termes de tel
Um combien de miles par entre une intervention nécessaire donc
Um améliorant massivement le nombre de kilomètres la voiture peut conduire en totalité
Autonomie avant une intervention requise qui est euh de la sécurité critique um so
Ouais c'est euh c'est la métrique fondamentale que nous mesurons euh chaque semaine et que nous faisons des radicaux
Améliorations sur ce salut merci salut merci beaucoup
La présentation très inspirante mon nom est Daisy J'ai en fait un non technique
Question pour vous, je suis curieux euh si vous êtes de retour à la vingtaine
Les choses que vous souhaitez que vous sachiez alors quels conseils vous donneriez à votre jeune moi
Eh bien, j'essaie de comprendre quelque chose d'utile pour dire
Ouais ouais j'ai rejoint Tesla serait une chose um
euh ouais je pense que j'essaye généralement de vous exposer à autant de personnes intelligentes
comme possible et j'ai lu beaucoup de livres
Um tu sais que je fais ça bien que euh
Alors euh je pense qu'il y a du mérite à juste aussi
euh comme ne pas être comme nécessairement trop intense euh et et comme profiter du
moment un peu plus je dirais à 20 ou 20 quelque chose moi uh juste à vous savoir uh
arrêter et sentir les roses de temps en temps serait probablement une bonne idée
um tu sais que c'est comme quand nous développons la fusée The Falcon One
Et euh sur l'atoll quadriline et nous avions cette belle petite île qui
Nous développons la fusée et pas une fois que pendant tout ce temps, j'ai même bu un verre sur le
plage je suis bien que j'aurais dû prendre un verre sur la plage qui aurait été bien
merci beaucoup euh je pense que vous avez excité tous les gens de la robotique avec
Avec Optimus, cela ressemble beaucoup à il y a 10 ans en conduisant mais comme euh
La conduite s'est avérée plus difficile qu'il y a 10 ans, que savons-nous maintenant que nous ne l'avons pas fait il y a 10 ans
Cela ferait par exemple Agi sur un humanoïde
Eh bien, je veux dire qu'il me semble que Hei avance très rapidement
à peine une semaine se passe sans une annonce significative et euh ouais je veux dire
À ce stade, AI semble être en mesure de gagner à presque n'importe quel jeu basé sur des règles
euh c'est capable de créer de l'art extrêmement impressionnant um
Engagez des conversations qui sont très sophistiquées, vous savez
Écrivez des essais et ceux-ci, ils ne cessent de s'améliorer
euh et il y a tellement plus de personnes talentueuses qui travaillent
sur l'IA et le matériel s'améliore, je pense que c'est une IA est sur un super
comme une forte courbe exponentielle d'amélioration indépendante de ce que nous faisons à
Tesla um et évidemment, nous bénéficierons quelque peu de cette courbe exponentielle de
L'amélioration avec Ai um accessible est également très
Bon en actionneurs que les moteurs vous connaissez les boîtes de vites
Um capteurs et um tu sais vraiment comme je dis que tu sais
La plus grande différence entre le robot sur quatre roues et le robot avec les bras et les jambes est d'obtenir les actionneurs
En fait, c'est un problème d'actionneurs et de capteurs um et évidemment, vous savez comment vous
contrôler ces actionneurs et ces capteurs, mais c'est un ouais actionneurs et capteurs et comment vous
Contrôlez les actionneurs c'est un je sais où vous devez avoir comme les ingrédients nécessaires pour créer un
robot convaincant et nous le faisons ainsi
salut elan uh tu amènent réellement l'humanité au niveau suivant littéralement Tesla et
Vous portez l'humanité au niveau suivant, vous avez donc dit Optimus Prime Uh
Optimus sera utilisé dans la prochaine usine de Tesla Ma question est une nouvelle Tesla
L'usine sera entièrement gérée par le programme Optimus et
Et quand le public peut-il commander un humanoïde oui, je pense que ce sera ce que vous savez que nous
va démarrer des optimistes avec des tâches très simples dans l'usine um vous savez comme peut-être comme le chargement
à part comme vous l'avez vu dans la vidéo charger une partie euh car vous savez en séparer un
placer à un autre ou charger une partie dans Um un de notre robot les plus conventionnels
cellules euh pour vous savoir euh qui soulève le corps ensemble, donc nous commencerons à savoir
J'essaye simplement comment le rendre utile du tout um puis élargir progressivement le nombre de situations où il est
utile et je pense que le nombre de situations où Optimus
est utile que cela grandira de façon exponentielle um comme vraiment très rapide
Um en termes de moment où les gens peuvent en commander un, je ne sais pas, je pense que ce n'est pas si loin
loin, bien je pense que tu veux dire quand les gens peuvent-ils en recevoir un
euh donc je ne sais pas que je dirais que je dirais probablement dans les trois ans que je ne suis pas plus
De plus de cinq ans dans les trois à cinq ans, vous pourriez probablement recevoir un Optimus
Je ressens la meilleure façon de faire les progrès pour Agis pour impliquer autant de personnes intelligentes à travers le monde que possible et donnée
la taille et la ressource de Tesla par rapport aux sociétés de robots et compte tenu de la recherche sur l'état de l'humanité pour le moment
ne serait pas logique que le type de Tesla en soit en quelque sorte open source
Parties matérielles de simulation Je pense que Tesla peut toujours être le plateforme dominant
où cela peut être quelque chose comme le système d'exploitation Android ou comme des trucs iOS pour tout l'homme ou la recherche
quelque chose qui plutôt que de garder l'optimus pour des chercheurs de Tesla ou le
L'usine elle-même peut l'ouvrir et laisser le monde entier explorer la recherche humaine
um je pense que nous devons faire attention à l'optimiste que l'Optimus soit potentiellement utilisé euh d'une manière qui est mauvaise euh parce que c'est une
des choses possibles à faire, je pense que vous le sauriez
Fournir des optimistes où vous pouvez fournir des instructions aux optimistes mais où ces instructions
Est-ce que vous savez régi par certaines lois de la robotique que vous ne pouvez pas surmonter
Alors tu sais ne pas faire de mal aux autres et euh
Il aurait pensé probablement pas mal de choses avec la sécurité avec Optimus ouais donc bien nous
Prenez peut-être peut-être quelques questions supplémentaires et puis et puis merci à tous d'être venus
Questions um une profonde et une large sur la profondeur pour Optimus ce que le
actuel et quelle est la bande passante de contrôleur idéale, puis dans la question plus large, il y a ce grand
publicité pour la profondeur et l'étendue de l'entreprise
Tesla qui permet à ce que quelqu'un de vouloir s'attaquer à la bande passante
question ouais ouais donc la bande passante technique du costume
D'accord pour la question de la bande passante, vous devez comprendre ou déterminer ce qu'est le
tâche que vous vouliez faire et quel est le libre si vous avez pris une transformée de fréquence de cette tâche, qu'est-ce que c'est que
Vous voulez que vos membres le fassent et c'est là que vous obtenez votre bande passante de ce n'est pas un nombre que vous pouvez spécifiquement dire que vous devez comprendre votre utilisation
Cas et c'est de là que la bande passante vient de euh ok quelle est la large question
Je ne me souviens pas tout à fait de l'étendue et de la profondeur que je peux répondre à l'étendue et à la profondeur mais oui
J'étais intéressant au dos de la question, je pense que nous finirons probablement par augmenter la bande passante ou vous
savoir ce qui se traduit par l'effet de la dextérité uh um et du temps de réaction du robot
Um comme vous pourriez sauver les états que ce n'est pas un hertz um et c'est peut-être que vous n'avez pas besoin d'y aller
jusqu'à 100 Hertz euh mais je ne sais pas peut-être 10 25 je ne sais pas
Au fil du temps, je pense que la bande passante augmentera un peu euh ou ou traduit par une dextérité et une latence
uh uh tu veux minimiser cela au fil du temps euh ouais minimiser la latence maximiser la dextérité
um je veux dire en termes de largeur et de profondeur um je suppose que tu sais que nous avons
Nous sommes une assez grande entreprise à ce stade, nous avons donc beaucoup de domaines d'expertise différents que nous devons nécessairement
se développer afin de fabriquer autonome ou pour fabriquer des voitures électriques, puis pour fabriquer des électriques autonomes
voitures um nous avons nous que je veux dire que Tesla est comme toute une série de startups et
Um jusqu'à présent, ils ont presque tous réussi à réussir, donc nous devons faire quelque chose de bien
euh et je sais que je considère que l'une de mes responsabilités de base uh uh iranie entreprise doit avoir un environnement où
euh, les grands ingénieurs peuvent s'épanouir et et je pense que dans de nombreuses entreprises
Je ne sais pas peut-être la plupart des entreprises euh si si quelqu'un est un ingénieur vraiment talentueux, ils sont incapables de
euh leurs talents sont supprimés dans de nombreuses entreprises et c'est vous savez
Et et certaines des entreprises que le talent d'ingénierie est supprimée d'une manière qui n'est peut-être pas évidemment mauvaise
Mais mais où c'est tellement confortable et vous avez payé tellement d'argent et vous mais vous êtes la production que vous devez réellement
Les produits sont si bas que c'est comme un piège à miel que vous savez, donc comme il y en a quelques-uns
Honey Trap Uh place dans la Silicon Valley Uh où ils ne semblent pas nécessairement comme de mauvais endroits pour les ingénieurs mais
Vous avez dit comme un bon ingénieur est entré et qu'ont-ils sorti
Et la sortie de ce talent d'ingénierie, il semble très bas
Même s'il semble s'amuser, c'est pourquoi je l'appelle, il y a quelques entreprises de pièges à miel
Silicon Valley Uh Tesla n'est pas un piège à miel que nous exigeons et c'est comme si tu allais faire beaucoup
Euh et ça va être vraiment cool euh et c'est tu ne sais pas être facile
Mais euh si vous êtes un ingénieur super talentueux, vos talents seront uh utilisés i
Pensez à une plus grande degré que partout ailleurs
tu sais que SpaceX aussi de cette façon si highline euh euh j'ai deux questions donc
à la fois dans l'équipe du pilote automatique donc le truc, c'est comme euh, je suis en train de suivre vos progrès depuis quelques années donc aujourd'hui
Vous avez apporté des modifications comme la détection Lean comme vous l'avez dit que, comme auparavant, vous faites une segmentation sémantique instantanée maintenant vous êtes les gars
construit des modèles de transfert pour la construction des voies, alors quels sont les autres quelques autres défis courants que vous les gars
sont confrontés en ce moment comme ce que vous résolvez à l'avenir en tant qu'ingénieur curieux afin que nous, en tant que chercheur, puissions travailler
sur ceux qui commencent à travailler sur ceux-ci et la deuxième question, c'est comme si j'étais vraiment curieux de savoir le moteur de données comme vous
Les gars ont dit un cas comme où la voiture est arrêtée, alors comment trouvez-vous des cas qui sont très similaires
À cela à partir des données que vous avez si un peu plus sur le moteur de données serait génial, donc ça va
um je vais commencer à répondre à la première question uh en utilisant le réseau d'occupation comme exemple, alors euh ce que vous avez vu dans la présentation
n'existait pas il y a un an, nous n'avons donc passé qu'un an sur le temps que je suis une relation avec plus de 12 occupation
Réseau et vous avez un modèle de fondation unique pour représenter l'ensemble
monde physique partout et vous toujours la condition est vraiment vraiment
Vraiment difficile, donc il y a seulement plus d'un an, nous aimons conduire un 2d où s'il y a une guerre et
Il dit Curve que nous représentons en quelque sorte avec le même bord statique qui est évidemment vous ne savez pas pas idéal
Grande différence entre une courbe et un mur lorsque vous conduisez, vous faites des choix différents, donc après nous avons réalisé que
Nous devons aller en 3D, nous devons essentiellement re-synchroniser l'ensemble du problème et réfléchir à la façon dont nous abordons cela, donc ce sera
Soyez comme un exemple de défis que nous avons euh euh nous avons une conquête au cours de la dernière année
Ouais pour répondre à la question de la façon dont nous approfondissons les exemples des voitures strictes, il y a plusieurs façons d'aller
À ce sujet, mais deux exemples en sont un que nous pouvons déclencher pour des désaccords dans nos signaux, alors disons ce peu garé
Les scintilleurs entre garés et la conduite déclenchent ce dos et le second est que nous pouvons tirer parti de plus de mode d'ombre
logique donc si le client ignore la voiture, mais nous pensons que nous devrions nous arrêter pour cela, nous récupérerons aussi ces données, donc ce sont juste
différent comme diverses logiques de déclenchement qui nous permettent de récupérer ces campagnes de données
salut euh merci pour la présentation incroyable merci beaucoup euh alors là
sont de nombreuses entreprises qui se concentrent sur le problème AGI et l'une des raisons pour lesquelles c'est un problème si difficile est
Parce que le problème lui-même est si difficile à définir plusieurs entreprises ont plusieurs définitions différentes sur lesquelles ils se concentrent
différentes choses alors qu'est-ce que Tesla comment Tesla définit le problème ATI et sur quoi vous concentrez-vous spécifiquement
Eh bien, nous ne nous sommes pas spécifiquement concentrés sur AGI je suis simplement
Dire que HGI est ainsi, cela semble être une propriété émergente de ce que nous sommes
faire Um parce que nous créons toutes ces voitures autonomes et humanoïdes autonomes
euh qui sont en fait euh dans un flux de données vraiment gigantesque qui arrive
Et et étant traité um, c'est de loin le plus grand nombre de données réelles et de données que vous ne pouvez pas obtenir
Il suffit de rechercher sur Internet parce que vous devez être là-bas dans le monde et interagir avec les gens et interagir avec les routes et et juste vous
savoir que la Terre est un grand endroit et la réalité est désordonnée et compliquée, donc je pense que c'est un peu comme euh
Probablement juste cela semble être une propriété émergente si vous en avez des dizaines ou des centaines de millions de
véhicules autonomes et et peut-être même un nombre comparable d'humanoïdes, peut-être plus que celui sur le front humanoïde
um bien c'est juste le plus de données um et si cette vidéo est traitée
Il semble que vous sachiez que les voitures seront certainement bien mieux que humaines
Les conducteurs et les robots humanoïdes deviendront de plus en plus
indiscernable des humains peut-être et et donc comme vous l'avez dit
Propriété émergente de AGI UM
Et sans doute les humains que vous connaissez collectivement une sorte de super intelligence, d'autant plus que nous
Améliorer le débit de données entre les humains, je veux dire que c'est comme ça semble être loin dans les premiers jours où Internet était
Comme Internet était comme Um Humanity acquiert un système nerveux où maintenant tout d'un coup
L'élément de l'humanité pourrait connaître toute la connaissance des humains en se connectant
à Internet presque toutes les connaissances ou certainement une grande partie de celle-ci alors qu'auparavant, nous échangerions
Informations par osmose par vous savez par nous devons aimer pour transférer des données afin que vous deviez rédiger une lettre
quelqu'un devrait porter la lettre par personne à une autre personne, puis tout un tas de choses entre les deux et
Ensuite, c'était comme cette position ouais je veux dire que c'est incroyablement lent quand tu penses à
C'est euh et même si vous étiez à la bibliothèque du Congrès, vous n'aviez toujours pas accès à toutes les informations du monde et à vous
ne pouvait certainement pas le chercher et je sais évidemment que très peu de gens sont dans la bibliothèque du Congrès donc
um je veux dire l'un des grands um une sorte d'éléments d'égalité
comme Internet est le plus grand égaliseur de l'histoire
Termes d'accès à l'information ou aux connaissances Um dans n'importe quel étudiant en histoire je pense
serait d'accord avec cela parce que vous savez que vous revenez mille ans, il y avait très peu de livres comme
comme et les livres seraient incroyablement chers, mais seulement quelques personnes savaient lire et seulement si un
Nombre de personnes avaient même un livre maintenant, regardez-le comme vous, vous pouvez accéder à n'importe quel livre instantanément que vous pouvez apprendre
n'importe quoi pour fondamentalement gratuitement c'est assez incroyable donc
Tu sais qu'on m'a demandé récemment quelle période de l'histoire serait-ce que je préfère être
au maximum et ma réponse était en ce moment
C'est la période la plus intéressante de l'histoire et j'ai lu beaucoup d'histoire
Alors, oh ouais, faisons de notre mieux pour continuer ça ouais
Et pour revenir à l'une des premières questions, je répondrais comme vous pouvez la chose qui s'est produite au fil du temps
en ce qui concerne le pilote automatique de Tesla est que nous avons juste le
Les filets neuraux ont obtenu de plus en plus de logiciels de plus en plus et dans la limite bien sûr que vous
pourrait dire simplement prendre les vidéos comme on le voit par la voiture et les comparer à ces
Les entrées de direction du volant et des pédales qui sont des entrées très simples et en principe, vous pouvez
s'entraîner avec rien entre les deux parce que c'est ce que les humains font avec un filet neuronal biologique que vous pourriez vous entraîner
Basé sur la vidéo et euh et ce qui forme la vidéo est le déménagement de
le volant et les pédales sans autre logiciel entre les deux, nous n'en sommes pas encore là mais c'est progressivement
aller dans cette direction oh tout attendre la dernière question de la dernière question
Allez-vous euh je pense que nous avons une question à l'avant ici, bonjour là-bas, j'en ferai deux
Questions bien là-bas um salut euh merci pour une si grande présentation bien la vieille question en dernier
Um avec le FSD utilisé par tant de gens, pensez-vous quel est le com comment évaluez-vous le risque de l'entreprise
tolérance en termes de statistiques de performance et pensez-vous qu'il doit y avoir plus de transparence ou de réglementation de tiers quant à la façon dont ce qui est bon
assez et um définir comme des seuils pour les performances uh à travers
plusieurs kilomètres et bien bien que tu sais je
La conception numéro un, il faut exiger à Tesla est la sécurité si euh comme et que
va de l'autre côté de la planche, donc en termes de sécurité mécanique de la voiture, nous avons la plus faible probabilité de blessure de toutes les voitures
Jamais testé par le gouvernement pour une sécurité mécanique passive essentiellement
Structure de crash et airbags et ainsi de suite uh nous avons le meilleur euh uh le plus élevé
Note pour la sécurité active aussi et um je pense que ça va arriver au point
où vous, l'acte de sécurité, est si ridiculement bon, c'est c'est que c'est comme absurdement meilleur qu'un humain
um et puis en ce qui concerne le pilote automatique um, nous publions ceci largement
Parler les statistiques sur les miles UM conduits avec des voitures qui n'ont pas
Autonomie ou voitures Tesla sans autonomie avec une sorte de matériel
Matériel trois um puis euh ceux qui sont en bêta FSD
euh et nous voyons des améliorations régulières tout au long du chemin et tu sais parfois qu'il y a ça
dichotomie de vous savez si vous attendez que la voiture soit comme je ne sais pas euh
Trois fois plus sûrs qu'une personne avant de déployer une technologie, mais je pense que c'est en fait moralement mauvais
Um au moment où vous croyez que l'ajout d'autonomie euh réduit uh
blessure et mort um je pense que vous avez une obligation morale de le déployer euh même si vous allez
être poursuivi et blâmé par beaucoup de gens parce que les gens dont vous avez sauvé la vie ne savent pas que leur vie est
sauvé et les gens que les gens qui font parfois mourir ou se blesser, ils connaissent définitivement ou leur succession
que c'était vous savez tout ce qu'il y a un problème avec le pilote automatique, c'est pourquoi vous devez regarder
Les chiffres en quelque sorte de kilomètres totaux ont été conduits combien d'accidents se sont produits combien d'accidents étaient sérieux combien
Les décès et vous savez que nous avons bien plus de trois millions de voitures sur la route, donc c'est ce que c'est que beaucoup de kilomètres
Chaque jour, ça ne va pas être parfait mais ce qui compte, c'est que c'est très clairement plus sûr que non
le déployer um ouais donc je pense que euh la dernière question
Je pense ouais alors merci quelle est la dernière question ici
ok um ouais je l'ai bien bond
Um je ne travaille pas sur le matériel alors peut-être l'équipe matérielle et vous le pouvez
Éclairez-moi euh pourquoi est-il nécessaire qu'il y ait une symétrie
Um dans la conception d'Optimus parce que les humains euh nous avons le bon
utilisons-nous un ensemble de muscles plus que d'autres au fil du temps il y a de l'usure
Euh, alors peut-être que vous commencerez à voir des échecs conjoints ou un actionneur
échecs plus au fil du temps, je comprends que c'est extrêmement pré-étape
Um aussi nous, les humains, nous avons basé tellement de fantasme et de fiction sur Super Human
Des capacités comme nous ne voulons pas marcher juste là-bas, nous voulons étendre nos bras et comme nous l'avons tout
Ceux-ci, vous connaissez beaucoup de designs fantastiques fantastiques, alors considérant
tout ce qui se passe en termes de batteries et d'intensité de
calculer peut-être que vous pouvez tirer parti de tous ces aspects pour proposer quelque chose
Eh bien, je ne sais pas plus intéressant en termes de votre robot que vous êtes
construire et j'espère que vous pouvez explorer ces directions ouais je veux dire que je pense que ce serait cool
avoir comme vous savez faire du gadget inspecteur réel qui serait assez doux um alors ouais je veux dire que vous savez en ce moment nous
Je veux juste faire un humanoïde de base ce qui fonctionne bien et notre objectif est le chemin le plus rapide
À un robot humanoïde uh utile, je pense que c'est cela nous fondera dans la réalité
littéralement euh et assurez-vous que nous faisons
Quelque chose d'utile comme l'une des choses les plus difficiles à faire est d'être utile pour
En fait, puis et puis pour avoir une utilité élevée sous la courbe comme combien de personnes avez-vous aidé le temps que vous connaissez et
Quelle aide avez-vous fournis à chaque personne en moyenne
Et puis combien de personnes avez-vous aidé l'utilitaire total, comme essayant d'expédier réellement un produit utile
Que les gens aiment un grand nombre de personnes sont si incroyablement dures, elle est confondue
l'esprit um que tu sais c'est pourquoi je pourrais dire comme l'homme il y a une sacrée différence entre une entreprise qui a un produit shift et on ne sait pas le produit, c'est un
jeu c'est nuit
la sortie d'une valeur supérieure au coût de l'entrée qui est à nouveau incroyablement difficile, surtout avec le matériel donc
euh mais je pense qu'avec le temps, je pense que nous refroidissons pour faire des choses créatives et avoir comme huit bras et quoi que ce soit
um et avoir différentes versions euh et peut-être que vous savez qu'il y aura du matériel
comme les entreprises qui peuvent ajouter des choses à un optimiste comme peut-être que nous l'avons
Vous savez ajouté dans un port d'alimentation ou quelque chose comme ça ou les attacher, vous pouvez ajouter que vous savez ajouter des pièces jointes à votre
Optimiste comme vous pouvez les ajouter à votre téléphone um, cela pourrait être beaucoup de choses intéressantes qui pourraient être faites au fil du temps et il pourrait
être peut-être un écosystème de petites entreprises qui ou des entreprises qui font des modules complémentaires pour
Optimus donc avec ça euh, remerciez l'équipe pour son travail acharné
euh vous êtes génial et euh ouais et euh merci
Vous et euh merci à tous d'être venus et pour tout le monde en ligne merci d'avoir réglé
euh et je pense que ce sera l'une de ces excellentes vidéos où vous pouvez aimer si vous pouvez avancer rapidement les bits
que vous trouvez le plus intéressant, mais nous essayons de vous donner une énorme quantité de détails uh littéralement pour que vous puissiez regarder
la vidéo à vos guises et vous pouvez vous concentrer sur les pièces que vous trouvez intéressantes et sauter les autres parties uh
Alors merci tout ce que c'est et nous le ferons essayer de le faire chaque année et nous pourrions faire une partie un podcast mensuel même
euh uh tellement euh mais je pense que ce sera tu sais que nous
Apportez-vous pour la balade et et comme vous montrez-vous ce que sont les choses cool et euh ouais merci