Día de la IA 2022: FSD simplificado

Blog

HogarHogar / Blog / Día de la IA 2022: FSD simplificado

Nov 18, 2023

Día de la IA 2022: FSD simplificado

Tesla celebró su evento AI Day 2022 en Palo Alto, California esta noche,

Tesla celebró su evento AI Day 2022 en Palo Alto, California esta noche, entrando en muchos detalles sobre sus últimos desarrollos en el mundo de la IA. Parte de la discusión se centró en la conducción autónoma total (FSD). Elon Musk advirtió antes del evento que iba a ser muy técnico y no decepcionó.

Aquí veremos la sección Full Self Driving del AI Day 2022 de Tesla mientras intentamos simplificar los conceptos.

Tesla comenzó la discusión con números. Tesla ha creado hasta ahora 35 lanzamientos con 281 modelos de entrenamiento diferentes. El número más interesante compartido son las solicitudes de extracción totales (número total de veces que se fusionó el código) 18,659.

FSD Beta ha utilizado un total de 4,8 millones de conjuntos de datos.

Luego, Tesla pasó a un diagrama de flujo que mostraría cómo cubrirían diferentes temas dentro del segmento Full Self Driving del Tesla AI Day 2022. Los datos de entrenamiento que pueden ser datos etiquetados automáticamente, datos simulados o del motor de datos, se alimentan en diferentes Redes Neuronales que van a la planificación.

Cada uno se cubrió con más profundidad más adelante durante la conferencia.

Habilite JavaScript

Esta red neuronal decide cosas como el control de brechas. Imagina que estás girando a la izquierda en una intersección. Hay un peatón cruzando. ¿Cuándo es seguro que se vaya el coche? Piense en la planificación como en la toma de decisiones (hay mucho más, pero lo simplificaremos).

Tesla usa algo que ellos llaman "búsqueda de interacción". Examina los carriles, la ocupación (lo que sucede en esos carriles) y otros objetos en movimiento. La primera capa de la red neuronal mira el carril. ¿Cómo es el carril?

Luego se ramifica (mira) semillas sin obstrucciones (quién está ocupando el carril) y se ramifica a interacciones dentro de los carriles; peatones u objetos.

Luego planifica la probabilidad de que usted intervenga. Hay comprobaciones que se producen, como ¿vas a tener una colisión? ¿Hay algún conflicto con los datos?

Esta red calcula bordillos, automóviles, escombros en la carretera y solo predicciones generales sobre adónde van las cosas. En lugar de usar solo una red de objetos básica, esta red crea una superficie transitable; donde el coche puede conducir.

Usan imágenes de cámara con fotos en bruto, no RGB estándar. Extraen las características de la foto y crean un módulo 3D con características espaciales. Luego pasa por "Deconvolución" para obtener una salida final. Tesla quería una salida de mayor resolución, por lo que están usando "Salidas consultables" y "NeRF" donde pueden crear entornos 3D con imágenes 2D.

Tesla también utiliza conjuntos de datos etiquetados automáticamente. Cada segundo capturan 400.000 videos. Con la extensión Pytorch personalizada (marco de aprendizaje automático extremadamente popular), los datos pasan del almacenamiento a la GPU para el entrenamiento. (No estoy muy versado en hardware). Verifican con verdad de tierra.

Necesitan usar predicciones ya que a veces no puedes ver cosas al otro lado de la intersección. Hay un "componente de visión" que proporciona datos de entrada. Tesla luego agrega un componente de mapa. Son datos de mapas de carreteras con información topográfica. Se aseguraron de señalar que no se trata de mapas HD; así, por ejemplo, no sabrán cuándo termina el carril antes de tiempo. Luego, Tesla agrega algo llamado el componente "idioma". Son posiciones de carril en el espacio 3D. El componente de idioma tiene una cuadrícula de predicción que mapea todos los carriles en el espacio 3D dado. Se repite una y otra vez hasta el final del segmento. Esta predicción de carril es necesaria, especialmente porque es posible que usted y el Tesla no vean la carretera con claridad. Necesita predicciones.

Actualmente, Tesla está limitado a un caché de intersección de 500k por día (límites de almacenamiento de datos). Quieren llegar a mil millones de intersecciones. Obviamente, las matemáticas no funcionan para su objetivo frente a sus límites. Ahora usan la "reconstrucción", que escala mejor y etiqueta más rápido que el enfoque de 2020. Usan etiquetadoras automáticas para casi todas las tareas de su planificación. Incluso etiquetará automáticamente en diferentes condiciones climáticas, como en la oscuridad, la lluvia o la niebla.

Hay situaciones en las que es difícil obtener datos del mundo real. Aquí es donde se utilizan las simulaciones. Imagínese que es como crear una escena en un videojuego y luego usar esos datos para ayudar a corregir cosas oscuras que ocurren al conducir. Los pasos que usa Tesla para crear estas simulaciones son;

Todos son automáticos y se pueden configurar en menos de 5 minutos. Le permite a Tesla intercambiar material o cambiar la ubicación, creando una cantidad infinita de escenas para hacer una nueva verdad en el terreno. Cree nuevos flujos para hacer predicciones para crear datos que no se pueden hacer del mundo real.

Hay casos de desafío al conducir. Tesla puede construir un conjunto de evaluación con videos de prueba. Pueden recopilar datos específicos de la conducción de Tesla que se encuentran exactamente en lo que están trabajando. Luego entrene, arregle y pruebe.

Si desea conocer todos los detalles, puede ver la presentación del Día de la IA 2022 a continuación. La sección sobre FSD comienza en el minuto 58.