Nvidia lanza modelo de mundo para robots
Fotos: WikipediaNvidia presentó Cosmos 3, un modelo de mundo de inteligencia artificial abierto diseñado para ayudar a robots, vehículos autónomos y otros sistemas físicos a entender y predecir mejor los entornos del mundo real. Cosmos 3 se entrenó con 20 billones de tokens de datos multimodales, incluyendo casi un millón de imágenes, 400 millones de videos reales y sintéticos, audio ambiental, texto y datos de acción de humanos y robots.
Este modelo es importante porque Nvidia está expandiendo su negocio más allá de los chips hacia modelos y software de inteligencia artificial, posicionándose como una plataforma fundamental para el desarrollo de inteligencia artificial física. Los desarrolladores pueden utilizar Cosmos 3 para simular acciones en entornos físicos y luego construir modelos específicos de tareas para robots y otras máquinas sobre él.
Según Ming-Yu Liu, vicepresidente del Laboratorio Cosmos de Nvidia, Cosmos 3 se diferencia de un generador de video regular porque está diseñado para modelar cómo se mueven las máquinas, no solo cómo se ven las escenas. Las acciones autónomas son clave. Nvidia también está estableciendo una coalición de empresas que apoyan este esfuerzo, con socios iniciales como Agile Robots y Black Forest.
Con Cosmos 3, los robots pueden aprender a navegar y manipular el mundo físico de manera más efectiva. Esto puede tener consecuencias significativas en la industria, permitiendo a los robots realizar tareas más complejas y precisas. La capacidad de Cosmos 3 para generar datos de acción, como ángulos de articulaciones de robots, posiciones de garras y trayectorias, puede ayudar a entrenar a las máquinas para que interactúen de manera más segura y eficiente con su entorno.
¿Es real esta noticia?
Análisis de fuentes, coherencia factual y contexto en tiempo real.



