Google lanza Gemini Omni
Fotos: WikipediaGoogle acaba de lanzar Gemini Omni, un nuevo modelo de inteligencia artificial que permite crear y editar videos usando únicamente lenguaje natural. Con Gemini Omni, ya no es necesario tener conocimientos técnicos para editar un video, ya que el modelo puede razonar sobre lo que debería suceder y llenar los detalles usando su propio conocimiento del mundo.
Este nuevo modelo de inteligencia artificial es capaz de recibir cualquier tipo de entrada —imagen, audio, video o texto— y generar un resultado coherente a partir de esa combinación. Gemini Omni es el primer modelo de Google que puede hacer esto, lo que lo convierte en una herramienta poderosa para la creación de contenido.
Según la guía técnica publicada por Google DeepMind, con Gemini Omni no es necesario ser tan específico en el prompt porque el modelo razona sobre lo que debería suceder y llena los detalles usando su propio conocimiento del mundo. Por ejemplo, se puede decir “explica visualmente la diferencia entre computación clásica y computación cuántica” sin describir cómo debería verse cada escena.
La memoria de contexto es otra capacidad clave de Gemini Omni. Cuando se edita un video, el modelo recuerda lo que ya se ha hecho, lo que permite mantener la coherencia en el contenido. Esto es especialmente útil para la creación de contenido que requiere una narrativa coherente.
¿Es real esta noticia?
Análisis de fuentes, coherencia factual y contexto en tiempo real.



