Sora: la revolucionaria IA de OpenAI que crea videos con indicaciones de texto
La empresa líder en inteligencia artificial, OpenAI, anunció un nuevo modelo de IA llamado Sora, que según ellos, puede producir videos “realistas” e “imaginativos” de 60 segundos a partir de breves indicaciones de texto. En su blog del miércoles, la empresa explicó que Sora puede crear videos de hasta 60 segundos de duración a partir de textos instructivos, con la habilidad de mostrar escenas con varios personajes, movimientos específicos y detalles de fondo.
“El modelo no solo entiende lo que el usuario ha solicitado en el texto, sino también cómo esas cosas existen en el mundo físico”, decía el blog. OpenAI dijo que su objetivo es entrenar modelos de IA que puedan “ayudar a las personas a solucionar problemas que implican interacción con el mundo real”. Este es el último avance de la empresa detrás del popular chatbot de ChatGPT, para impulsar la inteligencia artificial generativa.
Aunque los “modelos multimodales” ya existen y hay modelos de texto a video, lo que los hace diferentes en este caso es la longitud y la precisión que OpenAI dice que tiene Sora, de acuerdo con Reece Hayden, analista senior de la firma de investigación de mercado ABI Research.
Hayden dijo que este tipo de modelos de IA podrían tener un gran impacto en los mercados de entretenimiento digital con la generación de nuevos contenidos personalizados a través de canales. “Un caso de uso evidente es el de la televisión; generando escenas cortas que refuercen las narrativas”, dijo Hayden. “El modelo aún es limitado, pero indica la tendencia del mercado”.
Al mismo tiempo, OpenAI dijo que Sora aún está en desarrollo y tiene algunas “debilidades”, especialmente cuando se trata de detalles espaciales de un texto (confundiendo izquierda y derecha) y causa y efecto. Puso el ejemplo de generar un video de alguien mordiendo una galleta pero sin que se vea la marca del mordisco después. Por el momento, los mensajes de OpenAI se enfocan en la seguridad. La empresa dijo que planea trabajar con un equipo de expertos para probar el último modelo y monitorear varias áreas, como la desinformación, los contenidos que incitan al odio y el sesgo. La empresa dijo que también está creando herramientas para ayudar a detectar información falsa.
Sora se pondrá a disposición primero de los profesores de ciberseguridad, llamados “equipos rojos”, quienes evaluarán el producto en busca de daños o riesgos. También se dará acceso a un grupo de artistas visuales, diseñadores y cineastas para recoger sus comentarios sobre cómo podrían usarlo los profesionales creativos. La última actualización llega mientras OpenAI sigue progresando con ChatGPT. A principios de esta semana, la empresa dijo que está probando una función en la que los usuarios pueden controlar la memoria de ChatGPT, lo que les permite pedir a la plataforma que recuerde los chats para hacer conversaciones futuras más personalizadas o decirle que olvide lo que se habló antes.