View all AI news articles

Sora Unwrapped: un vistazo al mundo real a Video Marvel de OpenAI

May 4, 2024
Sora parece hacer girar historias a partir de simples palabras, pero la magia se desvanece un poco cuando miras detrás de la cortina.

Un poco de magia, un poco de realidad

Cuando me enteré por primera vez de Sora, la herramienta de generación de vídeos de OpenAI, parecía que alguien había entregado a los cineastas una varita mágica. Escribe tu visión y listo, ¡aparece un vídeo! Si eres como yo, que pasé horas en la escuela de cine soñando con escenas que nunca podría hacer realidad del todo, entenderás por qué mi corazón dio un vuelco. Pero como todos sabemos, tanto en la vida como en la tecnología, si algo suena demasiado bueno para ser verdad, por lo general lo es. Vamos a profundizar en lo que Sora realmente ofrece y las condiciones que conlleva.

Entre bastidores con cineastas

Ni siquiera Sora puede escribir el guion del caos cuando Sarah, la cámara antropomórfica, grita «¡Acción!» en un mundo en el que los trípodes tienen patas y las luces chismean más que la tripulación.

La determinación detrás del glamour

Imagina esto: una cineasta, llamémosla Sarah, tiene acceso a Sora. Está emocionada porque piensa que sus días de buscar localizaciones y editar hasta altas horas de la madrugada han terminado. Pero aquí está el truco: las producciones de Sora, si bien son impresionantes, aún necesitan un toque de cineasta tradicional. Desde la corrección del color hasta la edición, no es tan diferente del uso de cualquier otra herramienta que requiera una combinación de creatividad humana y destreza técnica.

Hablé con algunas personas que usaron Sora para sus proyectos y pintaron un panorama de prueba y error. Ingresaban instrucciones detalladas, esperaban lo mejor y, a menudo, terminaban con algo que era casi, pero no del todo, lo que querían. Esto se hace eco de lo que Patrick Cederberg discutió en su guía fx Entrevista: Sora es una herramienta, no un reemplazo para un equipo de filmación.

Anécdota: Cuando Sora conoció la realidad

¿Recuerdas cuando intenté usar voz a texto por primera vez, pensando que entendería mi acento perfectamente desde el principio? Terminé con un galimatías que eran más ridículos que utilizables. Trabajar con Sora me lo recordó. Los cineastas tienen que ser muy específicos en sus descripciones, y aun así, es como pedirle a un robot ansioso pero algo despistado que lea tu mente.

Adentrándonos en la jungla técnica

Cuando le pides un guion a Sora, pero la IA escucha «garabatos», ¡hablas de perdido en la traducción!

Cómo Sora teje su magia

Sora no está sacando estos vídeos de la nada. Se basa en una arquitectura compleja basada en transformadores, similar a la que utilizan los modelos GPT y los sistemas de generación de imágenes como el DALL-E. Si sientes curiosidad por los detalles más curiosos, es fascinante ver cómo transforma el texto en vídeo mediante la predicción de secuencias de imágenes. Piensa en ello como una versión muy avanzada de los flipbooks que hacíamos cuando éramos niños.

Pero a pesar de su destreza, Sora lucha con ciertas tareas. Supongamos que quieres que un personaje lleve un sombrero rojo en todas las escenas. Es posible que Sora olvide ese sombrero a la mitad, lo que puede resultar frustrante. Es como hornear un pastel, seguir la receta al pie de la letra y terminar con algo que se hunde en el medio.

Desafíos en el control y la coherencia

Uno de los mayores obstáculos es controlar los detalles más sutiles de los clips. Los cineastas aún tienen que intervenir mucho para mantener la coherencia, del mismo modo que un director se asegura de que cada sección de la orquesta esté sincronizada. Este aspecto de la tecnología de Sora sigue evolucionando y, aunque puede hacer maravillas a grandes rasgos, lo malo está en los detalles.

Navegando por el laberinto legal

Sora intenta hacer tripletas en cada escena, pero ¿la mantiene en rojo? ¡Esa es otra historia!

Problemas de derechos de autor: más vale prevenir que curar

Sora es cautelosa y está programada para evitar pisar los derechos de autor. Pídele una escena de «La guerra de las galaxias» y la rechazará cortésmente. Está programado para reconocer y evitar posibles dificultades legales, lo que, si bien limita, también constituye una capa de protección para los creadores contra las infracciones involuntarias.

Perspectivas futuras: el camino por delante

Incluso Sora respeta el letrero de «Prohibición de entrada» del libro de leyes de derechos de autor: ¡no se permiten sables de luz sin permiso!

Aún no está listo para reemplazar a los humanos

Tal como están las cosas, Sora no va a dejar obsoletos a los cineastas. Lo que hace es ofrecer una nueva herramienta en el arsenal creativo, perfecta para hacer borradores o dar vida a visiones imposibles dentro de ciertos límites. Su evolución será crucial, sobre todo en lo que respecta a la forma en que equilibre la libertad creativa con las limitaciones técnicas.

La promesa del mañana

Al mirar hacia el futuro, recuerdo los primeros días de la CGI, que pasó de formas básicas a efectos asombrosamente realistas durante décadas. El camino de Sora podría ser similar, reduciendo gradualmente la brecha entre el contenido generado por IA y las películas dirigidas por humanos.

Conclusión: Sigue soñando, sigue creando

Sora representa un importante paso adelante, pero es parte de un viaje más largo. Por ahora, ofrece una visión de un futuro en el que nuestra imaginación es el único límite. Y eso es algo que nos entusiasma, aunque tengamos que tener un manual a mano.

En el cine, como en cualquier arte, la verdadera alegría proviene de mezclar lo nuevo con lo conocido. Sora nos invita a soñar, experimentar y, quizás lo más importante, a colaborar con nuestros homólogos robóticos para crear algo verdaderamente mágico.

Recent articles

View all articles