Inteligencia Artificial de video: ¿tu competencia?

“Hola, soy Sora, tu próxima competencia en creación de videos. Soy un fenómeno mundial de Inteligencia Artificial que tiene la capacidad de generar contenido realista y de calidad en segundos y estoy a unos cuantos meses de ser estrenada”. 

La presentación del nuevo software de Inteligencia Artificial Sora (“cielo” en japonés) el pasado 15 de febrero ha puesto sobre la mesa un debate mayor que posiblemente tomará un par de años en llegar a concluirse: ¿Es el fin de las profesiones que involucran la creación de contenido en video (cineastas, periodistas de viajes, influencers, mercadólogos, etc.)?

Si la Inteligencia Artificial nos desplaza

Mientras unos muestran preocupación ante la teoría de la Inteligencia Artificial como sustituta de los humanos, otros, como lo menciona Sam Altman (CEO de Open Ai, empresa creadora de Sora), se cuestionan los beneficios que tendría en diferentes sectores más allá del medio laboral. Según su análisis, en el sur global se preguntan cómo la IA podría ayudar en los problemas de salud y educación y en los países más desarrollados están preocupados en los problemas actuales que se pueden resolver a largo plazo.

No es el fin del trabajo, sino la evolución del trabajo. Dejar lo mundano para hacer lo más interesante.

mencionó Altman con respecto al ámbito laboral en una entrevista.

Esta perspectiva podría alentar a los creadores de contenido a generar una nueva forma de realización audiovisual, tanto para los que quieren utilizar la Inteligencia Artificial de video, como para los que la rechazan. Al final, no cambia el significado de qué es un video, pero cambia la industria, como cambia todo.

Por ejemplo, si somos periodistas de viajes o vloggers de viajes, posiblemente podríamos ocuparla para describir visualmente un destino que nos fue imposible registrar para complementar el contenido que ya tenemos. De otra manera, podríamos prescindir de ella y generar nuestro propio contenido con un concepto que se aleje del hiperrealismo que muestra la Inteligencia Artificial, como la experta Sora.

Sora aún no está abierta al público

La empresa Open Ai desea primero mejorar las funciones de este software que convierte una comanda de texto en video. Todavía mantiene fallas específicas (como no poder mostrar el rompimiento de cristales)  y cuando se comercialice, sólo tendrá la capacidad de desarrollar videos de hasta 60 segundos de duración. Además, la empresa quiere tomar responsabilidad por los 2 desafíos principales a los que se enfrenta: la ciberseguridad y la desinformación (por ejemplo, los crecientes deepfakes).  

La genialidad de esta empresa recae en haber creado un algoritmo que aprende genuina y verdaderamente y que mejora con la práctica para poder llegar a un proceso de alineación (llegar a lo que los humanos queremos). En el caso del generador de video, la situación va más allá que un algoritmo. 

En twitter, Sam Altman pidió ideas para mostrar los avances de su tecnología. Un usuario replicó que le gustaría ver un par de golden retrievers haciendo un podcast en la cima de la montaña, a lo que Altman le respondió con este video:

Es así como marca el inicio de un sinfín de posibilidades de creación. Es importante resaltar la calidad mostrada no sólo en los objetos en primer plano, también en los paisajes que les rodea, por lo que será un aliado para los que buscan tener en sus contenidos un video del monte Everest sin haberlo subido.

El desarrollo de los efectos visuales ha crecido exponencialmente en poco tiempo

Esta es la misma sensación que se tuvo cuando Pixar desarrolló en 2004 una tecnología capaz de simular el movimiento natural del pelo en Monsters Inc. Sin embargo, en menos de un año, se han hecho cambios que, para la fecha actual, pueden ser apantallantes. 

Recordemos que hace aproximadamente un año, circulaba en redes sociales el repugnante video de Will Smith comiendo pasta y hoy en día podemos ver lo mismo, pero sin saber si es un video del actor, o de la misma inteligencia artificial. 

Es un hecho que las personas ya estamos acostumbradas a los efectos visuales hiperrealistas, que pudiera ser mucho más interesante preguntarnos ahora, ¿Qué sigue?

Posiblemente la atención se disperse entre los que quieren ver una transformación exponente de esta “hiperrealidad”, como los que preferirían ver contenido hecho a lo más “artesanal” posible, que de una sensación de realismo. Algo incluso, que pudiera acercarnos hacia lo documental.

Aún no tenemos idea de los efectos en nuestra profesión 

No tenemos idea de qué pasará con las profesiones relacionada con la creación de video, como no tenemos idea de la relevancia que tendrá en nosotros como consumidores de contenido; no sabemos si Sora será realmente nuetra competencia, o una gran aliada que potencialice nuestros contenidos.  

Tom Graham, CEO y cofundador de Metaphysic que revolucionó la industria con la creación de deep fakes que se hicieron virales (como el falso Tom Cruise), desde el 2023 nos advertía que en algún momento del futuro cercano, perderemos nuestra capacidad para distinguir entre los hechos y la ficción creada por las máquinas y que, a futuro, podríamos convertiremos en parte de la ficción en algún momento.

Es una afirmación que se comprobó a la salida del famoso video de la chica caminando por las calles. ¿Qué tan real nos parece?

Lee un artículo sobre esto.

Hemos de preguntarnos después de tomar en cuenta este fenómeno ¿Estamos de acuerdo con el desarrollo de la Inteligencia Artificial en video? ¿En qué tipo de contenido audiovisual utilizamos este recurso y con qué finalidad?

¿Cómo trabaja Sora? 

Por último, es importante introducirte el proceso de creación de Sora, un modelo de difusión, muy parecido a DALL-E 3 y Stable Diffusion. 

En palabras sencillas, después de dar tu comanda en texto, la manera de empezar a formar las imágenes en movimiento comienza con ruido que se va transformando gradualmente, eliminando a lo largo de muchos pasos. “Reconoce” los objetos y conceptos incluidos en la instrucción escrita y los extrae del ruido, por así decirlo, hasta que surge una serie coherente de fotogramas de vídeo.

“Es una simulación de muchos mundos, reales o fantásticos. El simulador aprende renderizado complejo, física ‘intuitiva’, razonamiento de largo alcance y fundamentación semántica, todo ello mediante algunas matemáticas de eliminación de ruido y gradiente”.

menciona Jim Fan, specialista en el entrenamiento de IA con datos sintéticos, en un artículo.

Si te gustaría ahondar más sobre la Inteligencia Artificial, de video, o de otros temas relacionados específicamente al periodismo de viajes, te recomendamos entrar al blog de School of Travel Journalism, en el apartado de Inteligencia Artificial, en donde encontrarás muchos otros artículos sobre la IA. Así mismo, te presentamos el Máster en Periodismo de Viajes que prepara a los próximos periodistas de viajes con materias relacionada a las nuevas tecnologías e Inteligencia Artificial.

Deja un comentario

Contacto

School of Travel Journalism

+34 623 98 10 11

hola@schooloftraveljournalism.com

Centro Colaborador de