Generación de videos con IA

Tabla de contenidos

La Inteligencia Artificial (IA) está revolucionando la forma en que creamos  contenido y el video no iba a ser una excepción.

Gracias a la IA, los profesionales del marketing y de la comunicación pueden producir contenidos mucho más rápido y presentarlos a sus respectivas audiencias de manera atractiva a una fracción del coste.

Y con los videos está sucediendo lo mismo.

Todavía resulta un poco complicado pero… ¿Quién se acuerda ya de los tiempos en los que era necesario una cámara y un set de televisión para grabar tu programa? 

Eso pasó a la historia hace 10 años.

Y con total seguridad esto puede ocurrir con los estudios virtuales y programas de edición de video con la llegada de la IA.

Y es que, en muy poco tiempo, casi con total seguridad no va ser necesario siquiera tener grabadas las imágenes para producir videos de mayor calidad a su audiencia en menos tiempo. 

De hecho, ya podemos contar con herramientas de IA que nos permiten convertir texto en imagen, generar audio de forma automática y editar texto con mayor eficiencia.

¿Qué nos dirías si, además, tuvieras una herramienta que pudiera hacerlo todo y de manera automática?

Pues ya es posible gracias a este pequeño script que te va a permitir generar videos con IA en piloto automático.

Ingredientes: Qué necesitas para la creación de un video con inteligencia artificial

Pero ¿Cómo vamos a crear este video de forma automática? 

Vale para ello es necesario encadenar tres APIs distintas:

  1. A la hora de crear un video, lo primero que necesitaremos es el contenido. Para ello, generamos el texto con la API de OpenAI y el modelo GPT 3. Aunque también podemos optar por GPT u otro modelo superior. Existen otros modelos alternativos que puedes utilizar, como por ejemplo, Bloom.
  2. Después convertiremos ese texto en voz. Para ello, utilizaremos Amazon Web Services (AWS), una de las APIs más comunes y usaremos su biblioteca de texto a voz, Polly. Las principales ventajas de Polly frente a otras herramientas es su bajo coste y muy sencilla de utilizar. Porque es fácil de usar y económico.
  3. Por último, transformamos el texto en imágenes. Emplearemos imágenes estáticas, no generaremos un video, aunque están ocurriendo muchos avances en este campo. Para ello, usaremos la API de Replicate y el modelo StyleGAN.

Aquí tienes un esquema con las funciones que vamos a usar, la API y el modelo concreto.

image1

Cómo hacer videos con inteligencia artificial

El input para nuestro video será un prompt en el que le especificaremos la temática de nuestro video. 

Le indicaremos a GPT-3: «escribe un guión para un video sobre la generación de videos con Inteligencia Artificial». 

El modelo GPT3 nos devolverá un guión y le diremos a Polly: «coge este texto y genera una voz». 

Esto nos dará un documento de audio, ahora nos toca hacerle una petición a Replicate: «Por cada frase, separa el texto en puntos y genera una imagen adecuada sobre ese texto». 

Esto nos dará una lista de imágenes. Luego, juntaremos el audio y las imágenes en un video final.

Funciones del script de contenidos para categorizar palabras clave:

Ahora, vamos a explicarte qué tareas ejecuta el script que ha programado nuestro Head of SEO, Alvaro Peña de Luna, basado en el script generado por @DavidGarciaSEO

El Colab realiza una serie de tareas específicas que te describiré a continuación:

  • Recoge un prompt: El Colab recoge un prompt o una sugerencia de texto que se proporciona para generar contenido.
  • Genera texto: A partir del prompt, el Colab genera automáticamente un texto utilizando modelos de lenguaje artificial entrenados previamente.
  • Le pone voz: Luego, el Colab utiliza un programa de síntesis de voz para convertir el texto generado en una voz sintética.
  • Crea las imágenes para cada una de las frases: Para cada una de las frases generadas, el Colab crea imágenes que corresponden a la visualización de las mismas. Estas imágenes pueden ser gráficos, ilustraciones o cualquier otra imagen que sea relevante para el contenido generado.
  • Concatena las imágenes: Después, el Colab concatena todas las imágenes generadas para cada frase y las une en una sola imagen que representa todo el contenido generado.
  • Crea un vídeo: Finalmente, el Colab utiliza un programa de edición de video para crear un video en el que se muestra la imagen generada para cada frase junto con la voz sintética que las lee.

Pasos previos a la ejecución del script para generación de video con IA

Lo primero que debes hacer es abrir el código de Python en tu navegador utilizando Google Colab.

Ahora, debemos tener acceso a las tres APIS que vamos a necesitar. Si eres seguidor de nuestra lista de IA en el canal de YouTube o de nuestro blog, el primer acceso ya lo tendrás creado. 

Una vez tengamos todas ellas, deberemos introducirlas en las siguientes líneas de código: 

Vamos a nuestro Colab y ejecutar script

Para crear un video de manera totalmente automática y por supuesto, con nuestro super ayudante conocido por su apodo IA, seguiremos estos pasos:
  • Creamos un cliente para la API de OpenAI , utilizando bibliotecas estándar de Python para el uso de APIs.
  • Escribimos el prompt inicial en la línea 16 del script de Phyton. 
  • Proporcionaremos las claves de acceso necesarias para el input y output de la API y elegimos los parámetros a utilizar.  Recuerda: puedes jugar con el modelo, la temperatura, número de tokens máximo a utilizar…
  • Con el texto del prompt, se generará un audio gracias al cliente que hemos utilizado de Polly, el cual se guardará en formato MP3.
  • Calcularemos la duración y separaremos el texto en frases para crear una imagen por cada una de ellas. Con estos datos, se determinará la duración de cada imagen.
  • Utilizando la API de Stable Difusión de Replicate, se generará una imagen para cada fragmento de texto, ajustando los parámetros según sea necesario. 
  • Se verificará que todo esté correcto y se guardará cada imagen en el contenido.
  • Concatenamos las imágenes con la duración establecida y agregamos el audio correspondiente. 
  • El resultado se guardará en formato MP4 y se podrá descargar.
En el video de abajo, podrás observar cada paso en detalle y, además, podrás conocer las líneas de código que puedes modificar para ajustar diferentes parámetros según tus necesidades.

Descarga Google Colab y crea tus propios videos

Este es el  script que hemos utilizado en el video anterior:  Accede aquí al Google Colab

Pruébalo y dinos qué te parece. 

O mejor aún, comparte tu trabajo con nosotros, para que podamos ver los resultados en directo.

Este el resultado obtenido

El resultado del video no es para echar cohetes porque el prompt utilizado en este caso: “AI generating videos for youtube” es muy pobre.

Ten en cuenta que los prompts empleados en el script de colab están mucho más elaborados y te darán mejor resultados que los vistos en el video tutorial que hemos grabado.

Lo importante, en definitiva, es quedarte con la idea de cómo es posible generar un video en automático.

Además, si sabes de python, puedes tocar nuestro script y mejorar el prompt para obtener un video mucho mejor elaborado para tus objetivos.

Alvaro Peña de Luna
Head SEO y coCEO en iSocialWeb | + posts

Co-CEO y Head of SEO de iSocialWeb, una agencia especializada en SEO, SEM y CRO que gestiona más de +350M de visitas orgánicas al año y con una infraestructura 100% descentralizada.

Además de la empresa Virality Media, una empresa de proyectos propios con más de 150 Millones de visitas activas mensuales repartidos entre diferentes sectores e industrias.

Ingeniero de Sistemas de formación y SEO de vocación. Aprendiz incansable, fan de la IA y soñador de prompts.

¿Quieres mejorar tu proyecto?