InicioDestacadasGoogle anuncia sus herramientas IA para crear vídeos realistas a partir de...

Google anuncia sus herramientas IA para crear vídeos realistas a partir de texto

Las herramientas de inteligencia artificial que generan contenidos visuales están siendo protagonistas en las conversaciones de las redes sociales durante las últimas semanas. Esto se debe a que las grandes empresas tecnológicas han anunciado sus propias herramientas para generar este tipo de contenido. Si bien la semana pasada Meta dio a conocer «Make-a-Video», ahora Google anuncia sus herramientas de IA para crear videos a partir de texto con Imagen Video y Phenaki.

Si Google ya tenía cierto recorrido en este ámbito como demostró con Imagen, ahora se ha apoyado en el mismo sistema de conversión de instrucciones escritas y lo ha perfeccionado para convertir las imágenes estéticas en otras con movimiento fluido. Gracias a ello, Imagen Video es capaz de generar videos cortos y sin sonido con el objetivo de que la calidad de la imagen sea la mejor posible. Así lo explica en Twitter Sundar Pichai, CEO de Google: videos HD y de larga duración coherentes según indicaciones de texto.

Los resultados de las composiciones con mejores resultados son aquellas que son más abstractas y que replican una animación determinada. De todas formas, se han hecho muchos esfuerzos para optimizar lo mejor posible aquellos videos que emulan el movimiento de personas y animales, conceptos con los que los usuarios están totalmente familiarizados y tienen una idea muy concreta de los que quieren ver. Google asegura que Imagen Video genera videos de alta resolución gracias a la inteligencia artificial con Modelos de Difusión en Cascada y cuenta con capacidad para dar lugar a piezas de 128 fotogramas con una resolución de 1280 × 768 y 24 fotogramas por segundo.

“Ante un mensaje de texto, Imagen Video genera videos de alta definición utilizando un modelo de generación de video base y una secuencia de modelos de superresolución de video espacial y temporal intercalados”, afirma Google en la página web de la herramienta. “Imagen Video no solo es capaz de generar videos de alta fidelidad, sino que también tiene un alto grado de controlabilidad y conocimiento del mundo, incluida la capacidad de generar diversos videos y animaciones de texto en varios estilos artísticos y con comprensión de objetos 3D”.

Más allá de los retos técnicos y tecnológicos a los que se enfrenta Google, la ética y la seguridad son las otras prioridades de la compañía de cara a cómo lo usen los usuarios. “Los modelos generativos de video se pueden usar para impactar positivamente en la sociedad, por ejemplo, amplificando y aumentando la creatividad humana. Sin embargo, estos modelos generativos también pueden ser mal utilizados, por ejemplo, para generar contenido falso, de odio, explícito o dañino”, afirma la compañía.

La privacidad y la seguridad de los datos son aspectos fundamentales de la experiencia de cliente a día de hoy. El usuario está cada vez más preocupado por el uso de sus datos, ya que cada vez se tiene más accesibilidad a ellos y los ciberataques han aumentado. Además, en Google también preocupa el uso de estas herramientas de inteligencia artificial por parte de los usuarios, ya que podrían utilizarse con fines peligrosos. En Contact Center Hub ya tratamos la importancia de la ética en la inteligencia artificial.

Para evitarlo, Google ha realizado pruebas internas y la aplicación de filtrado de mensajes de texto de entrada y de contenido de video de salida. También añade que Imagen Video y su codificador de texto congelado T5-XXL fueron entrenados en datos problemáticos. Sin embargo, la compañía ha decidido por motivos de seguridad  no lanzar todavía el sistema ni su código fuente al público. “Si bien nuestras pruebas internas sugieren que gran parte del contenido explícito y violento se puede filtrar, todavía existen prejuicios y estereotipos sociales que son difíciles de detectar y filtrar”, explica la compañía.

Phenaki: videos de mayor precisión y duración 

Phenaki es el otro sistema presentado por un grupo de investigadores de Google. Este está basado, al igual que el anterior, en la conversión de instrucciones de texto a video, pero enfocado a la generación de piezas de mayor duración gracias a descripciones y mensajes más detallados. 

“Generar videos a partir de texto es particularmente desafiante debido al costo computacional, las cantidades limitadas de datos de video de texto de alta calidad y la duración variable de los videos”, explican los investigadores. “En comparación con los métodos de generación de video anteriores, Phenaki puede generar videos largos arbitrarios condicionados a una secuencia de indicaciones, es decir, texto variable en el tiempo o una historia”. 

 “Si bien la calidad de los videos generados por Phenaki aún no es indistinguible de los videos reales, llegar a ese punto está dentro del ámbito de la posibilidad, incluso hoy. Esto puede ser particularmente dañino si se va a usar Phenaki para generar videos de alguien sin su consentimiento y conocimiento”, afirman desde Google respecto a las herramientas IA. Sin embargo, la herramienta todavía no se ha lanzado al público por temas de seguridad y optimización.

«Las versiones futuras del modelo serán parte de un conjunto de herramientas cada vez más amplio para artistas y no artistas por igual, proporcionando nuevas y emocionantes formas de expresar la creatividad», explican desde Google, respecto a lo que supondrán estas herramientas en términos de creatividad y creación de experiencias a través de la tecnología.

artículos relacionados

La tecnología mejora el bienestar en el trabajo: el...

Un nuevo proyecto usa la tecnología de inteligencia artificial y big data para mejorar el bienestar laboral y reducir posibles lesiones en el trabajo.

Talkdesk, elegido como solución de centro de contacto de...

El pionero en sistemas de carga de vehículos eléctricos se embarca en la transformación digital para generar una mejor experiencia del cliente.

La nueva investigación de Infobip desvela el dominio de...

Las interacciones de WhatsApp han crecido un 80% en la primera mitad de 2022 y el 99% de las interacciones de atención al cliente y chatbot ya se realizan en este canal.

Directorio de empresas