InicioActualidadImagen, el nuevo proyecto de inteligencia artificial de Google

Imagen, el nuevo proyecto de inteligencia artificial de Google

El gigante tecnológico Google ha presentado Imagen, su nuevo proyecto de inteligencia artificial que pretende revolucionar el fotorrealismo mediante un nivel profundo de comprensión del lenguaje.

Imagen trata de establecer un modelo de difusión de texto a imagen con un grado de fotorrealismo sin precedentes, basándose en el poder de los grandes modelos de lenguaje transformadores para comprender el texto. De esta forma, la inteligencia artificial es capaz de generar imágenes espectaculares con un alto nivel de realismo a partir de un texto escrito por un usuario.

Este proyecto está construido construido en base a grandes modelos lingüísticos para lograr el profundo entendimiento del lenguaje que alcanza su tecnología. Además, trabaja en conjunto con modelos de difusión para la creación de imágenes con un mayor nivel de fidelidad, adecuándose con mayor eficiencia a las descripciones realizadas en el texto. En cuanto a lo más destacado de la investigación de Imagen, los puntos más importantes son los siguientes:

  • Los grandes codificadores de texto congelado preentrenados son muy efectivos para la tarea de conversión de texto a imagen.
  • Escalar el tamaño del codificador de texto preentrenado es más importante que escalar el tamaño del modelo de difusión.
  • Presentan un nuevo muestreador de difusión de umbral, que permite el uso de pesos de guía sin clasificador muy grandes.
  • Presentan una nueva arquitectura Efficient U-Net, que es más eficiente en computación, más eficiente en memoria y converge más rápido.
  • En COCO, han logrado un nuevo COCO FID de última generación de 7.27; y los evaluadores humanos encuentran que las muestras de Imagen están a la par con las imágenes de referencia en términos de alineación de imagen y texto.
inteligencia artificial Google
Fuente: Imagen

De momento, se ha decidido que Imagen sea un proyecto cerrado, ya que Google es consciente del impacto social de la inteligencia artificial y el posible mal uso de sus producto. Este es un debate que cada vez ha ido cobrando más importancia, la importancia de la ética en la inteligencia artificial. 

Tal y como afirman desde Imagen, en primer lugar, las aplicaciones posteriores de los modelos de texto a imagen son variadas y pueden afectar a la sociedad de formas complejas. Los riesgos potenciales de uso indebido plantean preocupaciones con respecto a la fuente abierta responsable de código y demostraciones.

En este momento, han decidido no lanzar el código o una demostración pública. En trabajos futuros, explorarán un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones. En segundo lugar, los requisitos de datos de los modelos de texto a imagen han llevado a los investigadores a depender en gran medida de grandes conjuntos de datos extraídos de la web, en su mayoría no seleccionados.

Si bien este enfoque ha permitido rápidos avances algorítmicos en los últimos años, Los conjuntos de datos de esta naturaleza a menudo reflejan estereotipos sociales, puntos de vista opresivos y asociaciones despectivas o dañinas con grupos de identidad marginados. Si bien se filtró un subconjunto de nuestros datos de capacitación para eliminar el ruido y el contenido indeseable, como imágenes pornográficas y lenguaje tóxico, también utilizamos el conjunto de datos LAION-400M, que se sabe que contiene una amplia gama de contenido inapropiado, incluidas imágenes pornográficas, insultos racistas y estereotipos sociales dañinos.

Imagen se basa en codificadores de texto entrenados en datos a escala web no seleccionados y, por lo tanto, hereda los sesgos sociales y las limitaciones de los grandes modelos de lenguaje. Como tal, existe el riesgo de que Imagen haya codificado estereotipos y representaciones dañinas, lo que guía su decisión de no publicar Imagen para uso público sin más garantías, puntos de vista opresivos y asociaciones despectivas, o dañinas de otro modo, a grupos identitarios marginados.

Si te interesa conocer más sobre la inteligencia artificial, sus usos y modelos más utilizados por las grandes marcas, no te pierdas los 7 mitos que giran alrededor de esta disciplina.

artículos relacionados

CaixaBank da un giro de 180º en su sistema...

La entidad bancaria ha integrado herramientas de inteligencia artificial para medir la satisfacción del cliente a tiempo real.

Talkdesk, elegido como solución de centro de contacto de...

El pionero en sistemas de carga de vehículos eléctricos se embarca en la transformación digital para generar una mejor experiencia del cliente.

La nueva investigación de Infobip desvela el dominio de...

Las interacciones de WhatsApp han crecido un 80% en la primera mitad de 2022 y el 99% de las interacciones de atención al cliente y chatbot ya se realizan en este canal.

Directorio de empresas