En la cuarta y penúltima parte de su conferencia en el evento Smart Travel News Inspire, celebrado en los Cines de Méndez Álvaro (Madrid) el pasado 6 de junio, Néstor Guerra, CEO de N Company, abordó el fascinante mundo de los modelos de texto a imagen. Esta entrega es parte de una serie de cinco vídeos que publicaremos.
De DALL-E a DALL-E 3: la evolución de la inteligencia artificial en imágenes
Guerra comenzó recordando los primeros días de DALL-E, el modelo de OpenAI que generaba imágenes a partir de descripciones textuales. «Al principio, DALL-E solo hacía aguacates y sillas con forma de aguacate», comentó Guerra, evocando los primeros experimentos con esta tecnología. Sin embargo, destacó el impacto de DALL-E 2, que permitió crear imágenes más complejas y realistas. «Podías pedir una foto realista de un gatito triste porque se quedó sin conexión en su consola de videojuegos, y el resultado era sorprendente», añadió.
El avance a DALL-E 3: precisión y detalle
Con la llegada de DALL-E 3, la tecnología ha alcanzado un nuevo nivel de perfección. Guerra explicó que este modelo no solo crea imágenes hiperrealistas, sino que también puede manejar múltiples personajes y texturas sin confusiones. «Los gatitos cute ahora son perfectos, pero más allá de eso, puedes usarlo para cosas serias, como diseñar un dossier de viaje o crear un tour visual para un cliente», indicó Guerra, sugiriendo aplicaciones prácticas para el sector turístico.
MidJourney: creatividad sin límites
Guerra también habló sobre MidJourney, otro modelo de texto a imagen que ha capturado la atención del público, especialmente con imágenes virales como la del papa con una chaqueta moderna. «La clave de MidJourney no es solo su capacidad de generar imágenes impresionantes, sino que está basado en código abierto, lo que permite a los usuarios entrenar el modelo con sus propias imágenes», explicó.
Para ilustrar su punto, Guerra compartió una anécdota personal sobre cómo usó un modelo de difusión similar para decidir su estilo de barba. «Entrené el modelo con unas 10-15 fotos mías y le pedí que me mostrara cómo me vería con diferentes estilos de barba. El resultado fue increíblemente preciso», relató, mostrando las imágenes generadas.
Aplicaciones prácticas para el turismo
La capacidad de estos modelos para generar imágenes detalladas y personalizadas tiene implicaciones significativas para la industria del turismo. Guerra sugirió que los profesionales del sector pueden usar estas herramientas para crear materiales de marketing visualmente atractivos, diseñar itinerarios personalizados y ofrecer experiencias únicas a los clientes.
Conclusión
En esta cuarta parte de su conferencia, Néstor Guerra destacó el impresionante progreso de los modelos de texto a imagen y sus aplicaciones prácticas en el mundo real. Desde la evolución de DALL-E hasta las capacidades personalizables de MidJourney, estas herramientas están revolucionando la forma en que creamos y utilizamos imágenes. Estén atentos a la última entrega de esta serie, donde Guerra continuará explorando las innovaciones en inteligencia artificial que prometen transformar nuestra forma de trabajar y comunicarnos.