MidJourney ya era uno de los generadores de imágenes de IA más impresionantes que existen, y con el lanzamiento de la versión 5.1, ahora se ha vuelto mucho más poderoso. La actualización del algoritmo significa que, incluso para principiantes, ahora es increíblemente fácil crear impresionantes obras de arte con un esfuerzo mínimo, y deepfakes. Muchos y muchos deepfakes.
El generador de imágenes de IA entró en la conciencia pública el mes pasado después de que imágenes deepfake del Papa Francisco con un abrigo acolchado blanco se volvieran virales. La controversia provocó conversaciones sobre la ética de los generadores de IA como MidJourney, y la compañía tomó medidas poco después.
El uso de la palabra "papa" en MidJourney ahora está prohibido, pero crear deepfakes de otras personas, como el presidente Joe Biden, todavía está permitido— probablemente hasta que veamos una imagen viral de Biden usando un traje de neón rosa haciendo yoga en la Oficina Oval.
O tal vez una de Biden usando un traje de espartano intergaláctico que se parece un poco a Iron Man.
Joe Biden como un espartano intergaláctico, creado con MidJourney.
MidJourney también permite a los usuarios crear deepfakes de alta calidad utilizando fotos como referencia. Esta función ha aumentado significativamente la popularidad de MidJourney debido a los impresionantes resultados que proporciona y su baja curva de aprendizaje. En este momento, es el modelo de imagen de IA más popular en términos de interés de los usuarios, superando a Dall-e y Stable Diffusion.
Búsquedas en Google para MidJourney (azul), Stable Diffusion (amarillo) y Dall-e (rojo). Imagen: Google Trends
La última actualización de MidJourney promete mejoras en la forma en que el algoritmo interpreta las indicaciones de los usuarios. La versión 5.0 se lanzó hace solo tres meses y marcó una evolución significativa de la versión 4.
V5.1 is now available! Images are more coherent, sharp, and beautiful. It's easier to use and should respond more precisely to instructions. We've also added a "RAW" mode for expert users to reduce the 'opinionatedness' of our model and give you more creative control.
Este nuevo modelo ofrece una mayor coherencia, más precisión en las indicaciones de texto, menos bordes no deseados o artefactos de texto (las cosas extrañas y aleatorias que a veces aparecen en las imágenes) y resultados más nítidos en general, según MidJourney. La guinda del pastel es que la nueva versión fue entrenada para ser una IA más "opinativa".
Ser opinativo significa que el modelo tiene la libertad de ser más creativo al interpretar la indicación del usuario. Esto resulta en mejores imágenes con indicaciones básicas, incluso con comandos absurdos de solo una o dos palabras.
Por ejemplo, simplemente comparar los resultados de las indicaciones "Billetera Bitcoin" utilizando la versión 5.1 y 5.0 demuestra las diferencias y mejoras. La versión 5.1 imagina una billetera de cuero, con un logotipo de Bitcoin bordado y colocado sobre una mesa de madera. La versión 5 simplemente muestra una billetera con un Bitcoin sobre una superficie plana.
La nueva versión enfatiza aún más las fortalezas que han llevado a la explosión de MidJourney, sin olvidar a los usuarios experimentados que ahora tienen un modo RAW si desean resultados más precisos y menos "opinados".
¿Y qué hay de las manos con muchos dedos? MidJourney v5.1 ha mejorado mucho. Las representaciones de manos ahora tienen éxito en la mayoría de los casos, aunque el generador todavía produce algunos errores.
El equipo de MidJourney dice que podríamos ver la versión 5.2 de su IA en el futuro, mejorando aún más las capacidades de esta herramienta. Si a la tercera va la vencida, entonces los días en que los generadores de IA arruinaban las manos en nuestros deepfakes favoritos podrían estar finalmente en los archivos del pasado.
Imagen creada por Decrypt usando IA (MidJourney V5.1)
Daily Debrief Newsletter
Start every day with the top news stories right now, plus original features, a podcast, videos and more.
Artificial Intelligence
The latest artificial intelligence news, in-depth features, explainers, and analysis, spanning from generative to transformational technology and beyond.
Amantes de la tecnología gratuita, ¡están de suerte! Google y xAI han revelado actualizaciones bastante interesantes en sus ofertas de IA de forma gratuita, igualando y expandiendo los recientes esfuerzos de democratización de OpenAI.
La semana pasada, OpenAI lanzó la última salva en la guerra por los corazones—y, en última instancia, las billeteras de los usuarios—con su ambiciosa campaña "12 Días de OpenAI", lanzando al público una serie de potentes herramientas. Los aspectos destacados de la...
OpenAI presentó el jueves las capacidades de video largamente prometidas de ChatGPT, permitiendo a los usuarios apuntar sus teléfonos a objetos para análisis de IA en tiempo real—una característica que había estado guardada desde su primera demostración en mayo.
Anteriormente, podías ingresar texto, gráficos, voz o fotos fijas e interactuar con GPT. Esta característica, lanzada el jueves por la noche, permite que GPT te observe en tiempo real y proporcione retroalimentación conversacional. Por e...
Esta semana, Google lanzó Gemini 2.0, dotando a su último modelo de IA con capacidades autónomas y características multimodales.
Lo que es inmediatamente notable en este lanzamiento es que Google ve los chatbots de IA evolucionando hacia Agentes de IA—software personalizado que usa IA generativa para interactuar con usuarios y entender y ejecutar tareas en tiempo real.
"Con nuevos avances en multimodalidad—como salida nativa de imagen y audio—y uso nativo de herramientas, nos permitirá construir...