DeepFloyd el nuevo modelo de stability

DeepFloyd IF: El primer modelo que puede generar texto en las imágenes

Y es que Stability.AI no se está guardando nada, y además de sus recientes lanzamientos como, StableLM y StableVicuna, recientemente ha anunciado DeepFloyd IF. El primer modelo que incorpora texto en las imágenes. Así que, veamos en profundidad, que es, porque es tan impresionante este modelo, algunos ejemplos y como puedes probarlo.

¿Qué es DeepFloyd IF?

Como dije, se trata del primer modelo de IA generativa que tiene la capacidad de generar texto dentro de las imágenes. Además, es capaz de lograr un impresionante fotorrealismo en dichas imágenes, lo que las hace difícil de distinguir contra las imágenes verdaderamente reales.

¿Qué lo diferencia de Stable Diffusion, Dall E y otros modelos de IA? Pues, su capacidad de introducir texto dentro de las imágenes que genera.

Aunque Stability ha dicho que es el primer modelo en crear texto dentro de imágenes, me acuerdo de que Stable Diffusion XL ya era capaz de hacer esto. Quizás ya tenía algo de este nuevo modelo incorporado o no era capaz de hacerlo al mismo nivel de interpretación y detalle que ahora puede hacer DeepFloyd IF.

¿Por qué es tan impresionante?

Bueno, este nuevo modelo de Stability, se destaca por las siguientes características:

  • Comprensión profunda del texto: DeepFloyd IF puede entender el texto a nivel semántico y sintáctico, lo que le permite generar imágenes coherentes y claras que reflejen la descripción proporcionada. Además de que puede generar imágenes con textos incorporados, incorpora estilos variados y relaciones espaciales complejas.
  • Un grado muy alto de realismo fotográfico: El modelo puede generar imágenes con un nivel de detalle y calidad muy elevados. Lo que hace difícil distinguir si fue creado con IA o es una imagen real.
  • Cambio de relación de aspecto: Esto es a lo que me refería con «relaciones espaciales complejas». Puede generar imágenes con una relación de aspecto no estándar, vertical u horizontal, así como la relación cuadrada estándar. Esto le da más flexibilidad al modelo para adaptarse a diferentes tipos de imágenes y textos.
  • Traducciones de imagen a imagen sin entrenamiento previo: DeepFloyd IF puede modificar imágenes existentes mediante un proceso de redimensionamiento, ruido y desruido con un nuevo texto. Esto le permite cambiar el estilo, los patrones y los detalles de la salida mientras mantiene la forma básica de la imagen original, todo sin necesidad de entrenamiento previo.

Ejemplos de DeepFloyd IF

Veamos algunos ejemplos han sido generados con este nuevo modelo y que tan realistas pueden ser las imágenes.

Ejemplo 1 con DeepFloyd IF
Ejemplo 1 con DeepFloyd IF
Ejemplo 2 con deepfloyd
Ejemplo 2

Ambas imágenes son muy buenas, particularmente la primera. Se ve más real que la segunda. Pero como buen modelo generativo que es, también crea imágenes sin texto y fotorrealistas. Les dejo un tercer ejemplo sin texto.

Ejemplo 3
Ejemplo 3

¡Es asombroso! La imagen es una fruta con textura de mora en su exterior y con textura de naranja en su interior. Está muy bien lograda, realmente parece real.

De modo que DeepFloyd IF, además de su innovación de crear texto en las imágenes, pasa a ser un muy buen competidor de otros modelos de IA generativas, como MidJourney o Dall E.

Prueba DeepFloyd IF y diviértete creando

Ahora sí. Estoy seguro de que tienes ganas de probar este nuevo modelo y crear imágenes espectaculares con tu nombre. Entonces, te dejo el siguiente link para que disfrutes creando imágenes geniales: https://huggingface.co/spaces/DeepFloyd/IF

En resumen, se trata de modelo que da un paso más allá en la creación de imágenes, añadiendo su particular característica de añadir texto en ellas, lo que lo hace único. Y si le sumamos su grado de realismo fotográfico, lo hace impresionante y atractivo. En fin, seguiremos atentos a stability y a sus nuevos anuncios y veremos como hace la competencia para también añadir esta posibilidad a sus modelos. ¡Hasta la próxima!

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *