31/10/2025
¿Te sorprenden (y te divierten😂...) éstas imágenes?
Todo parte del concepto de GANs (Generative Adversarial Networks), básicamente son dos inteligencias artificiales que compiten entre sí: una que crea y otra que corrige. El “generador” inventa imágenes falsas (por ejemplo, rostros humanos), y el “discriminador” intenta detectar si son reales o no. Con cada intento, ambos mejoran. Este juego de creación y corrección se repite millones de veces hasta que el generador logra producir imágenes tan realistas que incluso el discriminador no puede distinguirlas.
Esa idea del 2014 fue el punto de partida de una revolución. Los GANs demostraron que una máquina podía aprender a crear, no solo a analizar.
Años después, Google llevó esta evolución a otro nivel con Nano Banana. Aunque ya no usa directamente la estructura clásica de los GANs, se apoya en su principio fundamental: el aprendizaje a partir de comparación y mejora continua.
Para entenderlo fácilmente, imagina que le dices a un robot: “Dibuja una niña que juega con un perro en el parque, al atardecer, con globos”. Gemini sigue básicamente estos pasos:
Primero lee lo que tú pides (Debes escribirlo bien). Entiende el texto y reconoce conceptos como “niña”, “perro”, “parque”, “atardecer”, “globos”.
Luego busca en su “caja de recuerdos”, una enorme biblioteca mental construida con millones de imágenes y descripciones.
Después combina esos elementos para “dibujar” la niña, el perro, el parque, la luz del atardecer, los globos, todo en armonía.
Finalmente, refina los detalles para que la imagen se vea real: las sombras, la luz, los pliegues de la ropa, la expresión del rostro y la interacción entre los personajes.
Así, en solo unos segundos, Gemini logra lo que antes requería horas de trabajo humano.
Hemos pasado de dibujos distorsionados a retratos fotográficos generados por IA, y apenas estamos al comienzo. El futuro de los tokens, la animación y los mundos interactivos promete una nueva de conocimiento.
🧌🧟♂️¡Feliz halloween! 👻🎃