7 de marzo del 2026
InicioNoticiasInternacionalesAlphabet introduce Gemini 2.5 Flash Image, su herramienta de edición de imágenes...

Alphabet introduce Gemini 2.5 Flash Image, su herramienta de edición de imágenes basada en inteligencia artificial

Presentación oficial del nuevo modelo de edición de imágenes

La empresa tecnológica Alphabet, propietaria de Google, ha anunciado públicamente el lanzamiento de Gemini 2.5 Flash Image, una versión avanzada de su sistema de creación y modificación de imágenes mediante inteligencia artificial. Este modelo fue presentado el martes 19 de noviembre de 2024 en Queens, Nueva York, durante un evento especial.

Características técnicas del modelo

Según declaraciones oficiales de la compañía, este sistema permite fusionar múltiples imágenes en una sola, mantener la uniformidad de personajes para mejorar la narrativa visual, realizar modificaciones precisas mediante lenguaje coloquial y aprovechar la base de conocimientos de Gemini para producir y alterar imágenes.

La actualización denominada nano-banana se basa en comentarios de usuarios de versiones anteriores, quienes valoraban su rapidez de procesamiento, costo accesible y simplicidad de uso, pero solicitaban mejoras en la calidad visual y mayor capacidad de control creativo.

Disponibilidad y rendimiento

Desarrollado por el laboratorio Google DeepMind, este innovador sistema de inteligencia artificial ya está disponible para profesionales mediante la API de Gemini y Google AI Studio, así como para organizaciones a través de Vertex AI. Su principal ventaja es la capacidad de mantener la coherencia visual entre distintas imágenes.

Según reportes de Business Insider, el desempeño de esta herramienta ha generado un impacto significativo en el sector, posicionándose como un competidor directo de aplicaciones tradicionales de edición como Adobe Photoshop. Pruebas independientes han demostrado que logra resultados más precisos que sus competidores, incluso en tareas complejas como incorporar elementos adicionales o modificar paletas cromáticas sin afectar detalles esenciales.

Funcionalidades adicionales

Entre las capacidades destacadas del modelo se encuentran: mantener la uniformidad visual de personajes u objetos a través de múltiples ediciones, adherirse a diseños predeterminados y realizar modificaciones específicas mediante instrucciones verbales. El sistema puede, por ejemplo, desenfocar fondos, eliminar imperfecciones, cambiar posturas o modificar colores con comandos sencillos.

Además, es capaz de interpretar y combinar múltiples imágenes, estilizar escenarios y generar elementos visuales consistentes para marcas, catálogos o entornos educativos. La integración con el modo «build» de Google AI Studio permite probar rápidamente las capacidades del modelo, desarrollar aplicaciones con un solo comando o personalizar plantillas predefinidas.

Costo del servicio

El precio del servicio es de US$30 por cada millón de tokens de salida, considerando que cada imagen promedio requiere 1.290 tokens (aproximadamente US$0,039 por imagen). Esta tarifa busca hacerlo competitivo en el mercado de herramientas de inteligencia artificial para edición de imágenes.

NOTICIAS RELACIONADAS

Deje una respuesta

¡Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Más Populares

Comentarios Recientes