Gemini es la abreviatura de Red de Inteligencia Multimodal Generalizada y es la nueva IA de Google, destinada a remodelar la forma en que interactuamos con la tecnología, tal y como hemos podido ver en su presentación oficial. Gemini es un modelo de inteligencia artificial multimodal, que muestra una competencia sin precedentes en el procesamiento de diversos tipos de datos, incluidos texto, imágenes, código, voz y mucho, mucho más. Todo lo que se ha visto hasta ahora traspasa los límites de lo que habíamos visto con GPT-4 y otras herramientas de inteligencia artificial. Es, sin duda, el último salto de Google en el campo de la inteligencia artificial. A diferencia de los modelos de IA tradicionales que están diseñados para manejar un tipo de datos, Gemini es capaz de procesar múltiples tipos de datos y tareas simultáneamente. Incluso gráficos, y con una velocidad de adaptación impresionante. Gemini no es, por tanto, solo texto o imágenes. Puede funcionar con audio y cualquier otro tipo de datos, lo que permite al usuario, tal y como se ha visto en la presentación oficial de Google, interacciones mucho más naturales y atractivas; casi como hablar con una persona real. Según el anuncio de la compañía, Gemini "fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar sin problemas diferentes tipos de información". Gemini se describe como el "modelo más flexible", capaz de ejecutarse en centros de datos o dispositivos móviles. Y con la presentación de Gemini vienen varias versiones más basadas en ella: Ultra, Pro y Nano. La versión Ultra ya ha logrado un hito al superar a los expertos humanos, con una puntuación del 90 % en una prueba multitarea que cubre diversas materias como matemáticas, física, derecho, medicina y ética. Además, Bard también utilizará "una versión mejorada de Gemini Pro", lo que representa la actualización más importante del robot de Google. El modelo Ultra de Gemini también puede impulsar AlphaCode2, una nueva herramienta de escritura de códigos que puede superar al 85% de los programadores de computadoras humanos de nivel competitivo. Desarrollada por DeepMind, una unidad de Google con sede en Londres, Google afirma que Gemini eclipsa al modelo más potente de ChatGPT, GPT-4, en 30 de 32 pruebas comparativas, lo que demuestra destreza en el razonamiento y la comprensión de imágenes. Sus capacidades son realmente avanzadas: desde generar texto creativo hasta responder preguntas complejas y traducir idiomas; su conjunto de habilidades es muy amplio. Gemini tiene la capacidad de generar resultados completamente nuevos. Esto significa que puede crear contenido que no necesariamente existe en sus datos de entrenamiento, lo que la convierte en una herramienta poderosa para tareas que tengan que ver con la creatividad y la innovación. El lanzamiento inicial se realizará en más de 170 países, excepto el Reino Unido y Europa, donde la autorización regulatoria está pendiente aún. Gemini es la última maravilla de la IA y significa un salto monumental en la búsqueda de capacidades de IA de vanguardia por parte de la compañía. Como bien lo expresa el director ejecutivo de Alphabet, Sundar Pichai, esta presentación representa un esfuerzo científico y de ingeniería colosal para la empresa. Gemini utiliza una nueva arquitectura que fusiona un codificador y decodificador multimodal. El trabajo del codificador es transformar diferentes tipos de datos a un lenguaje común que el decodificador pueda entender. Luego, el decodificador decide generar salidas en diferentes modalidades según las entradas codificadas y la tarea en sí misma. A diferencia de GPT-4, Gemini aprende y mejora constantemente. Puede incorporar nueva información en tiempo real, asegurando que su conocimiento esté siempre actualizado y sea relevante para sus necesidades. Pero no podemos dejar de lado a Elon Musk. En el otro lado del campo de batalla de la IA se encuentra xAI, una empresa que Musk fundó con la intención de establecer esta IA como un contendiente formidable en el espacio de la inteligencia artificial en general. xAI pretende trabajar en estrecha colaboración con X (Twitter), Tesla y otras empresas. A medida que los actores de la inteligencia artificial se preparan, está claro que veremos una colisión de visiones estratégicas y destreza tecnológica en el ámbito de la IA dentro de muy poco tiempo.