Google (NASDAQ:GOOGL) ha lanzado Gemini, su propio modelo de IA, teóricamente más potente que el primigenio ChatGPT. La carrera por la conquista del mundo de la inteligencia artificial no ha hecho más que empezar.
Gemini, una IA «más potente» que ChatGPT
Tal y como han explicado desde la empresa, Gemini es el resultado de un gran desarrollo multidepartamental de los equipos de Google. Esta IA está hecha en origen a fin de ser multimodal, lo que le permite generalizar, comprender, operar y combinar sin problemas toda la información posible, sea en forma de texto, código, audio, imagen y vídeo.
«Estamos dando el siguiente paso en nuestro viaje con Gemini, nuestro modelo de IA más capaz y general hasta el momento, con un rendimiento de última generación en muchos puntos de referencia líderes«.
Sundar Pichai, director ejecutivo de Google y Alphabet.
Gemini 1.0 parte con tres modalidades
La primera versión, Gemini 1.0, está optimizada para diferentes tamaños: Ultra, Pro y Nano.
- Modelo Ultra es el más grande y capaz para tareas altamente complejas.
- Modelo Pro es el mejor para escalar en una amplia gama de tareas.
- Modelo Nano es el más eficiente para tareas en el dispositivo.
«Estos son los primeros modelos (…) y la primera realización de la visión que tuvimos cuando formamos Google DeepMind a principios de este año. Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa. Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo».
Sundar Pichai
La potencia de la nueva IA de Google
Desde Google comentan que el desempeño de su IA más potente, Gemini Ultra, supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos (desde la comprensión de imágenes naturales, audio y video hasta el razonamiento matemático) ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM).
Gemini Ultra también logra una puntuación de vanguardia del 59,4 % en el nuevo punto de referencia MMMU, que consta de tareas multimodales que abarcan diferentes dominios que requieren un razonamiento deliberado.
«Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar ambos mundos, conocimientos y habilidades para la resolución de problemas (…) las sofisticadas capacidades de razonamiento multimodal (…) pueden ayudar a dar sentido a información visual y escrita compleja. Esto lo hace especialmente hábil para descubrir conocimientos que pueden ser difíciles de discernir en medio de grandes cantidades de datos».
Comunicado de Google
Gemini 1.0 ha sido capacitado para reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados. Esto lo hace especialmente bueno para explicar el razonamiento en materias complejas como matemáticas y física.
La salida al público del modelo de IA de Google
Desde este miércoles, el chatbot de Google, Bard, utilizará Gemini Pro para ayudar con el razonamiento avanzado, la planificación, la comprensión y otras capacidades. A principios del próximo año, lanzará «Bard Advanced«, que utilizará Gemini Ultra, y representa la mayor actualización de Bard, su chatbot similar a ChatGPT.
A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de su API en Google AI Studio o Google Cloud Vertex AI. Los desarrolladores de Android, por su parte, podrán crear con Gemini Nano a través de AICore, una nueva capacidad del sistema disponible en Android 14, a partir de los dispositivos Pixel 8 Pro.