Presenta Google a Gemini, ¿podrá destronar a ChatGPT?
ChatGPT podría perder su dominio como desarrollo de IA, después de que Google lanzara Gemini, su modelo de IA más grande y capaz hasta la fecha. Diseñado desde cero para ser multimodal, Gemini puede generalizar y comprender información de diferentes tipos, como texto, código, audio, imagen y video. Además, es un modelo flexible que puede ejecutarse eficientemente tanto en centros de datos como en dispositivos móviles.
We’re excited to announce 𝗚𝗲𝗺𝗶𝗻𝗶: @Google’s largest and most capable AI model.
Built to be natively multimodal, it can understand and operate across text, code, audio, image and video - and achieves state-of-the-art performance across many tasks. 🧵 https://t.co/mwHZTDTBuG pic.twitter.com/zfLlCGuzmV— Google DeepMind (@GoogleDeepMind) December 6, 2023
Este avance, anunciado por Demis Hassabis, CEO y cofundador de Google DeepMind, es el resultado de esfuerzos colaborativos entre varios equipos de Google, incluidos los dedicados a la investigación. La versión inicial de Gemini, denominada Gemini 1.0, lanzará en tres tamaños diferentes: Gemini Ultra, el modelo más grande y capaz, diseñado para tareas altamente complejas; Gemini Pro, el mejor modelo para escalar en una amplia gama de tareas; y Gemini Nano, el modelo más eficiente para tareas en el dispositivo.
La carta maestra de Google en el mercado de la IA promete resultados relevantes. Gemini Ultra, por ejemplo, demostró un rendimiento importante en diversas tareas, superando los resultados actuales en 30 de los 32 puntos de referencia académicos ampliamente utilizados. “Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar ambos mundos. conocimientos y habilidades para la resolución de problemas”, se lee en el comunicado.
Gemini Ultra outperforms human experts on MMLU (massive multitask language understanding): one of the most popular methods of benchmarking AI models.
It involves a combination of 57 test subjects from math to history to law and more. ↓ https://t.co/mwHZTDTBuG pic.twitter.com/587naHIR1Q— Google DeepMind (@GoogleDeepMind) December 6, 2023
En las pruebas de referencia de imágenes, Gemini Ultra supera a los modelos de última generación anteriores sin la ayuda de sistemas de reconocimiento de caracteres de objetos. Esto resalta la capacidad nativa multimodal de Gemini y sus signos tempranos de capacidades de razonamiento más complejas, pero, ¿esto será suficiente para competir con ChatGPT?
Una de las particularidades de Gemini, es que ha sido diseñado para ser multimodal desde el principio. Esto significa que ha sido entrenado previamente en diferentes modalidades, permitiéndole comprender y razonar sobre varias entradas de manera más efectiva que los modelos multimodales existentes.
OpenAI diseñó a ChatGPT basado en la arquitectura GPT (Generative Pre-trained Transformer) de red neuronal, que ha demostrado ser muy eficaz para tareas de procesamiento de lenguaje natural. Gemini 1.0, por su parte, fue entrenado a escala utilizando las Unidades de procesamiento tensorial (TPU) v4 y v5e de Google. En comparación con modelos anteriores, Gemini corre significativamente más rápido en estos TPU
Esto significa que también puede extraer información de texto, imágenes, audio y más simultáneamente, lo que lo hace hábil para entender información matizada y responder preguntas relacionadas con temas complejos.
Let's go hands-on with #GeminiAI.
Our newest AI model can reason across different types of inputs and outputs — like images and text. See Gemini's multimodal reasoning capabilities in action ↓ pic.twitter.com/tikHjGJ5Xj— Google (@Google) December 6, 2023
Aunque alcanzar a ChatGPT no es una tarea fácil. En su primer año después de su lanzamiento, ha tenido importantes reconocimientos en el ámbito de la Inteligencia Artificial. ChatGPT, ha sido notablemente más rápido en acumular un millón de usuarios que cualquier otro. El chatbot tardó menos de cinco días en llegar a un millón de usuarios, aunque, a diferencia de los principales servicios de tecnologías y servicios de Internet de las cosas, como Netflix y Airbnb, ChatGPT no tenía rivales prominentes.
Además de eso, OpenAI, la empresa desarrolladora, fue la plataforma de aprendizaje automático más financiada en 2022. La financiación total de la empresa en 2015 se valoró en más de mil millones de dólares estadounidenses, según datos de Statista. OpenAI podría incluso convertirse en una de las startups de IA más valiosas en la actualidad, con el financiamiento e inversión de gigantes como Microsoft.
Por su parte, no es la primera vez que Google lanza un intento por competir con OpenAI. En febrero de este año, la empresa presentaba a Bard, un bot conversacional de inteligencia artificial desarrollado por Google basado en la familia PaLM 2. Sin embargo, en la presentación, el chatbot cometió un error, dando información falsa. Esto tuvo consecuencias importantes en la cotización de la empresa.
Google no deja atrás sus apuestas en IA , pero ninguna de las anteriores está cerca de alcanzar a ChatGPT. Sin embargo, este desarrollo, también estará disponible en varios productos y plataformas de Google. Gemini Pro estará disponible en productos de Google, mientras que Gemini Nano impulsará nuevas funciones en el próximo Pixel 8 Pro. Gemini también se integrará en productos como Búsqueda, Anuncios, Chrome y Duet AI en los próximos meses, por lo que podría impulsar su popularidad y su uso.