Presenta Google a Gemini, ¿podrá destronar a ChatGPT?

Con una puntuación del 90,04% en MMLU (comprensión masiva del lenguaje multitarea), es el primer modelo que supera a los expertos humanos en un test, junto a la capacidad de resolución de problemas.

6 Diciembre, 2023 Actualizado el 6 de Diciembre, a las 22:01

No es la primera vez que Google lanza un intento por competir con OpenAI. (Imagen: Google)

Arena Pública

ChatGPT podría perder su dominio como desarrollo de IA, después de que Google lanzara Gemini, su modelo de IA más grande y capaz hasta la fecha. Diseñado desde cero para ser multimodal, Gemini puede generalizar y comprender información de diferentes tipos, como texto, código, audio, imagen y video. Además, es un modelo flexible que puede ejecutarse eficientemente tanto en centros de datos como en dispositivos móviles.

We’re excited to announce 𝗚𝗲𝗺𝗶𝗻𝗶: @Google’s largest and most capable AI model.

Built to be natively multimodal, it can understand and operate across text, code, audio, image and video - and achieves state-of-the-art performance across many tasks. 🧵 https://t.co/mwHZTDTBuG pic.twitter.com/zfLlCGuzmV
— Google DeepMind (@GoogleDeepMind) December 6, 2023

Este avance, anunciado por Demis Hassabis, CEO y cofundador de Google DeepMind, es el resultado de esfuerzos colaborativos entre varios equipos de Google, incluidos los dedicados a la investigación. La versión inicial de Gemini, denominada Gemini 1.0, lanzará en tres tamaños diferentes: Gemini Ultra, el modelo más grande y capaz, diseñado para tareas altamente complejas; Gemini Pro, el mejor modelo para escalar en una amplia gama de tareas; y Gemini Nano, el modelo más eficiente para tareas en el dispositivo.

La carta maestra de Google en el mercado de la IA promete resultados relevantes. Gemini Ultra, por ejemplo, demostró un rendimiento importante en diversas tareas, superando los resultados actuales en 30 de los 32 puntos de referencia académicos ampliamente utilizados. “Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar ambos mundos. conocimientos y habilidades para la resolución de problemas”, se lee en el comunicado.

Gemini Ultra outperforms human experts on MMLU (massive multitask language understanding): one of the most popular methods of benchmarking AI models.

It involves a combination of 57 test subjects from math to history to law and more. ↓ https://t.co/mwHZTDTBuG pic.twitter.com/587naHIR1Q
— Google DeepMind (@GoogleDeepMind) December 6, 2023

En las pruebas de referencia de imágenes, Gemini Ultra supera a los modelos de última generación anteriores sin la ayuda de sistemas de reconocimiento de caracteres de objetos. Esto resalta la capacidad nativa multimodal de Gemini y sus signos tempranos de capacidades de razonamiento más complejas, pero, ¿esto será suficiente para competir con ChatGPT?

Una de las particularidades de Gemini, es que ha sido diseñado para ser multimodal desde el principio. Esto significa que ha sido entrenado previamente en diferentes modalidades, permitiéndole comprender y razonar sobre varias entradas de manera más efectiva que los modelos multimodales existentes.

OpenAI diseñó a ChatGPT basado en la arquitectura GPT (Generative Pre-trained Transformer) de red neuronal, que ha demostrado ser muy eficaz para tareas de procesamiento de lenguaje natural. Gemini 1.0, por su parte, fue entrenado a escala utilizando las Unidades de procesamiento tensorial (TPU) v4 y v5e de Google. En comparación con modelos anteriores, Gemini corre significativamente más rápido en estos TPU

Esto significa que también puede extraer información de texto, imágenes, audio y más simultáneamente, lo que lo hace hábil para entender información matizada y responder preguntas relacionadas con temas complejos.

Let's go hands-on with #GeminiAI.

Our newest AI model can reason across different types of inputs and outputs — like images and text. See Gemini's multimodal reasoning capabilities in action ↓ pic.twitter.com/tikHjGJ5Xj
— Google (@Google) December 6, 2023

Aunque alcanzar a ChatGPT no es una tarea fácil. En su primer año después de su lanzamiento, ha tenido importantes reconocimientos en el ámbito de la Inteligencia Artificial. ChatGPT, ha sido notablemente más rápido en acumular un millón de usuarios que cualquier otro. El chatbot tardó menos de cinco días en llegar a un millón de usuarios, aunque, a diferencia de los principales servicios de tecnologías y servicios de Internet de las cosas, como Netflix y Airbnb, ChatGPT no tenía rivales prominentes.

Además de eso, OpenAI, la empresa desarrolladora, fue la plataforma de aprendizaje automático más financiada en 2022. La financiación total de la empresa en 2015 se valoró en más de mil millones de dólares estadounidenses, según datos de Statista. OpenAI podría incluso convertirse en una de las startups de IA más valiosas en la actualidad, con el financiamiento e inversión de gigantes como Microsoft.

Por su parte, no es la primera vez que Google lanza un intento por competir con OpenAI. En febrero de este año, la empresa presentaba a Bard, un bot conversacional de inteligencia artificial desarrollado por Google basado en la familia PaLM 2. Sin embargo, en la presentación, el chatbot cometió un error, dando información falsa. Esto tuvo consecuencias importantes en la cotización de la empresa.

Google no deja atrás sus apuestas en IA , pero ninguna de las anteriores está cerca de alcanzar a ChatGPT. Sin embargo, este desarrollo, también estará disponible en varios productos y plataformas de Google. Gemini Pro estará disponible en productos de Google, mientras que Gemini Nano impulsará nuevas funciones en el próximo Pixel 8 Pro. Gemini también se integrará en productos como Búsqueda, Anuncios, Chrome y Duet AI en los próximos meses, por lo que podría impulsar su popularidad y su uso.

Presenta Google a Gemini, ¿podrá destronar a ChatGPT?

Archivado en

Temas

Estilo de Vida

Más formatos

Comercial

Más

Presenta Google a Gemini, ¿podrá destronar a ChatGPT?

Amazon refuerza su oferta Prime con Alexa+, pero podría encender las alarmas antimonopolio de nuevo

Archivado en

Amazon refuerza su oferta Prime con Alexa+, pero podría encender las alarmas antimonopolio de nuevo

Te recomendamos

Tractian recauda 2,450 mdp y acelera su expansión en el norte de México con foco en el nearshoring

Apuesta Liverpool por IA, personalización y automatización para liderar en comercio unificado

Nikon México supera expectativas hacia el cierre del año, pese a entorno desafiante

El auge de las consultoras de IA, ¿cómo diseñar una estrategia que agregue valor? Platicamos con Diego Halffter

La Alta Dirección en México ya está reconociendo el valor estratégico de la IA: IBM México

Tractian, la startup industrial, prevé crecer 300% este año y pone la mirada en NYSE