Comentar oralmente que «ve», identificar objetos, reproducir música y responder a inquietudes que requieran cierto grado de análisis, justificando su «razonamiento».
Google hoy tiene nueva inteligencia artificial. Se llama Geminis y promete ser superior al modelo de lenguaje GPT4 de AbiertoAI, el motor que utiliza los servicios de ChatGPT para generar respuestas a las preguntas de los usuarios. A esto le siguen varios ensayos y ejemplos concretos, que incluyen diversa información sobre programación y lógica.
«Con una puntuación del 90,0%, es el primer modelo de lenguaje en superar a un humano experto en MMLU (siglas en français comprensin masiva del lenguaje multitarea), una batería de pruebas que utiliza una combinación de 57 atribuciones como materias, física, historia, derecho, medicina y garrapatas para poner a prueba tanto el conocimiento global como las habilidades de resolución de problemas”, explica Demis HassabisResponsable de Google DeepMind, una de las divisiones de Google que trabajó en el desarrollo de Gemini.
Google anuncia a Gemini el paso de mayo durante la conferencia de desarrolladores Google IO. La intención original era lanzarlo antes de fin de año, pero en las últimas semanas diversos rumores podrían apuntar a un posible regreso debido a problemas de compresión del modelo al utilizar diferentes modismos en inglés en las preguntas.
Finalmente, Google completó el calendario de previsiones, pero sólo los medios. A partir de hoy está disponible una versión de Gemini en inteligencia artificial conversacional Bardo y en teléfonos Pixel 8, pero la compañía está preparando para 2024 varios servicios de suscripción con funciones avanzadas de MS.
Tres versiones
Gemini ofrece inicialmente tres versiones diferentes: Ultra, Pro y Nano. El primero es el modelo más complejo y capaz de ofrecer mejores respuestas. Es por eso que hemos supervisado a GPT4 en varias evaluaciones comparativas realizadas, pero no estaremos en la lista hasta 2024.
Esta es una versión de menor rendimiento que requiere menos potencia informática para generar respuestas. Está diseñado como una habilidad directa de GPT 3.5, que es el modelo de lenguaje que utiliza ChatGPT en su versión gratuita.
Y además que Google ofrece a partir de hoy la versión gratuita de Bard. La próxima semana también estará disponible para los clientes del servicio VertexAI de Google y en los próximos meses también necesitarás utilizar otros servicios y herramientas de Google, como Tasks. A partir de ahí, Google tiende una versión de la página para registrarse en Bard que funciona con la versión. Géminis Ultra.
Finalmente, existe una versión del MS Pequea de Gemini, Nano, diseñada para ejecutarse en teléfonos móviles. El Pixel 8, el teléfono avanzado de Google, es el primero en tener acceso a este modelo, aunque Google permite que otros fabricantes lo utilicen. Con este modelo, los teléfonos pueden realizar determinadas tareas, como traducir entre varios idiomas o generar texto o imágenes, sin necesidad de conectarse a un servidor remoto.
Texto, imágenes y vídeo.
Géminis es un modelo a seguir»multimodal«. Esto significa que puedes escuchar tanto texto, como imágenes o audio en los temas. No es el modelo de lenguaje pequeño con esta capacidad, pero en Google, tienes la seguridad de que has dado un paso para todos, enseña el principio. para que realmente puedas contestar tus respuestas utilizando todos los elementos disponibles.
Google mostró algunos escenarios de Gemini utilizando esta capacidad. En uno, la inteligencia artificial es capaz de sugerir ideas para ayudarte a partir de una fotografía de dos huevos de lana, identificando los colores y formas que se pueden hacer con ellos.
En segundo lugar, ante una foto del ingrediente de una tortilla y una preocupación por los pasos a seguir, la IA es capaz de crear los diferentes pasos de la receta.
cabeza de carrera
Google juega mucho con Géminis. Nuestros laboratorios han logrado muchos avances que han permitido modelos modernos de lenguaje extendido, como GPT4 y Gemini. La empresa, sin embargo, no ha avanzado lo suficiente en su aprobación para crear mosaicos con sus herramientas.
El lanzamiento de ChatGPT también convirtió a su rival, OpenAI, en la empresa que comercializa el ritual en este nuevo mercado. Por eso es importante que Gemini pueda adherirse a GPT4 en áreas específicas.
Estos patrones de lengua han dado resultados sorprendentes en mosaicos con importantes aplicaciones comerciales. También carece de la capacidad de generar texto o resumir documentos largos, pero también es experto en generar, por ejemplo, Se necesita cdigo para crear la aplicación.
La forma en que se presentan las enfermedades, sin obstáculos, puede presentar problemas en tareas complejas. Los datos sobre los que se han registrado, por ejemplo, se han introducido en las respuestas y los modelos tienden a recopilar vacos de información sobre datos inventados, conocidos en la industria como «alucinaciones».
Para evitar estos escenarios, Google ha dedicado muchos recursos. “Hemos construido varios mecanismos de protección y trabajamos en colaboración con gobernadores y expertos para abordar los riesgos que surgen en el mediano plazo para que las inteligencias artificiales se vean con más capacidades”, explica Sundar Pichai, presidente ejecutivo de Google.



