Google ha revolucionado la carrera corporativa de la IA y el año Gemini, un modelo que promete superar al ChatGPT... para humanos

ÁNGEL JIMÉNEZ POR LUIS

Atlanta

Actualizado 7 de julio de 2023 –
01:10

Comentar oralmente que «ve», identificar objetos, reproducir música y responder a inquietudes que requieran cierto grado de análisis, justificando su «razonamiento».

El director ejecutivo de Alphabet, Sundar Pichai, en una presentación — El director ejecutivo de Alphabet, Sundar Pichai, en la presentación de Gemini.PENSILVANIA.

Google hoy tiene nueva inteligencia artificial. Se llama Geminis y promete ser superior al modelo de lenguaje GPT4 de AbiertoAI, el motor que utiliza los servicios de ChatGPT para generar respuestas a las preguntas de los usuarios. A esto le siguen varios ensayos y ejemplos concretos, que incluyen diversa información sobre programación y lógica.

«Con una puntuación del 90,0%, es el primer modelo de lenguaje en superar a un humano experto en MMLU (siglas en français comprensin masiva del lenguaje multitarea), una batería de pruebas que utiliza una combinación de 57 atribuciones como materias, física, historia, derecho, medicina y garrapatas para poner a prueba tanto el conocimiento global como las habilidades de resolución de problemas”, explica Demis HassabisResponsable de Google DeepMind, una de las divisiones de Google que trabajó en el desarrollo de Gemini.

Google anuncia a Gemini el paso de mayo durante la conferencia de desarrolladores Google IO. La intención original era lanzarlo antes de fin de año, pero en las últimas semanas diversos rumores podrían apuntar a un posible regreso debido a problemas de compresión del modelo al utilizar diferentes modismos en inglés en las preguntas.

Finalmente, Google completó el calendario de previsiones, pero sólo los medios. A partir de hoy está disponible una versión de Gemini en inteligencia artificial conversacional Bardo y en teléfonos Pixel 8, pero la compañía está preparando para 2024 varios servicios de suscripción con funciones avanzadas de MS.

Tres versiones

Gemini ofrece inicialmente tres versiones diferentes: Ultra, Pro y Nano. El primero es el modelo más complejo y capaz de ofrecer mejores respuestas. Es por eso que hemos supervisado a GPT4 en varias evaluaciones comparativas realizadas, pero no estaremos en la lista hasta 2024.

Esta es una versión de menor rendimiento que requiere menos potencia informática para generar respuestas. Está diseñado como una habilidad directa de GPT 3.5, que es el modelo de lenguaje que utiliza ChatGPT en su versión gratuita.

Y además que Google ofrece a partir de hoy la versión gratuita de Bard. La próxima semana también estará disponible para los clientes del servicio VertexAI de Google y en los próximos meses también necesitarás utilizar otros servicios y herramientas de Google, como Tasks. A partir de ahí, Google tiende una versión de la página para registrarse en Bard que funciona con la versión. Géminis Ultra.

Finalmente, existe una versión del MS Pequea de Gemini, Nano, diseñada para ejecutarse en teléfonos móviles. El Pixel 8, el teléfono avanzado de Google, es el primero en tener acceso a este modelo, aunque Google permite que otros fabricantes lo utilicen. Con este modelo, los teléfonos pueden realizar determinadas tareas, como traducir entre varios idiomas o generar texto o imágenes, sin necesidad de conectarse a un servidor remoto.

Texto, imágenes y vídeo.

Géminis es un modelo a seguir»multimodal«. Esto significa que puedes escuchar tanto texto, como imágenes o audio en los temas. No es el modelo de lenguaje pequeño con esta capacidad, pero en Google, tienes la seguridad de que has dado un paso para todos, enseña el principio. para que realmente puedas contestar tus respuestas utilizando todos los elementos disponibles.

Google mostró algunos escenarios de Gemini utilizando esta capacidad. En uno, la inteligencia artificial es capaz de sugerir ideas para ayudarte a partir de una fotografía de dos huevos de lana, identificando los colores y formas que se pueden hacer con ellos.

En segundo lugar, ante una foto del ingrediente de una tortilla y una preocupación por los pasos a seguir, la IA es capaz de crear los diferentes pasos de la receta.

cabeza de carrera

Google juega mucho con Géminis. Nuestros laboratorios han logrado muchos avances que han permitido modelos modernos de lenguaje extendido, como GPT4 y Gemini. La empresa, sin embargo, no ha avanzado lo suficiente en su aprobación para crear mosaicos con sus herramientas.

El lanzamiento de ChatGPT también convirtió a su rival, OpenAI, en la empresa que comercializa el ritual en este nuevo mercado. Por eso es importante que Gemini pueda adherirse a GPT4 en áreas específicas.

Estos patrones de lengua han dado resultados sorprendentes en mosaicos con importantes aplicaciones comerciales. También carece de la capacidad de generar texto o resumir documentos largos, pero también es experto en generar, por ejemplo, Se necesita cdigo para crear la aplicación.

La forma en que se presentan las enfermedades, sin obstáculos, puede presentar problemas en tareas complejas. Los datos sobre los que se han registrado, por ejemplo, se han introducido en las respuestas y los modelos tienden a recopilar vacos de información sobre datos inventados, conocidos en la industria como «alucinaciones».

Para evitar estos escenarios, Google ha dedicado muchos recursos. “Hemos construido varios mecanismos de protección y trabajamos en colaboración con gobernadores y expertos para abordar los riesgos que surgen en el mediano plazo para que las inteligencias artificiales se vean con más capacidades”, explica Sundar Pichai, presidente ejecutivo de Google.

Google ha revolucionado la carrera corporativa de la IA y el año Gemini, un modelo que promete superar al ChatGPT… para humanos

Tres versiones

Texto, imágenes y vídeo.

cabeza de carrera

Por Selesio Gurule Castro

Google ha revolucionado la carrera corporativa de la IA y el año Gemini, un modelo que promete superar al ChatGPT… para humanos

Tres versiones

Texto, imágenes y vídeo.

cabeza de carrera

Por Selesio Gurule Castro

You May Also Like

España: cómo reducir paro estructural con formación y mejor intermediación laboral

Cómo las reglas de alquiler y propiedad en Suecia condicionan la movilidad laboral

Pakistán: combinar reformas tributarias y protección social para mejorar ingresos

La importancia de la manufactura y servicios para la estabilidad macroeconómica en Argelia