Blog de aprendizaje

Ada, Babbage, Curie, Davinci y Cushman: las personas tras los modelos de ChatGPT

246

Ada, Babbage, Curie y Davinci son los nombres de las diferentes versiones del modelo de lenguaje generativo pre-entrenado ChatGPT 3 desarrollados por OpenAI. Estos modelos difieren principalmente en la cantidad de parámetros que manejan, así como en la calidad y diversidad de los textos que pueden generar.

OpenAI decidió nombrar los modelos de ChatGPT en honor a estos pioneros como una forma de reconocer y honrar sus contribuciones al campo de la informática y la ciencia. Cada uno de los modelos trabajan con una cantidad de parámetros, y además son modelos adecuados para determinados propósitos y usos.

De forma muy simplificada, cuanto más grande es el modelo de ChatGPT, más capacidad tiene para generar texto de alta calidad y realizar tareas de lenguaje natural complejas. Sin embargo, también es más costoso y requiere más recursos de procesamiento y almacenamiento.

  • Ada es un modelo de ChatGPT con 1.2 mil millones de parámetros. Aunque es más pequeño que otros modelos de ChatGPT, Ada puede generar textos de alta calidad y completar tareas de lenguaje natural. Debido a que es un modelo más pequeño, Ada se utiliza principalmente para tareas de lenguaje natural más simples, como la generación de texto en redes sociales o chatbots.
  • Babbage es un modelo con 6 mil millones de parámetros. Con mayor capacidad de procesamiento y una mayor cantidad de parámetros, Babbage se utiliza para tareas de lenguaje natural más complejas, como pueden ser la generación de texto para aplicaciones de análisis de sentimiento o para la redacción de artículos periodísticos.
  • Por su parte, Curie es un modelo de ChatGPT con 13 mil millones de parámetros. Es más grande que Babbage y puede generar textos aún más detallados y precisos en varios idiomas y campos de conocimiento. Así, se suele emplear en la traducción de idiomas, la creación de resúmenes y la redacción de informes científicos.
  • Davinci es un modelo con más de 175 mil millones de parámetros. Es el modelo más grande y avanzado de la serie de GPT 3, y puede generar textos de alta calidad en múltiples estilos y tonos, realizar tareas de lenguaje natural complejas como traducción y respuesta a preguntas, y crear contenido creativo como poemas y diálogos, guiones de cine e incluso poesía o haikus.

Las principales diferencias entre Ada, Babbage, Curie y Davinci son su tamaño y capacidad para generar texto de alta calidad y realizar tareas de lenguaje natural complejas. Pero… ¿por qué se denominan así los modelos? ¿Quiénes fueron las geniales personas tras los nombres de los modelos?

Los pioneros y pioneras tras los modelos

Los nombres Ada, Babbage, Davinci y Curie corresponden a los nombres de algunos pioneros y figuras importantes en la historia de la informática y la ciencia.

  • Ada Lovelace (1815-1852) fue una matemática y escritora británica del siglo XIX, considerada como la primera programadora de la historia por sus contribuciones al desarrollo del primer algoritmo destinado a ser procesado por una máquina. El modelo Ada de ChatGPT es el que maneja menos parámetros, es más rápido e impreciso, quizás -teorizamos- a que ella históricamente fue pionera en el campo de la computación y por tanto, al ser de las primeras, sus descubrimientos abrieron el camino a otros que llegaron después.
  • Charles Babbage (1791-1871) fue un matemático y científico británico del siglo XIX, considerado como el padre de la computación debido a su diseño conceptual de la «Máquina Analítica», un dispositivo mecánico programable que se considera un precursor de la computadora moderna.
  • Ada Lovelace y Charles Babagge se conocieron en 1833, cuando Ada tenía 17 años y Babbage estaba trabajando en su Máquina Diferencial. Lovelace quedó fascinada por el proyecto de Babbage y comenzó a trabajar con él en el diseño de la Máquina Analítica. Durante su trabajo conjunto, Ada Lovelace realizó una importante contribución al desarrollo de la informática al crear el primer algoritmo para ser procesado por la Máquina Analítica. Además, también propuso que la máquina podría utilizarse no solo para cálculos matemáticos, sino también para crear música y arte, lo que demuestra una visión pionera y visionaria sobre el potencial de la tecnología que todavía hoy sigue siendo relevante. El segundo martes de octubre de cada año se celebra el día de Ada Lovelace, buscando fomentar el interés de las mujeres en la tecnología y la programación, así como promover la igualdad de género en el ámbito de la informática y la tecnología.
  • El modelo Curie lleva el nombre de Marie Curie (1867-1934) en reconocimiento a su legado como una pionera en la investigación científica y su trabajo pionero en física y química, áreas que tienen una fuerte conexión con el procesamiento del lenguaje natural, en el que se utiliza el modelo GPT Curie. Madame Curie fue la primera mujer en ganar un Premio Nobel, y la única persona en ganar dos premios Nobel en diferentes disciplinas científicas (física y química). También fue la primera mujer en enseñar en la Universidad de París. Con la elección del nombre de Marie Curie para este modelo, se busca honrar y celebrar el papel de las mujeres en la ciencia y la tecnología.
  • Por último, Leonardo da Vinci (1452-1519) fue un artista, inventor y científico italiano del siglo XV y XVI, famoso por sus innovaciones y contribuciones en múltiples campos, incluyendo la mecánica, la ingeniería y las artes visuales. Obviamente, el modelo Davinci lleva su nombre en reconocimiento a su legado como un pensador creativo, innovador y multidisciplinario, cuyo trabajo abarcó una amplia gama de campos, como el arte, la ciencia, la tecnología y la ingeniería.

Con la elección de Da Vinci para este modelo, se busca enfatizar la capacidad de GPT-3 para imitar y generar contenido creativo y artístico, así como su capacidad para comprender y manipular conceptos complejos y multidisciplinarios.

Cushman, el nuevo modelo tras Chat GPT4

GPT-4 es un nuevo modelo de lenguaje creado por OpenAI que puede generar texto similar al habla humana. Se trata de una versión mejorada de ChatGPT, lanzada en marzo de 2023, que se basa en GPT-3.5. Algunas de las novedades de GPT-4 son su capacidad para interpretar fotos y realizar descripciones de imágenes, así como la creación de videos a partir de textos.

El modelo Cushman de Chat GPT4 es eficaz y rápido. Aunque Davinci es más fuerte cuando se trata de analizar tareas complicadas, Cushman es un modelo capaz para muchas tareas de generación de código. Cushman se ejecuta normalmente más rápido y es más barato que Davinci.

El modelo Cushman rinde homenaje a Robert Cushman Murphy (1887-1973), naturalista, cartógrafo y ornitólogo estadounidense que pionero en estudiar las aves marinas del Atlántico Sur. Interpretamos que OpenAI escogió a Cushman como metáfora por el ágil vuelo de las aves sobre el mar de datos y de parámetros del océano de información que maneja. ¿Qué olas surfearemos sobre el modelo Cushman? Chat GPT4 nos lo dirá.

Imagen de portada generada con Dale.e.

También podría gustarte

Deja una respuesta

Tu dirección de correo electrónico no será publicada.