1. Open Assistant la alternativa de código abierto
a ChatGPT, compatible con 35 idiomas
Desde que ChatGPT se puso a disposición del público para pruebas el
pasado noviembre, OpenAI ha acaparado titulares en los principales sitios
de tecnología y se ha convertido en la herramienta preferida de muchos
desarrolladores. chatGPT se ha implementado no sólo para ofrecer
sugerencias de código, resumir textos largos, responder preguntas, etc.,
sino, lo que es más importante, para marcar el comienzo de una nueva era
de AIGC.
Sin embargo, debido al problema de que OpenAI ya no es abierto, la
herramienta ha sido controvertida en el camino de ser muy aclamada. En
este contexto, un grupo de profesionales del código abierto ha iniciado
varios intentos de replicar un ChatGPT en la dimensión de modelo grande, y
OpenAssistant es uno de los productos de código abierto que compiten.
El modelo de aprendizaje automático OpenAssistant está gestionado por
una organización alemana sin ánimo de lucro, LAION. Recientemente, la
organización anunció que el modelo OpenAssistant, los datos de
entrenamiento y el código ya están disponibles, y calificó el modelo como
"la réplica de código abierto más grande del mundo de ChatGPT".
El proyecto OpenAssistant comenzó en diciembre de 2022, poco después
de que OpenAI lanzara ChatGPT.
"No nos detenemos en replicar ChatGPT; queremos construir el asistente
del futuro que no solo pueda escribir correos electrónicos y cartas de
presentación, sino también realizar trabajos significativos, utilizar API,
2. buscar información de forma dinámica y mucho más, y que cualquiera
pueda personalizar y ampliar. Queremos hacerlo de forma abierta y
accesible, lo que significa no sólo construir un gran asistente, sino también
hacerlo lo suficientemente pequeño y eficiente como para funcionar en
hardware de consumo", escriben los responsables del proyecto
OpenAssistant en su página de GitHub.
En pocas palabras, el objetivo de Open Assistant es crear un asistente de IA
de código abierto con las mismas capacidades que ChatGPT. Con este
proyecto, los responsables creen que pueden mejorar el propio lenguaje,
de forma similar a como un flujo constante de personas crea nuevas obras
de arte e imágenes.
Para demostrar la eficacia del conjunto de datos de OpenAssistant
Conversation, el equipo de investigación ha creado la idea de que
OpenAssistant es el primer modelo de sintonización de comandos a gran
escala y de código abierto entrenado con datos humanos.
Paralelamente, el equipo utilizó los datos recopilados para centrarse en
modelos lingüísticos de ajuste fino para el modelo LLaMA de Meta y el
modelo Pyhtia de EleutherAI. De ellos, Pythia es un modelo de lenguaje de
última generación con una generosa licencia de código abierto, mientras
que LLaMA es un potente modelo de lenguaje con una licencia
personalizada no comercial.
Sin embargo, el modelo también tiene algunas limitaciones. El artículo
muestra que los datos de entrenamiento recogidos por el equipo de
investigación procedían en su mayoría de anotadores varones con una
media de edad de 26 años. Según el artículo, "este perfil demográfico
puede introducir inadvertidamente un sesgo en el conjunto de datos, ya
que reflejará necesariamente los valores, opiniones e intereses de los
anotadores".
Sin embargo, el equipo también tomó medidas para detectar y eliminar la
información perjudicial del conjunto de datos, pero el sistema no es
infalible". Dadas las limitaciones expuestas, abogamos por utilizar nuestro
LLM sólo en el contexto de la investigación académica", dice el artículo, "y
animamos encarecidamente a los investigadores a investigar a fondo la
seguridad y los sesgos de estos modelos antes de emplearlos en tareas
posteriores. Es importante reconocer que los modelos publicados pueden
mostrar un comportamiento inseguro y es probable que sean vulnerables a
ataques de inyección."
En general, el uso del OpenAssistant de código abierto sirve como sustituto
cuando no se puede utilizar la API o el Plus de OpenAI. En respuesta,
también hay muchos usuarios que han dicho:
3. "Este es un acontecimiento emocionante. Voy a dejar de suscribirme a
ChatGPT. Ojalá hubiera una forma fácil de copiar mis conversaciones de
ChatGPT a Google Docs o directamente a OpenAssistant para poder
probarlas y ver si funcionan también en OpenAssistant."