StableLM is released!

StableLM: el modelo de lenguaje abierto que desafía a ChatGPT

Stability AI, la empresa creadora de Stable Diffusion, se sube al barco de los chatbots y ha lanzado su suite de modelos de lenguaje llamada StableLM. Una herramienta conversacional de código abierto, pequeña y eficiente para los usuarios.

¿Qué es StableLM?

StableLM es el acrónimo de Stability AI Language Models, es decir, modelos de lenguaje desarrollados por Stability AI. Como la mayoría ya conoce por ChatGPT, un modelo de lenguaje es un sistema que aprende a producir texto a partir de datos textuales. Por ejemplo, si le das una frase como “Hola, me llamo”, el modelo de lenguaje podría completarla con “Juan” o “María” o cualquier otro nombre.

Sabemos que los modelos de lenguaje se pueden usar para muchas aplicaciones, sin embargo, entrenar y usar estos modelos no es fácil ni barato. Se necesita mucha potencia computacional y mucha información para que los modelos de lenguaje sean capaces de generar textos coherentes, relevantes y originales, como GPT 4.

StableLM AI chat
StableLM AI chat: Diferencias con GPT 4

Es por eso que Stability AI ha decidido crear StableLM, una familia de modelos de lenguaje con las siguientes caracteristicas:

  • Son de código abierto: cualquiera puede acceder al código fuente y a los pesos de los modelos en GitHub, bajo la licencia Creative Commons BY-SA-4.0. Esto significa que se puede usar, modificar y compartir los modelos libremente, siempre que se reconozca la autoría original y se mantenga la misma licencia.
  • Son pequeños y eficientes: los modelos de StableLM tienen entre 3 y 65 mil millones de parámetros, que son las variables que el modelo usa para aprender. Esto es mucho menos que los 175 mil millones de parámetros que tiene ChatGPT (en su versión GPT 3), el modelo de lenguaje más famoso y potente del momento. Al tener menos parámetros, los modelos de Stability son más rápidos y consumen menos recursos, lo que permite ejecutarlos en dispositivos personales como smartphones o laptops.
  • Son versátiles y adaptables: se pueden entrenar y afinar con diferentes tipos de datos para lograr distintos objetivos. Por ejemplo, se puede entrenar un modelo con datos conversacionales para crear un chatbot, o con datos de programación para generar código. Además, se puede afinar un modelo con datos específicos para mejorar su rendimiento en un área en particular.
  • Son transparentes y responsables: se entrenan con datos cuidadosamente seleccionados y filtrados para evitar sesgos o contenidos inapropiados. Además, los modelos incorporan criterios de parada y advertencias para evitar generar textos dañinos o engañosos, como ya ha sucedido con algunos chatbots. Por último, los modelos son auditables y explicables, lo que facilita su supervisión y evaluación.

«La unión hace la fuerza»

Esta suite de modelos, es el resultado del trabajo conjunto de Stability AI con otras organizaciones e investigadores del campo de la inteligencia artificial. Entre ellos se encuentran The Pile Project, que ha creado un conjunto de datos masivo y diverso para entrenar modelos de lenguaje; Stanford Alpaca, que ha desarrollado un método para afinar modelos con múltiples fuentes de datos; y Stable Diffusion XL, que ha generado imágenes artísticas inspiradas en los modelos de StableLM.

La empresa de la estabilidad espera que su gama de modelos sea una herramienta útil y beneficiosa para la sociedad, que impulse la innovación y la inclusión en el ámbito de la AI.

¿Como probar StableLM?

Podemos probar el modelo en Hugging Face Spaces. Pero, no olvides que está en fase Alpha, así que no es perfecta. Recomiendo hablarle en inglés, ya que con el español responde cualquier cosa. Pero es cuestión de tiempo para que vaya evolucionando y mejorando, como ChatGPT, aunque este último está increíblemente muy por encima de cualquier modelo de lenguaje actual. Si te interesa saber más sobre StableLM, puedes visitar su repositorio en GitHub.

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *