Opinión

La IA de código abierto

Por Chris Wright, Chief Technology Officer y Senior Vice President of Global Engineering de Red Hat.

Hace más de tres décadas, Red Hat vio el potencial de cómo el desarrollo y las licencias de código abierto podían crear un mejor software para impulsar la innovación en TI. Treinta millones de líneas de código después, Linux no solo se ha convertido en el software de código abierto más exitoso, sino en el software más exitoso de la historia. Nuestro compromiso con los principios del código abierto persiste a día de hoy, tanto en nuestro modelo de negocio como en nuestra cultura corporativa. Creemos que estos conceptos pueden tener el mismo impacto en la inteligencia artificial (IA) si se aplican de la manera correcta. Sin embargo, existe una clara división dentro del mundo de la tecnología en cuanto a cuál es «la manera correcta«.

La IA, especialmente los grandes modelos lingüísticos (LLM) que impulsan la IA generativa, no puede verse de la misma manera que el software de código abierto. A diferencia del software, los modelos de IA consisten principalmente en pesos del modelo, que son parámetros numéricos que determinan cómo un modelo procesa las entradas, así como las conexiones que establece entre varios puntos de datos. Los pesos del modelo entrenados son el resultado de un extenso proceso de entrenamiento que involucra grandes cantidades de datos de entrenamiento que se preparan, mezclan y procesan cuidadosamente.

Si bien los pesos del modelo no son software, en algunos aspectos cumplen una función similar al código. Es fácil hacer la comparación de que los datos son, o son análogos a, el código fuente del modelo. En el código abierto, el código fuente se define comúnmente como la «forma preferida» para realizar modificaciones al software. Los datos de entrenamiento por sí solos no encajan en este rol debido a su enorme volumen y al complejo proceso de preentrenamiento. Este proceso crea una conexión tenue e indirecta entre cada dato de entrenamiento, los pesos entrenados y el comportamiento final del modelo.

La mayoría de las mejoras y perfeccionamientos de los modelos de IA que se están llevando a cabo actualmente en la comunidad no implican el acceso ni la manipulación de los datos de entrenamiento originales. Más bien, son el resultado de modificaciones en los pesos del modelo o de un proceso de ajuste fino que también puede servir para ajustar el rendimiento del modelo. La libertad para realizar esas mejoras en el modelo requiere que los pesos se publiquen con todos los permisos que los usuarios reciben bajo las licencias de código abierto.

La visión de Red Hat sobre la IA de código abierto

Red Hat considera que el umbral mínimo para la IA de código abierto son los pesos del modelo con licencia de código abierto combinados con componentes de software de código abierto. Este es un punto de partida para la IA de código abierto, no el destino final. Animamos a la comunidad de código abierto, a las autoridades reguladoras y a la industria a seguir esforzándose por lograr una mayor transparencia y alineación con los principios del desarrollo de código abierto a la hora de entrenar y ajustar los modelos de IA.

Esta es la visión de Red Hat sobre cómo nosotros, como ecosistema de software de código abierto, podemos participar de forma práctica en la IA de código abierto. No es un intento de una definición formal, como la que está llevando a cabo la Open Source Initiative (OSI) con su Definición de IA de Código Abierto (OSAID). Nuestro punto de vista hasta la fecha es simplemente nuestra opinión sobre lo que hace que la IA de código abierto sea alcanzable y accesible para el conjunto más amplio de comunidades, organizaciones y proveedores.

Ponemos en práctica esta visión a través de nuestro trabajo en comunidades de código abierto, como el proyecto InstructLab, liderado por Red Hat, y nuestro trabajo en torno a la familia Granite de modelos con licencia de código abierto con IBM Research. InstructLab reduce significativamente las barreras para la contribución de modelos de IA por parte de profesionales que no se dedican a la ciencia de datos. Con InstructLab, expertos de diversos sectores pueden aportar sus conocimientos y habilidades, tanto para uso interno como para impulsar un modelo de IA de código abierto compartido y accesible para las comunidades upstream.

La familia de modelos Granite 3.0 aborda una amplia gama de casos de uso de IA, desde la generación de código hasta el procesamiento del lenguaje natural y la extracción de información de grandes conjuntos de datos, todo bajo una licencia de código abierto permisiva. Ayudamos a IBM Research a traer una familia de modelos de código Granite al mundo del código abierto y continuamos apoyando la familia de modelos, tanto desde el punto de vista del código abierto como parte de nuestra oferta de Red Hat AI.

Las repercusiones causadas por los recientes anuncios de DeepSeek muestran cómo la innovación de código abierto puede impactar la IA, tanto a nivel de modelo como en otros aspectos. Obviamente, existen preocupaciones sobre el enfoque de DeepSeek, especialmente la falta de claridad en su licencia respecto a la creación del modelo, lo que refuerza la necesidad de transparencia. Dicho esto, esta disrupción valida nuestra visión del futuro de la IA: uno abierto, centrado en modelos más pequeños, optimizados y abiertos que se pueden personalizar para casos de uso de datos empresariales específicos en cualquier lugar y en todas partes de la nube híbrida.

Expandiendo la IA de código abierto más allá de los modelos

La tecnología y los principios de desarrollo del código abierto son fundamentales para nuestras ofertas de IA, al igual que para nuestra cartera de Red Hat AI. Red Hat OpenShift AI se basa en Kubernetes, KubeFlow, contenedores compatibles con Open Container Initiative (OCI) junto con una serie de otras tecnologías de código abierto nativas de la nube. Red Hat Enterprise Linux AI (RHEL AI) incorpora la familia Granite LLM de IBM, bajo licencia de código abierto, y el proyecto de código abierto InstructLab.

La labor de Red Hat en el ámbito de la IA de código abierto va mucho más allá de InstructLab y la familia de modelos Granite, abarcando las herramientas y plataformas necesarias para el consumo y uso productivo de la IA. Participamos activamente en un número cada vez mayor de proyectos y comunidades upstream, y hemos iniciado muchos más por nuestra cuenta, incluidos (entre otros):

  • RamaLama, un proyecto de código abierto que busca simplificar y facilitar la gestión y el servicio local de modelos de IA;
  • TrustyAI, un conjunto de herramientas de código abierto para construir flujos de trabajo de IA más responsables;
  • Climatik, un proyecto centrado en ayudar a que la IA sea más sostenible en términos de consumo de energía;
  • Podman AI Lab, un conjunto de herramientas para desarrolladores enfocado en facilitar la experimentación con LLMs de código abierto;

Nuestro reciente anuncio sobre Neural Magic refuerza nuestra visión de la IA, haciendo posible que las organizaciones alineen modelos de IA más pequeños y optimizados, incluidos los modelos con licencia de código abierto, con sus datos, donde quiera que residan en la nube híbrida. Las organizaciones de TI pueden usar el servidor de inferencia vLLM para impulsar las decisiones y los resultados de estos modelos, lo que ayuda a construir un stack de IA basado en tecnologías transparentes y compatibles.

Para Red Hat, la IA de código abierto vive y respira en la nube híbrida. La nube híbrida proporciona la flexibilidad que tanto se necesita para elegir el mejor entorno para cada carga de trabajo de IA, optimizando el rendimiento, el coste, la escalabilidad y los requisitos de seguridad. Nuestras plataformas, objetivos y organización respaldan este esfuerzo, y esperamos colaborar con partners de la industria, nuestros clientes y la comunidad de código abierto en general a medida que continuamos impulsando la innovación de la IA de código abierto.

Existe un inmenso potencial para ampliar esta colaboración abierta en el espacio de la IA. Vemos un futuro que abarca el trabajo transparente en los modelos, así como su entrenamiento. Ya sea la próxima semana o el próximo mes (o antes, dada la rapidez con la que evoluciona la IA), continuaremos respaldando y adoptando los esfuerzos que amplían los límites de lo que significa democratizar y abrir el mundo de la IA.

Noticias de la Nube o Cloud Computing, Big Data, Blockchain, Fintech, Inteligencia Artificial, Móvil, Inversión, Soluciones, Tecnología, Ciberseguridad, Opinión, etc.

Noticias Relacionadas

1 of 49

Dejar un Comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.