Ajuste fino

¿Qué es el ajuste fino (IA)?

El ajuste fino en el aprendizaje automático es el acto de cambiar los parámetros de un modelo previamente entrenado para responder a una tarea o un conjunto de datos específico. El modelo se vuelve a entrenar con los datos relacionados con la tarea objetivo mientras se retiene su capacitación anterior.

Empresario sonriendo en una oficina
  • ¿Cómo funciona el ajuste fino?
  • El proceso del ajuste fino
  • Ajuste fino con HPE
¿Cómo funciona el ajuste fino?

¿Cómo funciona el ajuste fino?

El ajuste fino es como el aprendizaje por transferencia, donde el modelo utiliza su capacitación para rendir mejor en un trabajo relacionado. El ajuste fino de un modelo previamente entrenado ofrece mejores resultados con menos recursos de computación y tiempo de entrenamiento que si se empezara desde cero. Resulta vital para los flujos de trabajo de aprendizaje automático contemporáneos, puesto que se utiliza en el procesamiento del lenguaje natural y la visión por ordenador para ajustar modelos a nuevas tareas o conjuntos de datos.

El proceso del ajuste fino

El proceso del ajuste fino

Los pasos para el ajuste fino en el aprendizaje automático incluyen:

  • Modelos preentrenados: elige un modelo que ya haya sido entrenado en un gran conjunto de datos y que haya ofrecido un rendimiento adecuado en la tarea o dominio relevante. El procesamiento del lenguaje natural (por ejemplo, BERT, GPT), la visión por ordenador (como ResNet o VGG) y otras disciplinas son ejemplos de modelos preentrenados.
  • Definir la tarea objetivo: especifica para qué tarea o conjunto de datos deseas aplicar el ajuste fino al modelo. Considera el análisis de sentimiento, la categorización de imágenes o el reconocimiento de entidades nombradas.
  • Preparación de los datos: recopila y procesa el nuevo conjunto de datos relacionado con la tarea. Divide los datos en conjuntos de entrenamiento, validación y pruebas, y prepáralos adecuadamente.
  • Ajuste fino del modelo: utilizando un descenso del gradiente, inicializa y vuelve a entrenar el modelo preentrenado con el nuevo conjunto de datos. Ajusta los hiperparámetros y las tasas de aprendizaje para evitar el sobreajuste o subajuste (overfitting o underfitting).
  • Evaluar y validar: realiza un seguimiento del rendimiento del modelo al que se ha realizado el ajuste fino en el conjunto de validación para hacer modificaciones. Pueden ser necesarios varios entrenamientos y evaluaciones para lograr un ajuste fino del rendimiento.
  • Prueba e implementación: prueba el modelo al que se ha realizado el ajuste fino en el conjunto de datos para determinar sus capacidades de generalización. Por último, aplica el modelo de inferencia con el ajuste fino a la práctica real.
  • Al seguir estas etapas, el ajuste fino adapta los modelos preentrenados a nuevas tareas y conjuntos de datos, y de este modo, mejora el rendimiento y la capacidad de aplicación a través de numerosas aplicaciones de aprendizaje automático.
Ajuste fino con HPE

Ajuste fino con HPE

HPE (Hewlett Packard Enterprise) permite el ajuste fino utilizando su plataforma Machine Learning Data Fabric (MLDES), sus servicios de GenAI y las soluciones de computación empresarial para GenAI. Cada parte facilita el ajuste fino:

  • HPE MLDES: MLDES gestiona y procesa conjuntos de datos de aprendizaje automático masivos. Optimiza la preparación de datos, el entrenamiento de modelos y la implementación para el ajuste fino de modelos de aprendizaje automático. Los orígenes de datos, el control de versiones y la colaboración se integran de manera fluida con MLDES, lo que simplifica el ajuste fino.
  • HPE AI Services - GenAI: las soluciones de GenAI de HPE equipan a las empresas con análisis sofisticados e inteligencia artificial. Estos servicios incluyen el procesamiento del lenguaje natural, la visión por ordenador y las herramientas y técnicas de análisis predictivos. Las organizaciones pueden utilizar servicios de GenAI para obtener modelos preentrenados y marcos para la personalización de tareas o conjuntos de datos.

Computación empresarial de HPE para GenAI: las soluciones de computación empresarial de HPE admiten cargas de trabajo de IA, incluido el ajuste fino. Estas soluciones incluyen infraestructura de HPC, almacenamiento escalable y servicios de nube optimizados para la inteligencia artificial. Las funcionalidades de computación empresarial de HPE permitirían a las empresas expandir las operaciones de ajuste fino para responder a las necesidades cambiantes y optimizar el rendimiento del modelo de IA.

Ajuste fino frente a RAG

Aspecto

Ajuste fino

Generación aumentada por recuperación (RAG)

1. Metodología

Ajusta parámetros de modelos preentrenados para tareas o conjuntos de datos específicos.

Utiliza un mecanismo de recuperación para aumentar la generación de tareas, combinando modelos de recuperación y generación.

2. Datos de entrenamiento

Requiere datos de entrenamiento específicos de la tarea para el ajuste fino.

Puede aprovechar corpus de textos a gran escala para componentes tanto de recuperación como de generación.

3. Capacidad de adaptación

Más adaptable a una amplia variedad de tareas y dominios.

Especialmente adecuado para tareas que conlleven la generación con recuperación de información contextual.

4. Rendimiento

Puede lograr un alto rendimiento con ajuste fino específico de la tarea.

El rendimiento depende enormemente de la calidad y relevancia de la información recuperada.

5. Casos de uso

Usado ampliamente en diversos dominios, como el procesamiento del lenguaje natural, la visión por ordenador, etc.

Especialmente beneficioso para tareas como la respuesta a preguntas, los sistemas de diálogo y la generación de contenido que requiera información contextual.

HPE Machine Learning Development Environment Software

Acelera la obtención de beneficios para tus cargas de trabajo y aplicaciones de inteligencia artificial en cualquier etapa de tu proceso de IA/aprendizaje automático. 

Más información

Temas relacionados

Aprendizaje automático

Más información

Modelo de aprendizaje automático

Más información

Modelo de IA

Más información