La integración continua de modelos en el aprendizaje automático es una práctica que permite automatizar y agilizar de manera constante el proceso de creación, entrenamiento, evaluación y despliegue de modelos de Machine Learning.
Esta metodología se basa en los principios similares de integración continua (CI) en el ámbito del desarrollo de software, haciendo uso de herramientas y sistemas para automatizar tareas repetitivas y ejecutar flujos de trabajo predefinidos. Asimismo, la gestión de los modelos y sus versiones ayuda a fomentar la colaboración y el seguimiento de las posibles mejoras que se planteen incorporar.
En el ámbito de Machine Learning, no sólo se aplica la automatización en las etapas de creación, entrenamiento y evaluación de modelos, sino también en la pruebas necesarias para evaluar el rendimiento de estos. Así, una vez que el modelo ha superado las pruebas, se despliega de forma automática en producción y comienza la monitorización continua con el fin de implementar futuras mejoras y mejorar su rendimiento.
La integración continua de modelos ayuda a acelerar el desarrollo de modelos de aprendizaje automático, mejora la colaboración y garantiza la calidad del modelo a lo largo del tiempo.
Herramientas como las de a continuación de las principales plataformas cloud favorecen la integración continua (CI) de modelos en el aprendizaje automático, permitiendo automatizar flujos de trabajo completos, desde la compilación y pruebas hasta la implementación de proyectos de aprendizaje automático: AWS CodePipeline, Azure DevOps o Cloud Build son algunas de ellas.
De la misma forma, los proveedores de servicios en la nube ofrecen plataformas de aprendizaje automático que además de incluir herramientas para la creación, entrenamiento y despliegue de modelos, permiten la integración con servicios de CI/CD. Estas son: AWS SageMaker, Azure Machine Learning o Cloud AI Platform.
Las anteriores son sólo algunas de las herramientas disponibles en las principales plataformas cloud. En su mayoría, estas herramientas se utilizan en ámbito DevOps, pero gracias a sus amplios servicios y cantidad de herramientas adicionales, se posicionan como soluciones adecuadas para la integración continua de modelos de machine learning.