MLOps.pptx

MLOps: Machine Learning en
Producción
Luis Beltrán luis@luisbeltran.mx

Luis Beltrán
luis@luisbeltran.mx
@darkicebeam

Un proyecto típico de Machine Learning

Problemas
• No hay un seguimiento del trabajo realizado
• ¿Qué datos se han utilizado?
• ¿Qué código se ha probado en cada ocasión?
• ¿Qué combinación de código y datos produjeron X modelo?
• ¿Cuáles fueron las métricas del modelo X?
• No siempre se generan entregables (“artefactos”)
• No se puede reproducir (repetir) un modelo
• No es posible pasar el modelo y todas sus variables (código, entorno,
datos, etc) con facilidad

El proceso de ciencia de datos en equipo

¿Qué es DevOps?
DevOps es la unión of
personas, procesos y
productos para habilitar la
entrega continua de valor a
tus usuarios finales.
“
”

MLOps
• MLOps permite a los científicos de datos y a los desarrolladores de
aplicaciones ayudar a llevar los modelos de machine learning a
producción.
• MLOps le permite realizar un seguimiento / gestionar versiones /
auditar / certificar / reutilizar cada activo en su ciclo de vida de ML y
proporciona servicios de orquestación para agilizar la gestión de este
ciclo de vida.

Beneficios MLOps
• Reproducibilidad
• El código impulsa las implementaciones
• Los pipelines son reproducibles y verificables
• Todos los artefactos se pueden etiquetar y auditar
• Validación
• Mejores prácticas de Ingeniería de Software para el control de calidad
• Comparaciones sin conexión de la calidad del modelo
• Minimice el bias y habilite la explicabilidad
• Automatización
• Capacidades de implementación controlada
• Comparación en vivo del rendimiento previsto frente al esperado
• Resultados retroalimentados para observar la deriva y mejorar el modelo

Diferencias entre DevOps y MLOps
• Control de versiones de datos / modelo! = Control de versiones de código: cómo
versionar conjuntos de datos a medida que cambian el esquema y los datos de
origen
• Los requisitos de seguimiento de auditoría digital cambian cuando se trata de
código + datos (potencialmente del cliente)
• La reutilización de modelos es diferente a la reutilización de software, ya que los
modelos deben ajustarse en función de los datos de entrada / escenario.
• Para reutilizar un modelo, es posible que deba ajustar / transferir el aprendizaje
en él (lo que significa que necesita un pipeline de entrenamiento)
• Los modelos tienden a deteriorarse con el tiempo y necesita la capacidad de
volver a capacitarlos a pedido para garantizar que sigan siendo útiles en un
contexto de producción.

Herramientas para acelerar
MLOps

Neptune
• Neptune es un rastreador de
experimentos centrado en Python. Es
un servicio alojado.
• Los experimentos se rastrean
mediante el uso de enlaces de
biblioteca para registrar parámetros
(modelo), resultados de evaluación y
cargar artefactos (como modelos,
hashes de datos de entrenamiento o
incluso código). La biblioteca puede
rastrear el uso del hardware y el
progreso del experimento.
Proporcionan una API para consultar los resultados
del experimento. Esto se puede utilizar para
alimentar las canalizaciones de CI / CD para la
implementación del modelo.
Los resultados se pueden analizar y comparar en un
sitio web. También hay opciones colaborativas.
Neptune tiene integraciones con portátiles Jupyter,
varias bibliotecas ML, visualizadores (HiFlow,
TensorBoard), otros rastreadores (MLFlow) y ofertas
externas (Amazon Sagemaker).

MLFlow
• MLFlow es un rastreador de
experimentos y un servidor de
modelos genérico. Puede ser
autohospedado.
• Los experimentos se rastrean
mediante el uso de enlaces de
biblioteca para registrar parámetros
(modelo), resultados de evaluación y
cargar artefactos (como modelos,
hashes de datos de entrenamiento o
incluso código). Los artefactos se
pueden registrar en el
almacenamiento local, remoto o en la
nube (S3, GFS, etc.).
Los resultados se pueden analizar a través de una interfaz de
usuario web y la exportación CSV está disponible. Los modelos
se empaquetan como un contenedor alrededor del formato
subyacente (Sklearn, XGBoost, Torch, etc.). Se pueden enviar a
Spark para la inferencia por lotes o se pueden servir a través de
REST.
Hay API de CLI, Python, R, Java y REST para una mayor
integración con las canalizaciones de CI / CD. Los modelos se
pueden enviar a servicios en la nube (SageMaker, AzureML, ...).

Kubeflow
• Kubeflow es esencialmente una versión
autohospedada de la plataforma de
inteligencia artificial de Google. Utiliza
Kubernetes para abstraer la infraestructura.
• Kubeflow puede implementar cuadernos de
Jupyter, ejecutar canalizaciones para el
procesamiento de datos y el entrenamiento
de modelos (programado, bajo demanda),
organizar ejecuciones, archivar modelos y
otros artefactos, y exponer modelos a través
de puntos finales. Las canalizaciones son
gráficos de cálculo y se describen en Python
con un DSL. Sus componentes se envuelven
como imágenes de Docker.
Se integra con GCP para que pueda escalar elásticamente
a la computación y el almacenamiento en la nube (p. Ej.,
Entrenamiento de modelos distribuidos). También se
integra con ofertas como BigQuery o Dataproc.
La solución es pesada y compleja, pero permite una
rápida ampliación. Es especialmente aplicable si la
infraestructura ya se administra a través de Kubernetes.

CML
• Continuous Machine Learning es una herramienta
CLI de código abierto para implementar (CI / CD) con
un enfoque en MLOps.
• Permite automatizar los flujos de trabajo de
desarrollo, incluido el aprovisionamiento de
máquinas, el entrenamiento y la evaluación de
modelos, la comparación de experimentos de
aprendizaje automático en el historial del proyecto y
el monitoreo de conjuntos de datos cambiantes.
• CML puede ayudar a entrenar y evaluar modelos, y
luego generar un informe visual con resultados y
métricas, automáticamente en cada solicitud de
extracción.
https://github.com/iterative/cml/
https://cml.dev/

Workshop
• Descarga el tutorial
https://drive.google.com/drive/folders/1h4tJ6q6VKB1oYCYsuGzR9J0qd
4a5rGHy?usp=sharing

MLOps.pptx

Más contenido relacionado

La actualidad más candente (20)

Similar a MLOps.pptx (20)

Más de Luis Beltran (20)

Último (20)

MLOps.pptx

Notas del editor