Del curso: Microsoft Azure IA esencial: Introducción a Workloads y Machine Learning en Azure

Clasificación multiclase

La clasificación multiclase predice uno de tres o más resultados. Al igual que la regresión lineal y la clasificación binaria, cada observación debe tener una etiqueta asignada. Sin embargo, los algoritmos de clasificación multiclase calculan probabilidades en múltiples clases, ayudando al modelo a identificar la clase más probable para cada observación. Veamos un ejemplo. Tenemos datos de clientes, que incluyen el rango de edad, el historial de compras, la ubicación, compromiso y sus ingresos. Estas son nuestras características. El tipo de cliente es nuestra etiqueta con tres clases posibles: comprador con un presupuesto máximo, es decir, aquellos que quieren gastar lo mínimo, comprador leal a la marca o comprador ocasional. Para entrenar un modelo multiclase, ajustamos un algoritmo a los datos que calcula los valores de probabilidad para cada clase. Existen dos tipos de algoritmos para esto: uno contra el resto, o OvR, siglas en inglés de one versus rest, y multinomial. Los algoritmos uno contra el resto crean un clasificador binario para cada clase. Cada función calcula la probabilidad de que una observación pertenezca a su respectiva clase. Para nuestro modelo de clientes, esto significa tres clasificadores. Uno para compradores con presupuesto máximo, uno para compradores leales a la marca y uno para compradores ocasionales. La mayor probabilidad entre los tres determina el tipo de cliente. Los algoritmos multinomiales, por otro lado, producen una sola función que genera una distribución de probabilidad en todas las clases sumando 1. Por ejemplo, una salida como 0.2, 0.3, 0.5 indica las probabilidades para compradores de presupuesto máximo, compradores leales a la marca y compradores ocasionales respectivamente. El valor más alto, en este caso 0.5, entonces identifica al cliente como un comprador ocasional. Para evaluar clasificadores multiclase, utilizamos métricas binarias para cada clase y métricas agregadas en todas las clases. Las métricas de confusión se expanden a partir de la versión binaria, mostrando predicciones para cada clase en el conjunto de validación. Para más detalles sobre la evaluación de modelos multiclase, puedes ir a la capacitación sobre clasificación multiclase en el sitio de Microsoft Learn.

Contenido