Del curso: Python para data scientist avanzado
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.700 cursos impartidos por expertos del sector.
Imputación de valores en Machine Learning - Tutorial de Python
Del curso: Python para data scientist avanzado
Imputación de valores en Machine Learning
Cuando tenemos una base de datos con muchos datos faltantes en una de nuestras columnas, como es el caso que vemos en pantalla, podemos hacer varias cosas. Si lo que nos ocupa es un problema de modelización, esta variable podemos no incluirla directamente, podemos intentar ajustar un modelo que no pierda la fila entera de datos cuando encuentra un valor faltante o podemos imputarle un valor. ¿A qué nos referimos con el concepto imputación? Sencillamente es ponerle en esta celda de aquí un valor. ¿Qué valor? Un valor que vamos a escoger basándonos en una cierta información. En este vídeo te voy a mostrar dos maneras distintas de hacerlo en función de la calidad de la información que usemos. La primera es imputar este valor de aquí por uno estadístico de centralidad asociado a esta columna, es decir, la media. Y otra es usar la información que nos den otras columnas sobre esta de aquí. La más popular es la primera, aunque, desde mi punto de vista, es bastante errónea. Ahora te explico…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
(Bloqueado)
Seleccionar en Machine Learning variables5 min 6 s
-
(Bloqueado)
Selección automatizada de variables en Machine Learning4 min 41 s
-
(Bloqueado)
Selección de parámetros en Machine Learning5 min 8 s
-
(Bloqueado)
Selección automatizada de parámetros en Machine Learning4 min 19 s
-
(Bloqueado)
Fundamentos del Principal Component Analysis (PCA)5 min 15 s
-
(Bloqueado)
Variantes del PCA2 min 52 s
-
(Bloqueado)
Imputación de valores en Machine Learning5 min 53 s
-
(Bloqueado)
-
-
-