Este repositorio contiene las clases para la capacitación del equipo de Poly Works.
Manejo básico de Numpy y Pandas
Predicción de valores - Regresión Lineal
Enfoque:
1. Matriz de correlación.
2. Correlación con relación a la variable dependiente.
4. Valores de los coeficientes.
3. Entrenamiento de modelo.
5. Error | R^2
6. Graficando el error.
Clasificación - Naive Bayes
Enfoque:
1. Convertir variables númericas a variables categóricas.
2. Implementar el modelo de clasificación Naive Bayes.
3. Clasificar y obtener las probabilidades para cada etiqueta predecida.
4. Implentar la curva ROC y observar su comportamiento.
5. Modificación de la alpha de Laplace dentro de nuestro modelo para alisar el comportamiento.
Clusterización - K-Means
Enfoque:
1. Realizar estandarización a los datos de dos maneras:
* z-score
* mínimo y máximo
2. Implementar PCA.
3. Utilizar el método del codo para seleccionar el número óptimo de clusters.
4. Utilizar el modelo de KMeans.
Series de Tiempo - ARIMA
Enfoque:
1. Tendencia y estacionareidad.
2. Graficar autocorrelación.
3. Test Dickey-Fuller.
4. Predecir el compartamiento de nuestros datos a futuro.
Sistema de Recomendación - SDV
Enfoque:
1. Análisis exploratorio de matriz y por qué es dispersa.
2. Implementación de Singular Value Decomposition.
3. Implementación de un modelo de sistema de recomendación de filtro colaborativo.
4. Generar la predicción de recomendaciones con buen resultado y no.
Detección de outliers - Local Outlier Factor
Enfoque:
1. Selección de características por Recursive Feature Elimination.
2. Implementación de Regresión Logística.
3. Identificación de Outliers con Local Outlier Factor.
Autoencoders - Redes Neuronales Profundas
Enfoque:
1. EDA
2. ¿Qué es Keras?
3. Implementación Autoencoders.
4. Modelo de Clasificación AdaBoost.
Análisis de Supervivencia - Kaplan-Meier|Cox
Enfoque:
1. Estimador Kaplan Meier.
2. Modelo de Cox.