Descripción del proyecto
Curso Online
Curso sobre Analizando datos con Python
Visión general del curso sobre Analizando datos con Python
APRENDA A ANALIZAR DATOS CON PYTHON
Aprenda a analizar datos usando Python en este curso introductorio. Pasará de comprender los conceptos básicos de Python a explorar muchos tipos diferentes de datos a través de conferencias, laboratorios prácticos y tareas.
¡Aprenderá cómo preparar datos para el análisis, realizar análisis estadísticos simples, crear visualizaciones de datos significativas, predecir tendencias futuras a partir de datos y más!
Lo que aprenderás en este curso
Aprenderá a:
- Cómo importar conjuntos de datos, limpiar y preparar datos para el análisis, resumir datos y construir canalizaciones de datos
- Utilice Pandas DataFrames, matrices multidimensionales Numpy y bibliotecas SciPy para trabajar con varios conjuntos de datos
- Cargue, manipule, analice y visualice conjuntos de datos con pandas, una biblioteca de código abierto
- Cree modelos de aprendizaje automático y haga predicciones con scikit-learn, otra biblioteca de código abierto
Incluye las siguientes partes:
Bibliotecas de análisis de datos: aprenderán a usar Pandas DataFrames, matrices multidimensionales Numpy y bibliotecas SciPy para trabajar con varios conjuntos de datos.
Le presentamos pandas, una biblioteca de código abierto, y la usaremos para cargar, manipular, analizar y visualizar conjuntos de datos geniales.
Luego, le presentaremos otra biblioteca de código abierto, scikit-learn, y utilizaremos algunos de sus algoritmos de aprendizaje automático para construir modelos inteligentes y hacer predicciones geniales.
Plan de estudio del curso
PROGRAMA DEL CURSO
Módulo 1 – Importar conjuntos de datos
- Objetivos de aprendizaje
- Comprender el dominio
- Comprender el conjunto de datos
- Paquete Python para ciencia de datos
- Importar y exportar datos en Python
- Información básica de conjuntos de datos
Módulo 2 – Limpieza y preparación de datos
- Identificar y manejar valores perdidos
- Formato de datos
- Conjuntos de normalización de datos
- Binning
- Variables indicadoras
Módulo 3: resumen del marco de datos
- Estadísticas descriptivas
- Básico de Agrupación
- ANOVA
- Correlación
- Más sobre correlación
Módulo 4 – Desarrollo de modelos
- Regresión lineal simple y múltiple
- Evaluación del modelo utilizando visualización
- Regresión polinómica y tuberías
- R cuadrado y MSE para evaluación en muestra
- Predicción y toma de decisiones
Módulo 5 – Evaluación del modelo
- Evaluación modelo
- Ajuste excesivo, ajuste insuficiente y selección de modelo
- Regresión de cresta
- Búsqueda de cuadrícula
- Refinamiento del modelo
Etiquetas: Programación Python