Materiales de clase

Clases DS Tukey

Notas, código y ejercicios del curso. Cada módulo corresponde a un tema visto en clase e incluye el notebook de trabajo correspondiente.

Fundamentos de Python
B1 / terminal

Línea de Comandos

Navegación por el sistema de archivos, creación y eliminación de archivos, rutas relativas y absolutas.

B2 / variables

Variables y Tipos de Datos

Asignación, reglas de nombres, tipos str, int y float, y la función type().

B3 / entrada-salida

Entrada y Salida de Datos

Captura de datos con input(), conversión de tipos y presentación con print() y f-strings.

B4 / operadores

Operadores Aritméticos

Suma, resta, división entera, módulo y potencia. Aplicados a un perceptrón y regresión lineal.

B5 / git

Git y GitHub

Control de versiones local con Git y respaldo remoto en GitHub: init, add, commit y push.

B6 / condicionales

Condicionales

Estructuras if/elif/else, operadores de comparación y lógicos. Aplicados a la función de activación.

B7 / listas

Listas y Bucle for

Colecciones ordenadas, iteración con for, patrón acumulador, range() y enumerate().

Módulos
01 / numpy

NumPy

Arrays n-dimensionales, operaciones vectoriales, álgebra lineal y construcción de funciones numéricas.

02 / visualización

Visualización de Datos

Matplotlib y Seaborn: tipos de gráficas, subplots y exploración visual de datos.

03 / eda

Análisis Exploratorio

Exploración inicial, filtros booleanos, agrupaciones y matrices de correlación.

04 / regresión simple

Regresión Lineal Simple

Construcción manual: función de pérdida ECM y solución por fórmula cerrada.

05 / gradiente

Gradiente Descendente

Algoritmo de optimización iterativa: derivadas, regla de actualización y learning rate.

06 / statsmodels

Regresión con Statsmodels

OLS en Python, interpretación del summary estadístico y análisis de residuos.

07 / avanzado

Regresión Avanzada

Variables categóricas, one-hot encoding, train/test split, K-Fold y LOOCV.

08 / hipótesis

Pruebas de Hipótesis

Fundamentos estadísticos: prueba t de Student, ANOVA y chi-cuadrada con Python.

09 / feature-scaling

Escalado de Features

Por qué las escalas importan, contornos de la función de costo, y métodos de escalado para mejorar el gradiente descendente.

-- / ejercicios

Ejercicios Prácticos

Problemas de análisis de residuos y aplicaciones interactivas con Streamlit.