Bem-vindo ao curso prático definitivo em pré-processamento de dados para aprendizado de máquina. Em 6 módulos focados, você passará de dados brutos e confusos para recursos prontos para produção — dominando cada etapa crÃtica do caminho:
🔹 Módulo 1: Diagnosticar e Limpar — Lidar com valores ausentes, outliers e formatos inconsistentes.
🔹 Módulo 2: Codificar Inteligentemente — Transformar categorias com Codificação de Rótulo, One-Hot e Codificação de Alvo.
🔹 Módulo 3: Dimensionar e Selecionar — Padronizar recursos, combater a dimensionalidade, extrair sinal.
🔹 Módulo 4: Medir o que Importa — Ir além da precisão: usar Recall, F1, AUC-ROC para dados desbalanceados.
🔹 Módulo 5: Validar para Generalizar — Detectar e prevenir overfitting com Validação Cruzada.
🔹 Módulo 6: Projeto Final — Construir um Sistema Real de Detecção de Fraudes do zero, de ponta a ponta.
Ferramentas: Python, Pandas, Scikit-learn, Seaborn.
Pré-requisitos: Conhecimento básico de Python + Introdução a ML.
Pare de alimentar lixo para seus modelos. Aprenda a pré-processar como um profissional — porque ótimos modelos começam com ótimos dados.