Pandas Chef
Seu Sous-chef Brasileiro de Data Science.
O Pandas Chef é uma coleção de "receitas" (snippets) essenciais para Cientistas de Dados, com foco especial nos problemas do dia a dia no Brasil.
Chega de errar o encoding='latin1' ou esquecer como faz um gráfico bonito no Seaborn. O Chef traz tudo pronto, temperado e formatado.
🚀 Dica Especial do Chef: Conheça o Sanice
Quer ir além dos snippets? O Sanice é o "poder de fogo" que abstrai Pandas, NumPy e Scikit-Learn em uma interface fluente e 100% em Português.
A promessa é simples: Do CSV à API (com modelo treinado) em 3 linhas.
from sanice import Sanice
# 1. Carrega e Limpa ➔ 2. Treina IA (AutoML) ➔ 3. Publica API
Sanice("dados.csv").auto_ml(alvo="resultado").servir_api()
Menos boilerplate, mais Data Science. Fale a língua dos seus dados.
Instale: pip install sanice
Documentação: PyPI - Sanice
v1.0.1: O que tem de novo?
[1.0.1]
- Adicionado snippet
chef_mesclar_datasets (Join/Merge).
- Adicionado snippet
chef_salvar_csv para exportação correta.
- Melhoria no
chef_limpar_cabecalho (remoção de acentos).
O Cardápio de Snippets
Diferente de outros pacotes de snippets, o Pandas Chef é organizado pelo fluxo de trabalho de dados. Basta digitar o prefixo chef_ e escolher a categoria:
0. Mise en place (Configuração Inicial)
chef_import: Importa de uma vez só: Pandas, Numpy, Matplotlib e Seaborn. Bônus: Verifica se as bibliotecas estão instaladas.
1. Entradas (Leitura de Dados)
chef_ler_csv_br: Carrega CSVs brasileiros (separador ; e encoding latin1).
chef_ler_excel: Carrega arquivos .xlsx com opção de escolher a aba.
2. Preparo (Limpeza e Tratamento)
chef_limpar_cabecalho: Padroniza colunas (remove espaços, acentos e deixa minúsculo).
chef_analisar_nulos: Mostra a porcentagem de valores nulos.
chef_tratar_datas: Converte strings para datetime no formato brasileiro.
chef_mesclar_datasets: Faz o Join/VLOOKUP entre duas tabelas.
3. Prato Principal (Análise)
chef_agrupar_media: Cria um resumo (Groupby) com Média, Contagem e Soma, já ordenado.
chef_filtros_loc: Estrutura pronta para filtrar DataFrame com múltiplas condições.
chef_salvar_csv: Exporta os dados limpos corretamente (UTF-8 com BOM, sem índice).
4. Sobremesa (Visualização)
chef_grafico_barra: Gera um gráfico de barras Seaborn profissional.
chef_grafico_correlacao: Gera um Heatmap de correlação pronto para relatórios.
Como Cozinhar (Como Usar)
- Abra qualquer arquivo Python (
.py) ou Jupyter Notebook no VS Code.
- Comece a digitar
chef.
- O menu de sugestões aparecerá.
- Escolha a receita e aperte
Enter.
- Use a tecla
Tab para navegar pelos campos editáveis (ex: nome do arquivo, nome da coluna).
Quer testar seus gráficos mas não tem dados? O Pandas Chef funciona perfeitamente com a biblioteca leblanc para gerar dados fictícios instantâneos.
- Digite
chef_import ➔ Traz as libs de análise.
- Gere dados com
leblanc ➔ Cria um DataFrame de vendas falso.
- Digite
chef_grafico_barra ➔ Visualiza o resultado.
- Digite
chef_salvar_csv ➔ Salva o relatório final.
Código Final:
# [1] chef_import: Importando as ferramentas
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# pip install leblanc
from leblanc import Tech
# [2] Gerando dados sintéticos instantâneos
# Cria um DataFrame com 50 registros de vendas de tecnologia
df = Tech(num_records=50).build()
try:
# Ajuste simples para calcular o Total dependendo da versão do LeBlanc
if 'unit_price' in df.columns:
df['Total'] = df['unit_price'] * df['quantity']
x_col = 'category'
else:
# Fallback genérico para colunas numéricas
df['Total'] = df.select_dtypes(include=['number']).iloc[:, 0] * df.select_dtypes(include=['number']).iloc[:, 1]
x_col = df.select_dtypes(include=['object']).columns[0]
# [3] chef_grafico_barra: Visualização
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x=x_col, y='Total', palette='viridis', estimator=sum, errorbar=None)
plt.title('Performance de Vendas (Dados via leblanc)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
# [4] chef_salvar_csv: Exportando o resultado para Excel
df.to_csv('relatorio_vendas.csv', index=False, sep=';', encoding='utf-8-sig')
print("Relatório salvo com sucesso!")
except Exception as e:
print(f"Erro ao processar os dados: {e}")
Requisitos
- VS Code versão 1.80.0 ou superior.
- Extensão Python da Microsoft instalada (recomendado).
Configuração Recomendada
Para uma melhor experiência, certifique-se de que as sugestões de snippet estão ativadas no seu VS Code (geralmente já vêm ativas por padrão).
Licença
Este projeto está licenciado sob a Licença Apache 2.0 - veja o arquivo LICENSE para detalhes.
Bon Appétit! 🍝
Desenvolvido por wSanice