Pandas Chef
Seu Sous-chef Brasileiro de Data Science.
O Pandas Chef é uma coleção de "receitas" (snippets) essenciais para Cientistas de Dados, com foco especial nos problemas do dia a dia no Brasil.
Chega de errar o encoding='latin1' ou esquecer como faz um gráfico bonito no Seaborn. O Chef traz tudo pronto, temperado e formatado.
Funcionalidades Principais
- Snippets Brasileiros: Comandos de leitura e tratamento adaptados para dados do Brasil (separadores
;, datas dd/mm/aaaa).
- Kit de Instalação Automático: Instale Pandas, Numpy, Matplotlib, Seaborn e OpenPyXL com um único clique.
- Detecção Inteligente: O Chef verifica automaticamente se o Kit Data Science está instalado quando você usa o comando
chef_import ou abre um arquivo Python.
O Cardápio de Snippets
Diferente de outros pacotes de snippets, o Pandas Chef é organizado pelo fluxo de trabalho de dados. Basta digitar o prefixo chef_ e escolher a categoria:
0. Mise en place (Configuração Inicial)
chef_import: Importa de uma vez só: Pandas, Numpy, Matplotlib e Seaborn. Bônus: Verifica se as bibliotecas estão instaladas e sugere a instalação caso faltem.
1. Entradas (Leitura de Dados)
chef_ler_csv_br: Carrega CSVs brasileiros (separador ; e encoding latin1).
chef_ler_excel: Carrega arquivos .xlsx com opção de escolher a aba.
2. Preparo (Limpeza e Tratamento)
chef_limpar_cabecalho: Padroniza colunas (remove espaços e deixa minúsculo).
chef_analisar_nulos: Mostra a porcentagem de valores nulos (muito mais útil que apenas a soma).
chef_tratar_datas: Converte strings para datetime no formato brasileiro (%d/%m/%Y).
3. Prato Principal (Análise)
chef_agrupar_media: Cria um resumo (Groupby) com Média, Contagem e Soma, já ordenado.
chef_filtros_loc: Estrutura pronta para filtrar DataFrame com múltiplas condições (& ou |).
4. Sobremesa (Visualização)
chef_grafico_barra: Gera um gráfico de barras Seaborn profissional (com título, rotação de eixos e tamanho ajustado).
chef_grafico_correlacao: Gera um Heatmap de correlação pronto para relatórios.
Como Cozinhar (Como Usar)
- Abra qualquer arquivo Python (
.py) ou Jupyter Notebook no VS Code.
- Comece a digitar
chef.
- O menu de sugestões aparecerá.
- Escolha a receita e aperte
Enter.
- Use a tecla
Tab para navegar pelos campos editáveis (ex: nome do arquivo, nome da coluna).
Quer testar seus gráficos mas não tem dados? O Pandas Chef funciona perfeitamente com a biblioteca leblanc para gerar dados fictícios instantâneos.
- Digite
chef_import ➔ Traz as libs de análise.
- Gere dados com
leblanc ➔ Cria um DataFrame de vendas falso.
- Digite
chef_grafico_barra ➔ Visualiza o resultado.
Código Final:
# [1] chef_import: Importando as ferramentas use (chef.installKit)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# pip install leblanc
from leblanc import Tech
# [2] Gerando dados sintéticos instantâneos
# Cria um DataFrame com 50 registros de vendas de tecnologia para teste usando a biblioteca leblanc
df = Tech(num_records=50).build()
try:
if 'unit_price' in df.columns:
df['Total'] = df['unit_price'] * df['quantity']
x_col = 'category'
elif 'Unit Price' in df.columns:
df['Total'] = df['Unit Price'] * df['Quantity']
x_col = 'Category'
else:
df['Total'] = df.select_dtypes(include=['number']).iloc[:, 0] * df.select_dtypes(include=['number']).iloc[:, 1]
x_col = df.select_dtypes(include=['object']).columns[0]
# [3] chef_grafico_barra: Visualização
# Gera um gráfico de barras somando o Total por Categoria
plt.figure(figsize=(12, 6))
sns.barplot(data=df, x=x_col, y='Total', palette='viridis', estimator=sum, errorbar=None)
plt.title('Performance de Vendas de Tecnologia (Dados gerados via leblanc)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
except Exception as e:
print(f"Erro ao processar os dados: {e}")
Requisitos
- VS Code versão 1.80.0 ou superior.
- Extensão Python da Microsoft instalada (recomendado).
Configuração Recomendada
Para uma melhor experiência, certifique-se de que as sugestões de snippet estão ativadas no seu VS Code (geralmente já vêm ativas por padrão).
Licença
Este projeto está licenciado sob a Licença Apache 2.0 - veja o arquivo LICENSE para detalhes.
Bon Appétit! 🍝
Desenvolvido por wSanice