Skip to content

Applied ML

Modelo analítico de churn com notebooks e publicação operacional

Feature engineering em PySpark, treino de modelo supervisionado e entrega de scores para CRM com explicabilidade mínima para o negócio.

2024 PySpark Notebooks Python Microsoft Fabric Power BI

Context

Assinatura B2B com cancelamentos silenciosos; time comercial precisava priorizar contas com maior risco.

Problem

Regras manuais de priorização não escalavam e não incorporavam sinais comportamentais recentes.

Data architecture

Base histórica na Gold → geração de features (recência, frequência, uso de produto, tickets) em notebook → split temporal para validação → modelo exportado como tabela de scores diária → consumo no CRM e painel de acompanhamento.

What was done

Pipeline reprodutível, métricas de performance registradas por versão e limiar de ação acordado com comercial (não “acurácia bonita” sem uso).

  • Notebook de treino com experimentação versionada
  • Tabela de scores + contrato de atualização
  • Painel de monitoramento de drift básico

Decisions & indicators

Priorização de abordagem comercial e leitura de drivers principais de risco (sem prometer caixa preta).

  • Recall@k no conjunto de validação temporal
  • Lift do quartil de maior risco
  • Adoção: contatos realizados sobre leads priorizados

Outcome / impact

Lista priorizada de contas e ritmo de ação mais consistente; redução de esforço em contatos de baixa conversão esperada.

Learnings

  • ML aplicado vive ou morre na operação: sem SLA de dados e sem dono do limiar, o modelo vira relatório.

Amplie aqui limitações éticas, viés de amostra ou plano de retreino: transparência gera confiança com stakeholders.