ML aplicado
Modelo analítico de churn com notebooks e publicação operacional
Feature engineering em PySpark, treino de modelo supervisionado e entrega de scores para CRM com explicabilidade mínima para o negócio.
Contexto
Assinatura B2B com cancelamentos silenciosos; time comercial precisava priorizar contas com maior risco.
Problema
Regras manuais de priorização não escalavam e não incorporavam sinais comportamentais recentes.
Arquitectura de datos
Base histórica na Gold → geração de features (recência, frequência, uso de produto, tickets) em notebook → split temporal para validação → modelo exportado como tabela de scores diária → consumo no CRM e painel de acompanhamento.
Qué se hizo
Pipeline reprodutível, métricas de performance registradas por versão e limiar de ação acordado com comercial (não “acurácia bonita” sem uso).
- Notebook de treino com experimentação versionada
- Tabela de scores + contrato de atualização
- Painel de monitoramento de drift básico
Decisión e indicadores
Priorização de abordagem comercial e leitura de drivers principais de risco (sem prometer caixa preta).
- Recall@k no conjunto de validação temporal
- Lift do quartil de maior risco
- Adoção: contatos realizados sobre leads priorizados
Resultado / impacto
Lista priorizada de contas e ritmo de ação mais consistente; redução de esforço em contatos de baixa conversão esperada.
Aprendizajes
- ML aplicado vive ou morre na operação: sem SLA de dados e sem dono do limiar, o modelo vira relatório.
Amplie aqui limitações éticas, viés de amostra ou plano de retreino: transparência gera confiança com stakeholders.