Ir al contenido

ML aplicado

Modelo analítico de churn com notebooks e publicação operacional

Feature engineering em PySpark, treino de modelo supervisionado e entrega de scores para CRM com explicabilidade mínima para o negócio.

2024 PySpark Notebooks Python Microsoft Fabric Power BI

Contexto

Assinatura B2B com cancelamentos silenciosos; time comercial precisava priorizar contas com maior risco.

Problema

Regras manuais de priorização não escalavam e não incorporavam sinais comportamentais recentes.

Arquitectura de datos

Base histórica na Gold → geração de features (recência, frequência, uso de produto, tickets) em notebook → split temporal para validação → modelo exportado como tabela de scores diária → consumo no CRM e painel de acompanhamento.

Qué se hizo

Pipeline reprodutível, métricas de performance registradas por versão e limiar de ação acordado com comercial (não “acurácia bonita” sem uso).

  • Notebook de treino com experimentação versionada
  • Tabela de scores + contrato de atualização
  • Painel de monitoramento de drift básico

Decisión e indicadores

Priorização de abordagem comercial e leitura de drivers principais de risco (sem prometer caixa preta).

  • Recall@k no conjunto de validação temporal
  • Lift do quartil de maior risco
  • Adoção: contatos realizados sobre leads priorizados

Resultado / impacto

Lista priorizada de contas e ritmo de ação mais consistente; redução de esforço em contatos de baixa conversão esperada.

Aprendizajes

  • ML aplicado vive ou morre na operação: sem SLA de dados e sem dono do limiar, o modelo vira relatório.

Amplie aqui limitações éticas, viés de amostra ou plano de retreino: transparência gera confiança com stakeholders.