ML aplicado

Modelo analítico de churn com notebooks e publicação operacional

Feature engineering em PySpark, treino de modelo supervisionado e entrega de scores para CRM com explicabilidade mínima para o negócio.

2024 PySpark Notebooks Python Microsoft Fabric Power BI

Hablar de algo similar Volver a la lista

Contexto

Assinatura B2B com cancelamentos silenciosos; time comercial precisava priorizar contas com maior risco.

Problema

Regras manuais de priorização não escalavam e não incorporavam sinais comportamentais recentes.

Arquitectura de datos

Base histórica na Gold → geração de features (recência, frequência, uso de produto, tickets) em notebook → split temporal para validação → modelo exportado como tabela de scores diária → consumo no CRM e painel de acompanhamento.

Qué se hizo

Pipeline reprodutível, métricas de performance registradas por versão e limiar de ação acordado com comercial (não “acurácia bonita” sem uso).

Notebook de treino com experimentação versionada
Tabela de scores + contrato de atualização
Painel de monitoramento de drift básico

Decisión e indicadores

Priorização de abordagem comercial e leitura de drivers principais de risco (sem prometer caixa preta).

Recall@k no conjunto de validação temporal
Lift do quartil de maior risco
Adoção: contatos realizados sobre leads priorizados

Resultado / impacto

Lista priorizada de contas e ritmo de ação mais consistente; redução de esforço em contatos de baixa conversão esperada.

Aprendizajes

ML aplicado vive ou morre na operação: sem SLA de dados e sem dono do limiar, o modelo vira relatório.

Amplie aqui limitações éticas, viés de amostra ou plano de retreino: transparência gera confiança com stakeholders.