A gigante do varejo Target implementou um novo sistema baseado em Inteligência Artificial generativa para aprimorar suas previsões de marketing. A solução utiliza LLMs (Large Language Models) e busca semântica para identificar campanhas históricas comparáveis antes mesmo do lançamento de novas iniciativas. Essa mudança substitui sistemas baseados em regras rígidas, que sofriam com a falta de flexibilidade diante da diversidade crescente de canais e formatos de anúncio.
O objetivo central do projeto não é a previsão automatizada de resultados, mas sim fornecer suporte à decisão para analistas, conectando campanhas atuais com dados históricos relevantes de forma rápida e precisa.
A arquitetura por trás da similaridade semântica
O sistema adota uma arquitetura de pipeline multi-estágio que separa a geração de embeddings, a recuperação de dados e o ranking final realizado pela LLM. Esse design modular permite que cada etapa seja ajustada independentemente, melhorando a observabilidade e o desempenho do modelo.
Processamento de dados e busca
- Normalização: Dados históricos de campanhas são convertidos em embeddings que capturam o significado semântico de atributos como segmento de público, categoria de produto, canal e intenção.
- Recuperação: Quando uma nova campanha é criada, o sistema gera embeddings baseados em seus metadados para buscar candidatos similares em um índice interno.
- Refinamento: Os resultados da busca são enviados para a LLM, que avalia a similaridade com base em restrições estruturadas, retornando uma lista ranqueada com explicações fundamentadas para cada match.
Resultados e eficácia operacional
Segundo a engenharia da Target, o sistema demonstrou uma eficácia notável nos testes de validação. Ao considerar apenas a recomendação principal do modelo, o sistema alcançou 75% de cobertura. Quando a profundidade de recomendação foi expandida para os três principais resultados, a cobertura atingiu 100%, garantindo que cada campanha avaliada encontrasse pelo menos um referencial histórico adequado.
A transição de uma lógica baseada em regras para uma abordagem de RAG (Retrieval-Augmented Generation) permitiu que a empresa reduzisse drasticamente a carga de manutenção manual. Antes, a equipe de analytics perdia tempo precioso atualizando regras conforme novos padrões de campanha surgiam. Agora, o sistema aprende e generaliza, o que é fundamental para cobrir campanhas de cauda longa que anteriormente careciam de definições confiáveis.
Human-in-the-loop: A importância da validação
Um ponto crucial na implementação é que a decisão final permanece com o especialista. Analistas de marketing revisam os candidatos recuperados e as explicações geradas pelo modelo antes de integrar essas informações nos fluxos de trabalho de previsão. Esse processo de human-in-the-loop garante que a interpretação humana complemente a eficiência computacional, mantendo o processo ancorado em fatos observáveis.
FAQ: Perguntas Frequentes sobre o sistema da Target
Por que a Target decidiu abandonar o sistema de regras?
O sistema antigo exigia manutenção manual constante e falhava em se adaptar a novos formatos de campanhas e canais, gerando um gargalo operacional conforme a complexidade do marketing crescia.
Como o sistema garante a relevância dos resultados?
O modelo utiliza uma combinação de embeddings para busca rápida e ranking feito via LLM para refinar a semântica, sempre oferecendo uma explicação para o match sugerido.
O sistema automatiza a previsão de resultados?
Não. O sistema foca em identificar campanhas similares do passado para que analistas possam tomar decisões informadas, mantendo a responsabilidade final com o time humano.
Como o sistema evolui ao longo do tempo?
A solução inclui um mecanismo de feedback que utiliza dados reais de performance de campanhas encerradas para refinar os embeddings e melhorar a precisão das futuras buscas.
Essa abordagem serve para outros tipos de negócio?
Sim. O uso de RAG e busca semântica para suportar tomadas de decisão baseadas em histórico é um padrão de arquitetura altamente replicável em qualquer setor com grande volume de dados não estruturados.