Infraestrutura

Como a Grab criou o Palana para rodar agentes de IA com segurança no Kubernetes

A Grab desenvolveu o Palana, uma plataforma nativa de Kubernetes, para isolar workloads de agentes autônomos e mitigar riscos críticos de segurança em IA.

R

· 5 min

Diagrama conceitual de arquitetura de segurança para agentes de IA no Kubernetes

Diagrama conceitual de arquitetura de segurança para agentes de IA no Kubernetes

O desafio da governança em agentes autônomos

A adoção de agentes de inteligência artificial autônomos introduziu um paradigma inédito para equipes de engenharia de plataforma e cibersegurança. Diferente de aplicações tradicionais, que operam sob fluxos previsíveis, agentes orientados a modelos possuem autonomia para executar ferramentas, manipular APIs e interagir com código-fonte. Essa liberdade operacional, embora poderosa, abre brechas para vulnerabilidades como injeção de prompt, sequestro de lógica e alucinações perigosas.

Para enfrentar esse cenário, a Grab desenvolveu o Palana, uma plataforma nativa de Kubernetes projetada para atuar como um ambiente de execução isolado e seguro. O objetivo principal é implementar mecanismos de controle determinísticos sobre o comportamento intrinsecamente não determinístico das aplicações baseadas em modelos.

Arquitetura Zero-Trust e Isolamento no Kubernetes

O Palana adota um modelo de zero-trust, onde o isolamento é a unidade básica de confiança. A infraestrutura garante que qualquer comprometimento em um framework de agente permaneça contido, impedindo o movimento lateral ou danos ao cluster de computação subjacente. A segmentação é realizada através de namespaces dedicados no Kubernetes, configurados com políticas rigorosas de Role-Based Access Control (RBAC) e políticas de rede customizadas.

Pilar técnico do Palana: Cada agente recebe identidades de serviço isoladas e armazenamento persistente localizado, permitindo que estados e memórias sejam preservados durante fluxos de trabalho assíncronos de longa duração, sem comprometer a segurança global do cluster.

Gerenciamento de segredos via proxy

Um dos maiores riscos em agentes autônomos é a exposição de chaves de API e tokens em variáveis de ambiente ou sistemas de arquivos montados. Para mitigar isso, o Palana dissocia o gerenciamento de segredos: o container do agente recebe apenas tokens de espaço reservado. Quando o agente realiza uma chamada externa, um proxy intermediário intercepta o tráfego, valida o destino e injeta dinamicamente o segredo real. Assim, o segredo nunca reside na memória ou logs do container do agente.

Controle e Auditoria centralizada

A visibilidade é um requisito fundamental para a operação em escala. Todo o tráfego de saída (egress) é roteado através de um proxy Envoy, utilizando regras do Open Policy Agent (OPA). A inspeção de tráfego, via terminação de autoridade certificadora (MitM), permite a validação de endpoints e a criação de trilhas de auditoria detalhadas.

Kill switches e ciclo de vida

Como não se pode confiar que um agente comprometido interromperá sua própria execução, a Grab implementou controles de nível de infraestrutura. Isso inclui kill switches que desabilitam políticas de rede diretamente do plano de controle e um sistema de reaper externo que encerra workloads ociosos ou suspeitos sem depender do código do próprio agente.

Ao utilizar operadores customizados do Kubernetes, a equipe de plataforma consegue tratar cada agente como um recurso nativo. Isso permite a auditoria programática e a gestão de centenas de workloads concorrentes seguindo práticas consolidadas de Infrastructure as Code (IaC), equilibrando simplicidade para o desenvolvedor e robustez para a engenharia de sistemas.

Segurança em Agentes de IA

  • Por que o Kubernetes é a base para o Palana? O Kubernetes oferece os mecanismos nativos de isolamento, namespaces e controle de rede necessários para escalar workloads de forma consistente.

  • Como o Palana evita vazamento de chaves de API? Utilizando um proxy que injeta segredos dinamicamente apenas no momento da requisição, garantindo que o agente nunca possua os dados brutos de autenticação.

  • O que é o controle de 'kill switch' no Palana? É uma camada externa de segurança que permite aos administradores cortar o acesso à rede de um agente comprometido, independente de sua execução interna.

  • Qual o papel do Open Policy Agent (OPA) nesta arquitetura? O OPA define as regras que validam se a chamada de rede realizada pelo agente é permitida e segura, funcionando como um filtro de conformidade.

  • A solução é exclusiva para a Grab? Embora o Palana seja proprietário da Grab, os conceitos de isolamento, proxy de segredos e orquestração via operadores são tendências de mercado para a arquitetura de agentes autônomos.

Fonte: Infoq — https://www.infoq.com/news/2026/06/grab-ai-platform/

R

Sobre o autor

Editor-chefe

Usuário técnico criado para escrever conteúdos da redação.

Mais publicações em Infraestrutura