Shadow AI: A Saída Silenciosa de Dados Corporativos

Funcionários usam ChatGPT, Claude e Gemini com dados reais da empresa. Sem rastreabilidade, sem aprovação, sem retorno. Entenda como o Shadow AI virou o principal vetor de exfiltração não intencional de dados em 2025.

8 min de leitura

Em 2023, a Samsung proibiu o uso de ChatGPT após funcionários colarem código-fonte proprietário no assistente. Em 2024, um levantamento da Cyberhaven mostrou que 11% dos dados colados em ferramentas de IA generativa eram considerados confidenciais pelas próprias políticas das empresas. Em 2025, o número cresceu — e a maioria das organizações ainda não tem visibilidade sobre o que sai.

Isso é Shadow AI: o uso de ferramentas de IA generativa externas com dados corporativos reais, fora de qualquer processo de aprovação ou monitoramento.


Por que isso acontece

A pressão por produtividade é real. Um analista que precisa resumir um contrato de 80 páginas sabe que o ChatGPT faz isso em 30 segundos. Um desenvolvedor que precisa depurar um código legado sabe que o Claude entende o contexto melhor do que a documentação interna.

A alternativa — esperar pela aprovação de uma ferramenta de IA corporativa, passar pelo processo de segurança, aguardar o rollout — pode levar meses. O trabalho precisa ser feito hoje.

O problema não é intenção maliciosa. A esmagadora maioria dos incidentes de Shadow AI é cometida por funcionários produtivos tentando fazer seu trabalho melhor. O risco é sistêmico, não comportamental.


O que realmente sai nos prompts

Dados de pesquisa mostram que os tipos de conteúdo mais frequentemente colados em ferramentas de IA pública incluem:

  • Contratos e acordos — para resumo, análise de cláusulas, comparação
  • Código-fonte — para depuração, refatoração, explicação
  • E-mails e comunicações internas — para rascunho de respostas, análise de tom
  • Dados financeiros — para análise de variações, projeções, relatórios
  • Dados de clientes — para análise de padrões, preparação de apresentações
  • Documentos de RH — para políticas, avaliações, feedback estruturado

Cada um desses tipos contém, potencialmente, dados pessoais (LGPD), segredos comerciais, informações reguladas ou dados de clientes sob contrato.


O que acontece com os dados nos modelos externos

Quando um funcionário cola um dado no ChatGPT ou Claude, o comportamento real depende de como a ferramenta foi acessada:

AcessoPolítica de dados
ChatGPT.com (conta pessoal)OpenAI pode usar para treinamento por padrão
ChatGPT.com (conta Teams/Enterprise)Não usado para treinamento, mas armazenado nos servidores OpenAI
API da OpenAINão armazenado para treinamento
Claude.ai (plano pessoal)Anthropic pode usar para treinamento
Claude.ai (Team/Enterprise)Não usado para treinamento

Na prática, a maioria dos funcionários usa a conta pessoal gratuita — sem qualquer garantia sobre armazenamento ou uso dos dados.


Por que bloquear por URL não funciona

A resposta mais comum de equipes de segurança ao Shadow AI é bloquear o acesso a chat.openai.com, claude.ai e similares via proxy ou CASB.

Essa abordagem tem três problemas sérios:

1. Proliferação de interfaces Existem dezenas de interfaces que acessam os mesmos modelos via API. Bloquear a URL oficial não bloqueia o modelo. Ferramentas como Cursor, Copilot no VS Code, extensões de browser, plugins do Notion e integrações do Slack acessam GPT-4 ou Claude sem passar pelas URLs que as equipes de segurança monitoram.

2. Dispositivos pessoais O trabalho remoto significa que parte da atividade ocorre em dispositivos fora do controle corporativo. O CASB não inspeciona o iPhone pessoal com o ChatGPT aberto na mesa de trabalho.

3. Falsa sensação de controle Organizações que bloqueiam as URLs principais frequentemente acreditam que o problema está resolvido. Os funcionários encontram alternativas; o monitoramento não acompanha.


O que realmente resolve: controle por conteúdo, não por URL

A abordagem efetiva contra Shadow AI não é bloquear ferramentas — é detectar quando dados sensíveis saem da organização, independentemente de como.

Isso requer:

Classificação ativa dos dados Você só pode monitorar a saída de dados sensíveis se souber o que é sensível. Classificação contínua — não pontual — é o pré-requisito.

DLP orientado a conteúdo Soluções de DLP modernas detectam quando dados classificados estão sendo copiados para a área de transferência, independente do destino. Isso funciona mesmo se a ferramenta de destino não for conhecida.

Monitoramento de endpoint Para dados que saem via cópia/cola fora do browser corporativo, o monitoramento precisa estar no endpoint.

Política de uso aceitável com dentes técnicos Uma política que diz “não use ChatGPT com dados da empresa” sem mecanismos de detecção é apenas um documento de compliance — não um controle de segurança.


O cenário LGPD

No Brasil, o uso de dados pessoais de clientes, funcionários ou parceiros em ferramentas de IA externa levanta questões específicas sob a LGPD:

  • O titular foi informado de que seus dados poderiam ser enviados a um processador externo de IA?
  • Existe base legal para esse tratamento?
  • O controlador tem evidência de onde os dados foram e em quais sistemas foram processados?

A ANPD ainda está desenvolvendo orientações específicas sobre IA, mas o princípio da finalidade e da necessidade já se aplicam. Dados de clientes colados no ChatGPT para uma finalidade operacional interna provavelmente extrapolam o escopo do consentimento original.


O que fazer agora, em três passos

Passo 1: Diagnóstico real de uso Antes de bloquear, entenda o que está acontecendo. Ferramentas de DLP com visibilidade de endpoint conseguem mapear quais tipos de dados estão sendo copiados e para onde. Esse diagnóstico costuma revelar padrões que surprendem até as equipes de segurança mais experientes.

Passo 2: Ofereça alternativa aprovada A causa raiz do Shadow AI é a falta de ferramentas aprovadas que atendam à necessidade de produtividade. Organizações que implantam Microsoft 365 Copilot (com as devidas precauções de permissão) ou uma instância corporativa de um assistente de IA reduzem dramaticamente o Shadow AI — porque removem a necessidade de usar ferramentas externas.

Passo 3: Monitore output, não só input No longo prazo, o controle de Shadow AI se funde com o controle de IA corporativa: qualquer sistema de IA com acesso a dados corporativos — interno ou externo — precisa ter seu output monitorado. O que o modelo gerou a partir dos seus dados também é dado da sua empresa.


Conclusão

Shadow AI não é um problema de comportamento. É um problema de infraestrutura: as organizações ainda não têm os controles para governar o uso de IA generativa com a mesma maturidade com que governam outros vetores de risco.

A boa notícia é que os mecanismos existem. A classificação de dados, o DLP orientado a conteúdo e a oferta de alternativas aprovadas resolvem a maior parte do problema. O passo inicial é ter visibilidade — e admitir que o bloqueio por URL não é visibilidade.

“Você não pode governar o que não vê. E bloquear uma URL não é ver.”

O diagnóstico DSPM avalia seu nível de visibilidade sobre Shadow AI e outros riscos de IA generativa no ambiente.

Rafael Martins

Especialista independente em DSPM e segurança de dados. Escreve sobre governança de dados, risco de IA generativa e LGPD sem patrocínio de vendors.

Saber mais →
← Voltar aos artigos