Shadow AI: A Saída Silenciosa de Dados Corporativos

Em 2023, a Samsung proibiu o uso de ChatGPT após funcionários colarem código-fonte proprietário no assistente. Em 2024, um levantamento da Cyberhaven mostrou que 11% dos dados colados em ferramentas de IA generativa eram considerados confidenciais pelas próprias políticas das empresas. Em 2025, o número cresceu — e a maioria das organizações ainda não tem visibilidade sobre o que sai.

Isso é Shadow AI: o uso de ferramentas de IA generativa externas com dados corporativos reais, fora de qualquer processo de aprovação ou monitoramento.

Por que isso acontece

A pressão por produtividade é real. Um analista que precisa resumir um contrato de 80 páginas sabe que o ChatGPT faz isso em 30 segundos. Um desenvolvedor que precisa depurar um código legado sabe que o Claude entende o contexto melhor do que a documentação interna.

A alternativa — esperar pela aprovação de uma ferramenta de IA corporativa, passar pelo processo de segurança, aguardar o rollout — pode levar meses. O trabalho precisa ser feito hoje.

O problema não é intenção maliciosa. A esmagadora maioria dos incidentes de Shadow AI é cometida por funcionários produtivos tentando fazer seu trabalho melhor. O risco é sistêmico, não comportamental.

O que realmente sai nos prompts

Dados de pesquisa mostram que os tipos de conteúdo mais frequentemente colados em ferramentas de IA pública incluem:

Contratos e acordos — para resumo, análise de cláusulas, comparação
Código-fonte — para depuração, refatoração, explicação
E-mails e comunicações internas — para rascunho de respostas, análise de tom
Dados financeiros — para análise de variações, projeções, relatórios
Dados de clientes — para análise de padrões, preparação de apresentações
Documentos de RH — para políticas, avaliações, feedback estruturado

Cada um desses tipos contém, potencialmente, dados pessoais (LGPD), segredos comerciais, informações reguladas ou dados de clientes sob contrato.

O que acontece com os dados nos modelos externos

Quando um funcionário cola um dado no ChatGPT ou Claude, o comportamento real depende de como a ferramenta foi acessada:

Acesso	Política de dados
ChatGPT.com (conta pessoal)	OpenAI pode usar para treinamento por padrão
ChatGPT.com (conta Teams/Enterprise)	Não usado para treinamento, mas armazenado nos servidores OpenAI
API da OpenAI	Não armazenado para treinamento
Claude.ai (plano pessoal)	Anthropic pode usar para treinamento
Claude.ai (Team/Enterprise)	Não usado para treinamento

Na prática, a maioria dos funcionários usa a conta pessoal gratuita — sem qualquer garantia sobre armazenamento ou uso dos dados.

Por que bloquear por URL não funciona

A resposta mais comum de equipes de segurança ao Shadow AI é bloquear o acesso a chat.openai.com, claude.ai e similares via proxy ou CASB.

Essa abordagem tem três problemas sérios:

1. Proliferação de interfaces Existem dezenas de interfaces que acessam os mesmos modelos via API. Bloquear a URL oficial não bloqueia o modelo. Ferramentas como Cursor, Copilot no VS Code, extensões de browser, plugins do Notion e integrações do Slack acessam GPT-4 ou Claude sem passar pelas URLs que as equipes de segurança monitoram.

2. Dispositivos pessoais O trabalho remoto significa que parte da atividade ocorre em dispositivos fora do controle corporativo. O CASB não inspeciona o iPhone pessoal com o ChatGPT aberto na mesa de trabalho.

3. Falsa sensação de controle Organizações que bloqueiam as URLs principais frequentemente acreditam que o problema está resolvido. Os funcionários encontram alternativas; o monitoramento não acompanha.

O que realmente resolve: controle por conteúdo, não por URL

A abordagem efetiva contra Shadow AI não é bloquear ferramentas — é detectar quando dados sensíveis saem da organização, independentemente de como.

Isso requer:

Classificação ativa dos dados Você só pode monitorar a saída de dados sensíveis se souber o que é sensível. Classificação contínua — não pontual — é o pré-requisito.

DLP orientado a conteúdo Soluções de DLP modernas detectam quando dados classificados estão sendo copiados para a área de transferência, independente do destino. Isso funciona mesmo se a ferramenta de destino não for conhecida.

Monitoramento de endpoint Para dados que saem via cópia/cola fora do browser corporativo, o monitoramento precisa estar no endpoint.

Política de uso aceitável com dentes técnicos Uma política que diz “não use ChatGPT com dados da empresa” sem mecanismos de detecção é apenas um documento de compliance — não um controle de segurança.

O cenário LGPD

No Brasil, o uso de dados pessoais de clientes, funcionários ou parceiros em ferramentas de IA externa levanta questões específicas sob a LGPD:

O titular foi informado de que seus dados poderiam ser enviados a um processador externo de IA?
Existe base legal para esse tratamento?
O controlador tem evidência de onde os dados foram e em quais sistemas foram processados?

A ANPD ainda está desenvolvendo orientações específicas sobre IA, mas o princípio da finalidade e da necessidade já se aplicam. Dados de clientes colados no ChatGPT para uma finalidade operacional interna provavelmente extrapolam o escopo do consentimento original.

O que fazer agora, em três passos

Passo 1: Diagnóstico real de uso Antes de bloquear, entenda o que está acontecendo. Ferramentas de DLP com visibilidade de endpoint conseguem mapear quais tipos de dados estão sendo copiados e para onde. Esse diagnóstico costuma revelar padrões que surprendem até as equipes de segurança mais experientes.

Passo 2: Ofereça alternativa aprovada A causa raiz do Shadow AI é a falta de ferramentas aprovadas que atendam à necessidade de produtividade. Organizações que implantam Microsoft 365 Copilot (com as devidas precauções de permissão) ou uma instância corporativa de um assistente de IA reduzem dramaticamente o Shadow AI — porque removem a necessidade de usar ferramentas externas.

Passo 3: Monitore output, não só input No longo prazo, o controle de Shadow AI se funde com o controle de IA corporativa: qualquer sistema de IA com acesso a dados corporativos — interno ou externo — precisa ter seu output monitorado. O que o modelo gerou a partir dos seus dados também é dado da sua empresa.

Conclusão

Shadow AI não é um problema de comportamento. É um problema de infraestrutura: as organizações ainda não têm os controles para governar o uso de IA generativa com a mesma maturidade com que governam outros vetores de risco.

A boa notícia é que os mecanismos existem. A classificação de dados, o DLP orientado a conteúdo e a oferta de alternativas aprovadas resolvem a maior parte do problema. O passo inicial é ter visibilidade — e admitir que o bloqueio por URL não é visibilidade.

“Você não pode governar o que não vê. E bloquear uma URL não é ver.”

O diagnóstico DSPM avalia seu nível de visibilidade sobre Shadow AI e outros riscos de IA generativa no ambiente.

Por que isso acontece

O que realmente sai nos prompts

O que acontece com os dados nos modelos externos

Por que bloquear por URL não funciona

O que realmente resolve: controle por conteúdo, não por URL

O cenário LGPD

O que fazer agora, em três passos

Conclusão

IA Generativa e o Risco de Dados no Microsoft 365 Copilot