O que o seu PDF revela antes de qualquer um ler
Nome do autor, software, data de edição: os campos escondidos no dicionário de informações de todo PDF, e por que importam antes de compartilhar com clientes ou ferramentas de IA.
Você exporta um contrato como PDF e manda pro cliente. As páginas ficaram exatamente como você queria. O que o cliente também recebeu, sem nenhum dos dois perceberem, foi o nome da conta do usuário que editou o arquivo, o software que a sua empresa usa internamente, e a data e horário exatos da última edição.
Essa informação fica nos campos de metadados. Não aparece em nenhuma página, mas viaja na estrutura do documento toda vez que o arquivo é compartilhado.
Os campos que a maioria nunca viu
O formato PDF armazena um conjunto padrão de campos junto ao conteúdo visível. A maioria dos aplicativos preenche isso automaticamente na exportação:
- Author: o nome da conta do usuário na máquina que salvou o arquivo.
- Creator: o aplicativo que produziu o documento (Word, Canva, InDesign, um app de notas).
- Producer: a biblioteca de exportação PDF que escreveu os bytes.
- Creation date: quando o arquivo foi gerado pela primeira vez.
- Modification date: a última vez que foi salvo.
- Title, Subject, Keywords: às vezes preenchidos com nomes de projetos internos ou rótulos gerados automaticamente pelo software.
Abre o PDF no navegador e você não vai ver nada disso. Mas está lá, e qualquer ferramenta que lê a estrutura do arquivo acessa instantaneamente.
Por que isso aparece mais quando você usa ferramentas de IA
Subir um PDF pra um chatbot ou ferramenta de análise de IA virou etapa rotineira pra muita gente. Algumas ferramentas enviam o arquivo completo pra uma API. Outras extraem só a camada de texto. Algumas leem a estrutura completa do documento, incluindo o dicionário de informações.
Mesmo quando a IA não usa os metadados diretamente, o upload aconteceu com esses campos intactos. Se o campo Author tem um nome real e você estava enviando algo de forma anônima, isso já vazou. Se o Creator revela um software interno que você preferia não expor a um serviço terceiro, mesmo problema.
Tem uma situação mais sutil também. Muita gente usa ferramentas de IA pra preparar documentos pra audiências externas: propostas, relatórios de cliente, resumos públicos. Releem o conteúdo visível com cuidado e nunca pensam no que o dicionário de informações está carregando.
A parte que não tem nada a ver com IA: o histórico do arquivo te segue
O problema é anterior às ferramentas de IA. Quando um PDF chega no cliente e o campo Creator diz que foi feito com uma ferramenta interna que você não queria mencionar, ou quando um campo Author tem o nome de alguém do seu time jurídico num documento que deveria parecer independente, essa informação já saiu. Não dá pra desfazer.
A data de modificação também pode te prejudicar sem você perceber. Se um documento foi enviado em um dia mas os metadados mostram que foi editado uma hora antes, essa diferença fica legível pra qualquer um com ferramentas básicas.
Como checar o que o seu arquivo está armazenando
No Adobe Acrobat, vá em File, depois Properties, depois a aba Description. No macOS você pode selecionar o arquivo no Finder e pressionar Command+I pra um resumo rápido. A ferramenta de linha de comando exiftool dá uma leitura mais completa, incluindo metadados XMP que alguns aplicativos escrevem além dos campos padrão.
Remover antes de compartilhar
O removedor de metadados do PDFShore limpa todos os campos padrão e salva uma cópia limpa. As páginas, fontes, imagens e layout ficam intocados. Só o dicionário de informações é apagado.
Roda no seu navegador, então o arquivo original não sai da sua máquina no processo. Pra algo feito pra evitar que informações vazem, essa parece ser a escolha certa.