Por que alguns PDFs não comprimem (e o que fazer)
Seis motivos concretos para um PDF não encolher, como diagnosticar o seu e quando menor simplesmente não é possível.
Você passa um PDF por um compressor, espera a barra de progresso, e o resultado tem o mesmo tamanho. Ou pior, está maior. Isso é frustrante e comum, e quase sempre tem uma causa específica e conhecível. Um PDF não se recusa a comprimir por implicância. Ele se recusa porque não sobrou nada para espremer, ou porque o que ocupa espaço não é o tipo de dado que a compressão ajuda. Veja como descobrir qual é o caso.
Motivo 1: o arquivo já é quase só texto
Texto em PDF é minúsculo. Um relatório de 50 páginas sem imagens pode ter algumas centenas de kilobytes, e isso já é perto do mínimo. Os bytes são caracteres e referências de fonte, não pixels, e há pouquíssima redundância para o compressor remover. Se o seu arquivo já é pequeno e cheio de texto selecionável, não há compressão relevante a obter. Isso não é falha. É um arquivo que já era eficiente.
Motivo 2: as imagens já estão comprimidas
A maior economia na maioria dos PDFs vem das imagens. Mas se essas imagens já estão guardadas como JPEGs bem comprimidos em resolução razoável, recomprimi-las quase não faz nada. Pior, passar uma imagem que já é JPEG por outra passada com perda pode adicionar artefatos economizando só uns poucos por cento. Um bom compressor reconhece isso e deixa quieto, e é por isso que às vezes você vê "0% de redução" num arquivo que parece cheio de imagem. As imagens já estavam otimizadas antes de você tocar no arquivo.
Motivo 3: o conteúdo é vetor, não raster
Gráficos, diagramas, logos e exports de CAD costumam ser gráficos vetoriais: instruções para desenhar linhas e formas, não grades de pixels. Vetores já são compactos e escalam infinitamente sem perda de qualidade. Reduzir resolução não faz nada com eles porque não há resolução a baixar. Um PDF de 10 MB com desenhos técnicos complexos pode ser 10 MB de pura matemática vetorial, e é simplesmente o quanto custa descrever o desenho.
Motivo 4: é um escaneamento salvo do jeito errado
Aqui está o caso em que o arquivo parece comprimível mas resiste. Um documento escaneado é uma pilha de imagens. Se o scanner salvou cada página como PNG sem perda ou JPEG de qualidade máxima a 600 DPI, o arquivo é enorme. Ele pode comprimir, e muito, mas só se você reduzir a resolução e recodificar. Se o seu compressor está em "sem perda" ou em padrões conservadores, ele não mexe na resolução e você não vê mudança. A solução é permitir o downsampling, não comprimir com mais força nos mesmos ajustes.
Motivo 5: o arquivo está inchado com dados ocultos
Alguns PDFs carregam peso que você não vê: fontes inteiras embutidas, histórico de revisões (toda edição já salva dentro do arquivo), miniaturas embutidas, arquivos anexados ou objetos que sobraram do software que o criou. Ferramentas de edição às vezes acrescentam mudanças em vez de reescrever o arquivo, então um documento aberto e salvo vinte vezes pode ser muito maior do que o conteúdo justifica. Aqui a solução não é compressão de imagem nenhuma. É reescrever o PDF de forma limpa, o que descarta os dados órfãos e achata o histórico de revisões.
Motivo 6: está criptografado ou protegido por senha
Um PDF travado não pode ser modificado até ser destravado, e compressão é uma modificação. A maioria das ferramentas ou recusa de cara ou pede a senha primeiro. Se o seu arquivo não comprime e você lembra de ter colocado senha, é nessa parede que você bateu. Destrave, comprima e proteja de novo se ainda precisar da senha.
Como diagnosticar o seu arquivo específico
- Você consegue selecionar e copiar o texto? Se sim, o arquivo é baseado em texto e provavelmente já é pequeno. Não espere muito.
- É um escaneamento (o texto faz parte da imagem, não dá para selecionar)? Se sim, ative o downsampling e ajuste um DPI apropriado para tela.
- As imagens ficam nítidas em qualquer nível de zoom? Isso é vetor. Não vai encolher por ajustes de imagem.
- O arquivo foi editado e salvo muitas vezes? Tente uma passada de "reescrever" ou "otimizar" para limpar o inchaço oculto.
- A ferramenta pede senha? Destrave primeiro.
Quando o arquivo realmente não pode ficar menor
Às vezes a resposta honesta é que o arquivo já está o menor possível sem jogar fora conteúdo que você precisa. Um documento denso e bem otimizado não tem folga. Se você precisa dele menor mesmo assim, as únicas opções que sobram envolvem trade-offs reais: baixar a qualidade da imagem além do ponto invisível, reduzir a resolução abaixo do que a tela precisa, ou dividir o documento para cada parte ficar mais leve. Nenhuma delas é "de graça" como remover desperdício é.
Fazendo o diagnóstico de forma privada
Você não deveria ter que enviar um arquivo confidencial só para descobrir se ele comprime. O PDFShore roda no navegador, então você solta o arquivo, tenta a compressão e vê o resultado sem o documento sair do seu dispositivo. Se não encolher, você aprendeu isso localmente, sem cópia em servidor esperando num cronômetro de exclusão. O diagnóstico custa só alguns segundos.