Extrair imagens de .pdf na sua Distro Linux


Confira nessa matéria como extrair imagens de .pdf rapidamente por linha de comando na sua Distro Linux.

 Extrair imagens de .pdf na sua Distro Linux

Para extrair as imagens de um .pdf iremos utilizar o poppler-utils

Poppler é uma biblioteca de renderização de PDF baseada no visualizador de PDF xpdf.
Este pacote contém utilitários de linha de comando (baseados no Poppler) para obter informações de documentos PDF, convertê-los para outros formatos ou manipulá-los:

  • pdfdetach -- lista ou extrai arquivos internos (anexos);
  • pdffonts - analisador de fontes;
  • pdfimages - extrator de imagens;
  • pdfinfo -- informações do documento;
  • pdfseparate -- ferramenta de extração de página;
  • pdftocairo -- conversor de PDF para PNG/JPEG/PDF/PS/EPS/SVG usando Cairo;
  • pdftohtml -- conversor de PDF para HTML;
  • pdftoppm -- conversor de PDF para imagens PPM/PNG/JPEG;
  • pdftops -- conversor de PDF para PostScript (PS);
  • pdftotext -- extrator de texto;
  • pdfunite -- ferramenta de mesclagem de documentos.

Instalação

Instale o poppler-utils com o comando para a sua distribuição Linux.

Para Arch Linux e Manjaro
sudo pacman -S poppler
Para Debian, Ubuntu e derivados
sudo apt install poppler-utils
Para Fedora
sudo dnf install poppler-utils
Para openSUSE
sudo zypper install poppler-utils

Utilização 

Pappler é um aplicativo por linha de comando, comece criando um diretório para a extração das imagens do seu .pdf.
mkdir imagens_pdf
Copie o seu .pdf para a pasta imagens_pdf criada na sua home.


Entre pelo terminal no diretório criado.
cd imagens_pdf
Faça a extração para .jpg.
pdfimages -j ./*.pdf ./
Ai estão as imagens do meu .pdf.


Para alterar a extensão de saída das imagens altere o -j pela extensão preferida.

Extração para .png
pdfimages -png ./*.pdf ./


Para mais formatos consulte o manual.
man pdfimages


Comentários

Você precisa ver isso

Todos os arquivos do blog

Mostrar mais