Confira nessa matéria como extrair imagens de .pdf rapidamente por linha de comando na sua Distro Linux.
Extrair imagens de .pdf na sua Distro Linux
Para extrair as imagens de um .pdf iremos utilizar o poppler-utils
Poppler é uma biblioteca de renderização de PDF baseada no visualizador de PDF xpdf.
Este pacote contém utilitários de linha de comando (baseados no Poppler) para obter informações de documentos PDF, convertê-los para outros formatos ou manipulá-los:
Para Arch Linux e Manjaro
Poppler é uma biblioteca de renderização de PDF baseada no visualizador de PDF xpdf.
Este pacote contém utilitários de linha de comando (baseados no Poppler) para obter informações de documentos PDF, convertê-los para outros formatos ou manipulá-los:
- pdfdetach -- lista ou extrai arquivos internos (anexos);
- pdffonts - analisador de fontes;
- pdfimages - extrator de imagens;
- pdfinfo -- informações do documento;
- pdfseparate -- ferramenta de extração de página;
- pdftocairo -- conversor de PDF para PNG/JPEG/PDF/PS/EPS/SVG usando Cairo;
- pdftohtml -- conversor de PDF para HTML;
- pdftoppm -- conversor de PDF para imagens PPM/PNG/JPEG;
- pdftops -- conversor de PDF para PostScript (PS);
- pdftotext -- extrator de texto;
- pdfunite -- ferramenta de mesclagem de documentos.
Instalação
Instale o poppler-utils com o comando para a sua distribuição Linux.Para Arch Linux e Manjaro
sudo pacman -S popplerPara Debian, Ubuntu e derivados
sudo apt install poppler-utilsPara Fedora
sudo dnf install poppler-utilsPara openSUSE
sudo zypper install poppler-utils
Utilização
Pappler é um aplicativo por linha de comando, comece criando um diretório para a extração das imagens do seu .pdf.
Entre pelo terminal no diretório criado.
Para alterar a extensão de saída das imagens altere o -j pela extensão preferida.
Extração para .png
Para mais formatos consulte o manual.
mkdir imagens_pdfCopie o seu .pdf para a pasta imagens_pdf criada na sua home.
cd imagens_pdfFaça a extração para .jpg.
pdfimages -j ./*.pdf ./Ai estão as imagens do meu .pdf.
Para alterar a extensão de saída das imagens altere o -j pela extensão preferida.
Extração para .png
pdfimages -png ./*.pdf ./
Para mais formatos consulte o manual.
man pdfimages
Comentários
Postar um comentário
olá, seja bem vindo ao Linux Dicas e suporte !!