Slideshare Downloader é uma ferramenta de linha de comando em Python para baixar apresentações do SlideShare diretamente como arquivos PDF de alta qualidade.
O script automatiza todo o processo: acessa o link, extrai as imagens de cada slide na maior resolução disponível, remove as bordas/faixas brancas de cada imagem e, finalmente, compila tudo em um único arquivo PDF, nomeado com o título original da apresentação.
- Download de Alta Qualidade: Extrai a URL da imagem de maior resolução de cada slide.
- Saída em PDF Limpo: Remove automaticamente as barras brancas ou de cor sólida das bordas de cada imagem antes de gerar o PDF.
- Suporte a Múltiplos Links: Baixe várias apresentações de uma só vez, passando múltiplos links como argumento.
- Nomenclatura Inteligente: Salva o arquivo PDF com o título original da apresentação.
- Flexível: Funciona com diferentes domínios do SlideShare (ex:
slideshare.net,pt.slideshare.net, etc.).
-
Clone este repositório para a sua máquina local:
git clone https://github.com/etoshy/Slideshare-Downloader.git
-
Navegue até a pasta do projeto:
cd Slideshare-Downloader -
Instale as dependências necessárias:
pip install -r requirements.txt
(O arquivo
requirements.txtcontém todas as bibliotecas que o script precisa para rodar).
O script é executado diretamente do seu terminal. A sintaxe básica é:
python slidedownload.py <URL1> <URL2> ...
python slidedownload.py https://www.slideshare.net/lorenakamilamelo/fisiologia-humana-7-sistema-respiratoriopython slidedownload.py https://link/da/apresentacao1 https://link/da/apresentacao2O script irá processar cada link sequencialmente, criando um arquivo PDF para cada um na mesma pasta onde o script foi executado.
- Acesso à URL: O script acessa a versão mobile da URL do SlideShare, que possui uma estrutura HTML mais simples.
- Análise do HTML: Utiliza
BeautifulSouppara analisar o conteúdo da página e encontrar o título da apresentação e as tags de imagem de cada slide. - Extração da Melhor Imagem: Para cada slide, ele lê o atributo
srcsete pega a URL da imagem de maior resolução. - Download e Limpeza: Baixa cada imagem e a processa com a biblioteca
Pillowpara detectar e cortar as bordas brancas. - Criação do PDF: Utiliza a biblioteca
img2pdfpara combinar as imagens limpas em um único arquivo PDF, garantindo que cada página tenha o tamanho exato da sua respectiva imagem (sem bordas adicionais). - Finalização: Salva o arquivo PDF no seu computador.
Desenvolvido por Etoshy.