Conversão de PDF para CSV com Python

herrmann · Novembro 3, 2021, 1:53am

Esse tipo de problema é muito comum. Você pode experimentar com outros processadores de PDF, até encontrar um que consiga interpretar a estrutura da tabela corretamente.

Este artigo sugere três bibliotecas diferentes para Python, sendo o Tabula apenas uma delas.

A biblioteca rows do @turicas também tem uma funcionalidade específica para extrair tabelas de PDFs:

http://turicas.info/rows/plugins/#pdf