Imagem de um peixe, símbolo do cristianismo
Menu

Conversor de PDF para Excel

Link do repositório: https://github.com/PHGodoyCosta/Conversor-pdf-to-excel

Python
Pandas

Tempo de agitação

Desenvolvi esse projeto em 2022, nesse ano eu fui morar com o meu pai em Natal/RN, estava no auge dos meus 15 anos e louco por começar logo minha carreira profissional.

Neste ano começei a Code Company, minha comunidade de programação onde tocavamos projetos e fui realmente adentrando nesse mundo.

Tinha vontade de trabalhar logo, fazer alguma coisa, me desenvolver urgentemente, mas mal tinha iniciado o 1° do ensino médio, como faria tudo isso?

Tendo contato com os programadores mais de perto, descobri que tinha um problema em comum com quase todos os iniciantes, a dificuldade de conseguir uma vaga sem experiência. E para os experiêntes que trabalhavam em freelance, a dificuldade de competir com o mercado exterior, como os Indianos que são muito baratos para contratar ksksk, como competir?

Foi quando tive uma ideia: Criar uma conta freelance para comunidade, para ser usada pelos membros. Por meio de uma aplicação que faria requisições ao freelancer.com via API!

Essa ideia ai não deu certo e acabou morrendo depois, até começei a fazer essa plataforma com PHP, mas como era inesperiente não salvei o código, e ainda bem, porque se na época eu achava que estava ficando ruim, imagina se olhasse hoje kkkkk.

Enfim... Toda essa introdução ai, para dizer que foi quando eu entrei na plataforma de freelance.

Freelance.com

Depois de aplicar em vários lugares e tentar vários Jobs, eu fiz uma proposta para um Italiano quase que implorando para aceitação ksksk, na descrição disse que faria o trabalho de graça porque queria algum trabalho cadastrado na plataforma.

E ele aceitou, mas disse que me pagaria normalmente, e eu fiquei tipo: 🤩🤩

O trabalho era: Ele tinha um PDF e queria um script Python que convertesse para Excel.

Eu já fazia muita coisa com Python, foi a minha primeira linguagem, pensei: "Ta no papo!". Eu tinha ideia do que estava fazendo? Nem um pouco ksksk

Desespero e sofrimento 😂

Encontrei uma biblioteca que lia o PDF, extraia tabelas dele e me retornava em um DataFrame do Pandas, seu nome é Tabula.

A partir do DataFrame do pandas é possível exportar um .csv, então vocês pensam... Aa, muito fácil, sucesso... Eu pensei isso tambem 😭

Nunca tinha feito nada com Pandas e tive uma breve experiência com Jupyter Notebook, então tive que aprender os dois, dobrar as mangas e virar a noite

Porém, o Tabula não conseguia ler e retornar tudo bonitinho como no PDF. Na foto ainda está bonito, mas em outros PDFs, colunas vinham juntas, informações misturadas, colunas sem necessidade com dados de outras...

E o Italiano ainda queria de uma forma específica no .csv em que eu precisaria tratar e mudar tudo isso.

Mas graças a Deus, o tabula lia quebrado, mas lia quebrado com um padrão, então eu conseguia consertar para funcionar em qualquer PDF daquele modelo (que era a intenção dele).

Aprendi tudo o que precisava, depois foi mais um sufoco porque deu muitos erros para rodar no PC dele, conversavamos pelo chat do Freelancer.com, ele teve que reinstalar umas coisas, instalar o Java (porque é requisito do Tabula), mas no final deu tudo certo!

Um dos exemplos de PDF é esse: (Resultado da EuroBet)

Tecnologia e repositório:

Repositório: https://github.com/PHGodoyCosta/Conversor-pdf-to-excel

PythonPandas

Resultado da ópera

No fim o script ficou bom, o rapaz gostou e fiz mais dois scripts com outros modelos de PDF para ele por $30-$40 dolares cada.

Infelizmente não avancei com o Freelance.com, porque não consegui sacar o dinheiro, era menor de idade e não conseguia fazer a verificação, tentei usar o CPF e a foto da minha mãe, mas eles não autorizaram.

Mas hoje olho para trás e vejo isso como uma boa primeira experiência profissional. Tinha um prazo curto (esqueci de mencionar mas ele tinha pressa, colocou na descrição do trabalho que precisava de algo entre 3 e 4 dias), tive que aprender tudo, conciliar com o IF (estava estudando no Instituto Federal), conversar com ele em Inglês pelo Chat, aprender rápido um framework complexo (Pandas)...

Não foi fácil, mas foi bom.