Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

A curated list of papers, code and resources pertaining to image composition

Motion detector, Full body detection, Upper body detection, Cat face detection, Smile detection, Face detection (haar cascade), Silverware detection, Face detection (lbp), and Sending email notifications

Connect Aseprite to Blender for painting pixelart textures in real time

Fast style transfer

Library used to deskew a scanned document

The papers published in top-tier AI conferences in recent years.

Some Boring Research About Products Recognition 、Duplicate Img Detection、Img Stitch、OCR

Image Smoothing and Blurring Using OpenCV

This is a repository to learn and get more computer vision skills, make robotics projects integrating the computer vision as a perception tool and create a lot of awesome advanced controllers for the robots of the future.

Provides OCR (Optical Character Recognition) services through web applications

Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation

YOLOv5 in DOTA with CSL_label.(Oriented Object Detection)（Rotation Detection）（Rotated BBox）

A python scripts that uses 3 different feature extraction methods such as SIFT, SURF and ORB to find a book in a video clip and project trailer of a movie based on that book, on to it.

A toolbox of scene text detection and recognition

EQFace: An implementation of EQFace: A Simple Explicit Quality Network for Face Recognition

Give a solution to recognize MaoYan font.

A simple Digits Recogniser made in Python

An OCR evaluation tool

~1000 book pages + OpenCV + python = page regions identified as paragraphs, lines, images, captions, etc.

A Python wrapper for Google Tesseract