Extraia o texto de documentos com o FreeOCR

Publicidade

Se você já teve que copiar o texto de um arquivo PDF, imagem ou documento digitalizado, você sabe que existem duas formas de fazer isso. Você pode digitar o texto manualmente ou utilizar um programa de OCR.

FreeOCR é um programa gratuito de OCR (Reconhecimento Óptico de Caracteres) que lhe permite extrair o texto de documentos digitalizados, imagens e PDFs e salvá-lo em arquivos de texto e documentos do Word.

Extraia o texto de documentos digitalizados com o FreeOCR

Publicidade

FreeOCR é simples de usar e oferece dois modos de operação. Você pode digitalizar documentos usando um scanner, ou abrir um arquivo de imagem ou um documento PDF que contém o texto que deseja extrair.

O documento adicionado é exibido do lado esquerdo da tela. Aqui você pode navegar pelas páginas se for um documento com várias páginas, selecionar a área da página que contém o texto que deseja extrair, etc.

Em seguida, na opção “OCR Language”, do lado direito superior da tela, escolha o idioma português “por”, depois clique no botão “OCR” e selecione se deseja extrair o texto da página atual ou de todas as páginas.

O processo de extração de texto é muito rápido e o resultado é exibido automaticamente do lado direito da tela, que funciona como um editor de texto. Por fim, você pode salvar o texto nos formatos TXT, DOC e RTF.

Em resumo, FreeOCR é uma ótima opção para extrair o texto de documentos digitalizados, arquivos PDF e imagens. Ele trabalha quase perfeitamente, especialmente em documentos com fundo branco e texto preto.

Por padrão, o FreeOCR não vem com o suporte ao idioma português. Você precisa baixar o arquivo OCR do idioma português separadamente. Para ajudá-lo, nós compilamos uma versão já com o português incluído.

Download FreeOCR (com português)

Download FreeOCR (sem português)

Publicidade