Aqui está uma lista dos melhores softwares OCR gratuitos de código aberto para Windows. Assim como qualquer software de OCR padrão, você pode usar esse software para extrair facilmente texto de imagens e arquivos PDF. Uma vantagem adicional desses softwares é que você também pode baixar e fazer modificações nos códigos-fonte desses softwares.
Este software de OCR ou Reconhecimento óptico de caracteres usa vários algoritmos de OCR diferentes (SpaceOCR, Tesseract, etc.) para reconhecer e extrair texto de imagens e PDFs. Alguns desses softwares também oferecem a liberdade de selecionar um algoritmo de OCR de sua escolha. Alguns desses softwares também podem executar OCR em lote que permite extrair texto de vários PDFs e imagens de uma vez. A maioria desses softwares também é capaz de reconhecer e extrair texto de diferentes idiomas de uma imagem ou arquivo PDF. Alguns dos idiomas suportados por esses softwares são inglês, francês, espanhol, vietnamita, chinês, etc.
Depois de extrair o texto, esses softwares mostram imediatamente o texto em suas interfaces que você pode copiar ou salvar no formato de arquivo TXT. As opções para editar o texto extraído estão disponíveis em alguns softwares. Além disso, alguns softwares de OCR de código aberto oferecem ferramentas de edição e manipulação de imagem, como brilho, contraste, escala de cinza, rotação, inversão, etc. Além disso, você também pode encontrar algumas ferramentas adicionais nesses softwares de OCR, como Scanner de documentos, impressão, tradução, conversão de texto em fala, etc. Percorra a lista para saber mais sobre esses softwares.
Meu software OCR de código aberto favorito para Windows:
a9t9 Free Ocr para Windows Desktop é meu software favorito porque pode reconhecer e extrair textos de diferentes idiomas de imagens e documentos PDF. Também permite extrair texto de várias imagens e arquivos PDF ao mesmo tempo. Além disso, é um dos softwares mais simples de usar e ainda fornece tos resultados mais precisos.
a9t9 Ocr grátis para área de trabalho do Windows
a9t9 Free Ocr for Windows Desktop é um software OCR de código aberto gratuito para Windows. Através deste software, você pode facilmente extrair texto de documentos PDF e imagens (PNG, JPEG, BMP, etc.). O bom deste software é que ele pode reconhecer texto de três idiomas diferentes, ou seja, inglês, espanhol e holandês. Além disso, ele pode extrair texto de várias imagens e arquivos PDF de uma só vez.
Como extrair texto de PDF ou imagem usando este software OCR de código aberto:
- Inicie este software e pressione o botão Abrir imagens para adicionar imagens ou pressione o botão Abrir PDF para carregar arquivos PDF.
- Depois disso, pressione o botão Processar todas as páginas no caso de várias imagens ed Arquivos PDF.
- Agora, selecione um dos três idiomas disponíveis no menu Ocr Language e pressione o botão Iniciar Ocr para iniciar o processo de extração de texto.
Depois de extrair o texto, este software mostra os dados extraídos no painel lado direito. Você pode salvar o texto extraído nos formatos TXT ou DOCX usando os botões Salvar como texto ou Salvar como Word, respectivamente .
Considerações finais:
É um dos softwares de OCR de código aberto mais simples e precisos, por meio do qual você pode facilmente extrair texto de várias imagens e arquivos PDF simultaneamente.
Página inicial DownloPágina de anúncios
gImageReader
gImageReader é outro software OCR de código aberto gratuito para Windows, Fedora, Debian, Ubuntu, OpenSUSE e ArchLinux. Usando este software, você pode facilmente extrair texto de documentos PDF e imagens de diferentes formatos como BMP, JPEG, TIF, PNG, ICO, PPM, e muito mais. Este software pode facilmente identificar texto em inglês e números com facilidade. Ele também pode reconhecer textos de diferentes idiomas (Hindi, Afrikaans, Dansk, Francais, etc.), mas você precisa primeiro habilitar todos os idiomas que deseja que este software reconheça acessando seu Gerenciar idiomas. Depois de reconhecer o text, este software mostra no painel de saída de onde você pode salvar o texto extraído no arquivo TXT ou copiar diretamente o texto para a área de transferência.
Como extrair texto de PDF ou imagem usando este software OCR de código aberto:
- Inicie este software e pressione o botão Fontes para carregar um PDF ou imagem para este software. A imagem/PDF carregada aparecerá em sua interface.
- Agora, use o mouse para selecionar a área do documento ou imagem PDF que deseja digitalizar e pressione o botão Reconhecer seleção para iniciar o processo de OCR.
- Após a conclusão do processo de OCR, você pode visualizar o texto de saída no painel Saída. Para salvar o texto reconhecido no arquivo TXT, pressione o botão Salvar.
Recursos adicionais:
- Controles de imagem: usando-o, você pode ajustar manualmente o brilho, contraste, e resolução da imagem de entrada. Além disso, também é fornecida uma opção para inverter as cores da imagem de entrada.
- Layout de detecção automática: este recurso pode detectar automaticamente o layout do texto de entrada para que você não precise selecionar manualmente a área onde o texto está presente.
Considerações finais:
É um software OCR de código aberto decente através do qual você pode facilmente extrair texto de imagens e documentos PDF.
Página inicial Página de download
VietOCR
VietOCR é mais um software OCR de código aberto gratuito para Windows, BSD, MAC e Linux. Este software permite extrair informações de texto de imagens e arquivos PDF. Nele, você também obtém um recurso Bulk OCR integrado por meio do qual pode extrair texto de várias imagens e arquivos PDF de uma só vez. O texto dos idiomas inglês e vietnamita pode ser facilmente extraído usando este software OCR de código aberto. Se você não estiver obtendo resultados precisos, também poderá selecionar manualmente algum outro mecanismo OCR dentre os três disponíveis: Legacy engine, LSTM engine, e Legacy & LSTM motores.
Como extrair texto de PDF ou imagem usando o VietOCR:
- Inicie este software e pressione o botão Abrirpara carregar um arquivo PDF ou imagem. Use a opção OCR em massa se quiser extrair texto de vários arquivos PDF e imagens de uma só vez.
- Depois disso, selecione o idioma inglês ou vietnamita de acordo com o texto presente no arquivo de entrada usando o menu Idioma OCR.
- Por fim, pressione o botão Executar OCR para extrair o texto dos arquivos de entrada. Você pode visualizar o texto extraído na área de texto.
- Você pode salvar o texto extraído no formato TXT usando a opção Salvar.
Recursos adicionais:
- Ferramentas de área de texto: Na área de texto deste software, você pode encontrar muitas ferramentas de edição de texto, como localizar e substituir, verificação ortográfica , remova os separadores de linha, etc.
- Ferramentas de imagem: você pode usar ferramentas de imagem (corte, corte automático, filtros, etc.) para fazer alterações nas imagens de entrada antes de iniciaro processo de OCR.
- Digitalizar documento: você pode usar esse recurso para digitalizar cópias impressas de documentos. No entanto, você precisa ter uma máquina de digitalização de documentos para usar esse recurso.
Considerações finais:
É um software OCR de código aberto muito bom, por meio do qual você pode facilmente extrair texto de documentos e imagens imprimíveis.
Página inicial Página de download
Texto GT
GT Text é o próximo software OCR de código aberto gratuito para Windows. Este software é capaz de extrair dados de texto de imagens de vários formatos como JPEG, BMP, JFIF, GIF, TIFF, PNG, etc. Além disso, também permite capturar qualquer parte da tela e extrair texto dele. Depois de extrair o texto, você pode copiar os dados do texto extraído para a área de transferência. O bom deste software é que ele pode reconhecer texto de vários idiomas além do inglês. Se este software não for capaz de reconhecer nenhum idioma específico, você poderá usar a opção Adicionar idiomas para baixar e instalar um pacote de idiomas para este software.
Como extrair texto da imagem usando GT Text:
- Inicie este software e use a opção Abrir para carregar uma imagem ou use a opção Capturar imagem da tela para capturar uma parte da tela.
- Depois disso, clique na opção Imagem OCR para iniciar o processo de OCRess.
- Assim que o processo de OCR for concluído, você poderá visualizar uma janela pop-up contendo o texto reconhecido. Ao pressionar o botão Continuar nesta janela pop-up, você pode copiar o texto extraído para a área de transferência.
Recursos adicionais:
- Salvar imagem: usando-o, você pode salvar a imagem da captura de tela capturada em PNG, BMP, JPEG, etc., formatos de imagem.
- Imprimir: permite imprimir diretamente ou salvar a imagem capturada como um documento PDF.
Considerações finais:
É um software de OCR de código aberto simples e direto que torna a tarefa de extração de texto de uma imagem muito fácil.
Página inicial Página de download
Capture2Text
Capture2Text é mais um software OCR de código aberto gratuito para Windows. Este software de código aberto permite capturar uma parte da tela e, em seguida, extrair o texto dela usando algoritmos de OCR. Para ativar este software, você só precisa usar as teclas de atalho Win + Q .
Este software pode reconhecer textos de sete idiomas diferentes, nomeadamente inglês, francês, alemão, japonês, coreano, russo, e espanhol. Depois de reconhecer o texto, abre uma janela pop-up mostrando o texto reconhecido.
Como extrair texto usando este software OCR de código aberto:
- Pressione Win+Q tecla de atalho para ativar este software e, em seguida, selecione uma área da tela que contenha algum texto.
- Depois de selecionar uma área, pressione o clique esquerdo para iniciar o processo de OCR.
- Depois que o processo de OCR for concluído, você poderá visualizar uma janela pop-up contendo o texto reconhecido que pode ser facilmente copiado.
Recursos adicionais:
- Fala: É um recurso de conversão de texto em fala que pode ler o texto extraído por este software.
- Traduzir: Permite traduzir um trecho de texto de um idioma para outro idioma. Para traduzir o texto, ele usa o serviço Google Tradutor.
- Teclas de atalho: Usando-o, você pode alterar as teclas de atalho deste software.
Considerações finais:
É outro software de OCR de código aberto simples de usar que qualquer pessoa pode usar sem muita dificuldade.
Página inicial Página de download
Snipping-Ocr
Snipping-Ocr é outro software OCR de código aberto gratuito para Windows. É outro software de OCR fácil de usar, através do qual você pode selecionar uma parte da tela e extrair todas as informações de texto presentes nela. Para extrair texto, este software usa os algoritmos SpaceOCR e Tesseract. De acordo com sua necessidade, você pode escolher qualquer um dos dois algoritmos de OCR disponíveis. Este software é capaz de reconhecer e extrair texto dos idiomas espanhol e inglês.
Como fazerextrair texto usando Snipping-Ocr:
- Inicie este software e pressione as teclas Ctrl+Shift+C para ativar o recurso de captura de tela deste software.
- Depois disso, selecione uma região da tela com a ajuda do mouse e solte o botão esquerdo do mouse para iniciar o processo de OCR.
- Quando o processo de OCR é concluído, você pode visualizar o texto reconhecido em uma janela pop-up que pode ser copiada.
Considerações finais:
É outro software OCR simples de código aberto através do qual você pode extrair rapidamente o texto de uma imagem ou conteúdo da web presente em sua tela.
Página inicial Página de download
GOCR
GOCR é o próximo software OCR de código aberto gratuito para Windows e Linux. É um software baseado em linha de comando que não vem com uma interface gráfica do usuário. Você precisa usar comandos específicos para extrair texto usando este software.
Ele é capaz de extrair texto de imagens de vários formatos como PNG, PNM, PPX, PBM, etc. No entanto, durante meus testes deste software, ele só foi capaz de extrair texto de
Como extrair texto da imagem usando comandos:
- Primeiro, copie e cole a imagem PNM na pasta principal deste software.
- Depois disso, inicie este software usando o prompt de comando e escreva este comando
gocr049.exe -i sample1.pnm -o output.txt. - Por fim, pressione o botão Enter para extrair o texto e salvá-lo no arquivo TXT.
No comando acima, substitua sample1 pelo nome da sua imagem e substitua output pelo nome que deseja dar ao arquivo de saída.
Limitações:
- A falta da interface gráfica do usuário é sua principal limitação.
- Sua incapacidade de extrair texto de qualquer formato de imagem diferente do formato de imagem PNM é outra grande limitação.
Considerações finais:
É outro software de reconhecimento óptico de caracteres de código aberto capaz de extrair texto de imagens.