Este documento discute um sistema de reconhecimento óptico de caracteres (OCR) para reconhecer placas de veículos. Ele apresenta os métodos necessários como binarização, segmentação, template matching e reconhecimento de caracteres. O documento também resume artigos relacionados e demonstra os processos de isolamento da placa e extração do texto, incluindo binarização, erosão, dilatação e suavização da imagem.
4. Proposta
Sistema de Reconhecimento OCR
Reconhecimento de caracteres de uma origem, seja uma
imagem, foto ou uma placa de carro.
Ferramentas:
● OpenCV e Tesseract
5. Proposta
Desafios
● Entendimento da API Tesseract
● Tratamento de imagens
○ Métodos necessários para o desenvolvimento.
■
Localizar o texto na
imagem;
■ Isolar o texto do
‘background’;
6. Artigos relacionados
BASSIL, Y., ALWANI, M. OCR Post-Processing Error Correction algorithm
using Google’s Online Spelling Suggestion. LACSC – Lebanese
Association for Computational Sciences january 2012.
ALVES, W. A. L. et al. Uma abordagem para localização e reconhecimento
de placas de licenciamento veicular por meio de operadores
morfológicos e busca por template. Exacta, São Paulo, v. 9, n. 3, p. 355362, 2011.
CONCI, A., HISS MONTEIRO, L. Reconhecimento de Placas de Veículos
por Imagem.
FARUK, A., MANJUMDER, N., BASU, S., NASIPURI, M. Design of an Optical
Character Recognition System for Camerabased Handheld Devices. IJCSI
International Journal of Computer Science Issues, july 2011
7. OCR Post-Processing Error Correction
algorithm using Google’s Online Spelling
Suggestion
•
•
•
Demonstração do OCR sobre um
documento qualquer;
Digitalização;
Reconhecimento das características
•
•
Extração do texto;
Correção de erros com o mecanismo de
sugestão do Google.
8. OCR Post-Processing Error Correction
algorithm using Google’s Online Spelling
Suggestion
•
Alguns erros de reconhecimento
•
•
OCR pode confundir uma letra ‘S’ com o
número ‘5’ ou o ‘B’ com o número ‘8’.
Correção baseada no contexto e dicionário
(abrange todas as palavras do vocabulário
específico).
10. Uma Abordagem para Localização e Reconhecimento
de Placas de Licenciamento Veicular por meio de
Operadores Morfológicos e Busca por Template
•
Localização e reconhecimento da placa
na imagem.
•
Encontrar a posição da placa;
•
Template matching;
•
Operações com a largura e altura dos
caracteres.
Geometria da fonte - distância dos caracteres.
Comparação com placas previamente
catalogadas.
Característica extraída.
11. Reconhecimento de Placas de Veículos por
Imagem
•
Abordagem de técnicas de tratamento e
transformações da imagem.
•
•
•
•
Binarização - treshold;
Dilatação;
Erosão;
Segmentação;
12. Design of an Optical Character Recognition
System for Camerabased Handheld Devices
•
Motivação principal: digitalização de
imagens, principalmente documentos;
•
Segmentação feita a partir da linha do
texto;
Como reconhecer os caracteres?
•
13. Design of an Optical Character Recognition
System for Camerabased Handheld Devices
15. Métodos necessários para a
resolução do problema
●
●
●
●
●
Binarização
Segmentação
Template matching
Reconhecimento de caracteres
16. Binarização
● A intensidade da imagem passa a ter apenas dois
níveis distintos, para que possamos separar o objeto do
fundo da imagem. Esse método pode ser descrito
através da aplicação da função s = T(r).
● A função T(r) compara o sinal de entrada com um valor
de threshold (T), escolhido como referência para a
separação dos níveis de cinza. O sinal de saída,
apresentado é obtido pela relação:
s = {1 para r > T ou 0 para r < T}.
17. Segmentação
● A segmentação é o processo de dividir uma imagem
em regiões, ou objetos. Em outras palavras, a
segmentação simples consistem em localizar objetos e
formas em imagens.
● O uso desta técnica em nossa proposta será para
podermos reconhecer na imagem aonde estão os
caracteres.
18. Template matching
● Através de um padrão, conseguir indentificá-lo, caso
ele apareca, em alguma imagem qualquer.
● Será usado para dizer qual caractere foi encontrado,
comparando o caractere segmentado da imagem
analisada com algum banco de padrões, para que o
mesmo possa ser reconhecido.
○ Cuidado na hora de reconhecer caracteres e
números. A letra ‘S’ pode ser confundida com o
número ‘5’ ou a letra ‘O’ pode ser confundida com o
número ‘0’.
19. Reconhecimento de caractere
● O reconhecimento de caracteres é a técnica do OCR.
Permite converter imagens com texto em documentos
de texto usando algoritmos de computação
automatizados. As imagens podem ser processadas
individualmente (arquivos .jpg, .png e .gif) ou em
documentos PDF com várias páginas (.pdf).