SlideShare una empresa de Scribd logo
1 de 14
Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.
Оптическое распознавание   - это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.
Плюсы Перевод в текстовый вид очень сложных текстовых документов, включая таблицы, формы, диаграммы, рисунки Проверка орфографии Сохранение файла в любом текстовом формате, а также в форматах электронных таблиц и баз данных
OCR - opticalcharacterrecognition (оптическое распознавание символов)
История OCR Программы появились сначала в США, а затем, и в России. OCR - opticalcharacterrecognition (оптическое распознавание символов) 1978 год - компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов
Программы OCR Recognita Plus DTK фирмыRecognita Corporation †,  Венгрия  TextBridgeфирмы †Xerox Imaging Systems TypeReaderфирмы ExperVision †, США  СharacterEyes фирмы Ligature, Израиль IRIS OCR фирмы I.R.I.S.,Бельгия  Easy Reader фирмы†Inovatic International, Франция WordScan Plus и OmniPage Professional †фирмыCaera, США
Системы OCR в России OCR CuneiForm; † † ABBYY FineReader
Этапы преобразования документа в электронный вид OCR-системами Сканирование и предварительная обработка изображения Анализ структуры документа Распознавание Проверка результатов Реконструкция документа (воссоздание его исходного вида) Экспорт
Описание OCR-процедуры Предварительная обработка изображения Распознавание объектов высших уровней. Бинаризация Распознавание символов Структурирование гипотез. Словарная проверка Синтез электронного документа
Базовые принципы технологий распознания текста Принципы IPA: Целостность (integrity) Целенаправленность (purposefulness) Адаптивность (Adaptability) Многоуровневый анализ документа
Принципы IPA Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее из связанных частей
Принципы IPA Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную цель. Согласно этому принципу, распознавание представляет собой процесс выдвижения гипотез о целом объекте и целенаправленной их проверки
Принципы IPA Принцип адаптивности (adaptability) подразумевает способность системы к самообучению. 
Ocr

Más contenido relacionado

Destacado

eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011
eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011
eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011ITACA-TSB
 
Sao paulo geep25 fundamentos moveup
Sao paulo geep25 fundamentos moveupSao paulo geep25 fundamentos moveup
Sao paulo geep25 fundamentos moveupMarco Coghi
 
Logo y nombre Play In
Logo y nombre Play InLogo y nombre Play In
Logo y nombre Play Ina_verdoy
 
Samudaya jatha booklet with picturesfinal
Samudaya jatha booklet with picturesfinalSamudaya jatha booklet with picturesfinal
Samudaya jatha booklet with picturesfinalC-DAC
 
IMPLANTAÇÃO DE ESCRITÓRIO
IMPLANTAÇÃO DE ESCRITÓRIOIMPLANTAÇÃO DE ESCRITÓRIO
IMPLANTAÇÃO DE ESCRITÓRIOMarco Coghi
 
Curitiba gp01.2012-fgp-w project
Curitiba gp01.2012-fgp-w projectCuritiba gp01.2012-fgp-w project
Curitiba gp01.2012-fgp-w projectMarco Coghi
 
Monster Some rekrytoinneissa esitysmateriaali
Monster Some rekrytoinneissa esitysmateriaali Monster Some rekrytoinneissa esitysmateriaali
Monster Some rekrytoinneissa esitysmateriaali Quiet Water Oy
 
Google研究会設立趣意書
Google研究会設立趣意書Google研究会設立趣意書
Google研究会設立趣意書Noriyuki Yamazaki
 
Como Abrir uma Empresa de Consultoria
Como Abrir uma Empresa de ConsultoriaComo Abrir uma Empresa de Consultoria
Como Abrir uma Empresa de ConsultoriaÉrico Machado
 
Mamita querida original
Mamita querida originalMamita querida original
Mamita querida originaljepraen
 
Actividad 4: Portafolio de Presentación
Actividad 4: Portafolio de PresentaciónActividad 4: Portafolio de Presentación
Actividad 4: Portafolio de Presentaciónaleperretta
 

Destacado (19)

eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011
eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011
eMotiva presentacion XI Congreso Nacional de Médicos de Residencias 2011
 
Sao paulo geep25 fundamentos moveup
Sao paulo geep25 fundamentos moveupSao paulo geep25 fundamentos moveup
Sao paulo geep25 fundamentos moveup
 
Cultura moche
Cultura mocheCultura moche
Cultura moche
 
Logo y nombre Play In
Logo y nombre Play InLogo y nombre Play In
Logo y nombre Play In
 
+EU
+EU+EU
+EU
 
Samudaya jatha booklet with picturesfinal
Samudaya jatha booklet with picturesfinalSamudaya jatha booklet with picturesfinal
Samudaya jatha booklet with picturesfinal
 
Lição 1
Lição 1Lição 1
Lição 1
 
IMPLANTAÇÃO DE ESCRITÓRIO
IMPLANTAÇÃO DE ESCRITÓRIOIMPLANTAÇÃO DE ESCRITÓRIO
IMPLANTAÇÃO DE ESCRITÓRIO
 
Curitiba gp01.2012-fgp-w project
Curitiba gp01.2012-fgp-w projectCuritiba gp01.2012-fgp-w project
Curitiba gp01.2012-fgp-w project
 
Gilvan Teste
Gilvan TesteGilvan Teste
Gilvan Teste
 
ESCOLED
ESCOLEDESCOLED
ESCOLED
 
Capasiniciodoano
CapasiniciodoanoCapasiniciodoano
Capasiniciodoano
 
Monster Some rekrytoinneissa esitysmateriaali
Monster Some rekrytoinneissa esitysmateriaali Monster Some rekrytoinneissa esitysmateriaali
Monster Some rekrytoinneissa esitysmateriaali
 
Manutenzione correttive e preventive
Manutenzione correttive e preventiveManutenzione correttive e preventive
Manutenzione correttive e preventive
 
Google研究会設立趣意書
Google研究会設立趣意書Google研究会設立趣意書
Google研究会設立趣意書
 
Como Abrir uma Empresa de Consultoria
Como Abrir uma Empresa de ConsultoriaComo Abrir uma Empresa de Consultoria
Como Abrir uma Empresa de Consultoria
 
Mamita querida original
Mamita querida originalMamita querida original
Mamita querida original
 
Vrije Opdracht Tabira Vitalino dos Santos
Vrije Opdracht Tabira Vitalino dos SantosVrije Opdracht Tabira Vitalino dos Santos
Vrije Opdracht Tabira Vitalino dos Santos
 
Actividad 4: Portafolio de Presentación
Actividad 4: Portafolio de PresentaciónActividad 4: Portafolio de Presentación
Actividad 4: Portafolio de Presentación
 

Similar a Ocr

Системы оптического распознавания документов
Системы оптического распознавания документовСистемы оптического распознавания документов
Системы оптического распознавания документовСергей Балан
 
WEB 2.0 НА СЛУЖБЕ СОВРЕМЕННОГО УЧИТЕЛЯ
WEB 2.0 НА СЛУЖБЕ  СОВРЕМЕННОГО УЧИТЕЛЯWEB 2.0 НА СЛУЖБЕ  СОВРЕМЕННОГО УЧИТЕЛЯ
WEB 2.0 НА СЛУЖБЕ СОВРЕМЕННОГО УЧИТЕЛЯfrostblood87
 
диссертационная презентация
диссертационная презентациядиссертационная презентация
диссертационная презентацияSon Ingvar
 

Similar a Ocr (6)

Системы оптического распознавания документов
Системы оптического распознавания документовСистемы оптического распознавания документов
Системы оптического распознавания документов
 
WEB 2.0 НА СЛУЖБЕ СОВРЕМЕННОГО УЧИТЕЛЯ
WEB 2.0 НА СЛУЖБЕ  СОВРЕМЕННОГО УЧИТЕЛЯWEB 2.0 НА СЛУЖБЕ  СОВРЕМЕННОГО УЧИТЕЛЯ
WEB 2.0 НА СЛУЖБЕ СОВРЕМЕННОГО УЧИТЕЛЯ
 
4.5 (1)
4.5 (1)4.5 (1)
4.5 (1)
 
диссертационная презентация
диссертационная презентациядиссертационная презентация
диссертационная презентация
 
Rutoken presentation
Rutoken presentationRutoken presentation
Rutoken presentation
 
test
testtest
test
 

Ocr

  • 1. Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.
  • 2. Оптическое распознавание - это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.
  • 3. Плюсы Перевод в текстовый вид очень сложных текстовых документов, включая таблицы, формы, диаграммы, рисунки Проверка орфографии Сохранение файла в любом текстовом формате, а также в форматах электронных таблиц и баз данных
  • 4. OCR - opticalcharacterrecognition (оптическое распознавание символов)
  • 5. История OCR Программы появились сначала в США, а затем, и в России. OCR - opticalcharacterrecognition (оптическое распознавание символов) 1978 год - компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов
  • 6. Программы OCR Recognita Plus DTK фирмыRecognita Corporation †, Венгрия TextBridgeфирмы †Xerox Imaging Systems TypeReaderфирмы ExperVision †, США СharacterEyes фирмы Ligature, Израиль IRIS OCR фирмы I.R.I.S.,Бельгия Easy Reader фирмы†Inovatic International, Франция WordScan Plus и OmniPage Professional †фирмыCaera, США
  • 7. Системы OCR в России OCR CuneiForm; † † ABBYY FineReader
  • 8. Этапы преобразования документа в электронный вид OCR-системами Сканирование и предварительная обработка изображения Анализ структуры документа Распознавание Проверка результатов Реконструкция документа (воссоздание его исходного вида) Экспорт
  • 9. Описание OCR-процедуры Предварительная обработка изображения Распознавание объектов высших уровней. Бинаризация Распознавание символов Структурирование гипотез. Словарная проверка Синтез электронного документа
  • 10. Базовые принципы технологий распознания текста Принципы IPA: Целостность (integrity) Целенаправленность (purposefulness) Адаптивность (Adaptability) Многоуровневый анализ документа
  • 11. Принципы IPA Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее из связанных частей
  • 12. Принципы IPA Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную цель. Согласно этому принципу, распознавание представляет собой процесс выдвижения гипотез о целом объекте и целенаправленной их проверки
  • 13. Принципы IPA Принцип адаптивности (adaptability) подразумевает способность системы к самообучению.