Софт для мобильных устройств в 99 случаев из 100 пишется доморощенными любителями-наколеночниками, вчерашними (и сегодняшними) школьниками, в лучшем случае — софоморами. По этому причине мы и наблюдаем колоссальную пропасть между потенциалом мобильного «железа» и программным наполнением наших смартфонов и планшетов.
Возвращаемся теперь к Abbyy FineReader Touch для iPhone. Программа меня заинтриговала именно прорывом в царство серьезного софта из привычной мобильной песочницы. Функционал оптического распознавания текта (OCR) — это уже по-взрослому. Скажем, движок преобразования текста в речь — вроде того, что в строен в микрочудо Evolvo («Об Алёне из Эволвы и пальцевом вводе косинуса«) — также принадлежит уже к категории взрослых продуктов, однако по сложности реализации очевидно уступает OCR.
Скажу сразу, ABBYY не совершила революционного прорыва, написав программу для оптического распознания речи, задействующую непосредственно возможности мобильной операционной системы (iOS). Однако ABBYY предложила весьма оригинальную и очень, на мой взгляд, перспективную парадигму, которая в ближайшем будущем позволит малой кровью, но при этом достаточно эффективно компенсировать недостаток взрослого софта на наших смартфонах. Во всяком случае нам не придется ждать, пока народится и оформится профессионально новое поколение ответственных и умелых программистов :)
Если коротко, то суть подхода ABBYY к решению вопроса сводится к дистанционному делегированию услуг. Выглядит это следующим образом:
1) Мы фотографируем встроенной в айфон камерой любой текстовых документ:

Очень удобный момент: электронную кнопку затвора можно нажимать сколько угодно раз — FineReader Touch автоматически добавляет всё новые и новые страницы до тех пор, пока вы не дадите программе понять, что съемка завершена. Это очень удобно, скажем, в ситуации, когда вы заглянули в книжный магазин, зачитались журнальной статьей (или книгой :) и решили отложить чтение, либо просто сохранить текст в электронном виде. В этом случае вы фотографируете нужные страницы и сохраняете их в FineReader Touch.
2) Проводим предварительную обработку изображения (ротация и обрезка):
Обратите внимание: изображения в техническом отношении очень сложные. FineReader Touch автоматически пытается поймать верную проекцию изображения, учитывая оптическое искажение. После обрезки видно, что «рыбий глаз» сильный и движку OCR придется серьезно попотеть.
3) Нажимаем кнопку «Распознать» и программа FineReader Touch … отсылает изображения на специальный сервер ABBYY!
Да, я понимаю ваше разочарование: подлинного чуда не происходит — могучее железо айфона не задействуется для непосредственного распознания текстовой графики и волшебной придачи ему оцифрованного вида. Зато происходит чудо поменьше: наша задача так или иначе выполняется, причем с минимальной для конечного пользователя головной болью!
Вспомните, сколько времени у нас уходило для OCR в программе FineReader! Сколько кнопочек приходилось нажимать, сколько настроек подкручивать, сколько исправлений вносить в выданный компьютером результат. Делегируя услуги на сервер ABBYY, мы экономим уйму времени. При условии, разумеется, что полученный с сервера результат окажется как минимум пристойным (а как максимум — безупречным).
Сервер ABBYY вернул обработанный и распознанный документ через четыре минуты. Следить за окончанием работы не обязательно: отчет о результате поступит в приложение в принудительном режиме, а результат распознавание будет безвозмездно храниться на сервере 14 дней:
Обратите внимание на изменение цифры «баланса» — было 97, стало 94. FineReader Touch изначально позволяет бесплатно распознать 100 страниц текста. После исчерпания лимита, вы пополняете баланс, докупая пакеты по 100 страниц.
Поглядим теперь на распознание текста из нашего примера (программа выдает результат в формате DOCX):
Тот же текст, открытый в читалке GoodReader:

Общее впечатление: один в один «сырой вариант» после обработки стационарным FineReader’ом, после которого текст доводится до ума уже ручками. В мобильных условиях fine tuning выполняется в любом редакторе, установленном на смартфоне:
По гамбургскому счету полностью автономное приложение для распознавания текста на смартфоне в функциональном отношении было бы предпочтительнее. Но это лишь в том случае, если для вас работа с OCR является важным элементом жизни (профессии). При возникновении потребности в распознании текста от случая к случаю вариант с делегированием услуг серверу, реализованный ABBYY в FineReader Touch, явно предпочтительнее. И для пользователя, и — уж подавно! — для разработчика, поскольку встроенные продажи 100-страничных пакетов распознавания открывает приятный канал для денежных поступлений.
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии