С «десяткой», однако, ситуация изменилась. То ли извелся в ожидании, то ли пресс-релиз Abbyy подогрел: «По сравнению с ABBYY FineReader 9.0 в новой версии программы существенно улучшено качество распознавания документов со сложной структурой — таблиц, контрактов, журнальных статей с текстами поверх картинок, графиками и рисунками. Гораздо проще считываются и переводятся в нужные форматы изображения низкого качества — факсы и снимки, сделанные с помощью фотокамеры мобильного телефона. А документы, снятые обычными цифровыми фотоаппаратами, ABBYY FineReader 10 преобразует на 30 % точнее предыдущей версии программы. В десятой версии увеличено число языков распознавания — теперь их стало 186. При этом качество „понимания“ текстов на азиатских языках улучшилось на 30 %, а на европейских — на 20 %».
Такое впечатление, что разработчики буквально мысли мои читали, внося улучшения в код «десятки» (сравните текст пресс-релиза с моим списком недоработок страницей выше). Добавьте сюда анонс улучшения распознавания формата djvu, в котором у меня скопилось огромное количество электронных книг, и вы поймете трепетное нетерпение, с которым я взялся за тестирование FineReader 10.
День, когда Abbyy представляла новый релиз своего продукта журналистам, я отметил ударным сбором винограда на своей молдавской фазенде, а потому официально-именного вручения коробочной версии не состоялось. Но это, знаете ли, и замечательно (как в том анекдоте про чукчу: «Жена, цяйника закипел?» — «Не закипел!» — «Ну и халасо, ста не закипел!»), потому как по случаю могу позволить себе большую вольность (не помню, делился ли публично своими морально-этическими принципами, которых придерживаюсь беспрекословно в сношениях с разработчиками и производителями: если мне передают программу или железяку на тестирование официально и по собственной доброй воле, я пишу только положительные отзывы, в случае же отрицательных впечатлений просто вообще ничего не пишу).
Короче говоря, десятый релиз FineReader я грубо конфисковал в редакции (коробка лежала безхозно на одном из ничейных столов), установил, а далее — предоставляю читателю результаты тестирования в режиме немого кино: никаких комментариев, никаких наводок, подводок, намеков и прочего психологического давления. Алгоритм простой: вот фотография или скриншот исходного изображения с текстом, вот — результат его оптической обработки «Файнридером». Дывытэся сами и, как говорят наши незалежно гриппующие братья по разуму, багатэйте думкою!
Самое пикантное, что на момент написания этого слова («пикантное») — я сам ещё не знаю, какие результаты продемонстрирует «Файнридер»! Ни разу даже ещё не запускал программу, лишь установил и зарегистрировал. Что ж, тем объективнее будет наше немое кино. Тем ценнее окажется обнажёнка фактов для потенциальных раздумщиков («Апгрейдиться или не апгрейдиться?»). Итак, начнём.
Первый OCR — анкета-заявление для получения загранпаспорта, сфотографированная со стенда камерой коммуникатора HTC Touch HD. Камера хоть и 5-мегапиксельная, но поганая-препоганая, так что у «Файнридера» есть все шансы продемонстрировать заявленное улучшение оптического распознавания текста, снятого некошерной мыльницей. Вот сама анкета:
Вот OCR, выполненный FineReader 10:
Меня так и распирают эмоции — до того хочется прокомментировать полученный результат, но раз обещал кино немое — обещание сдержу и буду молчать аки сом.
Сказать, что фотография анкеты-заявления чудовищная по качеству, значит ничего не сказать. Что ж, облегчим «Файнридеру» задачу и подберём картинку полегче, да хоть бы такую — с реквизитами УФМС:
Фотография по-прежнему жуткая, к тому же ещё и без фокуса да мутная, но зато — без таблиц и сложной структуры. «Файнридер 10» оценил упрощение структуры и распознал фотографию раза в четыре быстрее, чем предыдущую:
Наконец, последний тест — скармливаю «десятке» сложную дежавюшку (текст в формате djvu):
Скан книги выполнен довольно коряво, к тому же и текст — не подарок: дореволюционная русская орфография. «Файнридер» выдал такой результат:
Нет, больше не могу и посылаю Великого Немого по боку! Как хотите, но я лично перехожу на «десятку» безоговорочно, читателям же даю единственную рекомендацию (ну не слепые же тут дети собрались!): основное требование к фотографированию мыльницами — следите за фокусом! Судя по всему «десятке» никакие сложные структуры расположения текста, блики и вспышки не страшны так, как мутное двоящееся изображение. С последним он однозначно не справляется. Что ж — определяется фронт работ для FineReader 11!
Марина Пелепец
Сергей Орловский (Nival): А на десерт будет полноценная модель мира
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии