Читаем Цифровой журнал «Компьютерра» № 2 полностью

Со всеми этими слабинками жить удавалось вполне припеваючи, так что к «восьмёрке» и «девятке» «Файнридера», с помощью которых перегнал по меньшей мере три сотни тысяч (!) книжных страниц в электронный вид (я читаю только электронные книги — бумажные люблю лишь держать-крутить в руках и… нюхать! Да-да, есть у меня такая персональная токсикомания), испытывал давнюю и стойкую приязнь.

Правда, рассказом о двух предыдущих — на мой взгляд, вполне себе удачных — версиях «Файнридера» я бессовестно манкировал, ибо радикальных улучшений и без того пристойного кода не обнаружил. Отсутствие этих улучшений, кстати, надолго отвратило от тестирования программ Abbyy Антонелло, который для себя лично твёрдо решил, что качественное развитие «распознавалки» закончилось где-то на 6-й версии, после которой каждый новый релиз привносил нового лишь по линии рюшечек и шашечек.

Я же, будучи человеком не столько дотошным, сколько романтичным, в чудеса верящим, исправно устанавливал и тестировал всякую новую версию «Файнридера», констатировал её «нехужесть» относительно версии предыдущей и на том успокаивался до лучших времён.

С «десяткой», однако, ситуация изменилась. То ли извелся в ожидании, то ли пресс-релиз Abbyy подогрел: «По сравнению с ABBYY FineReader 9.0 в новой версии программы существенно улучшено качество распознавания документов со сложной структурой — таблиц, контрактов, журнальных статей с текстами поверх картинок, графиками и рисунками. Гораздо проще считываются и переводятся в нужные форматы изображения низкого качества — факсы и снимки, сделанные с помощью фотокамеры мобильного телефона. А документы, снятые обычными цифровыми фотоаппаратами, ABBYY FineReader 10 преобразует на 30 % точнее предыдущей версии программы. В десятой версии увеличено число языков распознавания — теперь их стало 186. При этом качество „понимания“ текстов на азиатских языках улучшилось на 30 %, а на европейских — на 20 %».

Такое впечатление, что разработчики буквально мысли мои читали, внося улучшения в код «десятки» (сравните текст пресс-релиза с моим списком недоработок страницей выше). Добавьте сюда анонс улучшения распознавания формата djvu, в котором у меня скопилось огромное количество электронных книг, и вы поймете трепетное нетерпение, с которым я взялся за тестирование FineReader 10.

День, когда Abbyy представляла новый релиз своего продукта журналистам, я отметил ударным сбором винограда на своей молдавской фазенде, а потому официально-именного вручения коробочной версии не состоялось. Но это, знаете ли, и замечательно (как в том анекдоте про чукчу: «Жена, цяйника закипел?» — «Не закипел!» — «Ну и халасо, ста не закипел!»), потому как по случаю могу позволить себе большую вольность (не помню, делился ли публично своими морально-этическими принципами, которых придерживаюсь беспрекословно в сношениях с разработчиками и производителями: если мне передают программу или железяку на тестирование официально и по собственной доброй воле, я пишу только положительные отзывы, в случае же отрицательных впечатлений просто вообще ничего не пишу).

Короче говоря, десятый релиз FineReader я грубо конфисковал в редакции (коробка лежала безхозно на одном из ничейных столов), установил, а далее — предоставляю читателю результаты тестирования в режиме немого кино: никаких комментариев, никаких наводок, подводок, намеков и прочего психологического давления. Алгоритм простой: вот фотография или скриншот исходного изображения с текстом, вот — результат его оптической обработки «Файнридером». Дывытэся сами и, как говорят наши незалежно гриппующие братья по разуму, багатэйте думкою!

Самое пикантное, что на момент написания этого слова («пикантное») — я сам ещё не знаю, какие результаты продемонстрирует «Файнридер»! Ни разу даже ещё не запускал программу, лишь установил и зарегистрировал. Что ж, тем объективнее будет наше немое кино. Тем ценнее окажется обнажёнка фактов для потенциальных раздумщиков («Апгрейдиться или не апгрейдиться?»). Итак, начнём.

Первый OCR — анкета-заявление для получения загранпаспорта, сфотографированная со стенда камерой коммуникатора HTC Touch HD. Камера хоть и 5-мегапиксельная, но поганая-препоганая, так что у «Файнридера» есть все шансы продемонстрировать заявленное улучшение оптического распознавания текста, снятого некошерной мыльницей. Вот сама анкета:

Вот OCR, выполненный FineReader 10:

Меня так и распирают эмоции — до того хочется прокомментировать полученный результат, но раз обещал кино немое — обещание сдержу и буду молчать аки сом.

Сказать, что фотография анкеты-заявления чудовищная по качеству, значит ничего не сказать. Что ж, облегчим «Файнридеру» задачу и подберём картинку полегче, да хоть бы такую — с реквизитами УФМС:

Фотография по-прежнему жуткая, к тому же ещё и без фокуса да мутная, но зато — без таблиц и сложной структуры. «Файнридер 10» оценил упрощение структуры и распознал фотографию раза в четыре быстрее, чем предыдущую:

Наконец, последний тест — скармливаю «десятке» сложную дежавюшку (текст в формате djvu):

Перейти на страницу:

Похожие книги

1С: Управление небольшой фирмой 8.2 с нуля. 100 уроков для начинающих
1С: Управление небольшой фирмой 8.2 с нуля. 100 уроков для начинающих

Книга предоставляет полное описание приемов и методов работы с программой "1С:Управление небольшой фирмой 8.2". Показано, как автоматизировать управленческий учет всех основных операций, а также автоматизировать процессы организационного характера (маркетинг, построение кадровой политики и др.). Описано, как вводить исходные данные, заполнять справочники и каталоги, работать с первичными документами, формировать разнообразные отчеты, выводить данные на печать. Материал подан в виде тематических уроков, в которых рассмотрены все основные аспекты деятельности современного предприятия. Каждый урок содержит подробное описание рассматриваемой темы с детальным разбором и иллюстрированием всех этапов. Все приведенные в книге примеры и рекомендации основаны на реальных фактах и имеют практическое подтверждение.

Алексей Анатольевич Гладкий

Экономика / Программное обеспечение / Прочая компьютерная литература / Прочая справочная литература / Книги по IT / Словари и Энциклопедии