Читаем Компьютерра PDA N161 (25.02.2012-02.03.2012) полностью

Исходя из этих посылок была сформулирована идея Универсальной Семантической Иерархии (УСИ), способной описывать явления от общего к частному. На составление этой иерархии у ABBYY и ушло 15 лет. Получилось то, что вы уже знаете: только на сегодняшний день 70 тысяч понятий в универсальной части когнитивной модели, более 80 тысяч - в русской, более 90 - в английской.

Алгоритм машинного перевода, основанного на УСИ, выглядит следующим образом:

- Лексический анализ текста (выделение слов, знаков препинания, цифр и прочих текстовых единиц);

- Морфологический анализ (определение грамматических характеристик лексем);

- Синтаксический анализ (установление структуры предложения);

- Семантический анализ (выявление выражаемого значения в системе языка);

- Синтез из универсальной семантической структуры предложения на выходном языке.

В результате подбор слов для перевода осуществляется не напрямую из первого языка, а из понятийного набора, который, условно говоря, «висит» на той же ветке универсального семантического дерева, но только уже со стороны второго языка.

Поскольку модель УСИ сквозная, нижестоящие элементы системы по иерархии наследуют признаки вышестоящих элементов. Это простое, казалось бы, обстоятельство позволяет добиваться беспрецедентной точности машинного перевода, поскольку каждое слово из переводимого предложения описывается максимальным набором понятийных эквивалентов, причем не только видового, но и родовых качеств на всех уровнях смысловой иерархии.

В УСИ предусмотрены взаимосвязи между элементами структуры, относящимися к разным классам, и эти связи также структурированы и формализированы, что позволяет выполнять многоуровневый понятийный анализ текста, также повышающий качество перевода.

В процессе создания УСИ разработчикам открылись неожиданные грани использования системы: помимо машинного перевода язык УСИ можно использовать в интеллектуальных смысловых поисках и, возможно, автоматическом распознавании речи на новом качественном уровне, который достигается за счет глубокой интеграции и взаимопроникновения синтаксиса и семантики в модели универсальной семантической иерархии.

На альтернативных направлениях возникают, конечно, и свои сложности. Скажем, сегодня самым узким местом для глобального применения семантико-синтаксического анализа в массовых поисковых системах выступают очень высокие требования к компьютерным мощностям, необходимым для индексации информационных массивов на понятийном уровне. Требования эти несоизмеримо выше, чем при существующих формах традиционной индексации. Впрочем, уже сегодня методика семантико-синтаксического анализа может эффективно применяться (и применяется ABBYY - видел полностью функциональный прототип поискового движка собственными глазами) для более целенаправленного и узкого поиска в закрытых корпоративных системах.

Мировых аналогов у Compreno сегодня нет, хотя в некоторых университетах и ведутся разработки в аналогичных направления. Однако фора в 15 лет, задействованные огромные человеческие ресурсы и материальные затраты позволяют надеяться, что ABBYY таки сумеет застолбить для себя эксклюзивное место первопроходца. На руку компании играет и то обстоятельство, что последние 10 лет подавляющая масса исследований в мире велась в русле статистической модели машинного перевода.

За теоретическим введением в Compreno последовало более чем часовое погружение в демонстрацию работы движка компьютерного перевода, основанного на УСИ. Я сидел в одном из конференц-залов офиса ABBYY и непрестанно протирал глаза, все еще до конца не веря в услышанное и увиденного.

Теперь пользуюсь разрешением и демонстрирую читателям сравнение переводов, выданных Compreno и статистическим переводчиком (каким - гостеприимные хозяева просили не называть, но думаю, не маленькие и сами догадаетесь ☺

Не сомневаюсь, что для любого человека, знающего толк в переводах, это сравнение откроет новую вселенную. Вот работа статистического переводчика (разумеется, предложения подобранны специально «поддых», поскольку бьют в самые слабые места статистической модели перевода).

Это, господа, просто другой космос, другой уровень понимания текста. Это - революция!

Смотрел я на это, слушал внимательно и, похоже, начал улавливать тайный смысл (шуточного) мотивационного плаката, висящего в одном из офисных коридоров ABBYY:

<p id="sec_4">Что показывают на Mobile World Congress 2012</p>

Автор: Андрей Письменный

Опубликовано 29 февраля 2012 года

На что похожи новые смартфоны HTC One X, HTC One S и HTC One V

К выставке Mobile World Congress 2012, которая проходит в Барселоне, в HTC придержали три новые модели смартфонов на Android 4.0 Ice Cream Sandwich. Все они носят имя HTC One, различается лишь индекс: X, S и V.

Первый взгляд на Samsung Galaxy beam — телефон со встроенным проектором

Перейти на страницу:

Все книги серии Компьютерра PDA

Компьютерра PDA 03.04.2010-09.04.2010
Компьютерра PDA 03.04.2010-09.04.2010

ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Светлее бледногоВасилий Щепетнев: Василий Щепетнёв: Цена верностиБерд Киви: Кивино гнездо: И биометрия на всех Николай Маслухин: Промзона: проект "Google-конверты" и диван-саквояжЮрий Ревич: Существуют ли государственные базы данных?Игорь Терехов: Flash посадили в "песочницу" ChromeМихаил Карпов: iPad: очереди, большие люди и хакерыЮрий Ильин: На что живёт Opera MiniВаннах Михаил: Кафедра Ваннаха: Информационные технологии и эскапизм Игорь Осколков: Что вычисляют российские суперкомпьютерыМихаил Карпов: Анатолий Вассерман: Пирамида МаслоуАндрей Письменный: Машинное обучение улучшило "Яндекс"Игорь Терехов: Проблемный BuzzВасилий Щепетнев: Василий Щепетнёв: Опоздавший к присягеИгорь Терехов: "Макхост" ушёл в оффлайнИрина Матюшонок: Почему Google отстаёт от "Яндекса"Андрей Письменный: Первые iPad, попавшие в Россию, скупают втридорогаОлег Парамонов: Первый взгляд на iPadНиколай Маслухин: Промзона: Светящиеся деньгиМихаил Карпов: Мартовский приз ReaditorialВаннах Михаил: Кафедра Ваннаха: Российская DARPA и гипотеза ФишераВиталий Губский: Надёжное железо (история и сегодняшние факты)Анатолий Вассерман: Досудебное помилованиеКрестников Евгений: Геоконтекстная реклама добралась до РоссииМихаил Карпов: В iPhone OS 4 появится многозадачностьБерд Киви: Кивино гнездо: Теневая сторона сетиНиколай Маслухин: Промзона: ножная мышьИгорь Осколков: Lenovo Thinkpad X100e – компактный ноутбук для бизнесаВасилий Щепетнев: Василий Щепетнёв: Власть и магияИгорь Терехов: Игровым приставкам настанет конецМихаил Карпов: Через три года мемристоры заменят транзисторы

Журнал «Компьютерра» , Компьютерра

Документальная литература / Прочая компьютерная литература / Прочая документальная литература / Документальное / Книги по IT
Компьютерра PDA 20.03.2010-26.03.2010
Компьютерра PDA 20.03.2010-26.03.2010

ОГЛАВЛЕНИЕВаннах Михаил: Кафедра Ваннаха: Пороки, ракеты, компьютеры Берд Киви: Кивино гнездо: Сеть на колёсахМихаил Карпов: Февральский призНиколай Маслухин: Промзона: Вязаный твиттер и дизайнерские светофорыМихаил Карпов: Samsung Forum 2010: робопылесосы NavibotАндрей Письменный: Opera наверстала отставание от других браузеровДмитрий Плесконос Развитие Интернета - один из приоритетовСергей Голубицкий: Голубятня: Непростой мальчик РобертЕвгений Крестников: Электронных денег станет больше, если их не запретятАнатолий Вассерман: Газоносные сланцыИгорь Терехов: Прощание с PalmЕвгений: Возраст честностиМихаил Карпов: Samsung Forum 2010: 3D-телевизорыВасилий Щепетнев: Василий Щепетнёв: Спецназ Леонардо в боюОлег Нечай: Ловушка номер 3D: о чём молчит рекламаЛеваков Владимир: Программы лояльности: чего не хватает российскому IT-рынку?Олег Данилов: Сколково открытий чудныхВаннах Михаил: Кафедра Ваннаха: Свобода и буржуазияРоман Георгиев: Грозовой перевал: кризис 3D-отрасли в РоссииМихаил Карпов: У новой приставки Nintendo будет стереоэкранЮрий Ревич: Политически корректные фильтрыАртём Алексеев: Виртуальная реальность нашей повседневностиИгорь Осколков: Arion рендерит световые волны параллельноОлег Нечай: Игрушечное кино: на что годятся пикопроекторыАндрей Письменный: Тег video делает Firefox устаревшим браузеромВасилий Щепетнев: Василий Щепетнёв: След жирафаАлександр Милицкий: УФАС - не указ?Анатолий Вассерман: Индивидуальный и массовый террорПоликарпов, Константин: Туманный экран PolivizorИгорь Терехов: Основатели Skype подались в инвесторыИгорь Осколков: Обзор интернет-устройства Viliv S5Михаил Карпов: Несколько вопросов по следам конференции MIXАндрей Письменный: CloudConf 2010: облачные вычисления в РоссииСергей Голубицкий: Голубятня: Миша, кока, деффкиИгорь Терехов: "Счастливый фермер" неплохо зарабатываетВаннах Михаил: Кафедра Ваннаха: Параллелизм в большом и малом мирахМихаил Карпов: The Beatles Rock Band: взгляд музыкантаРоман Георгиев: Грозовой перевал: российская 3D-анимацияЕвгений Крестников: В. Достов: "Когда мы защищаемся неизвестно от чего, платит всегда покупатель"Олег Нечай: Ёмкостные против резистивныхИгорь Терехов: Технологии будущего по версии Microsoft

Журнал «Компьютерра» , Компьютерра

Документальная литература / Прочая компьютерная литература / Прочая документальная литература / Документальное / Книги по IT
Компьютерра PDA N113 (28.05.2011-03.06.2011)
Компьютерра PDA N113 (28.05.2011-03.06.2011)

ОГЛАВЛЕНИЕСергей Голубицкий: Голубятня: Начало продажВасилий Щепетнев: Василий Щепетнёв: Переход на летние деньгиЕвгений Крестников: Первый взгляд на Fedora Linux 15Евгений Лебеденко, Mobi.ru: Технология Gyricon: забытый электронный папирусВаннах Михаил: Кафедра Ваннаха: Цифровая шарага китайского образцаОлег Нечай: Путеводитель по настольным процессорам AMD (часть 1)Игорь Осколков: Обзор ноутбука Eurocom W860CU CougarВасилий Щепетнев: Василий Щепетнёв: Приказано иметь честьДмитрий Шабанов: Отпечатки пальцев и отпечатки мозгаСергей Голубицкий: Голубятня: Юбилейное откровениеКиви Берд: Кивино гнездо: На звон БитМонетВаннах Михаил: Кафедра Ваннаха: ТМО и парад геевОлег Нечай: Путеводитель по настольным процессорам AMD (часть 2)Берд Киви: На звон БитМонет (часть 2)Василий Щепетнев: Василий Щепетнёв: Просить и не проситьКиви Берд: Кивино гнездо: Зачем вам думать?

Журнал «Компьютерра» , Компьютерра

Документальная литература / Прочая компьютерная литература / Прочая документальная литература / Документальное / Книги по IT

Похожие книги

1937. Трагедия Красной Армии
1937. Трагедия Красной Армии

После «разоблачения культа личности» одной из главных причин катастрофы 1941 года принято считать массовые репрессии против командного состава РККА, «обескровившие Красную Армию накануне войны». Однако в последние годы этот тезис все чаще подвергается сомнению – по мнению историков-сталинистов, «очищение» от врагов народа и заговорщиков пошло стране только на пользу: без этой жестокой, но необходимой меры у Красной Армии якобы не было шансов одолеть прежде непобедимый Вермахт.Есть ли в этих суждениях хотя бы доля истины? Что именно произошло с РККА в 1937–1938 гг.? Что спровоцировало вакханалию арестов и расстрелов? Подтверждается ли гипотеза о «военном заговоре»? Каковы были подлинные масштабы репрессий? И главное – насколько велик ущерб, нанесенный ими боеспособности Красной Армии накануне войны?В данной книге есть ответы на все эти вопросы. Этот фундаментальный труд ввел в научный оборот огромный массив рассекреченных документов из военных и чекистских архивов и впервые дал всесторонний исчерпывающий анализ сталинской «чистки» РККА. Это – первая в мире энциклопедия, посвященная трагедии Красной Армии в 1937–1938 гг. Особой заслугой автора стала публикация «Мартиролога», содержащего сведения о более чем 2000 репрессированных командирах – от маршала до лейтенанта.

Олег Федотович Сувениров , Олег Ф. Сувениров

Документальная литература / Военная история / История / Прочая документальная литература / Образование и наука / Документальное
Хрущёвская слякоть. Советская держава в 1953–1964 годах
Хрущёвская слякоть. Советская держава в 1953–1964 годах

Когда мы слышим о каком-то государстве, память сразу рисует образ действующего либо бывшего главы. Так устроено человеческое общество: руководитель страны — гарант благосостояния нации, первейшая опора и последняя надежда. Вот почему о правителях России и верховных деятелях СССР известно так много.Никита Сергеевич Хрущёв — редкая тёмная лошадка в этом ряду. Кто он — недалёкий простак, жадный до власти выскочка или бездарный руководитель? Как получил и удерживал власть при столь чудовищных ошибках в руководстве страной? Что оставил потомкам, кроме общеизвестных многоэтажных домов и эпопеи с кукурузой?В книге приводятся малоизвестные факты об экономических экспериментах, зигзагах внешней политики, насаждаемых доктринах и ситуациях времён Хрущёва. Спорные постановления, освоение целины, передача Крыма Украине, реабилитация пособников фашизма, пресмыкательство перед Западом… Обострение старых и возникновение новых проблем напоминали буйный рост кукурузы. Что это — амбиции, нелепость или вредительство?Автор знакомит читателя с неожиданными архивными сведениями и другими исследовательскими находками. Издание отличают скрупулёзное изучение материала, вдумчивый подход и серьёзный анализ исторического контекста.Книга посвящена переломному десятилетию советской эпохи и освещает тогдашние проблемы, подковёрную борьбу во власти, принимаемые решения, а главное, историю смены идеологии партии: отказ от сталинского курса и ленинских принципов, дискредитации Сталина и его идей, травли сторонников и последователей. Рекомендуется к ознакомлению всем, кто родился в СССР, и их детям.

Евгений Юрьевич Спицын

Документальная литература
1917: русская голгофа. Агония империи и истоки революции
1917: русская голгофа. Агония империи и истоки революции

В представленной книге крушение Российской империи и ее последнего царя впервые показано не с точки зрения политиков, писателей, революционеров, дипломатов, генералов и других образованных людей, которых в стране было меньшинство, а через призму народного, обывательского восприятия. На основе многочисленных архивных документов, журналистских материалов, хроник судебных процессов, воспоминаний, писем, газетной хроники и других источников в работе приведен анализ революции как явления, выросшего из самого мировосприятия российского общества и выражавшего его истинные побудительные мотивы.Кроме того, авторы книги дают свой ответ на несколько важнейших вопросов. В частности, когда поезд российской истории перешел на революционные рельсы? Правда ли, что в период между войнами Россия богатела и процветала? Почему единение царя с народом в августе 1914 года так быстро сменилось лютой ненавистью народа к монархии? Какую роль в революции сыграла водка? Могла ли страна в 1917 году продолжать войну? Какова была истинная роль большевиков и почему к власти в итоге пришли не депутаты, фактически свергнувшие царя, не военные, не олигархи, а именно революционеры (что в действительности случается очень редко)? Существовала ли реальная альтернатива революции в сознании общества? И когда, собственно, в России началась Гражданская война?

Дмитрий Владимирович Зубов , Дмитрий Михайлович Дегтев , Дмитрий Михайлович Дёгтев

Документальная литература / История / Образование и наука