REPRESENTING AND SPEEDILY IS AN GOOD APT OR COME CAN DIFFERENT NATURAL HERE HE THE A IN CAME THE TO OF TO EXPERT GRAY COME TO FURNISHES THE LINE MESSAGE HAD BE THESE.
Следует отметить, что на выбор нами следующего слова сильно влияет стоящее впереди. И наконец Шеннон обратился к «аппроксимации слов второго порядка»: он выбрал слово наугад, пролистал книгу вперед, пока не обнаружил еще один пример, а потом записал следующее слово:
THE HEAD AND IN FRONTAL ATTACK ON AN ENGLISH WRITER THAT THE CHARACTER OF THIS POINT IS THEREFORE ANOTHER METHOD FOR THE LETTERS THAT THE TIME OF WHO EVER TOLD THE PROBLEM FOR AN UNEXPECTED.
«Определенная последовательность из десяти слов обрушилась на английского писателя, так что характер ее нельзя назвать нерациональным», – с гордостью отметил Шеннон[6].
Постепенно отрывки становились все более приемлемыми, напоминая человеческий язык. Они не были написаны от руки, они генерировались: единственным вмешательством человека в этот процесс было применение правил. Как, задавал вопрос Шеннон, мы получаем английский язык? Мы получаем его, делая наши правила более ограничивающими и делая себя более предсказуемыми. Мы делаем это, становясь менее информативными. И эти стохастические методы – всего лишь модель того выбора, который мы, не задумываясь, делаем каждый раз, когда произносим предложение и отправляем любое сообщение.
Оказывается, что некоторые самые детские вопросы о мире – «Почему яблоки не падают вверх?» – также являются самыми научно продуктивными. Если бы существовал пантеон абсурдных и откровенных вопросов, то туда бы следовало включить и такой вопрос Шеннона: «Почему никто не говорит XFOML RXKHRJFFJUJ?» В поисках ответа на этот вопрос стало ясно, что «свобода нашей речи» – это, по большей части, иллюзия: она происходит из обедненного понимания свободы. Собеседники, обладающие большей свободой, чем мы – свободой, конечно же, в том, что касается неопределенности и информации – сказали бы «XFOML RXKHRJFFJUJ». Flo в реальности огромное множество возможных сообщений заранее исключено для нас, еще до того, как мы произнесем слово или напишем строчку. Мы также лишены свободы слегка изменить одну из удачно сложившихся последовательностей, которые случайно появились в блокноте Шеннона: ТНЕ LINE MESSAGE HAD [ТО] BE THESE.
И все же кому интересна частота появления букв?
Во-первых, специалистам по криптоанализу – и Шеннон был одним из лучших в этой области. Он был знаком с таблицами частоты появления букв, диграмм и триграмм, потому что они были необходимым инструментом шифровальщика. Практически в любом коде преобладают определенные символы, и они, вероятней всего, обозначают наиболее распространенные знаки. Вспомните, как в любимом рассказе Шеннона «Золотой жук» эксцентричный господин Легран обнаружил спрятанный клад, разгадав этот кажущийся недоступным пониманию код:
53##+305))6*;4826) 4#.) 4#); 806*;48+81 160))85;;]8*;: #*8+83
(88)5*+;46(;88*96*?;8)*#(;485);5*+2:*#(;4956*2(5*=4)81 18*;
4069285);)6+8)4##;1#9;48081;8:8#1;48+85;4)485+528806*81
(#9;48;(88;4(#?34;48)4#;161;:188;#?;
Он начал, как все опытные шифровальщики, с того, что подсчитал частоту появления знаков. Символ «8» появлялся чаще, чем другие – 33 раза. Эта маленькая деталь стала той трещиной, которая взломала всю структуру. Ниже приведено объяснение господина Леграна, которое поразило воображение маленького Шеннона: