Посмотрим, какой результат мы получили, положив скорость передачи в телефонном канале равной 30 кбит/с, а в телеграфном 30…40 бит/с? Ведь мы предположили, что каждый последующий отсчет сигнала независим от предыдущего и может принимать любые значения. Для телеграфного текста это означает, что вероятность появления любой буквы алфавита одинакова и не зависит от того, какие буквы были переданы ранее. Но при передаче осмысленного текста все совсем не так! Вы смотрите на ленту телеграфного аппарата и читаете: «Добрый ден…». Стоп! Какая буква следующая?
Со стопроцентной уверенностью вы скажете, что «ь», и будете совершенно правы. Так сколько бит информации нес этот последний символ «ь»? А нисколько. Но на его передачу было затрачено пять двоичных разрядов. Таким образом, мы оценили максимально возможную скорость передачи информации. Она реализуется лишь для хаотических, случайных сигналов и беспорядочного набора символов, т. е. для нестандартных текстов.
В реальном тексте можно допустить довольно много пропусков и ошибок, почти не уменьшив количество переданной информации.
Возьмите текст стандартной телеграммы: «Поздр-м-с-ем ро-д-ния ж-ла с-a-тья зд-р-в-я ус-хо-». Из пятидесяти букв пропущено восемнадцать, более трети, и что же? Текст прекрасно восстанавливается. Несколько труднее было бы восстановить текст: «Грузите апельсины бочками», но и это нетрудно, если знать классиков юмористической литературы. А вот текст нестандартной поздравительной телеграммы: «Завидуем только сорок желаем новой весны». Здесь уже труднее выбросить часть букв, и не зря в таких случаях работники телеграфа делают к телеграммах приписку: «Текст верен».
Таким образом, действительное количество информации в сообщении является случайной величиной. Как и для любой случайной величины, можно найти среднее количество информации на символ (букву).
Первую попытку уменьшить количество передаваемой информации, повысив эффективность кодирования, предпринял еще С. Морзе, изобретатель телеграфной азбуки. Вместе с помощниками он изучил немало английской классической литературы, не вникая в смысл прочитанного, а подсчитывая количество различных букв в тексте. В результате была найдена относительная вероятность появления той или иной буквы. Чаще других встречалась буква «
Телеграфисты, использовавшие код Морзе, не успокоились на достигнутом. При обычном телеграфном обмене передается очень много стандартных слов и фраз. Их стихийно стали сокращать, и в результате появился особый язык общепринятых сокращений. Он особенно был в ходу в 20-е и 30-е годы в связи с развитием телеграфной радиосвязи и используется до сих пор как профессиональными радистами, так и радиолюбителями-коротковолновиками. У них он так и называется «радиолюбительский код». Вот типичный пример текста при радиосвязи: «