Удивляться не следует: ведь нас с вами интересуют сейчас не частные свойства тех или иных конкретных объектов, а закономерности взаимодействия информации и энтропии, общие для самых разнообразных по своей природе систем. Именно такой общесистемный подход к явлениям позволяет сопоставлять то, что казалось несопоставимым в силу множества частных различий, мешающих видеть за деревьями лес.
Для выявления закономерностей взаимодействия информации с энтропией очень удобной системой оказался письменный текст. В отличие, скажем, от наследственных кодов, спрятанных от любопытного взгляда ученого на глубокий молекулярный уровень (в ДНК), все взаимосвязи букв текста и их сочетаний, все вероятностные зависимости между элементами системы осуществляются буквально у нас на глазах. Вот почему, рассуждая об энтропийно-информационных свойствах самых разнообразных явлений, мы будем вновь и вновь сопоставлять их с письменным текстом, проецировать общие вероятностные закономерности, наглядно проявляющиеся в тексте, на целый ряд самых разных по своей природе систем.
В свою очередь, текст отражает в себе статистические свойства более сложной и универсальной системы — человеческого языка.
Проведенные с помощью методов теории информации статистические исследования написанных на разных языках текстов показали, что несмотря на различия грамматических и фонетических правил, все исследованные языки обладают очень близкими статистическими характеристиками. Этот факт свидетельствует о действии неких общих статистических механизмов, управляющих процессами формирования и развития всех языков.
Наш язык — это гибкая, подвижная, легко адаптирующаяся в различных условиях система. В способности отражать, выражать, объяснять самые разнообразные стороны жизни и заключается основное достоинство языка, сохранившееся в нем потому, что в процессе своей эволюции он не достиг предела «приспособленности», в результате которой системы способны существовать только в определенных жестко детерминированных условиях (пчелы повторяют лишенные смысла инстинктивные действия, а тексты вырождаются в повторение одинаковых букв или слов).
Чтобы всего этого не случилось, язык сохранил в себе непредсказуемость, определенную «порцию» энтропии Оценить, каков удельный вес этой порции, позволяет опять-таки письменный текст. Подсчитано, что на каждые 4 бита обусловленной жесткими правилами избыточной (предсказуемой) информации приходится порция энтропии (непредсказуемой информации), составляющая примерно 1 бит.
Введем для удобства обозначения
Для обычного текста
Текст из одних «А» обладает нулевой энтропией (
Текст с максимальной энтропией не подчиняется правилам. Для него
Помимо обычных текстов, существуют специальные тексты: бухгалтерские отчеты, протоколы собраний и заседаний и т. п. Они больше обычных текстов тяготеют к шаблону, в них повторяются стандартные термины и выражения (дебет-кредит, сальдо-бульдо, слушали-постановили и т. д.). Для таких текстов коэффициент
А обычный текст сохранил одну пятую часть (20 процентов) спасительной энтропии именно для того, чтобы иметь гибкость и многозначность, из которых проистекает совершенство, красота, образность, универсальность и все прочие бесценные качества нашего языка. При
Наличие детерминированных правилами связей (
Язык поистинне неисчерпаем.