Одно свойство управляющей системы для нас оказалось неожиданным. После обучения управляющей системы, при котором на космический аппарат оказывают случайные пробные воздействия, качество управления вначале невысоко, но уже в процессе управления оно постепенно возрастает. Выяснилось, что свойства объекта управления зависят от того, каким способом вы его испытываете: обращаетесь ли с ним бесцеремонно, дергая его во все стороны, «тряся как грушу» в процессе исследования-обучения, или испытываете его осторожно. Это имеет прямую аналогию с жизненными ситуациями: так врач, бережно исследующий пациента, точнее поставит диагноз, нежели обращающийся с пациентом неделикатно. Оказалось также, что из обученной базы знаний можно извлечь самые важные знания и, представив их в удобной форме, передать более простой детерминированной системе управления, которая сможет управлять объектом, но уже без адаптации.
Важно, что с небольшими изменениями система Pilot может быть использована для управления и многими другими объектами: активными подвесками транспортных средств, стабилизаторами блоков питания и других энергетических установок, обрабатывающими станками и так далее.
Метод автономного адаптивного управления может быть использован и для решения социальных задач.
По заказу Центра президентских программ мы исследовали возможность применения нашего метода в системе поддержки принятия решений при управлении социальными объектами. Сначала нас тревожило, возможно ли вообще представлять в цифровой форме состояния социального объекта. Но оказалось, что такая задача вполне решаема.
Следующая проблема возникла в связи с очень медленным поступлением входной информации, что крайне замедляло бы процесс накопления эмпирических знаний. Это натолкнуло нас на идею обучения системы по архивным данным. Эксперименты на архивных данных, описывающих социальные процессы в одном из районов Сибири, показали, что такое обучение возможно и после накопления необходимых знаний управляющая система может в некоторых ситуациях принимать эмпирически обоснованные решения.
Сравнив возможности системы «Тактик» с возможностями обычной нейросети, мы показали, что «Тактик», в отличие от нейросети, не только предсказывает некоторые события, но и предлагает на каждом шаге управляющие воздействия, которые способны улучшить текущую ситуацию.
Конечно, при управлении социальными объектами окончательные решения должны приниматься ответственными лицами. Задача управляющей системы — помочь выявить некоторые закономерности в развитии социальной ситуации, которые могут ускользнуть от взгляда человека.
В настоящее время наша группа работает и над другими системами управления, имеющими как практическое, так и теоретическое значение. Мы надеемся, что свойства созданных прототипов управляющих систем привлекут к ним внимание разработчиков объектов, которым требуется автономное адаптивное управление. Это в свою очередь поможет развивать его теорию и продвигаться по пути создания систем «автономного искусственного интеллекта».
Наши исследования финансировались, в частности, грантами Российского фонда фундаментальных исследований и Министерства науки и технологий РФ.
Наступление машин