Наиболее очевидной причиной современных сложных сбоев являются все более сложные информационные технологии (ИТ), которые лежат в основе всех аспектов жизни и работы сегодня. Фабрики, цепочки поставок и операции во многих других отраслях зависят от сложных компьютерных систем управления, где небольшой сбой в одной части системы может выйти из-под контроля. Возможно, вы помните, как компания Equifax, предоставляющая кредитные отчеты, сообщила, что номера социального страхования, адреса и номера кредитных карт почти 150 миллионов американцев были украдены с ее программной платформы. Согласно показаниям генерального директора Ричарда Смита в Конгрессе в октябре 2017 года, "утечка произошла как из-за человеческих ошибок, так и из-за технологических сбоев". Хакеры получили учетные данные для входа на три сервера, что позволило получить доступ к сорока восьми дополнительным серверам. Комплексный сбой усугубился тем, что взлом оставался незамеченным в течение семидесяти шести дней, что дало хакерам достаточно времени, чтобы побродить по системе, извлекая персональные данные, а также информацию высокого уровня о структуре данных и инфраструктуре Equifax.
Возможно, вы потеряли ценную информацию, хранящуюся на персональном компьютере, из-за того, что не сделали резервную копию данных, хотя знали, что она очень важна. Надеемся, что последствия потери данных не столь плачевны, как те, с которыми столкнулся валлийский системный инженер по имени Джеймс Хоуэллс. В 2013 году он случайно выбросил жесткий диск, принадлежавший старому компьютеру (жесткий диск, извлеченный после того, как пролитый лимонад уничтожил его игровой ноутбук), и слишком поздно понял, что потерял приватный ключ из шестидесяти четырех символов, который разблокировал то, что начиналось как его скромные инвестиции в биткоины. Несмотря на неустанные попытки получить разрешение на извлечение драгоценного жесткого диска с городской свалки, спустя восемь лет он так и не смог получить полмиллиарда долларов, которые тогда стоил биткоин.
Социальные сети изменили бизнес, политику и дружеские отношения, сделав вирусные сообщения привычным термином. Глобальная финансовая индустрия связывает каждый банк и бесчисленные домохозяйства в каждой стране, делая нас уязвимыми перед человеческими ошибками, происходящими на другом конце света. Как объясняет мой друг, профессор стратегии Колумбийского университета Рита Макграт, много лет назад большинство наших учреждений были разделены и тем самым защищены от последствий ошибок за их стенами. Теперь это не так. Оцифровка огромных объемов информации продолжает расти в геометрической прогрессии по мере снижения стоимости вычислительных мощностей. Развитие интеллектуальных систем, которые взаимодействуют независимо друг от друга, породило бесконечное множество потенциальных сбоев. Такая взаимозависимость - питательная среда для сложных сбоев. По словам Риты, когда "вещи, которые раньше хранились отдельно, сталкиваются друг с другом (другими словами, когда некогда сложные системы становятся сложными), становится гораздо сложнее предсказать, что произойдет дальше". ИТ создают новые уязвимости, поскольку взаимосвязанность мгновенно распространяет последствия небольших сбоев.
Нам не нужно искать дальше коронавируса 2019 года, который зародился в Ухане (Китай) и быстро распространился по всему миру, чтобы найти примеры того, как глобальная взаимосвязь делает сложные сбои более вероятными. Рассмотрим этот небольшой пример. В начале 2020 года, когда спрос на защитные маски внезапно вырос по всему миру, фабрики в Китае начали наращивать производство, грузить их на грузовые суда и отправлять в разные страны. В результате пустых морских контейнеров скопилось в этих далеких странах как раз в тот момент, когда Китай больше всего нуждался в них, чтобы экспортировать больше масок.
Отслеживание контактов - попытка ограничить распространение вируса путем поиска людей, с которыми контактировал инфицированный, чтобы изолировать всех участников, - основана на признании сложных неудач. Каждый инфицированный или подвергшийся воздействию вируса человек потенциально является одной из множества причин сбоя, которым является продолжающаяся пандемия. Мои друзья Крис Клирфилд и Андраш Тильчик буквально написали книгу о комплексном сбое и о том, почему он находится на подъеме. Их увлекательная, а порой и пугающая книга Meltdown объясняет "общую ДНК ядерных аварий, катастроф в Twitter, разливов нефти, провалов на Уолл-стрит и даже правонарушений". Как и я, Крис и Андраш попали под влияние социолога Чарльза Перроу, который выявил факторы риска, делающие определенные виды систем уязвимыми к сбоям.
Как системы порождают сложные сбои