Мы собираем так много данных, что из них невозможно составить четкую картину, – наш разум не справляется с такими огромными объемами информации. Когда у нас слишком много данных и мы пытаемся разобраться в них, мы сталкиваемся с двумя вариантами. Первый – это отобрать немного информации на основе некоего критерия, который может заставить нас пренебречь контекстом, что, в свою очередь, значительно ухудшит наше понимание изучаемого вопроса. Представьте, что вы с другом спорите из-за выхода Великобритании из ЕС. Размышляя о наболевшем, вы решаете перечитать все свои текстовые сообщения, в которых упоминается данная тема. Эти сообщения могут не отражать ваши с другом отношения в целом, они лишь демонстрируют несогласие, но размышления над ними могут привести к прекращению вашей дружбы. Если бы вы вспомнили все хорошие времена, которые у вас были, но остались не зафиксированы в цифровом виде, или если бы вы прочитали сообщения, в которых ваш друг поддерживал вас в трудную минуту, вы бы вспомнили, почему вы были друзьями.
Второй и все чаще встречающийся способ попытаться разобраться в чрезмерном объеме данных основан на алгоритмах как на фильтрах, которые могут помочь нам упорядочить повествование, несмотря на то, они не могут думать за нас и понимать, что из общего объема информации действительно важно. Например, алгоритм, предназначенный для оценки кредитоспособности, может обнаружить случайную корреляцию между наличием трех кредитных карт и выплатой кредитов. Алгоритмы не обладают необходимой способностью рассуждать, чтобы понять, что, вероятно, нет причинно-следственной связи между количеством кредитных карт у человека и его способностью выплачивать кредит.
Помимо этого, алгоритмы зависят от наших предубеждений, закладываемых в данные, от предположений, которые мы делаем о том, что необходимо измерить, и от заданной нами программы. Недавно я встретила человека, который утверждал, что доверяет алгоритмам больше, чем людям, потому что люди совершают слишком много ошибок. Как легко мы упускаем из виду тот факт, что алгоритмы создают люди, а зачастую технологии не только не исправляют наши ошибки, но и усугубляют их.
Таким образом, обработка слишком большого количества данных может привести к уменьшению объема знаний и ухудшению процесса принятия решений. Двойной риск искажения правды и того, что память станет препятствием для перемен, в совокупности делает постоянные и обширные записи о людях действительно опасными. Такие записи фиксируют людей в их худшем состоянии и сохраняют такое представление о них, не позволяя им полностью преодолеть свои ошибки. Старые персональные данные также могут привести к предубеждениям, связанным с нашей историей: если мы будем использовать старые данные для предсказания будущего, мы будем склонны повторять ошибки нашего прошлого.
Нам нужно ввести даты истечения срока годности и забвения в цифровой мир. Мы могли бы разработать технологию так, чтобы любые создаваемые данные самоуничтожались по прошествии определенного периода времени. Некоторые приложения уже делают это: например, вы можете установить дату истечения срока действия своих текстовых сообщений в
Какие бы технологические средства мы ни выбрали, суть в том, что по умолчанию не следует хранить персональные данные бесконечно. Это слишком опасно. Нам нужны методы, позволяющие периодически удалять ненужную информацию.
Кто-то может возразить, что с этической точки зрения нельзя заставить общество забыть. Демократическому обществу не свойственно навязанное забвение. Сжигание книг и удаление сообщений в интернете – это признаки авторитарного правления, а не демократии.
Как утверждают некоторые, накопление данных – это естественная тенденция стабильного общества, уважающего права своих граждан. Такое рассуждение было бы убедительным, если бы у нас не было возможности хранить данные вечно. В бесконечном хранении данных нет ничего естественного. Раньше природа давала нам забвение через способность забывать, а теперь, когда мы бросили вызов этому естественному процессу, мы понимаем, что цена оказалась слишком высока. Мы должны заново внедрить то, что является естественным, в цифровой контекст, который весьма далек от природы. Важно отметить, что данные никогда не должны удаляться по идеологическим соображениям. Правительство не должно удалять данные, которые выставляют его в дурном свете. Следует удалять только персональные данные и только при соблюдении прав граждан, без дискриминации в отношении их политического содержания.