2. Независимость: мнения людей не определяются мнениями окружающих; участник принимает свое решение самостоятельно, независимо от других.
3. Децентрализация: решения основаны на локальных и конкретных знаниях отдельных лиц.
4. Агрегация: существует механизм, который превращает индивидуальные суждения в коллективное решение.
Краудсорсинг набирает все большую популярность для сбора контента, в том числе в академической гуманитарной среде. Пользователи могут выполнять перевод документов на иностранные языки, редактирование и транскрибирование текстов, совершенствование технологической составляющей (программного обеспечения, дизайна, баз данных), модерирование и администрирование, ведение блогов и микроблогов, разметку изображений (например, фотодокументов, предметов искусства и др.).
В книге «Цифровые гуманитарные науки на практике» [Digital Humanities in Practice, 2012] приводятся классификации проектов краудсорсинга и обзор исследований в этой области. Так, Р. Доусон и С. Бингалл выделяют 15 категорий краудсорсинга сайтов [Dawson, Bynghall, 2011]. Р. Холли дает обзор определений краудсорсинга и обосновывает его актуальность для библиотек с точки зрения временных, финансовых и человеческих ресурсов; возможности создания новых виртуальных сообществ и использования их знаний, опыта и интересов для улучшения качества информационных систем. Кроме того, среди возможных направлений использования краудсорсинга автором выделяются каталогизация, комментирование, тегирование, рейтингование, написание обзоров, укрепление лояльности пользователей к библиотеке, поощрение чувства общественной солидарности и ответственности за создание коллекций культурного наследия [Holley, 2010].
Среди значимых примеров краудсорсинга – программа оцифровки австралийских газет, организованная Национальной библиотекой Австралии[46]. Платформа начала работать в августе 2008 г., а в ноябре 2009 г. уже содержала 8,4 млн статей для поиска, редактирования, добавления тегов и комментариев [Holley, 2010]. Позднее этот проект стал частью национального австралийского ресурса-агрегатора Trove[47], в котором и в настоящее время активно используется краудсорсинг для развития ресурса. Статистика на главной странице сайта позволяет оценить ежедневное приращение ресурса.
Еще один значимый проект – Transcribe Bentham[48]. Он стартовал в 2010 г. в Университетском колледже в Лондоне, его цель – вовлечение публики в онлайн-транскрипцию или набор оригинальных и неизученных рукописных статей философа и реформатора Джереми Бентама (1748–1832). На текущий момент волонтеры переписали более 20 тыс. страниц сочинений Бентама[49].
Крупнейшим отечественным проектом по оцифровке и созданию электронной публикации литературного наследия с привлечением труда волонтеров стал проект Tolstoy Digital[50], посвященный цифровому изданию 90-томного собрания сочинений Л. Н. Толстого. В 90 томов вошли как художественные произведения, так и черновики, дневники и письма писателя. При подготовке цифровой версии юбилейного собрания сочинений Государственный музей Л. Н. Толстого, Государственный мемориальный и природный заповедник «Музей-усадьба Л. Н. Толстого “Ясная Поляна”» и компания ABBY запустили в 2014 г. краудсорсинговый проект «Весь Толстой в один клик»[51]. Силами компании ABBY 90 томов, изданных в период с 1928 по 1964 г., были оцифрованы и распознаны в автоматическом режиме. Затем проверку текстов осуществляли волонтеры. В проекте приняли участие более 3 тыс. человек по всему миру, которые несколько раз вычитали порядка 46 тыс. страниц текста. Проект предусматривал три основных функции для участия волонтеров: 1) участник (первичное редактирование после автоматического распознавания программой), 2) аудитор (проверка качества отредактированного текста) и 3) редактор (профессиональная верификация).
Эффективность подхода и огромный интерес публики к подобным проектам иллюстрирует и тот факт, что вся работа по редактированию текстов была проделана в двухнедельный срок. В итоге компании ABBY и Wexler подготовили электронные версии 761 книги, в которые вошли как целые тома, так и отдельные произведения писателя (эти книги находятся в свободном доступе и свободны для скачивания на сайте «Лев Толстой»[52]). В дальнейшем проект предполагается продолжить с привлечением волонтеров к разметке дат, событий, персоналий и других значимых смысловых единиц в текстах, а также к созданию полноценной цифровой семантической версии собрания сочинений Л. Н. Толстого [Bonch-Osmolovskaya, 2016].
Наиболее яркий российский исторический краудсорсинговый проект – «Прожито»[53] – электронный архив личных дневников. «Для того чтобы найти, обработать и загрузить тысячи дневников, нам нужны тысячи часов усилий самых разных людей», – пишут авторы проекта. С момента открытия проекта в 2015 г. через него прошло больше полутысячи участников, занимавшихся выявлением публикаций, сканированием, распознанием, набором текстов и подготовкой дневников к загрузке на сайт[54].
Вильям Л Саймон , Вильям Саймон , Наталья Владимировна Макеева , Нора Робертс , Юрий Викторович Щербатых
Зарубежная компьютерная, околокомпьютерная литература / ОС и Сети, интернет / Короткие любовные романы / Психология / Прочая справочная литература / Образование и наука / Книги по IT / Словари и Энциклопедии