Книга Организованный ум, страница 48. Автор книги Дэниел Левитин

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Организованный ум»

Cтраница 48

Сфера, в которой краудсорсинг применяется, возможно, чаще всего, остается практически незаметной для большинства: это reCAPTCHA, то есть нечетко написанные слова, которые используются, чтобы не позволить так называемым ботам, то есть компьютерам, получить доступ к защищенным страницам. Человеку прочесть и напечатать предложенное слово довольно легко, а компьютер этого чаще всего не может. (Слово CAPTCHA – сокращение от Completely Automated Public Turing test to tell Computers and Humans Apart, или «Полностью автоматизированный публичный тест Тьюринга, позволяющий отличить людей от компьютеров». Сокращение reCAPTCHA указывает на возможность многократного использования возможностей человеческого мозга. [223]) Откуда берутся эти нечеткие изображения слов [224]? Часто это страницы старых книг или рукописей, которые были оцифрованы, но Google их все же сложно расшифровать. На каждое слово человеку требуется секунд десять; за день удастся разобрать более 200 миллионов слов, а это 150 000 рабочих часов в день. Грех не использовать это время на что-то полезное.

Технологии автоматического сканирования письменных материалов и превращения их в тексты, доступные для поисковых систем, пока неидеальны. Во многих случаях человек может разобрать рукописное слово, а компьютер нет. Вот для примера отрывок из книги, которую Google пытается оцифровать [225]:


Организованный ум

После того как текст был отсканирован, две разные системы распознавания (так называемые OCR, системы оптического чтения символов) пытались превратить неразборчивые знаки во что-то читаемое. Те слова, в отношении которых программы дают разный результат, считаются не подлежащими расшифровке, и их используют в программе reCAPTCHA, фактически передавая на проверку посетителям сайтов. А откуда система понимает, что вы узнали слово верно? Система сопоставляет непонятные слова с расшифрованными, исходя из предположения, что если вы можете прочесть известное системе слово, то вы человек, а не бот, и тогда вы, скорее всего, верно прочтете и нерасшифрованное пока слово. Когда несколько независимых пользователей предлагают одно и то же прочтение нерасшифрованного слова, эта версия признается верной и добавляется в сканированный текст.

Созданная компанией Amazon платформа для поиска и предложения краудсорсинговых услуг Mechanical Turk используется для решения задач особого рода: компьютеры справляются с ними не особенно хорошо, а людям без дополнительной мотивации они кажутся скучными. Эта платформа использовалась в ходе проведенного недавно когнитивными психологами эксперимента, результаты которого опубликованы в журнале Science. Добровольцы (каждому заплатили по три доллара) должны были прочесть историю, а потом пройти тест, по результатам которого оценивался их уровень эмпатии. Эмпатия предполагает способность смотреть на ситуацию с разных точек зрения, а для этого нужно использовать задумчиво-мечтательное состояние мозга (сеть пассивного режима работы мозга); при этом задействуется префронтальная кора, передняя поясная, а также зона их соединения с височно-теменным узлом [226]. Подозреваю, что, скажем, республиканцы и демократы, вспоминая друг о друге, эти зоны не используют. Исследования показали, что люди, которым пришлось читать отрывок из художественной прозы (а не текст более легкого жанра или научно-популярный), гораздо успешнее смогли на следующем этапе считывать чужие эмоции. Была сформулирована теория, что художественная проза вовлекает читателя в декодирование мыслей и чувств героев – в отличие от популярных и научных текстов, которые такой задачи не ставят. Для эксперимента потребовались сотни добровольцев, и если бы пришлось работать с ними очно в лабораториях, было бы потрачено гораздо больше времени.

Разумеется, человеку свойственно хитрить и искать более легкие решения, и любой, кто собирается использовать краудсорсинг, должен это учитывать. Читая в интернете отзывы о ресторане, никогда не знаешь, написаны они тем, кто там на самом деле побывал, или родственниками владельца. В случае с Википедией проверка достоверности реализуется автоматически, просто в силу того, что над каждой статьей работают довольно много человек. В основе этого подхода лежит предположение, что обманщиков, мошенников и вообще людей, склонных к антисоциальному поведению, в любой образованной случайным образом группе меньшинство, поэтому добро всегда побеждает зло. К сожалению, в реальности это не всегда так, но в основном принцип справедлив, поэтому результатам, полученным с помощью краудсорсинга, в целом можно доверять. А еще этот метод во многих случаях оказывается удивительно эффективной альтернативой привлечению проверенных проплаченных экспертов.

Находятся люди, верящие, что «толпа всегда права», но ошибочность этого утверждения уже неоднократно доказана. Отдельные личности могут проявлять упрямство и узость взглядов и опираться при этом на неверную информацию, но если собрать группу экспертов, которые смогут оценить и скорректировать результаты работы добровольцев, можно серьезно повысить точность и качество результатов в таких проектах, как Википедия. Адам Гопник, журналист New Yorker, объясняет:

«Прекрасно, когда достичь согласия удается относительно легко, – но в том, что сохраняются группы с диаметрально противоположными взглядами по таким вопросам, как, скажем, природа происхождения капитализма, тоже нет ничего страшного: вы имеете возможность услышать обе точки зрения. Проблема начинается, когда одна сторона права, а другая нет, но не осознаёт этого. На страницах Википедии, посвященных Туринской плащанице или обсуждению авторства Шекспира, публикуется немало сомнительных данных, в силу чего там продолжаются споры. В киберпространстве полно как сторонников теории креационизма [227], так и эволюционистов. Так что проблема не в отсутствии разумных доводов, а в непреодолимом упорстве идиотов» [228].

Вход
Поиск по сайту
Ищем:
Календарь
Навигация