Такое смешение популярного и хорошего проявляется во многих цифровых системах принятия решений, использующих субъективную оценку качества. То есть человек может увидеть разницу между концептами популярного и хорошего. Человек также способен понять, что нечто популярно, но не хорошо (как рамен-бургеры или расизм) или хорошо, но непопулярно (как налоги на доход и ограничения скорости), и оценить это социально релевантным образом. (Но, например, дети или физические упражнения одновременно популярны и хороши.) Тем временем машина способна идентифицировать только популярность, опираясь на заранее установленные критерии, и сама по себе не способна распознать качество этой популярности.
Здесь мы видим фундаментальную проблему: алгоритмы разрабатываются людьми и эти люди встраивают свои бессознательные стереотипы в алгоритмы. Едва ли так происходит специально – но это не значит, что на такое положение дел можно не обращать внимания. Нам следует быть бдительными и критически настроенными относительно того, что, как нам известно, может пойти не так. Если полагать наличие дискриминации по умолчанию, то можно разработать системы, работающие в направлении равенства.
Одной из ключевых идей интернета является возможность ранжировать объекты. Нынешнее общество сходит с ума по измерениям; правда, мне не совсем ясно, появилась ли эта мания благодаря неистовому стремлению математиков к ранжированию либо это стремление является банальной реакцией на социальный запрос. В любом случае подсчеты нынче правят бал. У нас есть системы оценки колледжей, спортивных команд, команд на форумах разработчиков софта. Студенты стараются заработать более высокую позицию в списке класса. Школы ранжированы, сотрудники ранжированы.
Все мечтают занять верхнюю строчку, и никто не хочет оказаться в самом низу: кому вздумается брать на работу (или выбирать) кого-то с самых низких позиций? В образовании, области, известной мне наилучшим образом, процветает логическое заблуждение. Если мы посмотрим на результаты тестов 1000 студентов, то увидим, что они вписываются в гауссову кривую. Половина студентов будет находиться выше среднего уровня, половина – ниже, также будет небольшое количество тех, кто занял самые высокие и самые низкие позиции. Это нормально – однако школьные округа и чиновники считают, что их цель заключается в доведении всех учащихся до «релевантного уровня компетентности». Это невозможно до тех пор, пока средний уровень компетентности не станет равным нулю. Школьные округа считают, что нужно, чтобы все учащиеся были успешными, однако это вовсе не означает, что стремиться к недостижимому идеалу – действительно хорошо.
Идея о том, что популярное важнее хорошего, внедрена в само «ДНК» интернет-поиска. Задумайтесь над его происхождением: в 1990 г. двое выпускников факультета вычислительной техники размышляли над тем, что еще можно почитать по своей специальности. Тогда возраст их специальности составлял всего лишь 50 лет (в отличие от сотен лет развития близкой им математики или, например, истории) и было сложно найти литературу вне программы курсов.
Они прочли какое-то математическое исследование, в котором анализировались цитаты с целью получить индекс цитируемости, и решили попробовать применить описанный алгоритм к веб-страницам (тогда было немного веб-страниц). Проблема заключалась в том, чтобы идентифицировать «хорошие» веб-страницы, то есть те, которые стоят того, чтобы быть прочитанными. Сперва они решили повторить логику отбора академических цитат: в области компьютерных наук самые-цитируемые-статьи всегда самые важные. Значит, хорошая статья должна быть популярной по определению. Таким образом, они создали поисковик, который подсчитывал количество ссылок, указывавших на эту страницу. Затем подсчитывался ранг страницы (PageRank), основанный на количестве указывавших на нее ссылок и ссылок, находящихся внутри нее. Они посчитали, что пользователи будут поступать точно как научные работники: каждый из них будет создавать страницу, которая бы включала ссылки, ведущие на важные, по мнению конкретного пользователя, страницы. Таким образом, популярной страницей становилась та, на которую указывало много ссылок. PageRank был назван в честь одного из выпускников, Ларри Пейджа. Он и его партнер Сергей Брин решили заработать на своем изобретении и создали Google, одну из самых влиятельных компаний в мире.
Долгое время PageRank прекрасно справлялся. Популярные страницы действительно были хорошими – в том числе потому, что в сети тогда было настолько мало контента, что этот порог был не очень высоким. Тем временем все больше людей оказывались онлайн, количество контента росло, и Google стал зарабатывать деньги за счет рекламы на веб-страницах. Модель поискового ранжирования позаимствовали у научных издательств, а рекламную модель – у рекламных изданий.
По мере того как пользователи выясняли, как можно перехитрить PageRank, чтобы повысить позицию своих страниц в поисковой выдаче, популярность стала чем-то вроде валюты в сети. Разработчикам Google пришлось добавлять новые факторы поиска так, чтобы спамерам не удавалось обходить систему. Постоянно подправляя алгоритм, они в итоге добавили несколько функций. Одной из них стало определение географического положения, помогавшее автоматически заполнять адрес. По сути, это поисковое автозаполнение, основанное на реалиях окружающего мира. И, если вы вводили «ga», система бы заменила это на «GA», если в вашей округе многие искали что-то связанное с Джорджией (или, может, футбольную команду Университета Джорджии (UGA)), или предложила бы «Lady Gaga», если пользователи рядом с вами искали что-то связанное с музыкой. Сегодня в поиск внедрены более двух сотен факторов, а PageRank был дополнен множеством дополнительных функций, в том числе машинным обучением. Все это отлично работает до тех пор, пока работает.
История о том, как оформители создавали макет первой полосы газеты, служит хорошим примером того, что машина на самом деле не может переводить. Текст тщательно подбирается. Например, у разных мест на странице есть названия вроде верхней полосы и нижней полосы – это из наиболее очевидного. В газетах The Wall Street Journal всегда есть какое-то заметное место, которое называется A-hed и добавляет легкость подачи материала. Давний сотрудник газеты Барри Ньюман писал:
A-hed долгое время было просто одним из названий заголовков. Однако вскоре стал обозначать название такой истории, которая бы с легкостью сходила со страницы. A-hed – заголовок, который не кричит. Он хихикает.
Как было замечено, великие редакторы создают сосуды, в которые затем авторы помещают свою работу. Именно этим Барни Килгор стал заниматься начиная с 1941 г. Главному редактору The Wall Street Journal было известно, что в мир бизнеса следует добавить немного радости.
Помещая нечто веселое на самое видное место, где оно было окружено новостями о повседневных заботах, Килгор формулировал определенный посыл: тот, кто относится к жизни настолько серьезно, чтобы читать The Wall Street Journal, должен также быть достаточно мудрым, чтобы отступить на шаг и посмотреть на нелепости жизни…
При правильном исполнении A-hed перестает быть просто элементом новостей. Благодаря нашим личным особенностям, любопытству и страстям возникают новые идеи. A-hed – это не юмористические колонки. Они не навязывают мнения. Мы не сочиняем. Иногда легкий, остроумный намек способен затмить все шутки. Двое репортеров, рассказывающих одну и ту же историю, всегда преподнесут ее в собственной причудливой манере
[129].