Прорыв в журналистике данных случился в 2009 г., когда репортеры и программисты Guardian запросили (посредством краудсорсинга) 450 000 записей о расходах членов парламента. За этим последовал скандал: выяснилось, что депутаты оплачивали бытовые и конторские расходы из государственного бюджета. Guardian также искусно овладела компьютерным анализом неофициальных сведений и просочившихся документов, которые использовали, например, в рамках расследований в период войн в Афганистане и Ираке
[25].
Другое знаковое расследование – проект The Wall Street Journal об анализе дискриминации цен
[26]. Лидирующие сетевые магазины вроде Staples и Home Depot устанавливали на своих сайтах цены, которые менялись в зависимости от почтового индекса, который посетитель вводил. При помощи компьютерного анализа журналисты выяснили, что индекс, соответствующий условно более обеспеченной локации, приводил к более низким ценам, чем у тех, кто вводил индекс условно менее обеспеченных локаций.
Исследования придают журналистике данных определенную полноту, поскольку репортеры стремятся полагаться на научные методы анализа. Чтобы быть хорошим журналистом, нужно, с одной стороны, понимать, когда следует обращаться к эксперту в той или иной области и, с другой стороны, уметь отличать эксперта от подсадной утки. Дата-журналистам приходится совмещать ряд научных подходов из разных областей. В 2008 г. профессор Технологического института Джорджии Ирфан Эсса организовал первый симпозиум для программистов и журналистов. Это ежегодное событие, где журналисты, исследователи из различных областей компьютерных знаний, коммуникации, статистики, человеко-машинного взаимодействия, визуального дизайна и других делятся своими знаниями и выстраивают междисциплинарный диалог. Николас Диакопулос, профессор Северо-Западного университета, – один из основателей симпозиума и автор знаковых работ об алгоритмах обратного проектирования как способах поддержания подотчетности фигур принятия решений. В своем исследовании «Алгоритмическая ответственность: журналистские расследования вычислительных систем господства» (Algorithmic Accountability: Journalistic Investigation of Computational Power Structures) он описывает некоторые примеры собственных расследований и расследований коллег-журналистов, посвященные анализу алгоритмических «черных ящиков»
[27].
Несмотря на тесную связь с вычислительной теорией, журналистика данных считается дисциплиной, относящейся к социальным наукам, потому большинство фундаментальных работ по теме обнаруживается в корпусе социальной литературы. В 2012 г. К. Андерсон опубликовал статью «Навстречу социологии компьютерной и алгоритмической журналистики» (Towards a Sociology of Computational and Algorithmic Journalism), где объединил четыре подхода Шудсона к анализу новостей на основе результатов полевых этнографических исследований, проведенных в 2007–2011 гг.
[28] Этнографический контекст также был обогащен благодаря книге Никки Ашер «Интерактивная журналистика: Хакеры, данные и код» (Interactive Journalism: Hackers, Data, and Code), выпущенной в 2012 г.
[29] В ней Ашер представляет читателям как результаты полевых исследований, так и интервью с дата-журналистами из The New York Times, Guardian, ProPublica, WNYC (Общественное радио Нью-Йорка), AP, NPR (Национального общественного радио) и англоязычного подразделения «Аль-Джазиры». Работа Синди Роял о том, как журналисты используют программирование, важна для понимания его роли для редакций и актуальна с точки зрения возможной интеграции компьютерных навыков в программы подготовки журналистов
[30]. В книге 2016 г. «Детективы демократии» (Democracy detectives) Джеймс Гамильтон подчеркивал актуальность журналистики данных для общества – и рассуждал о цене подобного служения. Ведение по-настоящему судьбоносных расследований в рамках журналистики данных обходится в сотни тысяч долларов. «Производство этих историй может стоить тысячи долларов, но они приносят миллионы в форме выгоды для всего сообщества», – пишет Гамильтон
[31].
А в 2010 г. журналистика данных обзавелась подтверждающей печатью от самого Тима Бернерса-Ли: «Журналистам следует быть находчивыми в плане данных. Раньше для создания историй требовалось просто поболтать с человеком в баре, порой это работает и сейчас. Однако сегодня важно также внимательно изучать данные и вооружаться инструментами, позволяющими их анализировать и выбирать самое интересное. Важно видеть все в перспективе, помогать людям представлять общую картину происходящего в стране»
[32]. А когда Нэйт Силвер запустил проект FiveThirtyEight.com и написал книгу «Сигнал и шум» (Signal and Noise), термин журналистика данных уже получил широкое хождение среди журналистов
[33].
Пока развивались компьютеры, человек оставался человеком. Людям нельзя давать расслабляться. Надеюсь, это книга поможет вам начать мыслить как дата-журналист, чтобы впредь вы не верили в сказки о технологиях и могли видеть несправедливость и неравенство в современном компьютеризированном мире. Присущий журналистам скепсис и умение предположить, что может пойти не так, способны помочь нам перейти от слепого технологического оптимизма к более разумной, сбалансированной перспективе того, как улучшить жизнь, а не подвергнуть ее риску и угрозам с помощью технологий.
II
Когда компьютеры не справляются
5
Почему ученики из малообеспеченных школ не справляются со стандартизированными тестами
Машины, коды, данные формируют удивительные и будоражащие воображение образы. Придерживаясь правильных расчетов, можно повысить прибыль, улучшить практику принятия решений, помочь вам найти себе пару и т. д. Величие данных горячо проповедуется и в современном образовании. В 2009 г. министр образования США произнес перед учеными следующее: «Я глубоко убежден, что сила данных способствует улучшению принимаемых нами решений. Данные предоставляют карту перемен. Они показывают, где мы находимся, куда нам следует двигаться и каковы категории наибольшего риска»
[34].