Все, что мы делаем, оставляет отпечаток. Этот отпечаток – данные. Но данные такого рода не во всем похожи на знания или факты. Это скорее ближе к следам, оставленным на пляже: свидетельство некого физического действия в прошлом. В случае технологических гигантов Кремниевой долины этот гипотетический пляж открыт для широкой публики, но находится в частной собственности, что дает владельцам право анализировать следы на песке. В утопии Цукерберга и других всякая мысль или эмоция, проскользнувшая в наших умах, будет оставлять следы, открывая глубины человеческой психологии для инспекции невиданных масштабов. Критики Кремниевой долины порой утверждают, что данные должны принадлежать пользователю в прямом смысле, коль скоро мы их произвели (как если бы заказ на Uber был сродни написанию стихов). Но если аналогия с пляжем верна, будет ли разумным утверждать, что мои следы – мои, особенно если песок не мой? В этом главная загадка данной проблемы. В отличие от статистиков или социологов Кремниевая долина стремится не составить точный портрет общества, а обеспечивать инфраструктуру, от которой мы все зависим и которая при этом будет фиксировать наши перемещения и настроения с наивысшей чувствительностью.
Прорывы в области методик машинного обучения увеличили чувствительность сверх пределов человеческого сознания. «Анализ чувств» включает в себя алгоритмы обучения по обнаружению разного рода эмоций в предложении, которые могут применяться для отслеживания эмоций, выражаемых в Twitter, Facebook, электронной почте или (благодаря технологиям распознавания речи) телефонном разговоре. «Аналитика лиц» реализует нечто похожее в части определения чьих-либо чувств исходя из движений на лице, и, по-видимому, теперь может использоваться для определения сексуальной ориентации
[197]. Вся область «аффективных вычислений», преобразившая маркетинговые исследования, использует машинное обучение, чтобы позволить компьютерам определять эмоции по языку тела и поведению. Большое разнообразие точек данных анализируются одновременно, наши предпочтения в покупках могут коррелировать с нашими привычками в общении, а те с политическими убеждениями. Одно из исследований показало, что усредненный пользователь смартфона трогает свое устройство 2 617 раз в день, и каждое из этих касаний является своего рода точкой данных, полагая, что все они попали на сенсорные поверхности
[198]. С учетом того, сколько внимания уделяется физическому телу как объекту цифрового отслеживания, больше нельзя назвать сеть Интернет чем-то «виртуальным» или «нереальным».
Чем дальше наблюдение проникает в наши жизни и культуры, тем более эмоционально интеллектуальными будут становиться машины. Расположенная в Бостоне и специализирующаяся на аффективных вычислениях компания Affectiva в 2017 году хвасталась, что проанализировала 4,7 млн лиц из 75 стран
[199]. Еще одна компания, рожденная в Вашингтонском университете под названием Megaface, располагает базой данных из 5 млн изображений 672 000 людей. Ира Кемемахер-Шлицерман, профессор информатики и консультант в Megaface, утверждала, чтобы дать ход практическому применению, нам необходимо протестировать распознавание лиц в планетарном масштабе – тестирование в больших масштабах позволяет обнаруживать успехи и недостатки алгоритмов распознавания
[200]. Бесконечное расширение слежки оправдывается тем, что это помогает машинному обучению.
Аналоговые статистические методики, такие как опросы, требуют от нас выражать свои взгляды и предпочтения в сознательной, связной и объективной манере, часто давая себе время на размышления. Цифровые же платформы, напротив, ожидают лишь того, чтобы мы продолжали проявлять эмоции и требовать, чего хотим и как, а алгоритмы отследят закономерности в получившемся хаосе. Не нужно заранее определять конечное число каких-либо классификаций или категорий (таких как «трудоустроен», «безработный», «самозанятый»). Чтобы зафиксировать чувства, тем не нужно быть осознанными или вербальными. Все может быть определено исходя из слов, изображений и следов, оставшихся после нас.
Аналитики данных теперь имеют огромное преимущество перед традиционными технократами и бюрократами. Неприязнь к экспертам проистекает из глубинного ощущения того, что в своем внимании к математическим законам и моделям те мало заинтересованы в конкретных людях, их желаниях, страхах и жизнях. Facebook не страдает от подобного отчуждения, поскольку его «фасад» и «тыл» совершенно различны. Его пользователи выражают себя собственными словами и чувствами, предоставляя уникальные биографии. Но за кулисами все это собирается вместе и подвергается математической обработке. По мере того как вычисления становятся все сложнее и сложнее, пользователь уже даже не ощущает в этом никакой математики.
От науки к науке данных
Любопытной особенностью аналитики «больших данных» является то, что занятым в этой сфере специалистам не так уж важно, от кого получены данные, от людей, частиц в атмосфере, автомобилей или бактерий. Профессионалы в области анализа данных чаще более подкованы в математике и физике, нежели в социологии. Они производят знания о нашем поведении, но никак не претендуют на экспертное мнение о людях, шопинге, финансах или градостроении. Им нет до нас никакого дела. Их умения относятся скорее к изучению тех аспектов бытия, что уже переведены в численные величины, чем изучению бытия как такового.
Это приводит к появлению нового типа экспертов, отличного от того, который появился в XVII веке. Они не изучают природу или общество так, как делали их предшественники, а обнаруживают закономерности в данных, уже зафиксированных компьютерами. В отличие от ученого аналитик данных сравним скорее с библиотекарем, т. е. с тем, кто обучен ориентироваться в обширной коллекции уже записанной информации. Разница в том, что архив данных растет с огромной скоростью, постоянно пополняясь благодаря множеству неодушевленных устройств их сбора, и может быть проанализирован только алгоритмически.
Возьмем для примера психологию. Наука о данных раскрывает много такого, что может заинтересовать психологов, ввиду способности алгоритмов распознавать эмоции, шаблоны поведения и тревоги среди населения. Facebook изначально построен так, чтобы формировать осмысленные с точки зрения психологии данные, что позволяет их рекламодателям попадать в целевую группу с огромной точностью. После выборов в 2016 году в США сообщалось, что можно было выбрать любую из 175 000 версий политической рекламы и направить ее подходящему человеку, исходя из 300 его «лайков»
[201]. И тем не менее аналитикам данных не требуется никаких теоретических знаний о том, как формируются политические взгляды и что это вообще такое. Равно как и не нужно им никакого заранее определенного представления о том, что стоит изучать. Они лишь определяют, как различные закономерности в поведении, изображения и слова могут коррелировать в пределах определенной части населения.