Эти характеристики мельчайших деталей индивидуального стиля автора, возможно, не слишком информативны, если брать каждую по отдельности. Однако вместе взятые они показывают важные закономерности в передаче авторского голоса и интонации, характерные для бестселлеров. Решение автора написать I’d вместо I would или you’re вместо you are важнее, чем кажется на первый взгляд. В бестселлерах прилагательные и наречия – особенно прилагательные – попадаются реже. Это означает, что предложения в бестселлерах короче и «чище», не загромождены лишними словами. Предложения не нуждаются в том, чтобы их драпировали дополнительными придаточными «для красоты». Никакое существительное не стоит того, чтобы описывать его тремя разными эпитетами. Глаголы (употребляемые в бестселлерах чуть чаще по сравнению с обычными книгами) не выигрывают, если к ним прицепить несколько хорошеньких словечек, с окончанием на «-но». Предложения в бестселлере – не новогодние елки, обвешанные всем подряд – гирляндами, шарами, мишурой, ангелами, звездами, и все это разных цветов, не гармонирующих друг с другом. Лучше взять простую елку и показать ее так, чтобы она стала живой и объемной.
Мужчины и женщины
На основании всех этих параметров (чаще всего незамечаемых), бестселлерометр вывел формулу идеального стиля. Когда мы взяли весь свой корпус бестселлеров и выстроили их исключительно по стилю, к нашему удивлению, оказалось, что во главе списка – почти одни женщины. Когда мы ранжировали книги по тематике и сюжету, картина была иная. Произведений авторов-мужчин в нашей коллекции бестселлеров было намного больше – почти на сотню. Но когда дело дошло до владения стилем, наиболее типичным для бестселлеров, женщины явно одержали верх. Более того, книги, которые наша модель отметила как лучшие по стилю, не обязательно принадлежали известным писателям. Многие из этих женщин попали в списки бестселлеров с первой же книгой. Мы взяли десять дебютных книг, занимающих самые высокие места в списке, – и оказалось, что девять из них написаны женщинами. Мы были крайне удивлены таким гендерным однообразием. Неужели авторам-женщинам легче попасть в список бестселлеров? Может, у них врожденное чутье на «гены» стиля, который способствует популярности?
Эти вопросы повели нас совершенно по иному пути, заставив отойти от намеченного ранее. Компьютерный анализ книг вообще часто преподносит сюрпризы, и в этом его прелесть. С этим сюрпризом мы решили разобраться. Мы хотели выяснить, насколько сильно выражен гендер в тексте. Предшествующие исследования в области установления пола автора с помощью компьютерного анализа достигли точности 83 %. Интересно, подумали мы, даст ли наша модель похожий результат?
[159] Сможет ли система в самом деле определить пол автора, глядя всего лишь на способ употребления слова of и частоту других распространенных слов (таких как remember, myself, just
[160])? С помощью стилеметрии уже удалось доказать, что Роберт Гэлбрейт на самом деле – Дж. К. Роулинг. Может ли компьютерная модель определить также, что «Дорога», «Сын повелителя сирот» и «Ганнибал»
[161] написаны мужчинами? А «Парижская жена», «Комната»
[162] и «Мертвые и забытые»
[163] – женщинами? Научив компьютерную модель отличать мужчин от женщин, мы установили, что это возможно.
Но прежде чем мы обсудим, что это значит, следует указать, что компьютер иногда ошибался. Он угадал пол автора в 71 % случаев, но некоторые его ошибки заслуживают внимания. Одна из самых удивительных состоит в том, что многие самые успешные бестселлеры он приписал авторам-женщинам, когда на самом деле они были созданы мужчинами. Вот три книги Джеймса Паттерсона, которые получили высокий индекс потенциального бестселлера за стиль. Все три, по мнению нашего компьютера, были написаны женщинами. Это «Дневник Сюзанны для Николаса»
[164], «Воскресенья у Тиффани» и «Четверо слепых мышат»
[165]. «Воскресенья у Тиффани» проще всего объяснить: Паттерсон написал ее в соавторстве с Габриэль Шарбонне. Если стиль бестселлера действительно зависит от пола автора, этим можно объяснить «женскую руку», заметную в книге. «Дневник Сюзанны для Николаса» – другое дело. Насколько нам известно, Паттерсон писал ее один, и все же наш компьютер с уверенностью 99 % заявил, что она больше похожа на другие книги нашего корпуса текстов, написанные женщинами. Если бы не «Четверо слепых мышат», мы бы решили, что компьютер ошибся из-за жанра. И «Дневник Сюзанны для Николаса», и «Воскресенья у Тиффани» – любовные романы. (Не в обиду Николасу Спарксу будь сказано, но это территория авторов-женщин.) Однако жанр никак не поможет объяснить, почему компьютер и «Слепых мышат» приписал женщине. «Мышата» даже близко не лежали к любовному роману. Это один из самых жестких детективов Паттерсона из серии про Алекса Кросса. Какой же вывод тут можно сделать? Утверждаем ли мы, что часть огромного успеха Паттерсона объясняется его «женским» стилем? Не торопитесь. Конечно, книги Паттерсона привлекают и мужчин, и женщин, и, возможно, его стиль в некоторой степени тому причина. Разумеется, полученные данные сообщают нам о какой-то характеристике стиля писателя, вероятно – коррелирующей с полом. Но что это за характеристика?
Интерпретация данных в этом случае осложнена не только средним уровнем точности модели (которая для определения пола автора на основе стилистических маркеров составляет 71 %), но и индивидуальной вероятностью, приписываемой каждой книге. Здесь возникает большой соблазн – сделать громкое обобщение: «Чтобы преуспеть (во всяком случае, в литературе), мужчины должны уподобиться женщинам!» Но на самом деле полученные нами данные рассказывают иную историю, более сложную и менее сенсационную. Да, наша модель была уверена, что «Долорес Клейборн»
[166] написана женщиной. Мы представили себе, какие заголовки появятся по этому поводу в газетах: «И Паттерсон, и Кинг пишут как женщины!» Но вслед за этим мы взяли другой роман Кинга, «Мистер Мерседес». На сей раз модель никак не могла определить, кто автор – мужчина или женщина. Она все-таки решила, что это мужчина, но с минимальным перевесом – с вероятностью всего 50,2 %. Похожий результат был получен для романа Дианы Гэблдон «Написано кровью моего сердца»
[167]: в этом случае модель правильно определила пол автора, но с вероятностью лишь 53 %. Значит, стиль некоторых книг можно назвать «нейтральным». И действительно, оказалось, что примерно 25 % книг в нашей коллекции не обладают ярко выраженными признаками, указывающими на пол автора. Еще у 25 % такие черты есть, но выражены они нечетко. Однако у оставшихся 50 % машина определила пол автора с уверенностью свыше 90 %. На эти книги следовало посмотреть пристальнее.