Таким образом, мы, анализируя эти тексты, по-видимому, нашли на (неформальном) семантическом уровне нарушение последовательности составляющих в связи с грамматическим и подразумеваемым временем, а также другого рода единицами, тогда как на синтаксическом уровне мы видим знаки препинания там, где их не ожидаем. Я полагаю, что эти два явления на самом деле связаны с таким упорядочиванием структур, при котором нарушается их последовательность либо структурный порядок. Похоже, что это симптомы одного типа. Я полагаю, что подобного рода перестановки и нарушения последовательности свойственны большинству из нас, но обычно в небольших объемах. Что поразило меня во всех текстах этого расследования, так это масштаб и типология деструктуризации. Затем я взглянул на лексический уровень, и оказалось, что здесь тоже происходит кое-что интересное. Некоторые слова разбиты на два слова пробелом, например, и в известных, и в исследуемых текстах мы встречаем inter course вместо intercourse («сношение»):
!: At that interview the Police withdrew the charge of rape, and substituted it to one of unlawful sexual inter course. [На том допросе Полиция сняла обвинение в изнасиловании и заменила его незаконным половым сношением.]
?: Joe was again interviewed by the Police, the rape charge was dropped and changed to one of unlawful sexual inter course. [Джо был вновь допрошен Полицией, обвинение в изнасиловании было отозвано и заменено обвинением в незаконном половом сношении.]
Наблюдаемый здесь разрыв основан на том представлении, что inter course – это два слова (~ «взаимо действие»). Это неупорядоченность структуры лексики. Для этого значения в лексике есть intercourse, а не inter course. Вероятно, можно сказать, что в английской лексике (по совершенно иным причинам) имеется ряд префиксов, например inter (как в international – «международный»), и, конечно, в ней есть слово course («курс», «направление», «ход»). Поэтому оба эти слова (inter и course) существуют, но в данном контексте они неуместны. Я предполагаю, что по сути мы имеем нарушение структуры лексики, наблюдаемое и в известных, и в исследуемых текстах, среди примеров которого также есть photo copied («фото копированы»), back fired (~ «от дача»), other wise («по другому») и some where («где то»). Как и с пунктуационными разрывами предложения, здесь мы видим разрыв (слова пробелом) там, где он не предполагается с точки зрения грамматики.
Между ! и ? немало сходств и на уровне правописания, например intensions, coarse (вместо intentions, course), ряд почти или совсем тождественных словосочетаний, например for a so-called rape и for the so-called rape («для так называемого изнасилования») и так далее. Однако ошибки правописания требуют иного рода категоризации по сравнению с остальными категориями примечательности, и эту тему я сейчас развивать не стану. Приведенные мной примеры – лишь небольшая выборка сходств, найденных мной в этих текстах. В каждом случае я составляю «таблицу соответствий», в которой перечисляю соответствия между известными и исследуемыми текстами в отношении некоторого типа сходства. Пример приведен в таблице 19.4.
Таблица 19.4. Примерная таблица соответствий известных и исследуемых текстов
Соответствия разных типов имеют разную значимость. Так, точные совпадения длинных придаточных предложений и целых предложений более значимы, чем совпадения описок. Макет и стиль документа важны меньше всего, даже меньше орфографических соответствий (правописания, расстановки апострофов и заглавных букв). Суть использования соответствующих свойств в том, что каждое заявляемое соответствие должно быть основано на понятии маркированности, то есть значимого систематического отличия от нормы. Например, если и известный нам автор, и кандидат на авторство пишут receive как recieve («получать»), то это может считаться маркированным, но вряд ли эта маркированность значительна. Около 2% популяции пишут receive неправильно. Это не так уж и необычно. Когда мы ищем маркированные особенности, нам нужно установить, имеем ли мы дело со структурами необычными и структурами просто непринятыми. Это и есть два типа маркированности.
Синтаксическая примечательность – почва более надежная, чем исследование черт более поверхностного уровня вроде макета документа: будучи носителями английского языка, мы знаем, что форма dog the («собака», артикль следует за существительным, а не перед ним) маркирована, так как нарушает простое, легко наблюдаемое грамматическое правило. Более глубокие семантический и идиоматический типы маркированности менее надежны просто потому, что они относятся к иному слою лингвистической организации, чем синтаксические структуры (см. Chaski, 2001: 40). В настоящем случае мое мнение таково, что и известному, и анонимному авторам были свойственны одни и те же тенденции, а именно нарушение хронологической, синтаксической и идиоматической последовательности. Обоим наборам текстов свойственны проблемы и симптомы одних и тех же типов. Следующий вопрос заключается в исчислении сходств и различий. Для того чтобы его провести, я, следуя работе упомянутого лингвиста Карола Часки, подсчитал количество маркированных конструкций для каждого типа явлений, синтаксических и прочих. Также было важно составить список контрпримеров. Нужно помнить, что задачей лингвиста не является доказать что-либо. Его задача – выявление и показ, а не доказывание.
Как судебный лингвист судит о полученных результатах? Точно так же, как и любой другой ученый. Если вы адекватно проверили свои результаты и свой метод и способны подтвердить их статистически, то вы можете положиться на них с большой степенью уверенности. Я использую слово «уверенность» в его неспециальном смысле. Это не то же самое, что «степень уверенности» в статистике. Статистическая «степень уверенности» – это вероятность ошибочности заявления о совпадении авторства. Одним из инструментов, которым я пользуюсь при вынесения суждения, является таблица рейтинга важности, приведенная под номером 19.5. В ней дан иерархический порядок разных типов маркированности.
Таблица 19.5. Таблица рейтинга важности типов стилевых черт
Из этой таблицы следует: если у нас есть два текста, написанные предположительно независимо друг от друга, со значимым количеством синтаксических соответствий, то они, скорее всего, более значимы, чем, скажем, соответствия в макете документа. Обычно лингвисты пользуются десятибалльной шкалой, хотя некоторые из них сегодня предпочитают более сложные статистические вычисления, такие как байесовские отношения вероятности. В завершение процесса лингвист высказывает свое мнение относительно того, существует ли значимая степень сходства между двумя наборами текстов. В данном случае я был вполне уверен в своем заключении и оценил свое мнение на восемь из десяти. Лучше всегда соблюдать осторожность. Вероятность восемь из десяти – это довольно много. Девять баллов – редкость, и я не слышал, чтобы кто-нибудь давал оценку «десять».