Книга Слово как улика. Всё, что вы скажете, будет использовано против вас, страница 45. Автор книги Джон Олссон

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Слово как улика. Всё, что вы скажете, будет использовано против вас»

Cтраница 45

Таким образом, мы, анализируя эти тексты, по-видимому, нашли на (неформальном) семантическом уровне нарушение последовательности составляющих в связи с грамматическим и подразумеваемым временем, а также другого рода единицами, тогда как на синтаксическом уровне мы видим знаки препинания там, где их не ожидаем. Я полагаю, что эти два явления на самом деле связаны с таким упорядочиванием структур, при котором нарушается их последовательность либо структурный порядок. Похоже, что это симптомы одного типа. Я полагаю, что подобного рода перестановки и нарушения последовательности свойственны большинству из нас, но обычно в небольших объемах. Что поразило меня во всех текстах этого расследования, так это масштаб и типология деструктуризации. Затем я взглянул на лексический уровень, и оказалось, что здесь тоже происходит кое-что интересное. Некоторые слова разбиты на два слова пробелом, например, и в известных, и в исследуемых текстах мы встречаем inter course вместо intercourse («сношение»):


!: At that interview the Police withdrew the charge of rape, and substituted it to one of unlawful sexual inter course. [На том допросе Полиция сняла обвинение в изнасиловании и заменила его незаконным половым сношением.]


?: Joe was again interviewed by the Police, the rape charge was dropped and changed to one of unlawful sexual inter course. [Джо был вновь допрошен Полицией, обвинение в изнасиловании было отозвано и заменено обвинением в незаконном половом сношении.]


Наблюдаемый здесь разрыв основан на том представлении, что inter course – это два слова (~ «взаимо действие»). Это неупорядоченность структуры лексики. Для этого значения в лексике есть intercourse, а не inter course. Вероятно, можно сказать, что в английской лексике (по совершенно иным причинам) имеется ряд префиксов, например inter (как в international – «международный»), и, конечно, в ней есть слово course («курс», «направление», «ход»). Поэтому оба эти слова (inter и course) существуют, но в данном контексте они неуместны. Я предполагаю, что по сути мы имеем нарушение структуры лексики, наблюдаемое и в известных, и в исследуемых текстах, среди примеров которого также есть photo copied («фото копированы»), back fired (~ «от дача»), other wise («по другому») и some where («где то»). Как и с пунктуационными разрывами предложения, здесь мы видим разрыв (слова пробелом) там, где он не предполагается с точки зрения грамматики.

Между ! и ? немало сходств и на уровне правописания, например intensions, coarse (вместо intentions, course), ряд почти или совсем тождественных словосочетаний, например for a so-called rape и for the so-called rape («для так называемого изнасилования») и так далее. Однако ошибки правописания требуют иного рода категоризации по сравнению с остальными категориями примечательности, и эту тему я сейчас развивать не стану. Приведенные мной примеры – лишь небольшая выборка сходств, найденных мной в этих текстах. В каждом случае я составляю «таблицу соответствий», в которой перечисляю соответствия между известными и исследуемыми текстами в отношении некоторого типа сходства. Пример приведен в таблице 19.4.

Таблица 19.4. Примерная таблица соответствий известных и исследуемых текстов

Слово как улика. Всё, что вы скажете, будет использовано против вас

Соответствия разных типов имеют разную значимость. Так, точные совпадения длинных придаточных предложений и целых предложений более значимы, чем совпадения описок. Макет и стиль документа важны меньше всего, даже меньше орфографических соответствий (правописания, расстановки апострофов и заглавных букв). Суть использования соответствующих свойств в том, что каждое заявляемое соответствие должно быть основано на понятии маркированности, то есть значимого систематического отличия от нормы. Например, если и известный нам автор, и кандидат на авторство пишут receive как recieve («получать»), то это может считаться маркированным, но вряд ли эта маркированность значительна. Около 2% популяции пишут receive неправильно. Это не так уж и необычно. Когда мы ищем маркированные особенности, нам нужно установить, имеем ли мы дело со структурами необычными и структурами просто непринятыми. Это и есть два типа маркированности.

Синтаксическая примечательность – почва более надежная, чем исследование черт более поверхностного уровня вроде макета документа: будучи носителями английского языка, мы знаем, что форма dog the («собака», артикль следует за существительным, а не перед ним) маркирована, так как нарушает простое, легко наблюдаемое грамматическое правило. Более глубокие семантический и идиоматический типы маркированности менее надежны просто потому, что они относятся к иному слою лингвистической организации, чем синтаксические структуры (см. Chaski, 2001: 40). В настоящем случае мое мнение таково, что и известному, и анонимному авторам были свойственны одни и те же тенденции, а именно нарушение хронологической, синтаксической и идиоматической последовательности. Обоим наборам текстов свойственны проблемы и симптомы одних и тех же типов. Следующий вопрос заключается в исчислении сходств и различий. Для того чтобы его провести, я, следуя работе упомянутого лингвиста Карола Часки, подсчитал количество маркированных конструкций для каждого типа явлений, синтаксических и прочих. Также было важно составить список контрпримеров. Нужно помнить, что задачей лингвиста не является доказать что-либо. Его задача – выявление и показ, а не доказывание.

Как судебный лингвист судит о полученных результатах? Точно так же, как и любой другой ученый. Если вы адекватно проверили свои результаты и свой метод и способны подтвердить их статистически, то вы можете положиться на них с большой степенью уверенности. Я использую слово «уверенность» в его неспециальном смысле. Это не то же самое, что «степень уверенности» в статистике. Статистическая «степень уверенности» – это вероятность ошибочности заявления о совпадении авторства. Одним из инструментов, которым я пользуюсь при вынесения суждения, является таблица рейтинга важности, приведенная под номером 19.5. В ней дан иерархический порядок разных типов маркированности.

Таблица 19.5. Таблица рейтинга важности типов стилевых черт

Слово как улика. Всё, что вы скажете, будет использовано против вас
Слово как улика. Всё, что вы скажете, будет использовано против вас

Из этой таблицы следует: если у нас есть два текста, написанные предположительно независимо друг от друга, со значимым количеством синтаксических соответствий, то они, скорее всего, более значимы, чем, скажем, соответствия в макете документа. Обычно лингвисты пользуются десятибалльной шкалой, хотя некоторые из них сегодня предпочитают более сложные статистические вычисления, такие как байесовские отношения вероятности. В завершение процесса лингвист высказывает свое мнение относительно того, существует ли значимая степень сходства между двумя наборами текстов. В данном случае я был вполне уверен в своем заключении и оценил свое мнение на восемь из десяти. Лучше всегда соблюдать осторожность. Вероятность восемь из десяти – это довольно много. Девять баллов – редкость, и я не слышал, чтобы кто-нибудь давал оценку «десять».

Вход
Поиск по сайту
Ищем:
Календарь
Навигация