Ознакомительная версия. Доступно 11 страниц из 55
4. Прочие социолингвистические факторы: нам не известен ни возраст, ни пол, ни уровень образования большинства кандидатов на авторство. Еще важнее то, что в отчете Уиллерби нет никаких упоминаний о попытках соответствовать социолингвистическим критериям. В отсутствие группы кандидатов, соответствующей подозреваемому (например, персонала компании или организации, в которой работает главный подозреваемый), для анализа с целью установления авторства обычно пытаются подобрать группу кандидатов, подобно тому, как это делается при опознании преступника. Например, довольно трудно представить себе, чтобы на опознании присутствовали высокий лысый человек среднего возраста, низкорослый юный волосатый толстяк, молодая женщина, пожилой человек (не важно, какого пола) и так далее. Более того, в идеальном расследовании мы, вероятно, хотели бы удостовериться в том, что наши кандидаты происходят из одной и той же географической области, что их занятия и достижения схожи, что все тексты написаны в пределах одного и того же достаточно короткого периода времени. Ни о чем подобном Уиллерби не упоминает.
В своем докладе Уиллерби пусть неявно, но принимает как данность, что у материала Икс был лишь один автор. Он все же исключает «письма к редактору» и иные очевидно неподходящие тексты, но забывает упомянуть о том, что у текстов Икс может быть несколько авторов. Следует помнить, что нередко публикации (независимо от их типа) приписывают одному автору, хотя в их создании и редактировании участвовали несколько лиц. Более того, в разного рода журналах не редкость и сотрудничество двух и более авторов в написании текста или текстов, подлежащих дальнейшей редактуре ради придания им характерного стиля издания. Поэтому непосвященный читатель отчета Уиллерби легко сочтет, что можно без опаски предположить наличие одного-единственного автора, а если возможность множественного авторства даже не рассматривается, это может повлиять на восприятие читателя, создавая у него определенную предвзятость.
В итоге работа Уиллерби не является профессиональным отчетом, отвечающим стандартам, установленным для вспомогательных судебных материалов. Я сделал такой вывод по нескольким причинам:
• Неправильно проведена выборка текстов: собственные работы Уиллерби смешаны с работами других авторов. Он не учитывает вопросы жанра, типа текстов, модуса, поля и тональности. Он пренебрегает социологическими аспектами возраста, пола и образования. Он полностью избегает вопросов двойного авторства и сокрытия авторства.
• Он, по-видимому, не осознает того факта, что служебные слова все же зависят от контекста, и, похоже, считает длину главного предложения и соотношение числа разных слов к общей длине текста связанными с вопросами анализа служебных слов. К тому же вызывает подозрения его метод подготовки текста. Почему он решил отсканировать электронные тексты? Насколько точным был полученный результат?
• В поддержку его выводов не приведены теоретические обоснования: мы не знаем, почему он считает, что авторам присущи «лингвистические отпечатки пальцев», когда на самом деле есть серьезные причины полагать обратное, если учитывать, например, тот факт, что язык усваивается в социуме, а не наследуется, что он подвержен влияниям и переменчив, в том числе под воздействием таких макросоциальных гомогенизирующих факторов, как образование и СМИ.
На мой профессиональный взгляд, уровень понимания Уиллерби данной темы и то, как он провел подбор корпуса текстов, полностью лишает его отчет какой бы то ни было ценности. Тем не менее, далее я продемонстрирую еще две области, в которых он допускает серьезные ошибки, а именно: порочность его метода лингвистического анализа и его метода составления статистического отчета.
Для того чтобы объяснить свою позицию, я сначала расскажу о двух основных типах слов в языке. Это знаменательные слова и служебные слова. Знаменательные слова передают значение, и к ним относятся имена существительные, имена прилагательные, глаголы и некоторые наречия. Служебные же слова не передают независимого значения, но выполняют в языке грамматическую функцию; к этой категории относятся предлоги, артикли и служебные наречия. Таково традиционное деление слов на типы или уровни семантической структуры, первоначально выдвинутое Генри Суитом, который говорил о «смысловых единицах» (то есть знаменательных словах) и «формальных единицах» (то есть служебных словах) (Sweet, 1891: 22).
По разделу «Подбор образцов» сложновато составить представление о процедуре, которой следовал Уиллерби. По-видимому, он взял пятьдесят самых часто встречающихся слов из каждого набора текстов и оставил из них только «контекстонезависимые». Он говорит, что отбросил «контекстозависимые» слова, такие как taxi-way («рулежная дорожка»). Мне не ясно, что он имеет в виду: отбросил ли он все знаменательные слова или только те знаменательные слова, которые посчитал зависящими от контекста? Каково основание или определение зависимости от контекста? В любом случае зависимость служебных слов от контекста следует поставить под вопрос. Можно подумать, что распределение служебных слов не зависит от контекста, но не для каждого из них это так. Распределение некоторых из них оказывается одинаковым независимо от жанра и типа текста, и потому они являются контекстонезависимыми в смысле распределения. У некоторых же распределение оказывается разным в текстах разных типов и жанров, то есть они контекстозависимы.
Тогда, если корпус состоит из текстов разных типов, то в результате такой процедуры частота употребления этих слов окажется искаженной и картина, с которой мы будем сравнивать текст устанавливаемого автора, не будет точной. Ниже я проиллюстрирую это положение, приведя некоторые примеры частоты служебных слов в текстах разного типа, полученные с помощью простого программного обеспечения для подсчета слов. Сначала я определил частоту слов в носителе, подобном исследуемым текстам, а именно – в газетных статьях. Затем я сравнил частоту слов в этом носителе с частотой в электронных письмах – носителе, использованном в корпусе Уиллерби. Я решил использовать только самые распространенные служебные слова: определенные и неопределенные артикли. Результаты приведены в таблице 14.1. Как видно из этой таблицы, хотя распределение артикля a(n) в этих двух типах текстов похоже, распределение артикля the в них значительно различается.
Таблица 14.1. Распределение артиклей the и a/an в небольшом корпусе новостных статей и текстов электронных писем
Таблица 14.2. Распределение некоторых личных местоимений в небольшом корпусе новостных статей и электронных писем
Из таблицы 14.2 видно, что выбранные местоимения практически отсутствуют в новостных статьях, но относительно часто встречаются в текстах электронных писем. На самом деле для этого есть веские лингвистические причины, поскольку газетные статьи крайне редко повествуют о первом или втором грамматическом лице (I, you – «я», «ты»), в то время как электронные письма, как правило, либо о «тебе», либо обо «мне», либо местоимения «ты» и «я» используются в них для ведения беседы о чем-то еще. Таким образом, показатели в таблицах 14.1 и 14.2, по-видимому, указывают на то, что при сравнении текстов разного типа мы не должны полагаться на частоту употребления некоторых распространенных служебных слов при установлении авторства: влияние типа текстов и их жанра может искажать результат. Например, если мы возьмем электронные письма и новостные статьи одного и того же автора, есть причины полагать, что тексты этих типов будут следовать вышеприведенным закономерностям.
Ознакомительная версия. Доступно 11 страниц из 55