
Онлайн книга «Библия G-модератора. Тактики и техники будущих властителей Земли»
Во-первых, нужна четкая и короткая фиксация поисковой категории (принцип формализации), то есть — вразумительная формулировка вопроса, ответ на который мы ищем. Мы должны четко представлять себе (а при компьютерной обработке материалов это должна представлять себе и поисковая система), что хотим узнать: дату вступления грузинских отрядов на территорию Абхазии, готовность ростовчан покупать в течение недели исключительно карамель «Ростов-Папа» или степень решительности нового генпрокурора засадить следующего проказливого богатея-губернатора, вдосталь попившего народной кровушки, в тюрягу. Во-вторых, надо, чтобы материал содержал в себе достаточно информации для анализа (принцип статистической значимости). При анкетировании тут все всегда в ажуре. А вот у дипломатов с содержанием информации ситуация — тихий ужас. Берешь пухлую распечатку двухчасового брифинга — и медленно, но верно сходишь с ума из-за отсутствия там не только нужной тебе информации, но и вообще каких-либо мало-мальски ценных сведений. В-третьих, надо, чтобы анализ данных, требующих итоговое заключение специалиста, эти специалисты и проводили (принцип компетентности). Например, нам для рекламы туристических путевок нужно составить по результатам анкетирования психопатологический портрет дурика-клиента, коему легче всего впарить путешествие по пыльным дорогам Афганистана или Ирака. Так вот, должна делать все это не молоденькая туроператорша, а профессор-психиатр, знающий, куда надо вставлять клизму шизофреникам. В-четвертых, надо определиться с точностью исследования (принцип погрешности). Если нам надо вычислить дату Конца Света с точностью до миллиардной доли секунды, то придется задействовать в расчетах все вменяемое население земного шара. А исследования эти продолжаться как раз до самого этого Конца. И кому тогда, пацаны, будут нужны их результаты? А вот если мы введем в наш анализ погрешность в плюс-минус миллион лет, то любой гимназист-двоешник за пару минут рассчитает, что Конец Света наступит через 1146 лет 3 месяца и 2 дня. В пятницу. Прямо после показа 666-го по счету римейка неувядающего "Влада Дракулы". В-пятых, после того, как материал проверен на вшивость, цели сформулированы, погрешности установлены, начальству налито кофе с коньяком, необходимо выбрать соответствующие единицы анализа. Именно их мы будем считать, именно с их изменениями в разных текстах мы будем составлять диаграммы и графики, именно с ними будут связаны наши бессонные ночи и выкрики "Эврика!" с пахнущей мочой хронического оборотня койки психиатрической лечебницы. В простейших же случаях, например в наших с вами, дорогие мои, рекламных делах, вообще — можно полностью отдать все компьютерным мозгам, а самим пить виски и танцевать твист в обществе жриц любви. Тут, правда, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Кроме уже упомянутых в случае с газом чисто подтекстуальных, основанных на нелинейной семантике единиц, есть еще целая куча гораздо более простых и совершенно линейных, рассчитанных на однозначное толкование единиц счета. Наиболее употребительны единицы счета, связанные с количеством людей и денег, со временем и пространством (число покупателей, газетных строк или площадей в квадратных сантиметрах, читателей журнала, время и продолжительность вещания рекламного ролика и прочая херня). Тут, пацаны, не так все просто. Важен выбор необходимых источников, подвергаемых контент-анализу. Конечно, самое простое — выкрасть нужную информацию из чужого сейфа. Но столь пошлая вещь не для такой правильной братвы, коей мы с вами, орлы и орлицы, имеем честь являться. Во-первых, зачастую нужной нам информации нет даже в хранилищах Гохрана. А во-вторых, из открытых источников сведения получаешь гораздо быстрее, чем из закрытых (таков парадокс современного постиндустриального информационного общества). При работе с открытыми источниками (периодическая печать, телек и все такое) возникает проблема выборки — на каком количестве сообщений остановится и с какой по какую дату их изучать. Чем больше будет всякой байды, тем больше времени потребуется для того, чтобы загнать всю эту смурную шнягу в нутро компьютера. Эти параметры выборки определяются задачами и масштабами исследования. Необходимым его условием является разработка таблицы-вопросника — основного рабочего документа, с помощью которого проводится исследование. Без нее контентолог — никто и ничто, без папки с этими таблицами его надо гнать из приличного общества пинками по колышущемуся, аки медуза-гигант на борту попавшей в шторм рыболовецкой шхуны, пухлому заду. Такая таблица внешне напоминает анкету: каждый вопрос предполагает ряд признаков (ответов), по которым садистки-жестоко дербанится содержание текста. Для регистрации же единиц анализа составляется другая таблица — кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с толстой пачкой матричных листов, заляпанных разводами приднестровского портвейна, измазанных волынским салом и покрытый кусочками мелко нашинкованного кубанского лука. Процедура подсчета при количественном контент-анализе проста, как бином Ньютона. Возьмем, к примеру, формулу вычисления коэффициента некоего Яниса (не путать с Янусом и с анусом!), предназначенную для того, чтобы узнать соотношение положительных и отрицательных оценок товара, который мы отрекламировали по полной программе, вкатив в рекламную кампанию немыслимое количество бабок. В случае, когда число положительных оценок товаров или услуг после рекламы превышает число отрицательных, считаем так: С=(a2-ab)/de. Тут «a» — это число положительных оценок; «b» — число отрицательных оценок; «d» — объем содержания текста, имеющего прямое отношение к изучаемой проблеме; «e» — общий объем анализируемого текста. В случае, когда число положительных оценок меньше, чем отрицательных, считаем иначе: С = (ab-b2) / de. Построенная на изменении полученных чисел диаграмма больше, чем все горластые рекламщики, покажет клиенту, каким же он был идиотом, поведясь на увещевания акул из агентства. Есть и более простые способы измерения. К примеру, удельный вес той или иной ключевой для нас фразы (слова) можно вычислить с помощью формулы: Е=f/g, где f — число единиц анализа, фиксирующих данную категорию, а g — общее количество единиц анализа. А теперь 6 бесплатных советов по контент-анализу, открытых мне одним контентологом под страшными пытками: |