Количественный контент-анализ и его прикладное применение

Всамом общем виде данный вариант методики может быть представлен как систематизированное изучение содержания пись­менного или устного текста с фиксацией наиболее часто повторя­ющихся в нем словосочетаний или сюжетов. Частота этих слово-сочетаний или сюжетов сравнивается с их частотой в других пись­менных или устных сообщениях, на основе чего делается вывод об основной направленности содержания исследуемого текста. Но количественный контент-анализ может основываться не только на тотальной сортировке элементов текстового массива, но и на определении частотности предварительно выделенных слов или понятий. В зависимости от этого рассматриваемые методики рас­пределяются на две группы: ненаправленного и направленного поиска.

В основе методик из группы ненаправленного поиска лежит ги­потеза о том, что определенная цепочка слов текста может быть репрезентативна по отношению ко всему тексту и его главному содержанию. Эти слова, названные репрезентативными, должны удовлетворять двум требованиям:

■ не носить функциональный характер;

■ иметь большую частоту встречаемости в тексте.

Примером применения ненаправленного контент-анализа может быть методика, предложенная Г. Луном. Она состояла из четырех этапов:

1) определение принципов выделения репрезентативных слов;

2)анализ каждого предложения текста с целью фиксации репрезентативных слов (наличие в предложении не менее одного репрезентативного слова, разделение репрезентатив­ных слов не более чем четырьмя нерепрезентативными сло­вами;

3) взвешивание и ранжирование предложений текста в зависимости от количества репрезентативных слов;

4) выделение выражений с наибольшим рангом (частотой упоминаний).

Техника ненаправленного контент-анализа текстового матери­ала представляет собой, по существу, последовательность приемов по первичной статистической обработке содержательных элемен­тов текстов. В настоящее время данные методики практически не применяются самостоятельно, а в подавляющем большинстве слу­чаев служат базой для последующих этапов исследования (напри­мер, для составления словарей, используемых при контент-ана­лизе с помощью ЭВМ) и служат основой, для построения более сложных исследовательских процедур.

Направленный количественный контент-анализ основывается на предварительном составлении исследователем-аналитиком переч­ня категорий и понятий, конкретизирующих каждую отдельную категорию. Текст структурируется и обрабатывается с учетом под­готовленного перечня (словаря). Гипотеза этого варианта методи­ки исходит из того, что обычно в вербальном потоке можно под­считать частоту обращения к определенной теме, наличие/отсут­ствие каких-то тем, связь между темами, причем основные темы, которые определяются соответствующими количественными по­казателями, отражают главный смысл текстового материала.

Один из интересных опытов направленного количественного (ча­стотного) контент-анализа в сфере политических исследова­ний был предпринят на материале инаугурационных речей прези­дентов США и строился на подсчете числа использования несколь­ких смысловых категорий, частота появлений которых достаточно широко варьировалась. В частности, были определены четыре смыс­ловые категории, к каждой из которых могло относиться несколь­ко конкретных понятий: национальная идентичность (правительство, Америка, наша/моя страна и т.д.), историческая отсылка (вели­кое прошлое, предки и т.д.), фундаментальные ценности (Бог, Конституция, свобода и т.д.), состояние социума (сегодняшнее благополучие, уверенность в будущем). Анализ категоризированных вариации представленности этих понятии в инаугурационных речах интересен сегодня не только для характеристики отдельных личностей, но и общественного фона, который служил для них кон­текстом.

В целом, направленный частотный контент-анализ выступле­ний политических лидеров дает очень полезный материал для при­кладной оценки ситуации, в том числе за пределами конкретных исследований, в ходе которых были получены те или иные данные. Например, в аналитических целях можно использовать такой кри­терий оценки содержания текстов, как индекс военной пропаган­ды, определяющий агрессивные устремления самых различных акторов. Этот индекс формируется за счет констатации относительного роста доли высказываний крупных государственных или политических деятелей о преследовании (угнетении, дискримина­ции, ограблении), отсылок к применению силы как способу пре­одоления трудностей, превентивным действиям в качестве само­защиты с одновременным уменьшением внимания к позитивным интересам других участников международной среды. Даже с уче­том современных международных реалий инструментальное обра­щение к индексу военной пропаганды, безусловно, не утратило актуальности.

Проведение количественного контент-анализа позволяет дать ответы на самые разные вопросы. Например, чтобы определить, насколько мировых лидеров интересуют проблемы борьбы с бед­ностью, можно взять подборки выступлений президентов стран «большой восьмерки» и подсчитать, сколько раз в текстах появят­ся слова «бедность» или «нищета». Другой возможный путь ответа на этот вопрос состоит в том, чтобы добавить к рассмотрению единицу анализа более высокого уровня, т.е. тему, определив гра­ницы сверхфразового единства.

Обычно тема понимается как некоторое вполне определенное с точки зрения смыслового содержания сочетание слов или поня­тий, воплощенное в предложении или даже в абзаце. При том, что понятие «тема» может интерпретироваться достаточно свободно, необходимо учитывать некоторые правила ее определения. Напри­мер, согласно О. Холсти, тема не должна иметь больше одного объекта действия (воспринимающего), больше одного субъекта действия (действующего), больше одной цели, больше одного вида действия и не может выходить за пределы абзаца.

По О. Холсти, для операциональной декомпозиции текста со­держание всех используемых информационных материалов дол­жно подвергаться кодировке, при которой на первом этапе коди­ровщик соотносит текст с моделью ситуации. Общая модель, в со­ответствии с которой проходит кодировка, схематически выстроена в виде четырех последовательных блоков, которые рассматрива­ются как универсальные понятийные структуры описания любой си­туации:

I II III IV

«воспринимающий» — «действующий» — «вид действия» — «цель».

Исходя из этих представлений, формулируются некоторые пра­вила выделения каждой отдельной темы: новая тема возникает, если происходит смена: «воспринимающего», «действующего», «вида действия» или «цели»1.

Действуя предложенным О. Холсти образом и подсчитывая темы, исследователь фактически ведет поиск упоминаний заранее опре­деленных объектов. Часто они выступают в виде словосочетаний или коротких фраз: «военные действия», «проблема беженцев», «мир­ные переговоры», «гуманитарная помощь». Данная процедура явля­ется инвариантом простого подсчета смысловых символов, но более чувствительна к нюансам содержания и логики текста. Вместе с тем попытки однозначно определить тему как основную единицу анали­за заставляют разрабатывать целый ряд предварительно оговоренных правил составления выборки, которые ведут к увеличению трудоем­кости и формализации результатов. Поэтому чрезмерное внимание к установлению фиксированной однородности критериев для харак­теристики элементов контент-аналитической выборки может при­вести к снижению общей эффективности исследования.

Аналогичные трудности могут возникать и при применении более сложных вариантов количественного контент-анализа, ког­да грань между направленным и ненаправленным поиском смыс­ловых единиц относительно стирается, а сама процедура факти­чески приобретает характер экспертных оценок. Так, некоторые варианты методики предполагают структуризацию текста на осно­ве взвешенных характеристик (оценок) входящих в его состав пред­ложений, которые содержат наиболее значимые высказывания. Оценки проводятся по заранее сформированной шкале, в соответ­ствии с которой позиция каждого слова фиксируется с учетом по­ложительного или отрицательного смысла его употребления и сте­пени интенсивности этих признаков. Например, при использова­нии десятибалльной шкалы для анализа содержания предложения «режим Мобуту является коррумпированным» слово «является» получает оценку «+5», «коррумпированным» «—5». Суммарный рейтинг складывается следующим образом: +5 умножается на —5 и дает итог —25, т.е. понятие «режим Мобуту является коррумпирован­ным» получает оценку «—25», которая является очень негативной.

Помимо слов, тем и других элементов, обозначающих содержа­тельную сторону текстовых материалов, существуют и иные едини­цы, позволяющие проводить количественный контент-анализ. Весь­ма показательным может быть объем информации об объекте науч­ного наблюдения, представленной в том или ином источнике. Например, сколько печатных знаков или газетных столбцов было отведено презентации каждого кандидата в ходе избирательной кам­пании. Или сколько статей в центральных периодических изданиях ежегодно посвящается африканской проблематике. Изменялось ли это количество за истекшие 5—10 лет или осталось неизменным.

Таким образом, количественный контент-анализ во всех его инвариантах заключается в установлении определенных ключевых слов (понятий) и подсчете частоты их употребления в массе ото­бранных текстовых материалов. Однако даже при самой простой процедуре, а тем более в случае применения сложных исследова­тельских техник, нельзя проводить подсчет без стандартизации измерения и без элементарного учета контекста, в котором упот­ребляются ключевые слова. Оценки контекста, например, с точки зрения позитивной или негативной окраски ключевых слов, по­зволяют расширять аналитическое поле разработок путем подсче­та соотношения позитивных и негативных упоминаний интересу­ющих исследователя факторов или политических процессов.

В направлении оценки контекстуальных моментов на рубеже нынешнего десятилетия группой германских ученых под руковод­ством профессора Т. Амака велись разработки по автоматизирован­ному выявлению в текущих публикациях прессы европейских стран слов с негативной окраской. Предлагалось несколько подходов, ко­торые помогают определить, является ли отношение позитивным, отрицательным или нейтральным. Негатив может отражать социальные конфликты и дезорганизацию, политическую/экономическую не­стабильность и слабость, позитив — социальное взаимодействие и сотрудничество, политическую и экономическую стабильность и силу. Тем самым массированная обработка материалов СМИ позволяет экспертам оценивать, по крайней мере в первом приближении, из­менения политического климата отдельных стран или настроений больших социальных групп современного общества.

Проведение количественного контент-анализа и особенно в том, что касается квантифицированной оценки выборки интересующих исследователя слов, в последнее время стало легче проводить благо­даря развитию компьютерных баз данных, таких, как, например, LEXIS/NEXIX, популярной среди зарубежных исследователей.