Количественный контент-анализ и его прикладное применение

Всамом общем виде данный вариант методики может быть представлен как систематизированное изучение содержания письменного или устного текста с фиксацией наиболее часто повторяющихся в нем словосочетаний или сюжетов. Частота этих слово-сочетаний или сюжетов сравнивается с их частотой в других письменных или устных сообщениях, на основе чего делается вывод об основной направленности содержания исследуемого текста. Но количественный контент-анализ может основываться не только на тотальной сортировке элементов текстового массива, но и на определении частотности предварительно выделенных слов или понятий. В зависимости от этого рассматриваемые методики распределяются на две группы: ненаправленного и направленного поиска.

В основе методик из группы ненаправленного поиска лежит гипотеза о том, что определенная цепочка слов текста может быть репрезентативна по отношению ко всему тексту и его главному содержанию. Эти слова, названные репрезентативными, должны удовлетворять двум требованиям:

■ не носить функциональный характер;

■ иметь большую частоту встречаемости в тексте.

Примером применения ненаправленного контент-анализа может быть методика, предложенная Г. Луном. Она состояла из четырех этапов:

1) определение принципов выделения репрезентативных слов;

2)анализ каждого предложения текста с целью фиксации репрезентативных слов (наличие в предложении не менее одного репрезентативного слова, разделение репрезентативных слов не более чем четырьмя нерепрезентативными словами;

3) взвешивание и ранжирование предложений текста в зависимости от количества репрезентативных слов;

4) выделение выражений с наибольшим рангом (частотой упоминаний).

Техника ненаправленного контент-анализа текстового материала представляет собой, по существу, последовательность приемов по первичной статистической обработке содержательных элементов текстов. В настоящее время данные методики практически не применяются самостоятельно, а в подавляющем большинстве случаев служат базой для последующих этапов исследования (например, для составления словарей, используемых при контент-анализе с помощью ЭВМ) и служат основой, для построения более сложных исследовательских процедур.

Направленный количественный контент-анализ основывается на предварительном составлении исследователем-аналитиком перечня категорий и понятий, конкретизирующих каждую отдельную категорию. Текст структурируется и обрабатывается с учетом подготовленного перечня (словаря). Гипотеза этого варианта методики исходит из того, что обычно в вербальном потоке можно подсчитать частоту обращения к определенной теме, наличие/отсутствие каких-то тем, связь между темами, причем основные темы, которые определяются соответствующими количественными показателями, отражают главный смысл текстового материала.

Один из интересных опытов направленного количественного (частотного) контент-анализа в сфере политических исследований был предпринят на материале инаугурационных речей президентов США и строился на подсчете числа использования нескольких смысловых категорий, частота появлений которых достаточно широко варьировалась. В частности, были определены четыре смысловые категории, к каждой из которых могло относиться несколько конкретных понятий: национальная идентичность (правительство, Америка, наша/моя страна и т.д.), историческая отсылка (великое прошлое, предки и т.д.), фундаментальные ценности (Бог, Конституция, свобода и т.д.), состояние социума (сегодняшнее благополучие, уверенность в будущем). Анализ категоризированных вариации представленности этих понятии в инаугурационных речах интересен сегодня не только для характеристики отдельных личностей, но и общественного фона, который служил для них контекстом.

В целом, направленный частотный контент-анализ выступлений политических лидеров дает очень полезный материал для прикладной оценки ситуации, в том числе за пределами конкретных исследований, в ходе которых были получены те или иные данные. Например, в аналитических целях можно использовать такой критерий оценки содержания текстов, как индекс военной пропаганды, определяющий агрессивные устремления самых различных акторов. Этот индекс формируется за счет констатации относительного роста доли высказываний крупных государственных или политических деятелей о преследовании (угнетении, дискриминации, ограблении), отсылок к применению силы как способу преодоления трудностей, превентивным действиям в качестве самозащиты с одновременным уменьшением внимания к позитивным интересам других участников международной среды. Даже с учетом современных международных реалий инструментальное обращение к индексу военной пропаганды, безусловно, не утратило актуальности.

Проведение количественного контент-анализа позволяет дать ответы на самые разные вопросы. Например, чтобы определить, насколько мировых лидеров интересуют проблемы борьбы с бедностью, можно взять подборки выступлений президентов стран «большой восьмерки» и подсчитать, сколько раз в текстах появятся слова «бедность» или «нищета». Другой возможный путь ответа на этот вопрос состоит в том, чтобы добавить к рассмотрению единицу анализа более высокого уровня, т.е. тему, определив границы сверхфразового единства.

Обычно тема понимается как некоторое вполне определенное с точки зрения смыслового содержания сочетание слов или понятий, воплощенное в предложении или даже в абзаце. При том, что понятие «тема» может интерпретироваться достаточно свободно, необходимо учитывать некоторые правила ее определения. Например, согласно О. Холсти, тема не должна иметь больше одного объекта действия (воспринимающего), больше одного субъекта действия (действующего), больше одной цели, больше одного вида действия и не может выходить за пределы абзаца.

По О. Холсти, для операциональной декомпозиции текста содержание всех используемых информационных материалов должно подвергаться кодировке, при которой на первом этапе кодировщик соотносит текст с моделью ситуации. Общая модель, в соответствии с которой проходит кодировка, схематически выстроена в виде четырех последовательных блоков, которые рассматриваются как универсальные понятийные структуры описания любой ситуации:

I II III IV

«воспринимающий» — «действующий» — «вид действия» — «цель».

Исходя из этих представлений, формулируются некоторые правила выделения каждой отдельной темы: новая тема возникает, если происходит смена: «воспринимающего», «действующего», «вида действия» или «цели»¹.

Действуя предложенным О. Холсти образом и подсчитывая темы, исследователь фактически ведет поиск упоминаний заранее определенных объектов. Часто они выступают в виде словосочетаний или коротких фраз: «военные действия», «проблема беженцев», «мирные переговоры», «гуманитарная помощь». Данная процедура является инвариантом простого подсчета смысловых символов, но более чувствительна к нюансам содержания и логики текста. Вместе с тем попытки однозначно определить тему как основную единицу анализа заставляют разрабатывать целый ряд предварительно оговоренных правил составления выборки, которые ведут к увеличению трудоемкости и формализации результатов. Поэтому чрезмерное внимание к установлению фиксированной однородности критериев для характеристики элементов контент-аналитической выборки может привести к снижению общей эффективности исследования.

Аналогичные трудности могут возникать и при применении более сложных вариантов количественного контент-анализа, когда грань между направленным и ненаправленным поиском смысловых единиц относительно стирается, а сама процедура фактически приобретает характер экспертных оценок. Так, некоторые варианты методики предполагают структуризацию текста на основе взвешенных характеристик (оценок) входящих в его состав предложений, которые содержат наиболее значимые высказывания. Оценки проводятся по заранее сформированной шкале, в соответствии с которой позиция каждого слова фиксируется с учетом положительного или отрицательного смысла его употребления и степени интенсивности этих признаков. Например, при использовании десятибалльной шкалы для анализа содержания предложения «режим Мобуту является коррумпированным» слово «является» получает оценку «+5», «коррумпированным» «—5». Суммарный рейтинг складывается следующим образом: +5 умножается на —5 и дает итог —25, т.е. понятие «режим Мобуту является коррумпированным» получает оценку «—25», которая является очень негативной.

Помимо слов, тем и других элементов, обозначающих содержательную сторону текстовых материалов, существуют и иные единицы, позволяющие проводить количественный контент-анализ. Весьма показательным может быть объем информации об объекте научного наблюдения, представленной в том или ином источнике. Например, сколько печатных знаков или газетных столбцов было отведено презентации каждого кандидата в ходе избирательной кампании. Или сколько статей в центральных периодических изданиях ежегодно посвящается африканской проблематике. Изменялось ли это количество за истекшие 5—10 лет или осталось неизменным.

Таким образом, количественный контент-анализ во всех его инвариантах заключается в установлении определенных ключевых слов (понятий) и подсчете частоты их употребления в массе отобранных текстовых материалов. Однако даже при самой простой процедуре, а тем более в случае применения сложных исследовательских техник, нельзя проводить подсчет без стандартизации измерения и без элементарного учета контекста, в котором употребляются ключевые слова. Оценки контекста, например, с точки зрения позитивной или негативной окраски ключевых слов, позволяют расширять аналитическое поле разработок путем подсчета соотношения позитивных и негативных упоминаний интересующих исследователя факторов или политических процессов.

В направлении оценки контекстуальных моментов на рубеже нынешнего десятилетия группой германских ученых под руководством профессора Т. Амака велись разработки по автоматизированному выявлению в текущих публикациях прессы европейских стран слов с негативной окраской. Предлагалось несколько подходов, которые помогают определить, является ли отношение позитивным, отрицательным или нейтральным. Негатив может отражать социальные конфликты и дезорганизацию, политическую/экономическую нестабильность и слабость, позитив — социальное взаимодействие и сотрудничество, политическую и экономическую стабильность и силу. Тем самым массированная обработка материалов СМИ позволяет экспертам оценивать, по крайней мере в первом приближении, изменения политического климата отдельных стран или настроений больших социальных групп современного общества.

Проведение количественного контент-анализа и особенно в том, что касается квантифицированной оценки выборки интересующих исследователя слов, в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как, например, LEXIS/NEXIX, популярной среди зарубежных исследователей.