ОЦЕНКИ ЧАСТОТ

Основные cведения из математической статистики

ЛЕЦИЯ №7

РЯД РАСПРЕДЕЛЕНИЯ. МНОГОУГОЛЬНИК РАСПРЕДЕЛЕНИЯ.

СЛУЧАЙНОЕ СОБЫТИЕ. ВЕРОЯТНОСТЬО СОБЫТИЯ. ЧАСТОТА СОБЫТИЯ.

ЛЕКЦИЯ №6

 

 

 

 

В контент-анализе самыми бедными по содержанию и в то же время самыми фундаментальными являются простые оцен­ки частот. Примем следующее обозначение: f(c,t) — частота встречаемости характеристики c в тексте t.

Отдельные слова как элементы содержания являются част­ным случаем того, что в контент-анализе называется категори­ей. Категория — это множество слов, объединенных вместе по тому или иному признаку. Так, в качестве категории ЖИЛЬЕ может выступать группа синонимов (берлога, дом, жилище, жи­лье, логово, логовище, обиталище, обитель). Другими примера­ми могут быть категории агрессивно окрашенной лексики АГ­РЕССИВНОСТЬ (бить, бушевать, грозить, назло, одолеть, по­гром, рычать,...) и позитивно окрашенной лексики ПОЗИТИВ (благодарность, бодрый, вкусный, добро, нежный, няня, теплый, шутка, юмор, ясный,..). Частота упоминания в тексте некото­рой категории подсчитывается как сумма частот входящих в нее слов, т.е. если K — категория, то

Логической операцией, лежащей в основе создания катего­рии, является определение через абстракцию. Вовсе не обяза­тельно категория должна задаваться посредством заранее фик­сированного списка слов. Иногда гораздо удобнее задать ее операционно. Примером такой категории может быть катего­рия глаголов прошедшего времени. Определение принадлеж­ности к ней будет заключаться не в сопоставлении с фиксиро­ванным списком слов, а в распознавании грамматических при­знаков глагола прошедшего времени.

Более сложными являются категории, состоящие не просто из отдельных слов, а из целых словосочетаний. Например, ка­тегория МОРЕ (Черное море, Средиземное море, Красное море, Балтийское море,...).

Контент-анализ с использованием категорий позволяет оце­нивать тексты на более высоком абстрактном уровне. Резуль­таты, получаемые с их помощью, качественно богаче. Возьмем, например, категории ПОЗИТИВ, НЕГАТИВ, АГРЕССИВНОСТЬ, АРМИЯ, ПОЛИТИКА, ЭКОНОМИКА, РАЗВЛЕЧЕНИЯ, ЗАКОН и подсчитаем частоты их встречаемости в интересующем нас издании на протяжении нескольких месяцев. Затем сопоставим, подсчитаем корреляцию с ежемесячными рейтингами этого же издания среди различных социально-демографических групп. Положительные и отрицательные коэффициенты корреляции между частотами отдельных категорий и рейтингами подска­жут, статьи какой тематики привлекают или отталкивают чита­телей той целевой группы, на которую рассчитано издание.

Можно подсчитывать частоту абзацев, обладающих определенными признаками. Более крупными элементами яв­ляются целые тексты — статьи и книги. Например, подсчет ча­стоты статей различной тематики позволяет делать выводы о редакционной политике издания. Аналогичный подсчет тема­тики книг, поступающих в научную библиотеку, позволяет су­дить о тенденциях в развитии науки, перспективных направле­ниях исследований и т. д.