Сущность и виды группировок. Таблицы и графики: их роль в анализе социологических данных.

В ходе исследований социологи собирают большие объемы информации. Чтобы сделать на их основе определенные выводы, необходимо всю информацию сжать, представить в виде небольшого числа обобщающих (статистических) показателей, удобных для дальнейшего анализа. Для решения этой задачи применяются методы математической статистики и ЭВМ. Сводка и группировка первичной информации представляют собой первый этап работы с ней.

Затем наступает этап анализа информации. В общем виде можно назвать следующие типы аналитических задач: описание социальных явлений; поиск причинно-следственных связей; прогнозирование; оптимизация процессов; принятие решений.

К основным методам математической статистики, получившим наибольшее распространение в социологии, относятся: статистическая группировка; построение рядов распределения; статистические таблицы; подсчет средних арифметической и геометрической, моды, медианы, среднего квадратичного (стандартного) отклонения и дисперсии; определение взаимосвязей двух и более признаков при помощи уравнений регрессии, корреляционного, дисперсионного, факторного и других методов; определение статистических ошибок; проверка статистических гипотез; графические и другие методы.

Самым начальным этапом является статистическая группировка, которая позволяет распределить единицы изучаемого объекта на однородные группы по существенным для него признакам. Например, несколько тысяч анкет можно свести к нескольким группам по профессиональному признаку (токари, слесари, плотники, столяры и др.), а затем подсчитать все значения других признаков — как они распределяются по полу, возрасту, образованию, зарплате, удовлетворенности профессией и т.д. Анализ этих признаков в зависимости от профессии позволяет сделать вывод о причинно-следственных связях и др.

Выбор группировочного признака зависит от целей исследования. Социологическая информация может быть сгруппирована по:

  • номинальному признаку (род занятий, национальность и т.д.);
  • признакам, соответствующим ранговым шкалам (например, по характеру труда: ручной труд, работа с механизмами, наладка станков, интеллектуальный труд);
  • количественному признаку (группы характеризуются числовым значением, они качественно сравнимы между собой, например группировка по возрастным интервалам: 18—20 лет, 21—25 лет, 26—30 лет и т.д.).

При работе с номинальными и ранжированными группами используются приемы математики, а группы, распределенные по количественному признаку, изучаются с помощью математической статистики.

Группировки бывают разных видов. Простая группировка- это классификация или упорядочение данных по одному признаку. Связывание фактов в систему осуществляется здесь в соответствии с описательной гипотезой относительно ведущего признака группировки (или признака классификации). Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию, по высказанным суждениям и т.д.Перекрестная (комбинированной) группировкаиспользуется, если опрашиваемых необходимо сгруппировать по двум или более признакам (например, по полу, возрасту и образованию), Она может быть структурной, типологической, аналитической — все зависит от решаемых в ходе исследования задач. Структурная группировка применяется при обобщении опрашиваемых по какому-либо признаку, присущему всей изучаемой совокупности, например, при установлении возрастного состава опрашиваемых.. Если же необходимо выделить из респондентов группы соответствующие типы, тогда осуществляется типологическая группировка. Аналитическая группировка производится по двум и более признакам и служит для выявления их взаимосвязи. Если нужно проверить, имеется ли связь между интересом к вопросам нравственного воспитания и чтением литературы (газет, журналов, монографий по данной проблеме), то группировку следует сделать по этим двум признакам.

В социологическом исследовании, как правило, выделяется не одна, а несколько групп респондентов (по возрасту, образованию, месту проживания и т.п.). Каждой группе соответствует некоторое выделенное число, которое характеризует количественный состав группы. Такой ряд чисел, получаемый в результате группировки, социологи называют рядом распределения. Ряд распределения называется вариационным. Например, построим вариационный ряд, отражающий распределение по стажу работы.

Стаж работы (х)
Число рабочих (n)
Объем совокупности составляет 526

Приведенный вариационный ряд можно преобразовать в интервальный вариационный ряд.

Стаж работы (х) До 2 2-4 4-6 6-8 8-10 10 и более
Число рабочих (n)
Объем совокупности составляет 526

Часто в социологических исследованиях используют динамические ряды (временные ряды, ряды динамики), представляющие собой изменения значения признака по годам (месяцам). Например, можно построить ряд динамики на основе следующих данных:

Год
Количество кинопосещений

Как видно, сначала число кинопосещений росло, затем — неуклонно снижалось. Динамический ряд не указывает причины событий, однако дает некоторое представление о процессе и побуждает к поиску причинно-следственных связей.

Статистические таблицы представляют собой группировку и распределение обследованных индивидов по двум или более признакам. Один из них является подлежащим, другой — сказуемым. Анализ таблиц дает некоторое представление о причинно-следственных связях, т.е. показывает, как изменение одного признака сопровождается изменениями другого (других). Таблицы (таблицы сопряженности) имеют следующий вид:

X Y Итого
a b a+b
c d c+d
Итого a+c b+d a+b+c+d

буквы в клетках обозначают соответствующие частоты

Предположим, что мы имеем два признака признака – пол (1 – мужчина, 0 – женщина) и курение (1 – курит, 0 – не курит).

Курение Пол Итого
м ж
Курит
Не курит
Итого

Данные таблицы 15 говорят о том,что в нашей совокупности имеется 90 мужчин, из которых 80 человек курят, и 10 женщин, среди которых 4 человека курящих и т.д.

Ряды распределения и подсчитанные на их основе средние арифметические величины, а также ряды динамики позволяют описать социальное явление, событие, процесс, но не дают возможности выяснить причины. А вот на основе анализа статистических таблиц можно составить некоторое представление о причинно-следственных связях, поскольку таблица показывает, как с изменением одного признака изменяется другой.

Ответ на вопрос о причинно-следственных связях дают такие методы математической статистики, как корреляционный, дисперсионный, факторный анализ и др.

Для анализа и наглядного представления полученных данных также используются графические методы — полигоны, гистограммы; секторные, круговые, ленточные и другие диаграммы.

return false">ссылка скрыта

Самый распространенный метод графического представления одномерных распределений - это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной, причем его середина совмещается с серединой данного интервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определенный интервал. Если просто соединить между собой точки, соответствующие абсолютным или относительным частотам (ось ординат) для середин интервалов, мы получим так называемый полигон распределения.

Пусть, например, вопрос в используемой социологом анкете звучит: “Какова Ваша профессия?” и сопровождается 5-ю вариантами ответов, закодированных числами от 1 до 5. Тогда частотное распределение - будет иметь, например, вид: