Сущность и виды группировок. Таблицы и графики: их роль в анализе социологических данных.
В ходе исследований социологи собирают большие объемы информации. Чтобы сделать на их основе определенные выводы, необходимо всю информацию сжать, представить в виде небольшого числа обобщающих (статистических) показателей, удобных для дальнейшего анализа. Для решения этой задачи применяются методы математической статистики и ЭВМ. Сводка и группировка первичной информации представляют собой первый этап работы с ней.
Затем наступает этап анализа информации. В общем виде можно назвать следующие типы аналитических задач: описание социальных явлений; поиск причинно-следственных связей; прогнозирование; оптимизация процессов; принятие решений.
К основным методам математической статистики, получившим наибольшее распространение в социологии, относятся: статистическая группировка; построение рядов распределения; статистические таблицы; подсчет средних арифметической и геометрической, моды, медианы, среднего квадратичного (стандартного) отклонения и дисперсии; определение взаимосвязей двух и более признаков при помощи уравнений регрессии, корреляционного, дисперсионного, факторного и других методов; определение статистических ошибок; проверка статистических гипотез; графические и другие методы.
Самым начальным этапом является статистическая группировка, которая позволяет распределить единицы изучаемого объекта на однородные группы по существенным для него признакам. Например, несколько тысяч анкет можно свести к нескольким группам по профессиональному признаку (токари, слесари, плотники, столяры и др.), а затем подсчитать все значения других признаков — как они распределяются по полу, возрасту, образованию, зарплате, удовлетворенности профессией и т.д. Анализ этих признаков в зависимости от профессии позволяет сделать вывод о причинно-следственных связях и др.
Выбор группировочного признака зависит от целей исследования. Социологическая информация может быть сгруппирована по:
- номинальному признаку (род занятий, национальность и т.д.);
- признакам, соответствующим ранговым шкалам (например, по характеру труда: ручной труд, работа с механизмами, наладка станков, интеллектуальный труд);
- количественному признаку (группы характеризуются числовым значением, они качественно сравнимы между собой, например группировка по возрастным интервалам: 18—20 лет, 21—25 лет, 26—30 лет и т.д.).
При работе с номинальными и ранжированными группами используются приемы математики, а группы, распределенные по количественному признаку, изучаются с помощью математической статистики.
Группировки бывают разных видов. Простая группировка- это классификация или упорядочение данных по одному признаку. Связывание фактов в систему осуществляется здесь в соответствии с описательной гипотезой относительно ведущего признака группировки (или признака классификации). Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию, по высказанным суждениям и т.д.Перекрестная (комбинированной) группировкаиспользуется, если опрашиваемых необходимо сгруппировать по двум или более признакам (например, по полу, возрасту и образованию), Она может быть структурной, типологической, аналитической — все зависит от решаемых в ходе исследования задач. Структурная группировка применяется при обобщении опрашиваемых по какому-либо признаку, присущему всей изучаемой совокупности, например, при установлении возрастного состава опрашиваемых.. Если же необходимо выделить из респондентов группы соответствующие типы, тогда осуществляется типологическая группировка. Аналитическая группировка производится по двум и более признакам и служит для выявления их взаимосвязи. Если нужно проверить, имеется ли связь между интересом к вопросам нравственного воспитания и чтением литературы (газет, журналов, монографий по данной проблеме), то группировку следует сделать по этим двум признакам.
В социологическом исследовании, как правило, выделяется не одна, а несколько групп респондентов (по возрасту, образованию, месту проживания и т.п.). Каждой группе соответствует некоторое выделенное число, которое характеризует количественный состав группы. Такой ряд чисел, получаемый в результате группировки, социологи называют рядом распределения. Ряд распределения называется вариационным. Например, построим вариационный ряд, отражающий распределение по стажу работы.
Стаж работы (х) | ||||||||||
Число рабочих (n) | ||||||||||
Объем совокупности составляет 526 |
Приведенный вариационный ряд можно преобразовать в интервальный вариационный ряд.
Стаж работы (х) | До 2 | 2-4 | 4-6 | 6-8 | 8-10 | 10 и более |
Число рабочих (n) | ||||||
Объем совокупности составляет 526 |
Часто в социологических исследованиях используют динамические ряды (временные ряды, ряды динамики), представляющие собой изменения значения признака по годам (месяцам). Например, можно построить ряд динамики на основе следующих данных:
Год | ||||||
Количество кинопосещений |
Как видно, сначала число кинопосещений росло, затем — неуклонно снижалось. Динамический ряд не указывает причины событий, однако дает некоторое представление о процессе и побуждает к поиску причинно-следственных связей.
Статистические таблицы представляют собой группировку и распределение обследованных индивидов по двум или более признакам. Один из них является подлежащим, другой — сказуемым. Анализ таблиц дает некоторое представление о причинно-следственных связях, т.е. показывает, как изменение одного признака сопровождается изменениями другого (других). Таблицы (таблицы сопряженности) имеют следующий вид:
X | Y | Итого | |
a | b | a+b | |
c | d | c+d | |
Итого | a+c | b+d | a+b+c+d |
буквы в клетках обозначают соответствующие частоты
Предположим, что мы имеем два признака признака – пол (1 – мужчина, 0 – женщина) и курение (1 – курит, 0 – не курит).
Курение | Пол | Итого | |
м | ж | ||
Курит | |||
Не курит | |||
Итого |
Данные таблицы 15 говорят о том,что в нашей совокупности имеется 90 мужчин, из которых 80 человек курят, и 10 женщин, среди которых 4 человека курящих и т.д.
Ряды распределения и подсчитанные на их основе средние арифметические величины, а также ряды динамики позволяют описать социальное явление, событие, процесс, но не дают возможности выяснить причины. А вот на основе анализа статистических таблиц можно составить некоторое представление о причинно-следственных связях, поскольку таблица показывает, как с изменением одного признака изменяется другой.
Ответ на вопрос о причинно-следственных связях дают такие методы математической статистики, как корреляционный, дисперсионный, факторный анализ и др.
Для анализа и наглядного представления полученных данных также используются графические методы — полигоны, гистограммы; секторные, круговые, ленточные и другие диаграммы.
return false">ссылка скрытаСамый распространенный метод графического представления одномерных распределений - это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной, причем его середина совмещается с серединой данного интервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определенный интервал. Если просто соединить между собой точки, соответствующие абсолютным или относительным частотам (ось ординат) для середин интервалов, мы получим так называемый полигон распределения.
Пусть, например, вопрос в используемой социологом анкете звучит: “Какова Ваша профессия?” и сопровождается 5-ю вариантами ответов, закодированных числами от 1 до 5. Тогда частотное распределение - будет иметь, например, вид: