Тема 1. Основные принципы измерения в социологии. Типы переменных

План

1. Предмет, задачи и структура курса.

2. Понятие измерения в социологии: методологические основы, методы
и уровни измерения.

3. Шкала - эталон измерения. Виды шкал в социологическом исследовании, их особенности, математические процедуры для каждой из них.

4. Виды ошибок измерения.

5. Типы переменных.

6. Особенности статистических рядов в ходе измерения социологической информации.

 

Методические указания по изучению темы

«Основные принципы измерения в социологии. Типы переменных»

Тема «Основные принципы измерения в социологии. Типы переменных» является вводной темой курса «Математические методы в социологии». Учитывая тот факт, что для «студентов-социологов» не является очевидной целесообразность изучения математики, в рамках данной темы следует обратить особое внимание на цель и задачи курса, подчеркнуть необходимость его изучения для будущей профессиональной деятельности.

Конечно же, студентам известно о том, что предметом социологии является изучение общества или его отдельных фрагментов сквозь призму их социальной организации, социальных связей и отношений. Необходимо вспомнить о том, что в организационной структуре социологических исследований существует три независимых уровня: уровень фундаментальных исследований (приращение научного знания путем построения теорий); уровень прикладных исследований (изучение актуальных проблем на основе фундаментальных знаний); социальная инженерия – уровень практического внедрения научных знаний. В этом контексте особую актуальность приобретают проблемы измерения социальных процессов и явлений. Несмотря на то что само понятие «измерение» уходит корнями в точные (математические) науки и имеет дело с конкретными числовыми значениями, основой прикладной социологии являются именно измерительные операции. Студентам необходимо запомнить, что для социолога измерение - это процедура, с помощью которой объекты социологического исследования отображаются в определенной числовой и/или графической системе, что осуществляется посредством математических методов. Такими системами являются шкалы. Представление социологической информации в виде шкал открывает возможности осуществления ряда математических операций, что в итоге позволяет исследователю сделать конкретные выводы в отношении предмета и объекта изучения. Студентам должно быть известно из содержания других курсов о том, что в социологии, как правило, используются следующие шкалы: номинальная; порядковая; метрическая. Однако, следует знать, что существуют и другие варианты измерения при помощи иных шкал.

Важно помнить, что в любой науке, и тем более гуманитарной, все исследовательские процессы требуют человеческой деятельности. В связи с этим каждое изменение подвержено ошибкам, свойственным человеку, а следовательно, каждое наблюдение выражается в численном виде с большей или меньшей ошибкой. Однако подобные ошибки не следует путать с погрешностями. Основное различие между ошибкой и погрешностью заключается в том, что для оценки и исключения погрешностей существует статистическая техника, в то время как ошибки исправить невозможно.

Кроме вопросов о видах шкал, ошибках и погрешностях, в рамках изучения данной темы студенты должны усвоить материал, связанный с рассмотрением различных типов переменных. В этой связи следует запомнить, что любой объект, который в ходе последовательных наблюдений меняется качественно или количественно, может быть назван переменной. Соответственно, переменные классифицируются как качественные или количественные. Помимо этого,
в математической статистике различаются также дискретные и непрерывные переменные. Дискретные представляют события, которые считаются «неделимыми», которые просто существуют или отсутствуют (все качественные переменные по своей природе дискретны). Количественные же могут быть как дискретными (прерывными), так и непрерывными.

Студентам следует также усвоить, что в соответствии с приведенной выше классификацией существует два основных типа статистической группировки: количественная (величины объединяются в упорядоченные интервалы – классы) и качественная (признаки дифференцируются по категориям разного порядка). При этом первым шагом к упорядочению результатов измерения является расположение их в зависимости от величины – в порядке возрастания или убывания. Для дальнейшего упрощения восприятия данных и их анализа необходима группировка близких величин в интервалы (классы родственных объектов).

Нужно помнить, что социологические данные, как правило, представляются в виде таблиц частот. Для того чтобы сделать материал, содержащийся в подобных таблицах, максимально доходчивым, следует придерживаться определенных правил, касающихся как содержания, так и общего вида таблиц. Например, заголовок таблицы должен в краткой и лаконичной форме доносить ее содержание
(то есть отвечать по порядку на вопросы: «Что?», «Как?», «Где?» и «Когда?»).

Студенты должны всегда иметь в виду, что любое частотное распределение приобретает смысл только в сопоставлении с другими распределениями. Однако при сравнении двух и более распределений часто возникают трудности, связанные с существующими различиями в природе соответствующих величин. Для того чтобы подобное сравнение стало возможным, опять же, необходимо обратиться к математике и перевести абсолютные величины в относительные
(в доли или проценты). Эта процедура представляет собой деление частоты
в каждой клетке таблицы на сумму всех величин (для получения долей) и умножение этого результата на 100 (для получения процентов).

 

Вопросы и задачи для самоконтроля

1. Определите процесс измерения с различных позиций.

2. Дайте определение шкалам, их типам. Проанализируйте возможности и различия шкал для измерения социологических процессов и явлений.

3. Индивид А одобрил 50 из 100 признаков, подтверждающих наличие расовых предрассудков, в то время как индивид В одобрил только 25. Можно ли утверждать, что расовых предрассудков у А в два раза больше, чем у В? Приведите все доводы «за» и «против».

4. Каковы возможные ошибки, погрешности и их источники в следующих гипотетических измерениях: а) число разводов увеличилось на 20% за последние 50 лет; б) 20% рабочей силы являются безработными.

5. Ошибки и погрешности являются отклонениями от «истинного» значения. В каких случаях это истинное значение наиболее очевидно?

6. Размер семьи является дискретной переменной, однако средний размер семьи в Украине составляет 3,4 человек, а в США - 7,8 человек. В чем заключается противоречие и каковы возможности его устранения?

7. Семейный доход измеряется в дискретных гривнях и копейках, тем не менее доход определяется как непрерывная переменная. Объясните кажущееся несоответствие этих утверждений.

 

Тема 2. Перекрестная классификация. Графическое представление
социологической информации

 

План

1. Типы перекрестной классификации социологической информации
и их интерпретация. Особенности построения и анализа динамических рядов.

2. Кумулятивные динамические ряды. Возможности математического анализа в изучении совпадающих тенденций развития социальных процессов.

3. Назначение графика. Общие принципы и частные примеры построения графиков при визуализации социологической информации.

4. Отображение двух, трех и более полигонов на одном графике. Возможности «ЕХСЕL» при построении различных видов графиков.


5. Графики качественных данных: диаграмма полос; круговая диаграмма – гартовская диаграмма; статистическая карта; временные диаграммы; многозначный график.

Методические указания по изучению темы

«Перекрестная классификация. Графическое представление
социологической информации»

В ходе изучения данной темы необходимо усвоить ее основные понятия, а именно: гистограмма, полигон распределения, правило нулевого начала, разрыв шкалы, многозначный график, арифметическая шкала, арифметическая временная диаграмма, график отношений, кумулята, диаграмма полос; круговая диаграмма.

Важным является усвоение основных форм и методов представления данных, собранных в ходе социологического исследования. Большие массивы данных, с которыми обычно работает социолог, довольно сложны для целостного восприятия человеческим сознанием. Однако именно целостность необходима для полноценного анализа этих данных. В связи с этим социология заимствует у математической статистики ряд методов группировки и представления информации. Изначально данные группируются в таблицы. Необходимо обратить внимание на тот факт, что любой табличный материал можно представить в графической форме, которая (обычно) более наглядно, чем таблица, выражает картину общего распределения. Однако следует учитывать, что не всегда подобная визуализация действительно необходима. Главное назначение графика – дать наиболее точное представление о форме частотного распределения – представление, понятное каждому.

Студентам, наверняка, уже известно, что существует множество видов графического представления. И все же, нужно понять, что каждое из них полезно в своем конкретном приложении, и научиться определять, какой вид или тип графика будет более уместен в конкретном случае. Некоторые из них весьма сложны, но для студентов, обучающихся социологическим специальностям, достаточно усвоить основные и простейшие: 1) гистограмма, 2) кумулята,
3) полигон распределения, 4) диаграмма полос, 5) статистическая карта, 6) временная диаграмма.

Первые три из указанных шести типов применимы только к количественным данным. Для визуализации качественных данных можно использовать диаграмму полос. Статистическая карта представляет распределение событий по географической площади, а временная диаграмма является графическим вариантом динамического ряда.

Следует всегда иметь в виду, что графики эквивалентны таблицам, а следовательно, они должны иметь аналогичные названия и обозначения и подчиняться критериям доступности, простоты и ясности. График нельзя построить до тех пор, пока не будет приготовлена соответствующая таблица.

Необходимо помнить, что гистограмма состоит из ряда соприкасающихся столбцов, высота которых пропорциональна частоте соответствующего класса событий, а ширина пропорциональна величине интервала группировки переменной. Гистограмма является не только графической записью абсолютных частот группировок, но и наглядным изображением значения каждой частоты относительно всех других.

Полигон распределения предназначен для изображения динамики изменения данных в виде сглаженной кривой, которая, возможно, возникла бы, если бы размеры интервалов стремились к нулю, а число наблюдений неограниченно возрастало. Полигон распределения можно получить из гистограммы, проводя прямые линии через средние точки верхних частей смежных столбцов.

Построение кумуляты несколько сложение, однако она весьма полезна,
так как позволяет расчленять частотное распределение в любых точках в зависимости от необходимости.

Студентам следует знать, что графическое изображение качественных данных отличается от графиков количественных данных. Для графического изображения качественных данных используется длина отрезка, площадь фигуры или интенсивность оттенка цвета. Здесь представляется только три простейших обычно встречаемых типа: 1) диаграмма полос; 2) гартовская диаграмма; 3) статистическая карта.

Важно также помнить, что при некоторых обстоятельствах возможно начертить на одной и той же арифметической шкале два или больше временных ряда (чтобы более ясно выявить соотношения между ними). Такой график легко понятен, потому что две переменные имеют приблизительно одну и ту же область и общее расположение на шкале. Однако студенты должны иметь в виду: эта процедура должна производиться с некоторой предосторожностью, так как может ввести в заблуждение в тех случаях, когда переменные располагаются неидентично. Ложное впечатление возникает в результате того, что два ряда данных расположены на неравных расстояниях от начала отсчета.

В целом, для выработки практических навыков в рамках данной темы, предлагается выполнить задание, заключающееся в следующем: каждый студент получает опросный лист, в котором уже зафиксированы результаты одномерного частотного распределения по каждому признаку; необходимо внимательно изучить этот опросный лист и постараться максимально полно визуализировать содержащиеся в нем данные (в табличной и/или графической форме – на усмотрение студента).

Вопросы и задания для самоконтроля

1. Определите следующие понятия: гистограмма, полигон распределения, правило нулевого начала, разрыв шкалы, многозначный график, арифметическая шкала, арифметическая временная диаграмма, график отношений, кумулята, диаграмма полос; круговая диаграмма.

2. Объясните, что более целесообразно: вычерчивать относительные или абсолютные частоты? Изменяется ли внешний вид гистограммы, когда на график вместо абсолютных частот наносятся относительные частоты?

3. В каких случаях полигон распределения наилучшим образом представляет дискретные данные? Рассмотрите его соответствие для наименьших возможных интервалов и для интервалов увеличенной ширины.

4. Если попытаться сравнить два распределения путем наложения графиков один на другой, какой тип представления данных лучше выбрать: гистограмму или полигон распределения? Объясните почему?