Шкалограммный анализ Гуттмана

Разработка шкал

Отдельно выделяют шкалы установок. Устанвока отражает ценностное отношение респондента к обхекту. Она показывает сочетание позитивных и негативных чувств респонедента по отношению к объекту. Выобрреспонедентом того или иного суждения будет говорить о степени выраденности его эмоционального отношения к предметц установки. Использование устаноччныхшкла отличается тем, что цифры приписыаются самим респонендентам. Известын три основных шкалы установок:

ü Шкала Гуттмана (шкалограммный анализ)

ü Шкала Лайкерта (метод суммарных оценок)

ü Шкала Терсторуна (метод равных, или субъективно равных интервалов)

Выше перечисленное – это методы, способствующие увеличению мощности шкалы, потому что со шкалами мы можем совершать различные преобразования – мы пожем понижать мощность шкалы, но чаще всего это тривиальная процедура. Как правило, социолог заинтересован в увеличении мощности шкалы.

Этот прием измерения используется … одномерной шкалы, то есть континуума значения социальной установки. Шкала Гуттмана строится в три этапа:

Ø На первом этапе набираются суждения, упорядоченные по определенном основании, на одну тему. Например, мы изучали мнения о новых русских:

a) Новые русские – это умные и деловые люди

b) Новые русские – это …

c) У новых русских нет морали

d) Без новых русских нет России

e) Новые русские нужны ювли России

f) Новые русские состоят из бандитов и жуликов.

В этих суждениях есть 2 типа: о позитивном отношении к русским (a, d, e), поэтому за согласия с этими вариантами респондент получает один балл. Одновременно, с согласием о положительных суждениях будет отказ от суждений с негативнымисуждеиями. При наборе суждений на первом этапе вовсе не обязательно, чтобы количество суждений первого типа совпадало с типами суждений второго типа.

Мы знаем, что все они располагаются на одной прямой, но не знаем в каком порядке. Последующие два этапа построения шкалы позволяют выстроить эту упорядоченность.

Ø На втором этапе проводится пилотажное исследование, небольшое по объему. Респондентам предлагается отметмть согласие или несогласие с суждениями. Предположим, что мы опросили 9 респондентов.

	А	B	C	D	E	F	Сумма
	+	-	+	+	+	+
	+	+	-	-	-	+
	+	+	+	+	+	+
	-	-	-	-	-	+
	+	+	-	+	+	+
	+	+	-	+	+	+
	+	+	-	+	+	+
	+	-	-	+	-	+
	+	+	-	+	-	+
Итого

Дальше мы должны выстроить иерархию суждений

F>A>D>B>E>C

Также мы должны проранжировать респондентов

«3» ≥ «1» ≥ «5» ≥ «6» ≥ «7» ≥ «9» ≥ «2» ≥ «8» ≥ «4»

Строим шкалограмму

F	A	D	B	E	C	Сумма
+	+	+	+	+	+
+	+	+	-	+	+
+	+	+	+	+	-
+	+	+	+	+	-
+	+	+	+	+	-
+	+	+	+	-	-
+	+	-	+	-	-
+	+	+	-	-	-
+	-	-	-	-	-

Если бы в области + были только +, а в области – только -, то шкалограмма была бы нереальной, а так как нет совершенства, то идеальной шкалограммы не бывает

Ø Проверка качества шкалограммы или ее репродуктивности

, где

– это общее число клеток

– это число респондентов

– это число суждений

– это число отклонений от идеальной шкалограммы

Граничное значение – 90%, то

R > 90% - шкалограмма репродуктивна, шкала работает

R < 90% - можно повысить репродуктивность шкалограммы , убрав противоречивое высказывание

На нашем примере видно, что в 96% случаев истинное значение, а в 4% - ложно, => можем присвоить нашим суждениям те баллы, которые они набрали и использовать жту шкалу как ранговую и даже метрическую.

Пример

А – новая методика повышает качество знаний (согласен – 1 балл, не согласен – 0)

Б – новая методика повышает интерес студента к новым знаниям

В – не все стороны новой методики хорошо продуманы и она мало эффективна (согласен – 0, не согласен – 1)

Г – новая методика значительно сложнее прежней – она вызывает перегрузку студента (согласен – 0, не согласен – 1)

Д – новые методы обучения ускоряют процесс профессионализации студента (согласен -1, не согласен – 0)

Е – новая методика облегчает труд преподавателя (согасен – 1, не согласен – 0)

Ж – новые методы слабо развивают творческое мышление студента (согласен – 0, не согласен – 1)

З – преимущества обучения по новой методике еще не выявлены (согласен – 0, не согласен – 1)

	А	Б	В	Г	Д	Е	Ж	З	Сумма
	+	-	+	+	+	+	-	-
	+	+	+	-	+	-	-	-
	+	-	+	-	+	+	-	-
	+	-	+	-	+	+	-	-
	-	-	-	-	+	-	-	-
	+	+	+	+	+	+	+	-
	+	-	+	+	+	+	-	-
	+	-	+	-	+	+	+	+
	+	-	-	+	+	-	-	-
	+	-	+	+	+	-	+	-
Итого

Д ≥ А ≥ В ≥Е ≥ Г ≥ Ж ≥ Б ≥ З

6 ≥ 8 ≥ 10 ≥ 1≥ 7≥ 2≥ 3≥ 4≥9≥5

Д	А	В	Е	Г	Ж	Б	З
+	+	+	+	+	+	+	-
+	+	+	+	-	+	-	+
+	+	+	-	+	+	-	-
+	+	+	+	+	-	-	-
+	+	+	+	+	-	-	-
+	+	+	-	-	-	+	-
+	+	+	+	-	-	-	-
+	+	+	+	-	-	-	-
+	+	-	-	+	-	-	-
+	-	-	-	-	-	-	-

Индексы в социологических измерениях

Одним из методов прямого измерения является построение индексов. В определении понятия «индекс» существует две позиции:

1. Индекс представляют как эмпирический показатель, которым обозначают наблюдаемые переменные и их значения. Здесь понятие показатель и индекс воспринимаются одинаково, то есть индекс в том смысле можно назвать любой код инфо. Индексы широко используются в статистике и массовых опросах.
Например, в качестве индекса используются результаты участия населения в голосовании. К числу голосов, поданных за ту или иную партию, можно приянть за индекс популярности этой партии. Однако, в большинстве случаев в социологии индекс рассматривается как сводный числовой показатель, полученный в результате исследований и анализа данных. Здесь индекс выступает как единый показатель свойств переменной, или несколькоих. Такой индекс используется для измерения латентной переменной. Сущность индексного метода в социологии состоит в редукции, то есть в сжатии социологической инфо и сведении ее е единому показателю. При этом не имеет значение количесвто признаков, индикаторов объекта, которые поверглись этому сжатию. Индекс как эмпирический показатель может создаваться и на начаьном этапе исследования и в результате уже проведенного исследования. Индекс показывает положение наблюдаемой единицы на одногмерной шкале и результат измерения на многомерной шкале.
Значимость индекса состоит в том, что он дает возможность сравнения и поиска отличий объекта и групп объектов. Выделяют несколько типов индексов:

a. Индексы в частной статистике. Практически вся государственная статистика состоит из аналитических индексов. Существует индекс качества жизни. В демографии есть индекс рождаемости, смертности. В медицине – индекс заболевания гриппом.
Можно провести опрос о различных аспектах социальной жизни, а затем свести все данные к единому показателю, спавнить их и определить соотношение по различным группам населения. С помощью индексов можно измерить и сравнить эффективность рекламы, уровень социальной напряженности, социального благополучия в обществе

b. Индексы в текстовой инфо: в качестве индексов здесь может быть приянта площадь, отводимая чем или иным изданием под разные рубрики. Индексом может служить и частота встречаемых положительных, или отрицательных, оценок чего-либо или кого-либо в изучаемом издании за период времени. Текстовые индексы применяются в методе контент-анализа. При создании индексов возникают некоторые методические проблемы – это, в первую очередь, поиск критериев отбора признаков, которые могут быт индикаторами исследуемого свойства. Во-вторых, определенный размер вклада и оказываемого влияния каждого выбранного признака на конечный единый … показатель индекс. Индекс позволяет эффекитвно свернуть инфо, содержавшуюся в исходных индикаторах, вопросах, текстах, пунктах. Однако от самого индекса уже нельзя вернуться к исходным данным, то есть индекс не позволяет устанавливать различия в структуре ответов респондентов.

c. Индексы в бюджетах времени. Индексный метод здесь используется преимущесвтвенно на стадии анализных данных, полученных на опросах, самонаблюдениях респондента. Индексы выступают в качесвте обобщенного показателя затрат времени на различные виды деятельности каждым респондентом или их совокупностью, а также частоты встречаемости этих видов деятельности в группе респондентов. Индекс этот может строиться на основе 5 показателей:

1) P₁ – средняя продолжительность затрат времени на осуществление занятий для всех респондентов
_,где
T_i – затраты времени на осуществление занятий, либо занятия отдельным i-респондентом
∑_Ti – сумма затрат времени всеми респондентами
N - число респондентов

2) P₂ – средняя частота встречаемости занятий для всех респондентов
, где
k_i – частота встречаемости занятия у одного респондента

3) P₃ – доля (% респондентов, которые используют тот или иной вид занятий среди всех респондентов (доля акторов))
, где
n_a – акторы

4) P₄ – средняя продолжительность затрат времени на осуществление занятий акторами

5) P₅ – средняя частота встречаемости показателя для акторов

d. Логические индексы - показатель определяемый логическим путем, то есть постреоенный на определенно логической схеме. С социологии используют логический квадрат, логический прямоугольник, логический куб.
Рассмотрим построение логического квадрата:
Например, необходимо выяснить удовлетворенность студентов учебой на каждом факультете по данной специальности. Для построения логического квадрата необходимо студентам задать 2 вопроса:

1) Представьте себе, что у вас есть возможность перейти на другой факультет, перешли бы? (да/нет/подумал бы)

2) Представьте себе, что вы нигде не учитесь, пришли бы вновь учиться на этот факультет? (да/нет/подумал бы)
в результате получаются 9 комбинаций (3 ×3). Сводим получившиеся данные в таблицу

	Нет	Подумал бы	Да
Да	a	b	F
Подумал бы	b	c	d
Нет	f	d	E

По соотношению на оба вопроса, самая большая социальная удовлетворенность – a; минимальная удовлетворенность – e средняя удовлетворенность в ситуации – c; ситуация b идентична: степень удовлетворенности в этом случае ниже, чем максимальная и выше, чем средняя; ситуация d близка по своему занчению …
Ситуация обозначается …, но с учетом логического сходства между ними. Логический квадрат потому и называется логичным, что исследователь проводит тонко логические операции; на входе в … логический квадрат мы имеем 2 трехбалльные шкалы, а на выходе одну ранговую шкалу с пятью градациями и одновременный детектор лжи
a > b > c > d > e
Можем присвоить им определенные баллы. Позицию a представить как удовлетворенность на 5 баллов, b – 4, c – 3, d – 2, e – 1. А кто … …

2. Продуманность композиции

3. Понятность вопросов для респондентов

4. Оригинальность вопросов

5. Четкость инструкции

6. Разнообразие шкал

7. Правила и эстетика

8. Филология грамотности

2. Аналитические индексы

Надежность социологического измерения

В социологии надежность социологического измерения имеет несколько аспектов. Одни социологи под надежностью понимают качество всего социологического исследования, то есть такого исследования, результатом которого можно доверять.

Другие социологи понятие надежности относят к измерительной процедуре, а точнее к измерительному инструменту. В некоторых случаях используется понятие достоверность. Надежность измерений и надежность отбора – это два аспекта надежности социологической инфо. Надежность инструмента и как следствие, надежность данных, получаемых с помощью измерений этим инструментом предполагала достижение при шкалировании таких требований, обоснованность, правильность, устойчивость измерения.

Контроль надежности необходимо рассматривать в этих 3 аспектах:

v Обоснованность шкалы заключается в том, что с ее помощью измеряют вполне определенные свойства или признак, не смешивая его с другими. Обоснованность предполагает уверенность в том, что измеряется заданное свойство объекта, а не какое-то другое на него похожее, то есть обоснованность – это соответствие инструментария измеряемому свойству объекта. Необходима обоснованность теории и эмпирики.

Теоритическая обонованность связана с содержанием исследования, выделением полного спектра смысловых ситуаций, отражающих концепцию исследования. Эмпирическая обоснованность предполагает получения надежных данных о свойствах объекта.
Для повышения обоснованности используют разные способы:

² Прежде всего – это логические рассуждения на основе опыта и здравого смысла. Такой способ контроля относят к самым простым. Например: необходимо измерить среднюю интенсивность просмотра телепередач с помощью метода опроса. Можно задать вопрос «Сколько, приблизительно, часов в день вы смотрите телевизор?»
5 интервалов шкалы:

1) Не больше 1

2) От 1 до 2

3) От 2 до 3

4) От 3 до 4

5) Более 4 часов
Сомнения в обоснованности этого метода: более логично выделить будни, выходные и праздничные дни, а также формулирование вопроса о том, в какие дни и сколько часов проводит респондент у телевизора. Таким образом, мы можем высчитать среднее просмотровое время.

² Помимо логического анализа используется тест по эталонной группе (более сильный способ). Смысл: сопоставление данных, полученных путем измерения по шкале с достоверными сведениями об объекте измерения. Так, например, измерения правосознания можно провести путем сравнения эталона негативного порядка и эталона правопослушных граждан.

² Проверка обоснованности шкалы измерения может быть осуществлена с помощью независимого критерия, в качестве которого выступает фиксируемая величина (самообследование, самофиксация затрат). С таким показателем может быть сравним величина среднепросмотрового времени, полученного во времени опроса респондента.

² При отборе шкал и их значений иногда метод экспертизы. В качестве экспертов выступают типичные представители основной массы опрашиваемых. Поэтому состав судей должен быть репрезентативным, то есть отражать характеристики групп респондентов по основным социальным параметрам.

v Правильность измерения.
Валидность (правильность) – соотнесение результата измерения шкалы ее истинному значению.
Правильность - способность, использования инструмента на … уровне, дифференцировать … совокупность. В противном случае, может оказаться, что не работает какая-то часть шкалы или недостает градации (то есть, разброс значений).
Например, если ответы респондентов фиксируются только в … пункте шкалы то это свидетельствует о ее непригодности, тогда как предлагаемые значения не имеют отношения к определяемому свойству объекта (не являются релевантными), или они трудно воспринимаемые, или ощущается влияние на респондента устоявшегося общественного мнения. Такая шкала нерелевантная.
Подобная ситуация встречается при использовании шкалы семантического дифференциала (Осгуд). Здесь дается набор полярных суждений, характеристик объекта, которые должны быть семантически привязаны к 3 основным полям: сила, активность, оценка.
Не редко во время опросов мы видим, что используется только часть шкалы, или один из ее полслв. Такое встречается, когда оценивается заведомо положительное/отрицательное явление. Тоже может произойти в случае, Если содержание значений переменной не равноценны, или шкала представлена чрезмерно дробной. Респонденту выбирать из большого числа предлагаемых вариантов всегда трудно. Он обращает внимание на основной, базовый, наиболее понятный вариант. Таким образом, недостаточная правильность измерения может проявляться:

· В отсутствии разброса значений по шкале, то есть все респонденты отметили 1 вариант ответа. Это говорит о том, что шкала построена не верно.

· Когда респондентами используется лишь часть шкалы (отрицательная часть шкалы избегается) => данная часть шкалы не работает.

· Неравномерное использование отдельных пунктов шкал. Шкальные значения, выраженные в баллах, не должны существенно отличаться по частоте, или по числу респондентов, от соседних. Если это отличие присутствует, то данные значения проявляются статически.
В социологии правильность определяется как отсутствие систематических ошибок, смещений. Прежде всего, смещений в шкале, то есть систематические ошибки – это ошибки, заданные самим исследователем в процессе конструирования шкалы, следовательно, они будут повторятся из раза в раз.

v Устойчивость – повторяемость получаемых результатов при повторных измерениях; отсутствие каких-либо существенных отклонений в них при некотором смещении процедуры исследования данной шкалы.
Устойчивость может быть:

· Полной (абсолютной) (характеризуется долей совпадающих ответов в ходе повторных измерений)

· Относительной (показывает способность шкалы отражать изменчивость … объекта его измеряемых свойств)

Апробируется какая-либо шкала на определенной группе респондентов, а через 2-3 недели та же группа оценивается по той же шкале – ретест. После проведения повторного опроса по каждому респонденту проводится сравнение результатов (смотрят на повторяемость результатов, тем самым оценивается устойчивость).
Оценка устойчивости – процент совпадения ответов на вопросы 2 измерений:

ü Если > 90% - устойчивая

ü Если < 90% - необходимо переделать

Эта проблема имеет и методические, и теоретические аспекты. Они связаны с правильностью перевода теоретических понятий в операциональные, а затем, в эмпирические индикаторы. Повышение устойчивости измерения достигается также за счет изменения чувствительности шкалы, путем повторения оптимального числа ее градаций. При меньшем числе градаций – менее чувствительна, зато более надежна. А при большом количестве значений шкалы – более чувствительна, но менее надежна, с большим риском появления ошибок. Рекомендуется использовать столько градаций в шкале, чтобы ошибки были сведены к минимуму.

v Ранжирование
…
Число рангов может быть равным числу объектов. В этом случае мы говорим о бесповоротном ранжировании.
Если допускается, что некоторые объекты могут иметь одинаковые ранги, то числа рангов и числа объектов не будут совпадать. В этом случае говорим о повторном ранжировании. Является ранжирование повторным или бесповоротным оговаривается в инструкции респондента.
Например, "Проранжируйте, насколько Вам важны следующие объекты… Цифрой 1 обозначьте самое важное, на 2 месте, следующее по значимости и т.д. Одной цифрой можно обозначить только 1 значение»
Объектами ранжирования могут быть респонденты (их мнения) и объекты (их свойства). Респондентов ранжируем по степени активности удовлетворенности, престижности, качества жизни и пр.
Объектами ранжирования могут быть товары, наблюдаемые явления, процессы, установки и т.д.
Все ранжируется по разным основаниям: товары – по степени нужности, качеству, цене, внешнему виду упаковки, использованию, безопасности, долговечности - но важно, чтобы непосредственно процесс ранжирования шел по одному основанию.
Ранжирование:

§ Прямое

§ Сложное (вычисление ранга)

Ø Ранжирование свойств объекта может осуществляться по сумме ответов респондентов, путем вычисления средней величины рангов каждого из свойств.

Ø Ранжирование возможно в результате выбора респондентом некоторых свойств объекта. Например, «Подчеркните какие характеристики товара для вас являются более значимыми».

Ø Ранжирование возможно при использовании порядковой шкалы (когда респондент сам определяет ранг объекта и присваивает ему определенную цифру, место или балл)

Ø Ранжирование возможно и по степени убывания значимости, ценности или свойств объекта без указания собственного ранга («Вычеркните из предложенных характеристик объекта те, которые не имеют для Вас значения»)
Так, например, мы можем определить степень доверия к политикам:

a) По количеству голосов респондентов, выразив им доверие – рейтинг

b) Путем непосредственного ранжирования политических деятелей , то есть выставление им соответствующего ранга по степени популярности, влиятельности, известности, содержательности с помощью любых шкал. Затем ведется подсчет среднего ранга и построение ранжированного ряда.

Если объекты мало различимы по своим свойствам, то они имеют одинаковые ранги. Их называют связанными рангами.