Априорное ранжирование факторов
Существует ряд задач, где напрямую не определяются параметры распределения. Одним из самых распространенных классов задач является группировка тех или иных объектов в соответствии с набором ряда признаков. В рамках этого класса задач простейшей задачей является задача ранжирования тех или иных объектов, обладающих рядом свойств, в том числе качественных. В рамках этой задачи рассматривается модель обработки данных экспертного анализа. Пусть для проведения экспертизы приглашены m экспертов. Каждый эксперт должен установить важность каждого из n факторов, задав каждому фактору определенное место или ранг. Ранги могут быть расположены по возрастанию или убыванию. И в том и в другом случае нужно проанализировать каждую полученную ранжировку. А именно:
· Эксперт каждому фактору присваивает собственный ранг. Тогда сумма всех рангов, присвоенных iым экспертом n-факторам равна сумме элементов арифметической прогрессии. Эта сумма является весовым коэффициентом каждого эксперта.
· Если эксперт затрудняется присвоить индивидуальный ранг каждому фактору, а присваивает индивидуальные ранги группе факторов, то говорят, что ранжировка содержит связанные ранги. Тогда нужно выполнить преобразования, заменив одинаковые ранги средним значением суммы этих рангов в нормальной ранжировке:
Фактор | |||||
Место |
Место | |||||
Среднее значение | 3,5 | 1,5 | 3,5 | 1,5 |
В приведенной выше таблице две группы связанных рангов, содержащих в каждой группе по два ранга.
По данным нормальной матрицы ранжирования можно найти: 1.Коэффициент конкордации, который служит мерой согласованности мнений экспертов и является единой выборочной мерой связи признаков. Этот коэффициент был предложен Кенделлом и Бебингтоном Смитом. Коэффициент можно рассчитать по формуле, которая учитывает связанные ранги: ,
где
. – среднее значение суммы рангов матрицы.
- сумма рангов, присвоенных всеми экспертами jому фактору. Tiоценивает связанные ранги:
, где t – количество связанных рангов в одной группе в iой ранжировке. l – количество групп, связанных рангами в iой ранжировке. W меняется от 0 до 1. Считается, что чем W ближе к 1, тем лучше мнение экспертов отражает реальность. После расчета W обязательно нужно оценить его значимость. Можно воспользоваться χ2-статистикой: . Если χ2расч> χ2табл, полученного при ν=n-1, H0 о равновероятности всех возможных ранжировок должна быть отвергнута. W – значима.
2.Коэффициент ранговой корреляции: бывают двух видов:
· коэффициент ранговой корреляции Спирмена (1904):
, dj – разность рангов jого фактора назначенных двумя экспертами: .
· коэффициент ранговой корреляции Кенделла:
,
где sign(x)=-1, если x<0
0, если x=0
1, если x>0
Наиболее широкое применение находит коэффициент Спирмена. После расчетов этих коэффициентов нужно обязательно оценить их значимость. Значение ρ и τ меняются от 0 до 1.
. Критическая точка двусторонней критической области при выбранном α и k=n-2. Если |ρ|<tкр, то H0принимается, то есть ранговая корреляционная связь между качественными признаками не значима. H0: ρ=0 в генеральной совокупности.
Коэффициент Кенделла:
, где Zкр – критическая точка двусторонней критической области, которая находится на таблице функции Лапласа:
. Если |τ|<Tкр, то H0 принимается, иначе отвергается.
Задача: нужно определить степень важности, а, следовательно, и очередность автоматизации ряда процессов легкой промышленности. Были приглашены6 экспертов, которым было предложено проранжировать 8 процессов:
- Подача материала к рабочим элементам швейных машин.
- Транспортировка рулонов ткани от склада к раскройным столам.
- Автоматизация вспомогательных приемов на пошивочном участке.
- Внутрипроцессорная транспортировка полуфабрикатов.
- Складирование рулонов ткани.
- Раскрой ткани.
- Разбраковка и промер ткани.
- Комплектовка тканей.
Требуется построить диаграмму рангов, дать заключение о согласованности мнений экспертов, провести анализ результатов. В результате анкетирования была получена информация, которая представлена в исходной матрице ранжирования.
ЭкспертФактор | ||||||||
Здесь первый и шестой эксперты не затруднились в ранжировании предложенных процессов, присвоив каждому процессу свой индивидуальный ранг. Все остальные эксперты некоторым факторам присвоили одинаковые ранги, причем второй эксперт условно разбил 8 процессов на три группы. То есть, сформированы три группы связанных рангов l=3, при этом в первой группе содержится два связанных ранга: t1=1, t2=3, t3=3. Данные исходной матрицы преобразуются в нормальную матрицу ранжирования.
ЭкспертФактор | Сумма | Количество связанных рангов | ||||||||
- | ||||||||||
1,5 | 1,5 | 2, 3, 3 | ||||||||
2,5 | 2,5 | |||||||||
4,5 | 4,5 | |||||||||
1,5 | 1,5 | |||||||||
- | ||||||||||
Σkij |
Σ ранж
факторы
Диаграмма рангов ясно показывает, что экспертный опрос позволил выделить три группы процессов: первая группа включает в себя процессы 7 и 6, которые нужно подвергнуть первоочередной автоматизации. Во вторую группу вошли процессы 2, 5, 8. В последнюю – третью группу, можно включить процессы 3, 1, 4.
Краткие выводы по курсу
Подавляющее большинство моделей относятся к моделям параметрической статистики и связаны с исследованием свойств одной величины или системы величин. Для теории вероятностей характерны параметры для статистического анализа. По данным выборки формируются статистики. Статистики позволяют по ограниченному набору показателей определить самые важные свойства распределений. Для одной случайной величины наиболее важными свойствами распределения являются:
· Положение кривой распределения, определяемое тем ее значением, относительно которого располагаются все другие значения этой величины.
· Степень рассеяния значения случайной величины относительно указанного значения.
· Степень косости кривой распределения.
· Степень крутости – эксцесс.
В статистике аналогами этих свойств служат соответствующие свойства ряда распределения. При формировании гистограммы можно выбрать правило «золотого сечения»: гистограмма помещается внутрь прямоугольника, где высота h относится к основанию a, как 5:8.
При анализе системы двух величин основными свойствами связи между ними являются:
· Форма связи. Форма связи – корреляция линейная и нелинейная.
· Направлене связи – положительная или отрицательная.
· Степнь связи – коэффициент корреляции, корреляционное отношение.
Статистические связи заключаются в том, что одному значению одной случайной величины соответствует ряд распределения другой случайной величины.
Стохастические связи – когда изменению одной случайной величины соответствует изменение той или иной характеристики расположения другой случайной величины. После расчета любых статистик обязательно следует процедура их оценки.
Большое практическое значение имеют задачи: оценки коэффициента корреляции в одной выборке и в двух выборках, проверки наличия корреляции в генеральной совокупности, оценка дисперсии, оценка среднего значения в генеральной совокупности и между двумя выборками. При проведении любого выборочного анализа возникает проблема отсева грубых погрешностей, который можно проводить по разным методикам. Например, , где
xi – xmax или xmin. τ1-p – табличное значение τ-критерия при доверительной вероятности q=1-p. Если неравенство соблюдается, то x не отсеивается, иначе объем выборки уменьшается64;-критерия при доверительной вероятности q=1-p. Если неравенство соблюдается, то x не отсеивается, иначе объем выборки уменьшается на 1.