ВНИМАНИЕ
Полученные таким путем значения случайных величин изменяются в ячейках таблицы при каждом пересчете.
---------------------------------------------------------------
Более простые по сравнению с законами распределения способы описания случайных величин связаны с использованием ихстатистических характеристик: среднего значения, дисперсий, среднеквадратичного отклонения, медианы, моды, квартиля, скоса и т. д.
ПРИМЕР
Рассмотрим случайную величину Х — ежедневное количество покупателей в некотором магазине. Пусть — это фактически подсчитанные количества покупателей соответственно в первый, второй,..., n-й день проведения подсчетов. Такую группу фактически измеренных значений случайной величины принято называтьвыборкой. Среднее значение случайной величины Х (обозначается как <х> или М[Х]) по имеющейся выборке вычисляют с помощью формулы:
Пусть, например, замеры количества покупателей в течение недели в магазинах № 1 и № 2 дали результаты, представленные в табл. 4 и 5 соответственно. Обозначим ежедневное количество покупателей в первом магазине как случайную величину X, а ежедневное количество покупателей во втором магазине как случайную величину Y. По приведенным в таблицах данным видно, что в среднем в день в каждом из рассматриваемых магазинов бывает 700/7= 100 покупателей, то есть<x>=100 и <y>=100.
Таблица 4. Замеры количества покупателей в магазине № 1
№п/п | День недели | Условное обозначение | Количество покупателей | (xi - <x>)2 |
Понедельник | x1 | 40*40=1600 | ||
Вторник | x2 | 20*20=400 | ||
Среда | x3 | (-20)*(-20)=400 | ||
Четверг | x4 | 50*50=2500 | ||
Пятница | x5 | (-10)*(-10)=100 | ||
Суббота | x6 | (-30)*(-30)=900 | ||
Воскресенье | x7 | (-50)*(-50)=2500 | ||
Итого |
Таблица 5. Замеры количества покупателей в магазине № 2
№п/п | День недели | Условное обозначение | Количество покупателей | (yi - <y>)2 |
Понедельник | y1 | 1*1=1 | ||
Вторник | y2 | (-2)*(-2)=4 | ||
Среда | y3 | 0*0=0 | ||
Четверг | y4 | 2*2=4 | ||
Пятница | y5 | (-3)*(-3)=9 | ||
Суббота | y6 | 3*3=9 | ||
Воскресенье | y7 | (-1)*(-1)=1 | ||
Итого |
Средние величины используются при решении довольно широкого спектра задач экономического анализа. Рассмотрим, например, применение средних для определения уровня сезонности явлений (так называемой «сезонной волны»). Под сезонностью понимают изменения показателей величин, вызванные различными объективными факторами сезонного характера (например, такими факторами могут выступать смена времен года или изменения природно-климатических условий). В качестве показателей сезонности обычно применяютиндексы сезонности. Наиболее часто для определения индексов сезонности применяют метод простой средней. В этом случае индекс сезонности вычисляют по следующей формуле:
,
где — среднее по определенному периоду времени (месяц, квартал), взятое в течение t лет;
- общее среднее, взятое за общее число периодов времени,
п — число анализируемых периодов, N=t*n,
yij— наблюдавшиеся значения случайной величины.
Пусть, например, ведутся помесячные наблюдения (период — месяц, число периодов n=12) за продажей некоторого товара в течение трех лет (t=3, N= t*n=36). Тогда i — это порядковый номер месяца, j — порядковый номер года наблюдения, yij — количество единиц товара, проданных в i-м месяце j-го года. Чтобы рассчитать индекс сезонности, скажем, января, нужно найти среднее число продаж только по январям за срок наблюдения и поделить на общее среднее по всем месяцам всего срока.
Среднее значение можно трактовать как своеобразную середину области возможных значений случайной величины. Важно также знать, как сильно значения изучаемой величины отличаются от ее среднего, насколько кучно размещаются измеренные значения вокруг среднего значения или, иначе говоря, насколько широк разброс случайной величины. Разброс или рассеивание случайной величины вокруг ее среднего характеризуется параметром, который называетсядисперсией D[X] случайной величины X. Чем больше дисперсия, тем больше разброс возможных значений случайной величины. Чтобы наглядно представить себе смысл этой величины, рассмотрим следующий пример. Имеются две группы сотрудников некоторой организации. В каждой группе по три человека. Зарплаты сотрудников первой группы: 1000 рублей, 6000 рублей и 11 000 рублей, зарплаты сотрудников во второй группе: 5800 рублей, 6000 рублей и 6200 рублей. В среднем сотрудники каждой из групп получают по 6000 рублей. А теперь сравните отклонения от средней величины в первой и во второй группах. Очевидно, что во второй группе сотрудники получают примерно одинаковую зарплату, отклонения от средней величины незначительны, дисперсия мала. А в первой группе очень велик разброс между уровнями зарплаты, отклонения от средней величины большие, дисперсия велика. Итак, дисперсия характеризует степень отклонения возможных значений случайной величины относительно среднего. Для вычисления значения дисперсии случайной величины Х используют следующую формулу:
На практике часто используют и другую характеристику рассеивания —среднеквадратичное отклонение , вычисляемое по формуле .
Величина также характеризует размах колебаний случайной величины Х около среднего значения, но среднеквадратичное отклонение , в отличие от дисперсии D[X], имеет ту же размерность, что и случайная величина X.
Вновь обратимся к рассматриваемому примеру. Так, в магазине № 1 (см. данные последнего столбца табл. 4) в среднем количество покупателей каждый день отличается от средней величины (100 человек в день) на 35 человек (так как D[Х]=8400/7=1200 и ). В магазине же № 2 (см. данные последнего столбца табл. 5) в среднем количество покупателей каждый день отличается от средней величины (100 человек в день) на 2 человека (так как D[Х] =28/7=4 и ). Таким образом, в нашем примере разброс случайной величины Х (количество покупателей в магазине №1) около своего среднего значения достаточно велик и составляет приблизительно третью часть средней величины, в то время как разбросом случайной величины Y (количество покупателей в магазине № 2) около ее среднего значения можно пренебречь, так как он составляет всего лишь 2% от средней величины. Исходя из этого, следует определенным образом планировать, например, завоз скоропортящихся продуктов в магазины. В первом магазине в один из дней может оказаться очень мало покупателей и существует большой риск, что продукция не будет распродана и пропадет; в то время как во втором магазине такой риск очень мал и им можно пренебречь.
Медиана — это статистическая характеристика, которая определяет середину выборки, то есть половина чисел, образующих выборку, имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Не нужно путать среднее с медианой. Так, для магазина № 1 среднее число покупателей, согласно проведенным выше расчетам, равно 70, в то время как медиана равна 90. В самом деле, если выстроить количество покупателей в разные дни недели по возрастанию, то будет получена следующая последовательность: 50, 70, 80, 90, 120, 140,150. Очевидно, что в этой последовательности три значения 50, 70, и 80 меньше, чем 90, и три значения 120, 140, 150 — больше. Следовательно, 90 является медианой рассматриваемой выборки.
Аналогичный характер имеют характеристики, которые называютсяквартилями,каждый из них определяет положение четвертой части выборки. Так, первый квартиль — это число, меньше которого 25% выборки. Второй квартиль совпадает с медианой, так как он определяется числом, меньше которого 50% выборки, а третий квартиль определяется числом, меньше которого 75% выборки.
Следующая статистическая характеристикамода определяется как наиболее часто встречающееся в выборке значение случайной величины. Так, в выборке {5,6,5, 4,4,3, 2, 4} мода равняется 4.
Числовая характеристика, которая называетсяскос илиасимметрия, характеризует степень несимметричности размещения элементов выборки относительно ее среднего значения. Положительный скос свидетельствует о перекосе выборки в сторону больших значений, и наоборот, отрицательный — о перекосе в сторону меньших значений. Так, скос для данных по первому магазину равен 0,196, а для данных по второму магазину равен 0, следовательно, в первом случае наблюдается положительная асимметрия, а во втором — отсутствует.
Для определения степени однородности случайной величины по формуле вычисляется еекоэффициент вариации Vx. Если величина Vx <0,33, то совокупность значений случайной величины Х можно считать достаточно однородной, в противном случае — неоднородной, состоящей из различных по своему содержанию совокупностей.
Для исследования степени связи между двумя различными случайными величинами Х и У определяется мера тесноты связи, которую принято называть коэффициентомкорреляции и обозначать rxy. Возможные значения коэффициента корреляции находятся в диапазоне от минус единицы до плюс единицы. После вычисления коэффициента корреляции необходимо проанализировать его значение. Принято считать, что между величинами имеется некоторая корреляционная зависимость, если модуль коэффициента корреляции больше 0,1. При | rxy | >0,3 корреляционная связь признается существенной, при | rxy | >0,5 — значительной, при | rxy | >0,7 - тесной. Если величина коэффициента корреляции близка к единице, то можно считать, что между случайными величинами имеется прямая причинно-следственная связь. Если коэффициент корреляции близок к минус единице, то это свидетельствует об обратной зависимости исследуемых величин. При коэффициенте корреляции, близком к 0, можно считать, что, связь между величинами отсутствует.
Для вычисления рассмотренных и многих других статистических характеристик случайных величин программа MS Excel располагает широким набором статистических функций. Их полный список можно получить, выполнив команду Вставка > Функция.... Программа MS Excel предусматривает также применение 18 статистических инструментов анализа, в том числе таких, как описательная статистика, гистограмма, генерация случайных чисел, корреляция и ряд других. Эти инструменты позволяют автоматизировать статистический анализ данных. Доступ к ним можно получить, выполнив команду Сервис > Анализ данных.... Затем в диалоговом окне Анализ данных в списке Инструменты анализа следует выбрать нужный инструмент и задать входной и выходной интервалы, а также другие требуемые параметры. Например, инструмент анализа Описательная статистика создает список рассмотренных выше статистических характеристик записанной в некотором диапазоне ячеек выборки. При помощи этого инструмента можно получить информацию об основной тенденции и изменчивости данных. В частности, можно вычислить следующие характеристики: дисперсию выборки, среднеквадратичное отклонение, медиану, моду и скос.
Если в меню Сервис отсутствует команда Анализ данных..., это свидетельствует о том, что инструменты анализа статистических данных не установлены в MS Office. В этом случае следует выполнить команду Сервис > Надстройки... и в списке надстроек окна команды включить флажок в строке Пакет анализа, нажав затем кнопку ОК
Контрольные вопросы
1. Что такое электронная таблица?
2. Что такое рабочий лист Excel?
3. Что понимают под рабочей книгой Excel?
4. В чем отличие электронной таблицы от обыкновенной?
5. Что понимают под координатами ячейки?
6. Какие типы данных можно вводить в ячейки таблицы?
7. Опишите способы ввода новых значений в ячейки таблицы.
8. Как осуществляется автоматическое заполнение данных?
9. В каких случаях целесообразно, применять автоматическое заполнение данных?
10.Опишите способы редактирования данных в. Excel.
11. Какую структуру имеет строка формул.?
12. Как создать таблицу на рабочем листе?
13. Как удалить электронную таблицу?
14. Что понимают под функцией в Excel?
15. Перечислите основные категории функций в Excel.
16. Как можно добавить (удалить) примечание в ячейку таблицы?
17. Как можно вставить строку (столбец) в таблицу?
18. Как осуществляется удаление строки (столбца)?
19. Перечислите способы изменения высоты строк и ширины столбцов таблицы.
20. Как можно управлять расположением данных в ячейке?
21. Как можно скрыть строку или столбец?
22. Когда следует применять команду Специальная вставка?
23. Что называется форматом?
24. Перечислите способы форматирования данных в ячейке.
25. Для чего предназначена команда Автоформат и как можно ее использовать?
26. Как отменить изменения, произведенные при автоматическом форматировании?
27. Как создать пользовательский формат?
28. Как создать пользовательский стиль?
29. Что называется диаграммой? Перечислите основные типы диаграмм в Excel.
30. Перечислите стандартные элементы, из которых состоят диаграммы в Excel.
31. Опишите порядок создания диаграммы в Excel.
32. Где можно поместить диаграмму
33. Каким образом можно добавить новые данные к уже существующей диаграмме?
34. Как можно изменить тип диаграммы?
35. Как можно изменить лю6ой из стандартных элементов диаграммы?
36. Как отредактировать заголовок диаграммы?
37. Как вставить (удалить) на графике линии сетки?
38. Как переместить диаграмму на другое местом пределах одного рабочего листа?
39. Как удалить диаграмму?
40. Что называется базой данных?
41. Что такое поле, запись базы данных?
42. Как можно ввести данные в базу данных?
44. Что такое форма?
45. Для чего можно применять формы?
46. Перечислите способы поиска в базе данных.
47. Как действует автофильтр?
48. Для чего применяется расширенный фильтр?
49. Как осуществляется сортировка Данных?
50. Влияет ли применение фильтра на Печать?
51. Как воспользоваться командой Итоги?
52. Как создать сводную таблицу?
53. Как изменить представление данных в сводной таблице?
54. В чем отличие данных, предоставляемых командой Итоги, от данных, полученных при создании сводной таблицы?
55. Что называется случайной величиной?
56. Приведите пример случайной величины.
57. Перечислите наиболее часто используемые статистические характеристики.
58. Что называют средним значением случайной величины?
59. Что называют дисперсией и средним квадратичным отклонением случайной величины?
60. Что такое квартиль и медиана?
61. Что такое мода и скос случайной величины?
62. Почему недостаточно использовать одну статистическую характеристику случайной величины? Приведите пример.
63. Какая статистическая характеристика характеризует тесноту связи между двумя случайными величинами?
64. Перечислите основные статистические инструменты анализа, применяемые в Excel для описания случайных величин.
65. Как в Excel можно получить набор случайных величий?