Глава 3. Элементы математической статистики

Статистическое распределение выборки

Задачи математической статистики

Математическая статистика разрабатывает методы планирования и анализы эксперимента.

К типичным задачам математической статистики относятся:

· задача определения закона распределения случайной величины по статистическим данным;

· задача нахождения неизвестных параметров распределения случайной величины;

· задача проверки правдоподобия выдвигаемых по статистическим данным гипотез о законе распределения случайной величины, о её параметрах.

Генеральная и выборочная совокупности

Определение 1.Выборочной совокупностью (или выборкой) называется совокупность случайно отобранных объектов.

Определение 2. Генеральной совокупностью называется совокупность всех однородных объектов, из которых производится выборка.

Определение 3. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Определение 4. Выборка называется представительной (или репрезентативной), если она осуществлена случайным образом, когда все объекты генеральной совокупности имели равные вероятности попасть в выборку.

Определение 5. Статистическим рядом, соответствующим полученной случайной выборке, называется набор значений (вариант) качественного или количественного признака объектов выборки, которые располагают в порядке возрастания.

Определение 6. Интервальным статистическим рядом, соответствующим полученной случайной выборке, называется упорядоченная последовательность интервалов [аi; аi+1), i = 1,2,… с указанием количества mi значений xi , попавших в них (табл. 7.1)

Таблица 7.1

Интервальный статистический ряд

[аi ; аi+1) mi
[а1; а2) m1
[а2; а3) m2
… … …
k [аk ; аk+1] mk

 

Причем, если n – объем выборки, то n = m1 + m2 + … + mk . Интервалы [а1; а2), [а2; а3), …, [аk ; аk+1] имеют не обязательно равные длины. Число k не должно быть большим, но и не малым. Обычно берут 7≤ k ≤ 20.

Замечание 1. Иногда для упрощения исследования интервальный статистический ряд заменяют дискретным рядом, где в качестве значений исследуемого признака берут середины или одну из границ соответствующих интервалов.