Ход работы

Лабораторная работа 2

Вычисление мер центральной тенденции и мер изменчивости

Цель работы:научиться вычислять с помощью статистических функций электронных таблиц показатели центра распределения и показатели вариации для задач статистического анализа в языкознании

 

Постановка задачи

В таблице 1 приведены полученные из опыта данные о средних частотах речи у русских писателей 19-20 вв. Данные получены из текстовых выборок длиной каждая в 500 знаменательных слов. Было взято по 20 выборок из текстов каждого писателя. Места текста, интуитивно определявшиеся как чуждые художественному тексту, в выборку не включались [Б.Н.Головин. Язык и статистика. М., Просвещение, 1971].

Таблица 1.

Средняя частота употребления частей речи русскими писателями 19-20 в.

Писатель Частота части речи
Глагол Наречие Союз
Карамзин
Пушкин
Лермонтов
Гоголь
Герцен
Гончаров
Достоевский
Толстой
Тургенев
Чехов
Куприн
Бунин
Толстой
Гладков

 

Вычислите средние, максимальные и минимальные значения для частоты употребления различных частей речи, а также стандартные отклонения. Представьте данные из таблицы в виде графика.

Ход работы

1. Загрузите электронные таблицы.

2. Введите исходные данные (см. таблицу 1) как показано на рис.1.

 

Рис.1. Исходные данные

3.Запишите формулы для вычисления среднего, стандартного отклонения, минимального и максимального значений для частоты встречаемости каждой части речи (см. рис. 2.)

 

Рис.2. Формулы для вычисления

4. В результате должна получиться таблица (см. рис.3).

Рис. 3. Результаты вычислений

 

5. Постройте на этом же листе три диаграммы (см. рис. 4-6),

иллюстрирующие разброс частот встречаемости различных частей речи у русских писателей. Для построения диаграммы, например, для «глагола», необходимо выделить данные с фамилиями писателей и частотой встречаемости глагола, вызвать мастер диаграмм, задать тип «график», задать необходимые подписи и размещение на имеющемся листе).

 

Рис. 4. Частота употребления глагола русскими писателями

6. Для сравнения диаграмм, задайте для всех диаграмм на вкладке Шкала максимальное значение 140 (щелкнуть по цифрам оси, выбрать Формат оси, Шкала).

7. Проанализируйте полученные результаты.

Рис. 5. Частота употребления наречия русскими писателями

Рис. 6. Частота употребления союзов русскими писателями

Отчет по работе должен содержать файлы с исходными данными и результатами вычислений, ответы на контрольные вопросы.

 

Контрольные вопросы

1. Назовите известные вам меры центральной тенденции?

2. Назовите известные вам меры изменчивости?

3. С помощью каких функций они вычисляются?

4. Как построить диаграмму с помощью электронных таблиц?

5. Как отредактировать диаграмму?

6. Дайте содержательную интерпретацию результатам.