Название: Общая теория статистики - Елисеева И.И.

Жанр: Статистика

Рейтинг:

Просмотров: 1497


где x̅1, x̅2 - выборочные средние; s2 - выборочная оценка общей дисперсии;

                   .                                        (7.39)

 

Гипотеза H0 отклоняется, если  

Рассмотрим пример. Для проверки устойчивости цен на яблоки в летний период на двух рынках города проведено выборочное обследование: на первом рынке по данным 15 продавцов определена средняя цена, равная 2 тыс. руб./кг. при среднем квадратическом отклонении s2 = 0,5 тыс. руб.; на втором рынке обследовано 17 продавцов, средняя цена оказалась равной 2,5 тыс. руб./кг, s2 = 0,4 тыс. руб.

                   Н0 : m = m0,   Н1: m ≠ m0.

 

                   .      

 

При a = 0,05 и d.f. = 30, tкрит = 2,042, tфакт > tкрит , H0 отклоняется, т. е. различия в ценах на двух рынках нельзя объяснить лишь случайностями выборки.

Проверка той же нулевой гипотезы при односторонней критической области будет проводиться на следующих условиях определения: tкрит :1 - 2a и d.f. = n1 + n2 -2. Следовательно, если Н1 : m1 = m2 (2a = 0,1, d.f. = 30), так что H0 опять-таки отклоняется.

Случай проверки гипотезы о средних величинах при неизвестных дисперсиях, равенство которых не предполагается, здесь не рассматривается ввиду его недостаточной теоретической разработанности[6].

 

7.12. Основы дисперсионного анализа

 

Может быть поставлена задача сравнения двух выборочных дисперсий. Для ее решения применяется критерий, названный в честь английского статистика Рональда Фишера (1890 - 1968) F- критерием. Этот критерий представляет собой отношение выборочных дисперсий s21 и s22, которые рассматриваются как оценки одной и той же генеральной дисперсии s2:

                             .

 

Испытуемая гипотеза является нулевой гипотезой Н0 : s21 = s22 = s2, альтернативная гипотеза Н1 : s21 s22 s2 .

F-критерий строится так, что в числителе стоит бо́льшая дисперсия. Fmin = 1, Fmax ® ¥ . Критические значения критерия F берутся из таблиц F-распределения. F-распределение зависит от уровня значимости и от числа степеней свободы сравниваемых дисперсий d.f.1 и d.f.2 (cм. приложение, табл. 3).

В дисперсионном анализе общая вариация подразделяется на составляющие и производится сравнение этих составляющих. Испытуемая гипотеза состоит в том, что если данные каждой группы представляют случайную выборку из нормально распределенной генеральной совокупности, то величины всех частных дисперсий должны быть пропорциональны своим степеням свободы и каждую из них можно рассматривать как оценку генеральной дисперсии.

Дисперсионный анализ часто применяется совместно с аналитической группировкой (см. гл. 6). В этом случае данные подразделяются на группы по значениям признака-фактора, вычисляются значения средних величин результативного признака в группах, считается, что различия в их значениях определяются различиями в значениях фактора. Задача состоит в оценке существенности различий между средними значениями результативного признака в группах. Итак, испытуемая гипотеза может быть записана как гипотеза о средних величинах Н0 : m1 = m2 =m3 =…   Как было показано в предыдущем параграфе, когда выделяются две группы, эта задача решается с помощью t-критерия. Если же число сравниваемых групп больше двух, то существенность различий между группами доказывается с помощью дисперсионного анализа, на основе F-критерия. Заметим, что результаты дисперсионного анализа, так же как и выводы о характере связи, значения показателей ее силы и тесноты, зависят от числа групп, выделенных по признаку-фактору.

В случае выделения групп по одному фактору мы имеем так называемый однофакторный дисперсионный комплекс. Разложение дисперсии при этом производится в соответствии с правилом сложения дисперсий (см. гл. б):

 

                   ,

 

где уij - значение результативного признака у i-й единицы в j-й группе;

i - номер единицы, i = 1, .... п.;

j - номер группы;

пj- численность у-й группы;

yj - средняя величина результативного признака в у-й группе;

у̅ общая средняя результативного признака.

 

Если обозначить суммы квадратов отклонений буквой D, получим равенство:

Dобщ = Dфакт +Dост                                                                             (7.41)

 

На основе разложения дисперсии (7.41) в соответствии с гипотезой отсутствия различий между группами могут быть получены три оценки генеральной дисперсии, пропорциональные степени свободы: на основе общей вариации, межгрупповой (факторной) и внутригрупповой (остаточной). Число степеней'свободы равно:


Оцените книгу: 1 2 3 4 5