Название: Общая теория статистики - Елисеева И.И.

Жанр: Статистика

Рейтинг:

Просмотров: 1493


= 0,8979 - 0,5765 = 0,3214;

 

Однако крупнейшим недостатком такого способа разложения R2 является зависимость величин р2j от принятого порядка включения факторов в уравнение регрессии. Первый включаемый фактор «забирает в свою пользу» львиную часть системного эффекта, а на долю последнего фактора остается ничтожная часть. Например, если переставить местами факторы х1 и х3, а также вычислить по рекуррентной формуле двухфакторный коэффициент детерминации  = 0,8035, то получим результаты, отличные от предыдущих:

p21 (для фактора х1) =  = 0,8782 = 0,7709;

р22 (для фактора x2) =  = 0,8035 - 0,7709 = 0,0326;

р23 (для фактора x3) =  = 0,8979 - 0,8035 = 0,0944.

Доля фактора x3 возросла более чем вдвое, а доля фактора x1 уменьшилась более чем втрое.

 

8.13. Вероятностные оценки параметров

           множественной регрессии и корреляции

 

Если показатели многофакторной системы связи используются как оценки генеральныхпараметров, экстраполируются на другие значения факторов, как при прогнозировании, то значения параметров необходимо сопроводить вероятностными оценками, указать среднюю ошибку и доверительные границы параметра с заданной. вероятностью. Для парной корреляции эта проблема изложена в п. 8.5. В этом параграфе приводятся формулы средних ошибок репрезентативности для специфических параметров многофакторной системы.

Средняя ошибка условно чистого коэффициента регрессии bp для фактора xp, обозначаемая mbp, имеет вид:

 

          .                                         (8.44)

 

где  - оценка остаточного (не объясненного факторами) среднего квадратического отклонения результативного признака с учетом степеней свободы вариации:

                  

                  

,

 

где   - оценка среднего квадратического отклонения при-знака xp.

 - коэффициент множественной детерминации для фактора xp, доля вариации фактора xp, связанная с вариацией других факторов.

 

Например, для фактора x1, имеем:

 =79,24.

 = 34,6.

 = 0,2433 - вычислен по рекуррентной формуле по данным табл. 8.11. Отсюда:

                  

 

Отношение величины коэффициента регрессии к его средней ошибке есть t-критерий Стьюдента. В данном случае имеем: b1/mb1 = 2,26/0,6582 = 3,43. Критическое значение t для вероятности нулевой гипотезы 0,01 при 12 степенях свободы равно 3,05. Следовательно, надежно установлено, что генеральное значение коэффициента b1, не является нулевым, влияние (условно чистое) фактора x1, на вариацию у существенно.

Доверительные границы коэффициента регрессии b1, с вероятностью 0,95, для которой значение критерия Стьюдента равно 2,18, составляют 2,26 ± 2,18·0,658 или от 0,826 до 3,694.

Очень широкие границы объясняются малой численностью единиц совокупности. Из (8.44) следует, что при росте объема совокупности в q раз ошибка коэффициента регрессии, как и ошибка выборочной оценки средней величины, уменьшится в √q̅ раз. При 400 единицах совокупности ошибка была бы меньше в 5 раз.

Если значение критерия t оказывается ниже критического для вероятности нулевой гипотезы 0,05, влияние фактора считается не доказанным надежно, и при работе программ ЭВМ с отсевом несущественных факторов по t-критерию данный фактор автоматически исключается из уравнения регрессии.

Средняя ошибка оценки коэффициента множественной корреляции mR определяется по формуле

                             .                                                   (8.45)

 

Оценка существенности и расчет доверительных границ генерального коэффициента корреляции осуществляются так же, как и для коэффициента регрессии. Если значение R близко к единице, необходимо использовать преобразование Фишера, рассмотренное ранее в п. 8.2. Существуют также специальные таблицы критических значений коэффициента корреляции для заданного числа степеней свободы и вероятности нулевой гипотезы (см. приложение, табл. 5).


Оцените книгу: 1 2 3 4 5