Название: Общая теория статистики - Елисеева И.И.

Жанр: Статистика

Рейтинг:

Просмотров: 1493


Ы22 =Dост : dfост = 75353,96 : 12 = 6279,5. Далее указано их отношение, т. е.

s21/s22 = F-критерию. Наконец, указывается вероятность ошибочного решения, т. е. нулевого R2, равная 0,000003171.

Три фактора, включенные в уравнение регрессии, объясняют 89,8% вариации уровня валового дохода, если рассматривать 16 хозяйств как генеральную совокупность, не считаясь с ее ограниченной численностью (некорректированный коэффициент детерминации равен 0,8979). Если же учесть конечность объема совокупности п, число факторов k, а также свойство метода, по которому по мере приближения числа k к числу п коэффициент детерминации автоматически приближается к единице и достигает ее при k = п - 1 независимо от реальной роли факторов, то необходимо корректировать коэффициент множественной детерминации на потерю степеней свободы вариации:

 

 

Корректированный коэффициент детерминации всегда ниже, чем некорректированный, причем разность их значений тем меньше, чем меньше факторов входит в уравнение регрессии. Если из числа факторов исключить факторы, слабо связанные с результативным признаком (т. е. с низкимзначением βj, например, β < 0,1), то некорректированный коэффициент детерминации немного уменьшится (он всегда уменьшается при исключении части факторов), но корректированный коэффициент может даже возрасти за счет уменьшения разности между R2 и корректированным R2. Что касается множественного коэффициента корреляции R, то программа «Microstat» рассчитывает его, как корень квадратный из некорректированного R2, а другие программы, например «Statgraphics», - как корень квадратный из R2корр.

Для случая двух факторов коэффициент множественной детерминации легко вычисляется по рекуррентной формуле из парных коэффициентов детерминации:

Используя матрицу парных коэффициентов корреляции (табл. 8.11), получим:

 

Таким образом, за счет вариации факторов x1 и х2 объясняется 57,65% общей вариации валового дохода с 1 га сельхозугодий.

Вернемся к табл. 8.12. Дисперсионный анализ системы связей предназначен для оценки того, насколько надежно доказывают исходные данные наличие связи результативного признака со всеми факторами, входящими в уравнение. Для этого сравниваются дисперсии у - объясненная и остаточная: суммы соответствующих квадратов отклонений, приходящиеся на одну степень свободы вариации. Отношение дисперсии за счет факторов к остаточной дисперсии есть критерий Фишера F; в нашем примере он равен 35,18. Табличное критическое значение для 3 и 12 степеней свободы при вероятности нулевой гипотезы 0,01 составляет 5,95. Следовательно, вероятность нулевой гипотезы много меньше 0,01. Программа «Microstat» дает значение вероятности нулевой гипотезы, т. е. вероятность случайного отклонения от нуля коэффициента детерминации при отсутствии связи в генеральной совокупности; она равна 3,17·10-6, т. е. три миллионных! Ясно, что эту ничтожную вероятность можно игнорировать и сделать вывод, что имеющаяся информация надежно свидетельствует о наличии связи.

Кроме показателя общей тесноты связи вариации результативного признака со всеми факторами, входящими в регрессионное уравнение, необходимы и показатели, измеряющие тесноту связи с каждым фактором. К таким показателям относятся коэффициенты раздельной детерминации.

Коэффициентом раздельной детерминации, обозначаемым далее как d2j, называется произведение парного коэффициента корреляции фактора хj на его β-коэффициент.

Формула (8.39) дает еще один метод вычисления коэффициента множественной детерминации, используемый в некоторых программах для ЭВМ. В нашем примере получаем следующие значения коэффициентов раздельной детерминации:

 

Таким образом, за счет вариации x1 объясняется 24,2% вариации, за счет вариации х2 - всего 7,3%; за счет вариации x3 - более половины - 583% вариации уровня дохода. Сумма коэффициентов раздельной детерминации равна некорректированному коэффициенту R2.

Недостатком коэффициентов раздельной детерминации является их гетерогенный характер: то, что они объединяют коэффициент парной корреляции, измеряющий нечистое влияние фактора, с β-коэффициентом, измеряющим условно чистое влияние фактора, абстрагированное от влияния других факторов, входящих в уравнение связи. Из-за этого могут возникнуть неинтерпретируемые отрицательные величины коэффициентов d2j, если знаки парного коэффициента корреляции и β-коэффициента не совпадают при существенной взаимосвязи между факторами. Кроме того, сама идея о том, что совокупное влияние всех факторов равно сумме влияния каждого из них, противоречит системному подходу к исследованию.

Рассмотрим разложение R2 с учетом системного эффекта. Система факторов - это не простая их сумма, так как система предполагает внутренние связи, взаимодействие составляющих ее элементов. Действие системы не равно сумме воздействий составляющих ее элементов. К последним добавляется «системный эффект» «Emergency». Методом, полностью отвечающим системному подходу, является метод разложения коэффициента множественной детерминации на сумму чистых влияний каждого фактора, выражаемых величинами β21, и показатель влияния системного эффекта факторов ηx.

Так как расчетные значения результативного признака у̂j можно представить как   , то вариацию у̃j1 только за счет влияния фактора xm можно представить при условии, что все остальные факторы, входящие в уравнение, закреплены на своих средних уровнях:

 .                           (8.40)

 

Подставим в (8.40) значение фактора  xm-1 = xm +Dxm1 :

 

         


Оцените книгу: 1 2 3 4 5