Название: Общая теория статистики - Елисеева И.И.

Жанр: Статистика

Рейтинг:

Просмотров: 1498


            и 

 

При отсутствии связи на первой диагонали таблицы в сумме было бы 100 + 450 = 550 единиц совокупности, а на самом деле их 170 + 520 = 690. Избыток, образовавшийся ввиду прямой связи между ответами, составил 690—550 = 140.

Предельно возможный избыток был бы в том случае, если бы не было гетерогенных сочетаний, т. е. Аb и Bа. Он составляет 140+80 + 230 = 450. Сам же показатель тесноты связи - отношение фактического излишка к предельному: 140 : 450 =0,311. Как видим, этот показатель близок к коэффициенту ассоциации, но обладает чрезвычайно логичной и ясной интерпретацией: связь составляет 0,311 или 31,1%, от предельно возможной функциональной. Этот показатель - аналог не коэффициента корреляции, а коэффициента детерминации. Поэтому правомерно обозначить его как R2 или η2 . Он имеет вид:

 

                             ,                                    (8.49)

 

где

         

 

Подставляя эти выражения в (8.49), получим:

 

       (8.50)*

 

При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков также разработаны разные методы измерения тесноты связи.

Рассмотрим некоторые из этих мер на примере изучения влияния религиозной принадлежности на формирование супружеских пар. Воспользуемся данными ФРГ, где такой учет ведется постоянно. Статистический ежегодник Федеративной Республики Германии приводит распределение живорожденных младенцев по религиозной принадлежности отца и матери. При этом выделены 5 групп по религиозной принадлежности граждан: евангелическая (в России их чаще именуют протестантами); 2) римско-католическая; 3) прочие христиане (включая и православных); 4) других религий; 5) неверующие или не указавшие религиозную принадлежность (табл. 8.16).

 

 

 

 

Таблица 8.16

Распределение новорожденных в ФРГ по религиозной

принадлежности отца и матери в 1993 г.

(тыс. чел.)

 

 

В табл. 8.16 представлена «решетка» 5 ´ 5, и все ее клетки не пусты: встречаются детные браки между лицами любых вероисповеданий. Но при этом наибольшие числа располагаются вдоль «главной диагонали», т. е. явно преобладают случаи, когда и отец и мать

      

 

Таблица 8.17

Предельные значения коэффициента Пирсона

 

По данным табл. 8.16 имеем:

                            

          146,1+195,9+10,5+62,8+77,7=493,0 .

 

 

Таким образом, за счет предпочтения браков между лицами одинаковых религий на главную диагональ «собралось» 60,85% возможных родительских пар сверх равномерного распределения: связь составила 60,85% предельно тесной. Итак, все способы измерения показали, что влияние религии на формирование супружеских пар в ФРГ в 1993 году было значительное.

Если кроме количественных факторов при многофакторном регрессионном анализе включается и неколичественный, то применяют следующую методику: наличие неколичественного фактора у единиц совокупности обозначают единицей, его отсутствие -нулем. Если таких факторов, или градаций неколичественного фактора несколько, в уравнение регрессии вводятся несколько так называемых «фиктивных переменных», принимающих значения либо единицы, либо нуля. Например, пусть имеется три количественных фактора урожайности (x1, x2, x3) и три природных зоны. В ЭВМ вводятся переменные в порядке их принадлежности к той или иной зоне (табл. 8.18).

Линейное уравнение регрессии будет иметь вид:

ŷ = a +b1x1 + b2x2 + b3x3 + b4u1 + b5u2                                            (8.57)

 

Величина коэффициента b4 означает, что все единицы II зоны при тех же значениях количественных факторов, как и единицы I зоны, будут в среднем иметь значение у̂ на b4 больше (или меньше, если b4 < 0), чем единицы совокупности I зоны. Величина b5 озна-


Оцените книгу: 1 2 3 4 5