Частный коэффициент корреляции

Частный коэффициент корреляции

Частный коэффициент корреляции характеризует тесноту связи между результатом и соответствующим фактором при закреплении влияния (элиминирования) других факторов, включенных в уравнение регрессии. При нелинейной взаимосвязи исследуемых признаков эту фкнкцию выполняют частные индексы корреляции. Частный коэффициент корреляции:

Числитель – множественный коэффициент детерминации всего комплекса m факторов с результатом;

Знаметатель – тот же показатель детерминации, но без введения в модель фактора x1 .

Формула для вычисления частного коэффициента корреляции

Если известна матрица парных коэффициентов корреляции, то частный коэффициент корреляции для фактора x1 может быть вычислен по формуле:

Где A1i – алгебраическое дополнение rxyi ;

A11 – алгебраическое дополнение ryy ;

Aii – алгебраическое дополнение rxixi ;

Для проверки значимости частных коэффициентов корреляции вычисляется t-критерий Стьюдента:

где k – число фиксируемых факторов (порядок частного коэффициента корреляции).

Частные коэффициенты корреляции различных порядков

Различают частные коэффициенты корреляции различных порядков. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых учитывается наряду в анализируемым фактором, например:

Ryx1*x2 – коэффициент частной корреляции первого порядка;

Соответственно, коэффициенты парной корреляции называются коэффициентами нулевого порядка.

Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентным формулам. Например, для двухфакторной регрессии можно воспользоваться рекурентными формулами:

Применение частных коэффициентов корреляции

Наибольшее практическое значение имеют частные коэффициенты корреляции максимального порядка. которые используются при отборе факторов в процессе построения регрессионной модели. Частные коэффициенты корреляции, подтверждая ранжировку факторов по их воздействию на результат, полученную на основе стандартизованных коэффициентов регрессии (&#&46;-коэффициентов), в отличие от последних дают конкретную меру тесноты связи каждого фактора с результатом в чистом виде.

5.189.137.82 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам.

Очень часто взаимосвязь между двумя признаками искажается вследствие того, что оба признака подвержены влиянию других факторов. Поэтому на практике для получения более точных взаимосвязей между двумя переменными исключают влияние на них третьей переменной. Это можно сделать с помощью частного коэффициента корреляции Частный коэффициент корреляции.

1. Измеряют результаты по трем признакам. Например, у группы спортсменов измерили результат в прыжках в длину (Частный коэффициент корреляции, массу тела (Частный коэффициент корреляции и силу мышц нижних конечностей (Частный коэффициент корреляции.

2. Рассчитывают коэффициенты линейной корреляции (см. 4.2.1.): Частный коэффициент корреляции=0,78,Частный коэффициент корреляции=0,89,Частный коэффициент корреляции=0,95.

3. Вычисляем частный коэффициент корреляции по формуле:

Частный коэффициент корреляции

Представим, что исследователя интересует «чистая» корреляция между результатами в прыжках в длину и массой тела, исключая влияние на эту взаимосвязь силы мышц нижних конечностей испытуемых:

Частный коэффициент корреляции

4. На основании полученного результата выявляем связь между изучаемыми признаками:

4.1. Если коэффициент имеет положительный знак (+), то связь положительная, и, наоборот, при отрицательном знаке (-) — связь отрицательная.

4.2. По абсолютному значению коэффициента (от 0 до 1) оцениваем количественную меру связи:

— если Частный коэффициент корреляции = 0 — корреляция отсутствует (данные факторы между собой нейтральны);

— если 0,09 Частный коэффициент корреляции 0,19 — статистическая взаимосвязь очень слабая;

— если 0,2 Частный коэффициент корреляции 0,49 — статистическая взаимосвязь слабая;

— если 0,5 Частный коэффициент корреляции 0,69 — статистическая взаимосвязь средняя;

— если 0,70 Частный коэффициент корреляции 0,99 — статистическая взаимосвязь сильная.

Т.о. на основании расчетного Частный коэффициент корреляции делается вывод о том, что между исследуемыми признаками существует слабая (средняя, сильная) положительная (отрицательная) связь.

В нашем примере полученный отрицательный коэффициент Частный коэффициент корреляции свидетельствует о том, что при прочих равных условиях (одинаковой силе мышц нижних конечностей) спортсмены с большей массой тела прыгали бы хуже. Этот пример показывает, что во многих случаях не достаточно использовать только простую корреляцию между двумя переменными. Вычисление частного коэффициента корреляции может помочь избежать ошибочных выводов, а также украсить работу.

Частный коэффициент корреляции

Частный коэффициент корреляции – это показатель, измеряющий степень сопряженности двух признаков при постоянном значении третьего.

Математическая статистика позволяет установить корреляцию между двумя признаками при постоянном значении третьего, не ставя специального эксперимента, а используя парные коэффициенты корреляции rxy. rxz и ryz . Частные коэффициенты корреляции рассчитывают по формулам:

Здесь в индексах буквы перед тире указывают, между какими признаками изучается зависимость, а буква после тире – влияние какого признака исключается (элиминируется). Ошибку и критерий значимости частной корреляции определяют по тем же формулам, что и парной корреляции (11.8):

Теоретические значения t берут из таблицы приложения критерия Стьюдента для принятого уровня значимости и n–3 степеней свободы.

Подобно парным коэффициентам корреляции частные коэффициенты могут принимать значения, заключенные между –1 и +1. Частные коэффициенты детерминации находят путем возведения в квадрат частных коэффициентов корреляции.

Определение степени частного воздействия отдельных переменных на результативный признак при исключении (элиминировании) связи его с другими признаками, искажающими эту корреляцию, часто представляет большой интерес. Например, тесноту связи урожаев с осадками может сильно искажать варьирование температуры, и поэтому целесообразно изучить связь между первыми двумя признаками при постоянных значениях третьего. С чисто внешней стороны (а не внутренней) при постоянном значении элиминируемого признака нельзя подметить его статистического влияния на изменчивость других признаков: он удерживается на постоянном уровне, а другие признаки варьируют и находятся в корреляционном отношении друг с другом.

Чтобы уяснить технику расчета и смысл частного коэффициента корреляции, рассмотрим данные по определению парной корреляции между окружностями початка кукурузы (X ), окружностью его стержня (Y ) и количеством рядков зерен (Z ) на основании измерения 9000 початков:

По приведенным выше соотношениям 12.1 – 12.3 определим частные коэффициенты корреляции:

Частный коэффициент корреляции ;

Частный коэффициент корреляции ;

Частный коэффициент корреляции

Частный коэффициент корреляции между окружностью початка и его стержня у початков с одинаковым числом рядков зерен
(rxy-z =0,720) показывает, что лишь незначительная часть взаимосвязи этих признаков в общей корреляции (rxy =0,799) обусловлена влиянием третьего признака. Аналогичное заключение необходимо сделать и в отношении частного коэффициента корреляции между окружностью початка и количеством рядков зерен у початков с одинаковой окружностью стержня (rxz-y = 0,55 и rxz = 0,57). Напротив, частный коэффициент корреляции между окружностью стержня и количеством рядков зерен у початков с одинаковой окружностью
ryz-x = 0,105 значительно отличается от общего коэффициента корреляции ryz = 0,507. Из этого видно, что если подобрать початки с одинаковой окружностью, то связь между этими признаками у них будет очень слабой, так как значительная часть в этой взаимосвязи обусловлена варьированием окружности початка.

При некоторых обстоятельствах частный коэффициент корреляции может оказаться противоположным по знаку парному. Например, при изучении взаимосвязи между морфологическими признаками стеблей льна массой (X ), длиной (Y ) и диаметром (Z ) – были получены следующие коэффициенты (n = 100): между массой и длиной rxy = 0,6; между массой и диаметром rxz = 0,9; между длиной и диаметром ryz = 0,4.

Частные коэффициенты корреляции при исключении влияния третьего признака:

Частный коэффициент корреляции ;

Частный коэффициент корреляции ;

Частный коэффициент корреляции

Частные коэффициенты корреляции между массой и длиной и массой и диаметром при статистическом исключении влияния третьего признака не вызывают никаких недоумений. Выявилась очень высокая частная корреляция массы и диаметра при исключении влияния длины стебля rxz-y и слабая корреляция между массой и длиной rx-yz для растений с одинаковым диаметром. Частная корреляция между длиной стебля при постоянном значении массы получилась отрицательной: при увеличении длины диаметр стебля уменьшается, тогда, как общий коэффициент корреляции указывает на положительную взаимосвязь между этими признаками. На первый взгляд этот результат кажется невероятным, он противоречит обычным представлениям о росте растений: если увеличивается высота, то, конечно, увеличивается и диаметр стебля. Однако это мнимое противоречие объясняется основным условием частной корреляции – постоянством исключаемого признака. Если взять стебли льна одной и той же массы, то среди таких стеблей увеличение длины может происходить только за счет уменьшения диаметра. При увеличении обоих признаков не могла бы оставаться постоянной масса стебля.

© 2015-2017 lektsii.org.

Коэффициент частной корреляции.

Анализ критериев значимости для коэффициента корреляции будет дан позже, вместе с критериями значимости коэффициентов регрессии. Будет выяснено, что коэффициент корреляции в примере со спросом на бензин незначимо отличается от нуля, что кажется неправдоподобно с точки зрения здравого смысла.

Одна из причин получения такого результата заключается в очень небольшом размере выборки. Возможно, что при большем размере выборки мы могли бы показать, что коэффициент корреляции значимо отличается от нуля. Здесь, однако, есть и еще одна причина для получения отрицательного результата: мы не учитывали влияние увеличения дохода на потребительский спрос в целом и на спрос на бензин в частности. Положительный эффект увеличения дохода в основном компенсировал отрицательный эффект роста цен, и, таким образом, спрос на бензин оставался стабильным. Следующий этап исследования состоит в выделении влияния этих двух факторов. Мы можем сделать это, используя так называемый коэффициент частной корреляции, который определяется следующим образом

где rху.я — коэффициент частной корреляции между х и у в случае постоянства воздействия величины z. а rху. rxz и ryz — обычные коэффициенты корреляции между х и у, между х и z, между у и z соответственно.

В примере со спросом на бензин мы можем вычислить корреляцию между ценой и располагаемым личным доходом и между спросом и доходом, используя для этого данные табл.1. ( Можно предложить студентам провести эти расчеты на практическом занятии). Результаты приблизительно составят 0,84 и 0,02. Подставляя эти значения в уравнение (22), мы оценим частный коэффициент корреляции для реальной цены и спроса на бензин как -0,91, что является намного более приемлемым результатом.

Вопросы для повторения

1. Что является предметом изучения эконометрики ?

2. В чем суть метода эконометрики?

3. Существуют ли различия в формулах для определения выборочной и генеральной дисперсии?

4. Перечислите правила расчета ковариации.

5. Чему равна дисперсия постоянной величины?

6. На сколько измениться дисперсия величины х, если каждое индивидуальное значение разделить на 2?

7. Что означает термин «ковариация», и каковы способы ее расчета?

8. Что такое теоретическая ковариация?

9. Что показывает знак ковариации?

10. Почему ковариация не является хорошей мерой связи?

11. Как рассчитывается парный линейный коэффициент корреляции?

12. Как рассчитывается частный коэффициент корреляции?

13. Какая связь существует между ковариацией и коэффициентом корреляции?

14. Что произойдет с ковариацией величин х и у, если единица измерения величины х увеличится на 10?

15. Что произойдет с ковариацией величин х и у, если единица измерения величины х увеличится в 2 раза?

16. Влияет ли изменение масштаба переменных на величину коэффициента корреляции?

17. Во сколько раз изменится коэффициент корреляции переменных х и у, если каждое значение у умножить на 3?

18. В каких пределах коэффициент корреляции принимает свои значения?

19. Чем частный коэффициент корреляции отличается от парного коэффициента корреляции?

20. С чем связаны различия в способах расчета выборочного и теоретического коэффициентов корреляции?

21. Может ли частный коэффициент корреляции быть больше парного?

22. Какие данные – выборочные или генеральные – используется чаще всего в эконометрических исследованиях?

23. С какой целью рассчитывают коэффициент корреляции?

24. Чему равна дисперсия выборочного среднего?

Резюме по модульной единице 1.

Взаимосвязь переменных проявляется в их согласованной изменчивости. Количественной мерой взаимосвязи являются показатели ковариации и корреляции. Коэффициент корреляции является более устойчивой характеристикой связи по сравнению с показателем ковариации, поскольку не зависит от масштаба переменных. Коэффициент парной корреляции может преувеличивать (или преуменьшать) влияние данного фактора на результат, поскольку не учитывает параллельное влияние других значимых факторов. В этом случае частная корреляция является более точной оценкой взаимосвязи двух переменных.

Тест для самоконтроля

1. Предметом изучения эконометрики являются:

1) качественные взаимосвязи связи экономических переменных

3) количественные взаимосвязи между экономическими переменными (верно)

2) статистические показатели

Частная корреляция

(слайд 6)Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в модель.

Частные показатели корреляции широко используются при отборе факторов, когда необходимо оценить целесообразность включения того или иного фактора в уравнение множественной регрессии. Кроме того, они позволяют ранжировать факторы по тесноте их связи с результатом.

Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

В общем виде частный коэффициент корреляции, измеряющий влияние на у фактора хi при неизменном уровне других факторов, можно определить по формуле:

Частный коэффициент корреляции,

где Частный коэффициент корреляции— коэффициент множественной детерминации для модели с полным набором факторов;

Частный коэффициент корреляции— тот же показатель, но без введения в модель фактора xi .

При i=1 формула примет вид:

Частный коэффициент корреляции

(слайд 7) Коэффициенты частной корреляции могут быть первого, второго, третьего и т.д. порядка. Это зависит от того, влияние скольких факторов элиминируется.

Частная корреляция первого порядка – когда фиксируется теснота связи двух переменных при устранении влияния одного фактора: Частный коэффициент корреляции(точка отделяет фактор, значение которого элиминируется (закрепляется на неизменном уровне)).

Частная корреляция второго и т.д. порядка – когда фиксируется теснота связи двух переменных при устранении влияния двух и более факторов, например:

Частный коэффициент корреляции— частная корреляция второго порядка при постоянном действии факторов х2 и х3;

Частный коэффициент корреляции— частная корреляция четвертого порядка при постоянном действии факторов х2, х3, х4, х5.

Соответственно, коэффициенты парной корреляции называются коэффициентами нулевого порядка.

Коэффициенты частной корреляции более высоких порядков можно найти через коэффициенты частной корреляции более низких порядков по рекуррентной формуле :

Частный коэффициент корреляции

При i=1 и двух факторах формула примет вид:

Частный коэффициент корреляции

При i=2 и двух факторах:

Частный коэффициент корреляции

Частные коэффициенты корреляции, рассчитанные по рекуррентной формуле, изменяются в пределах от -1 до +1, а по формуле через множественный коэффициент детерминации – от 0 до 1.

Сравнение частных коэффициентов друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Обычно частные коэффициенты корреляции не имеют самостоятельного значения, они используются на стадии формирования модели, в частности в процедуре отсева факторов.

Предпосылки метода наименьших квадратов

Метод наименьших квадратов (МНК) позволяет построить уравнение регрессии на основе минимизации суммы квадратов отклонений: Частный коэффициент корреляции, илиЧастный коэффициент корреляции.

Поэтому важно исследовать поведение остаточных величин регрессии – ε. Они должны отвечать определенным критериям:

1. Несмещенность – означает, что математическое ожидание остатков равно нулю: Частный коэффициент корреляции, т.е. при большом числе наблюдений остатки не будут накапливаться и найденный параметр регрессииb можно рассматривать как среднее значение из возможного большого количества несмещенных оценок. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным выборкам.

2. Эффективность – оценки считаются эффективными, если они характеризуются наименьшей дисперсией.

3. Состоятельность – характеризует увеличение точности оценок с увеличением объема выборки.

Условия, необходимые для получения несмещенных, эффективных и состоятельных оценок, представляют собой предпосылки МНК (условия Гаусса-Маркова) . соблюдение которых желательно для получения достоверных результатов регрессии.

Выделяют пять предпосылок МНК:

случайный характер остатков;

нулевая средняя величина остатков, не зависящая от х ;

отсутствие автокорреляции остатков;

нормальное распределение остатков.

Iпредпосылка МНК. Прежде всего проверяется случайный характер остатков ε. С этой целью строится график их зависимости от теоретических значений результативного признака Частный коэффициент корреляции:

Частный коэффициент корреляции

Рис. 2.1. Зависимость случайных остатков Частный коэффициент корреляцииот теоретических значенийЧастный коэффициент корреляции

Если на графике нет направленности в расположении точек, то остатки представляют собой случайные величины и МНК оправдан.

Возможны следующие случаи, если Частный коэффициент корреляциизависит отЧастный коэффициент корреляции, то:

остатки Частный коэффициент корреляциине случайны

Частный коэффициент корреляции

остатки Частный коэффициент корреляциине имеют постоянной дисперсии

Частный коэффициент корреляции

остатки Частный коэффициент корреляцииносят систематический характер

Частный коэффициент корреляции

В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки Частный коэффициент корреляциине будут случайными величинами.

IIпредпосылка МНК. Нулевая средняя величина остатков, не зависящая от х. т.е. Частный коэффициент корреляции. С целью проверки выполнения этой предпосылки строится график зависимости случайных остатковЧастный коэффициент корреляцииот факторовЧастный коэффициент корреляции, включенных в регрессию (рис. 2.3).

Частный коэффициент корреляции

Рис. 2.3. Зависимость величины остатков от величины фактора Частный коэффициент корреляции.

Если расположение остатков на графике не имеет направленности, то они независимы от значений Частный коэффициент корреляции. Если же график показывает наличие зависимостиЧастный коэффициент корреляциииЧастный коэффициент корреляции, то модель неадекватна.

IIIпредпосылка МНК.Гомоскедастичность – это однородность относительно дисперсии, т.е. дисперсия остатков одинакова для каждого значения х. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность (неоднородность относительно дисперсии).

Частный коэффициент корреляцииЧастный коэффициент корреляции

а – дисперсия остатков растет

по мере увеличения Частный коэффициент корреляцииб – дисперсия остатков достигает

максимальной величины при средних

значениях переменной Частный коэффициент корреляциии уменьшается

при минимальных и максимальных значениях Частный коэффициент корреляции

Частный коэффициент корреляции

в – максимальная дисперсия остатков при малых значениях Частный коэффициент корреляциии дисперсия остатков однородна по мере увеличения значенийЧастный коэффициент корреляции

Для проверки выполнения предпосылки МНК о гомоскедастичности остатков используются различные методы:

1. Тест Гольдфельда-Квандта. Процедура применения теста Гольдфелда-Квандта состоит из следующих шагов:

1) наблюдения упорядочиваются по возрастанию фактора хi ;

2) из рассмотрения исключаются С центральных наблюдений. При этом должно выполняться условие (n-С)/2 > р, где p – число оцениваемых параметров (авторами метода рекомендовано для случая одного фактора при n =30 принимать С=8, а при n =60 принимать С =16);

3) совокупность из nC наблюдений разделяется на две группы (соответственно с большими и малыми значениями фактора х ) и по каждой группе определяется уравнение регрессии;

4) определяются остаточные суммы квадратов для первой (Частный коэффициент корреляции) и второй (Частный коэффициент корреляции) групп и находится их отношение:R = Частный коэффициент корреляции. где S2 > S1;

5) нулевая гипотеза о гомоскедастичности остатков отвергается, если выполнено условие R>F. где F – табличное значение F -критерия Фишера на уровне значимости α при числе степеней свободы (n-С-2р)/2.

2. Тест ранговой корреляции Спирмена. Суть теста заключается в том, что в случае гетероскедастичности остатки ε коррелированы со значениями фактора х. Эту корреляцию можно измерить с помощью коэффициента ранговой корреляции Спирмена:

Частный коэффициент корреляции,

где d – абсолютная разность между рангами значений х и ε .

Статистическая значимость данного коэффициента оценивается с помощью t-критерия:

Частный коэффициент корреляции

Если Частный коэффициент корреляции(табличное значение t -критерия Стьюдента на уровне значимости α и при числе степеней свободы (n –2)), то корреляция между х и ε статистически значима, т.е. имеет место гетероскедастичность остатков. В противном случае принимается гипотеза об отсутствии гетероскедастичности.

3. Рассмотренные методы не дают количественной оценки зависимости дисперсии ошибок регрессии от соответствующих значений факторов. Они лишь позволяют определить наличие или отсутствие гетероскедастичности остатков. Поэтому если гетероскедастичность остатков установлена, можно количественно оценить зависимость дисперсии ошибок регрессии от значений факторов. Для этого используются тесты Уайта, Парка, Глейзера и др.

IVпредпосылка МНК. Отсутствие автокорреляции остатков.

Под автокорреляцией остатков понимают зависимость распределения значений остатков друг от друга. Это означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Оценить эту зависимость можно, вычислив коэффициент корреляции между этими остатками по формуле линейного коэффициента корреляции:

Частный коэффициент корреляции

Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированны.

Vпредпосылка МНК о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью критериев Фишера и Стьюдента. Вместе с тем, оценки регрессии, найденные с применением МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков, т.е. при нарушении пятой предпосылки МНК.

При нарушении гомоскедастичности и наличии автокорреляции рекомендуется заменять традиционный МНК обобщенным методом.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *