Корреляционная связь

Понятие корреляционной связи

Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся – с их успеваемостью по математике или по литературе и т.п.?

Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь – это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.

Корреляционные связи – это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики. «Оба термина, корреляционная связь и корреляционная зависимость – часто используются как синонимы. Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.

Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Корреляционные связи различаютсяпо форме, направлению и степени (силе).

По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.

Понаправлению корреляционная связь может быть положительной («прямой9quot;) и отрицательной («обратной9quot;). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значе­ниям одного признака — низкие значения другого. При отрицательной корреляции соотношения обратные. При положительной корреляции коэффициент корреляции имеет положительный знак, например r=+0,207. при отрицательной корреляции — отрицательный знак, например r= –0,207 .

Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.

Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.

Максимальное возможное абсолютное значение коэффициента корреляции r=1,00 ; минимальное r=0,00 .

Общая классификация корреляционных связей:

сильная, или тесная при коэффициенте корреляции r>0,70;

средняя при 0,50

умеренная при 0,30

слабая при 0,20

очень слабая при r<0,19.

Переменные Х и Y могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции (см. табл. 3):

Использование коэффициента корреляции в зависимости от типа переменных

Корреляционная связь
Главная | О нас | Обратная связь

Понятие корреляционной связи

Термин «корреляция» (от латинского correlatio – соотношение, взаимосвязь) применяется в различных областях науки и техники для обозначения взаимозависимости, взаимного соответствия, соотношения понятий, предметов, функций.

Широкое распространение в науке термин «корреляция» получил благодаря работам английского ученого-естествоиспытателя Френсиса Гальтона (1822-1911 гг.). В 1888 году Ф. Гальтон сформулировал свои представления о корреляции в работе «Корреляция и ее измерение». Продолжил научную работу в области корреляции британский ученый Карл Пирсон (1857-1936 гг.). Идеи Пирсона о корреляции были опубликованы в серии из 18 книг (между 1893 и 1912 гг.) под заголовком «Математический вклад в теорию эволюции». Также результатом его работы явился широко известный коэффициент корреляции Пирсона.

Корреляционная связь — это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого.

О силе и направленности корреляционной связи мы можем судить по значению коэффициента корреляции.

Коэффициент корреляции — статистический показатель степени (силы) и направленности взаимосвязи между двумя переменными.

Коэффициент корреляции мы можем определить с помощью корреляционного анализа.

Корреляционным анализом называется совокупность методов обнаружения корреляционной связи между случайными величинами или признаками. Корреляционный анализ — это проверка гипотез о связях между переменными.

Задача корреляционного анализа сводится к установлению направления (положительного или отрицательного) и формы связи (линейной, криволинейной) между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Необходимо отметить, что согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зависимости этих признаков между собой, а о зависимости обоих этих признаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании. Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков, или она оказывается за пределами исследуемой пары признаков — установить этот факт с помощь корреляционного анализа невозможно. Найти причину изменений мы можем с помощью дополнительных исследований и обработки данных, например, с помощью дисперсионного анализа.

Корреляционные связи различаются по форме, направлению и степени (силе).

По форме корреляционные связи могут быть прямолинейными или криволинейными. В свою очередь прямолинейная корреляционная связь может различаться по направлению и быть прямой (положительной) или отрицательной (обратной) (см. рис. 9.1).

Корреляционная связь

Рис. 9.1 Схема прямолинейных корреляционных связей: а) положительная (прямая) корреляционная связь; б) отрицательная (обратная) корреляционная связь

В случае прямой или положительной корреляции взаимосвязь характеризуется тем, что высокие значения одной переменной связаны с высокими значения другой, а также низкие значения первой переменной – с низким значениями второй. Графически такая связь представляется прямой линией, отсюда ее более короткое название – линейная связь.

В качестве примера можно привести взаимосвязь роста человека и его веса, т.е. чем выше человек тем, как правило, он больше весит, и наоборот чем меньше рост, тем меньше вес.

Отрицательная корреляция означает обратную взаимосвязь. Высокие значения одной переменной связаны с низкими значениями другой, и наоборот. Например, у людей с высокой тревожностью, как правило, низкая самооценка.

О том, с каким направлением корреляции (положительной или отрицательной) мы имеем дело, можно судить по знаку коэффициента корреляции. При положительной корреляции коэффициент корреляции имеет положительный знак, например r = +0,87, при отрицательной корреляции — отрицательный знак, например r = – 0,87.

При криволинейных связях с возрастанием значения одного признака возрастание (или убывание) другого признака происходит неравномерно, или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

Например, криволинейной может быть связь между уровнем возбуждения и результативностью выполнения задания. Сложные задания выполняются хорошо при среднем уровне возбуждения, но гораздо хуже при очень низком или очень высоком (см. например, Anderson, 1990). При очень низком уровне возбуждения у человека недостаточно сил, чтобы работать над заданием, а очень высокое возбуждение мешает эффективной обработке информации, требующейся для выполнения работы (см. рис. 9.2).

Корреляционная связь

Рис. 9.2 Криволинейная корреляционная связь

Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Максимальное возможное абсолютное значение коэффициента корреляции r = +1,00 или r = –1,00; минимальное r = 0. Если коэффициент корреляции по модулю оказывается близким к +1,00 или – 1,00 то это соответствует высокому уровню связи между переменными, а близким к нулю — низкому уровню связи.

Величина коэффициента линейной корреляции не может превышать + 1 и быть меньше чем – 1. Эти два числа +1 и – 1 являются границами для коэффициента корреляции. Когда при расчете получается величина большая + 1 или меньшая – 1 то, это свидетельствует о том, что произошла ошибка в вычислениях.

Понятие корреляционной связи

Лекция 6. Элементы корреляционного и регрессионного анализа

В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Такого рода однозначные зависимости между пере­менными величинами X и У называют функциональными. Но подобные однозначные, или функциональные, связи между переменными величинами встречаются далеко не всегда

Поэтому, связи между психологическими признаками имеют не функциональный, а статистический характер, когда в среднем определенному значению одного признака, например, выраженной акцентуации подростков по гипертимному типу, рассматриваемому в качестве аргумента, соответствует не одно какое-либо значение, а целый спектр, распределяющихся в вариационный ряд числовых значений, например, такого психологического признака, как тревожность, который можно рассматривать в качестве зависимой переменной или функции. Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь— это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.

Функциональные связи легко обнаружить и измерить на единичных и групповых объектах, однако этого нельзя проделать с корреляционными связями, которые можно изучать только на представительных выборках методами математической статистики. Корреляционные связи — это вероятностные изменения.

Виды корреляционных связей между измеренными признака­ми могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна — если с увеличением или уменьшением одной переменной X, вторая переменная Y всреднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не лине­ен, а описывается другими законами.

Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции.

Корреляционная связьКорреляционная связь

Корреляционная связь

Корреляционная связь

Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи. Подчеркнем, однако, что нередко встречаются задачи, в которых традиционная и наиболее часто встречающаяся в психологических исследованиях ли­нейная корреляционная связь отсутствует, в то время как имеется высокозначимая криволинейная связь, например, полиномиальная или гиперболическая.

Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.

Сила связи не зависит от ее направленности и определяется по абсолютному значениюкоэффициента корреляции. Максимальное возможное значение коэффициента корреляции ; минимальное .

Используются две системы классификации корреляционных связей по их силе: общая и частная. Общая классификация корреляционных связей:

1) сильная, или тесная при коэффициенте корреляции ;

5) очень слабая при

Частная классификация корреляционных связей:

1) высокая значимая корреляция при . соответствующем уровню статистической значимости ;

2) значимая корреляция при . соответствующем уровню статистической значимости ;

3) тенденция достоверной связи при . соответствующем уровню статистической значимости ;

4) незначимая корреляция при . не достигающем уровня статистической значимости.

Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньше величины коэффициента корреляции оказывается достаточно, чтобы корреляция была признана достоверной. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки даже слабая корреляция может оказаться достоверной.

Обычно принято ориентироваться на вторую классификацию, так как она учитывает объем выборки. Вместе с тем, необходимо помнить, что сильная, или высокая, корреляция – это корреляция с коэффициентом . а не просто корреляция высокого уровня значимости.

Задача корреляционного анализа сводится кустановлению направления (положительное или отрицательное) и формы (ли­нейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимо­сти полученных коэффициентов корреляции.

Зависимость между коррелирующими переменными X и У. как и в математике, можно выразить с помощью формул и урав­нений (т.е. аналитически), аможно выразить графически.

Графики корреляционных зависимостей строят по уравнени­ям следующих функций:

которые называются уравнениями регрессии . Здесь и ,так на­зываемые, условные средние арифметические переменных Х и Y.

Переменные X и У могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции. Представим соотношения между типами шкал, в ко­торых могут быть измерены переменные Х и У и соответствую­щими мерами связи в виде таблицы 1:

ПОНЯТИЕ КОРРЕЛЯЦИОННОЙ СВЯЗИ

Психолога нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или с чем больше связан уровень умственного развития учащихся – с их успеваемостью по математике или литературе и т.п.?

Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г.

Первоначальное значение термина «корреляция» – взаимная связь (Oxford Advanced Learner’s Dictionary of Current English, 1982). Когда говорят о корреляции, используют термины «корреляционная связь» и «корреляционная зависимость».

Корреляционная связь – это согласованные изменения двух при­знаков или большего количества признаков (множественная корреляци­онная связь). Корреляционная связь отражает тот факт, что изменчи­вость одного признака находится в некотором соответствии с изменчи­востью другого. С другой стороны, корреляционная связь может говорить не о зависимости признаков между собой, а о зависимости этих признаков от другого (других). Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам неизвестно.

Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин.

Говорить в строгом смысле о зависимости мы можем только в тех случаях, когда сами оказываем какое–то контролируемое воздействие на испытуемых или так организуем исследование, что оказывается возможным точно определить интенсивность не зависящих от нас воздействий.

Независимые переменные – воздействия, которые можно качественно определить или даже измерить.

Зависимые переменные – признаки, которые измеряются и могут изменяться под влиянием независимых переменных.

Согласованные изменения независимой и зависимой переменных действительно могут рассматриваться как зависимость.

Корреляционные связи различаются по форме, направлению и степени (силе).

По форме корреляционная связь может быть линейной и криволинейной.

Линейнаясвязь – если с увеличением или уменьшением одной переменной, вторая переменная в среднем либо также растет, либо убывает (рис. 9.1, 9.2). Например, прямолинейной можно назвать связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии.

Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности (рис.9.3).

По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»).

При положительной (прямой) корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого (рис. 9.1).

При отрицательной (обратной) корреляции высокие значения одного признака соответствуют более низким значениям другого (рис. 9.2).

Рис.9.1.Линейная положительная связь Рис.9.2. Линейная отрицательная связь

Рис. 9.3. Криволинейная связь Рис. 9.4. Случайная связь

Степень (сила или теснота) корреляционной связи определяется по величине коэффициента корреляции, обозначающегося часто как r. Величина коэффициента корреляции находится в диапазоне от -1 до +1.

Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными.

Используются две системы классификации корреляционных связей по их силе: общая и частная.

Общая классификация корреляционных связей (по Ивантер Э.В. Коросову А.В. 1992):

1) сильная, или тесная 2) средняя 3) умеренная 4) слабая 5) очень слабая

при r > 0,70 ; при 0,50 < r < 0,69 ; при 0,30 < r < 0,49 ; при 0,20 < r < 0,29 ; при r < 0,19.

Частная классификация корреляционных связей:

1) высокая значимая корреляция – при r. соответствующем уровню статистической значимости a £ 0,01;

2) значимая корреляция – при r. соответствующем уровню

статистической значимости a £ 0,05;

3) тенденция достоверной связи – при r. соответствующем уровню статистической значимости a £ 0,10;

4) незначимая корреляция при r. не достигающем уровня ста­тистической значимости.

Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины коэффициента корреляции оказывается доста­точно, чтобы корреляция была признана достоверной. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки даже слабая корреляция может оказаться достоверной.

Обычно принято ориентироваться на вторую классификацию, по­скольку она учитывает объем выборки. Вместе с тем необходимо пом­нить, что сильная, или высокая, корреляция – это корреляция с коэффи­циентом r >0,70, а не просто корреляция высокого уровня значимости.

Переменные могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции. В таблице 9.1 представлены соотношения между шкалами [3].

3.4. Форма корреляционной связи

Форма уравнения связи устанавливается на основе теоретических, технологических соображений или интуиции. Когда заранее трудно представить зависимость, то строят корреляционное поле точек для двух признаков, по расположению которых на плоскости судят о направлении действия и форме связи. Каждой паре значений исследуемых признаков соответствует точка на корреляционном поле.

Если точки корреляционного поля (рис.3.1):

беспорядочно разбросаны по всему полю, то зависимости между исследуемыми признаками нет;

концентрируются вокруг прямой линии, идущей от нижнего левого угла в верхний правый угол, то имеется прямая линейная зависимость;

концентрируются вокруг прямой линии, идущей от верхнего левого угла в нижний правый угол, то имеется обратная линейная зависимость;

концентрируются вокруг некоторой кривой, то имеется нелинейная зависимость.

Корреляционная связь

Рис.3.1. Связь корреляционного поля точек с выборочным коэффициентом корреляции

Корреляционное поле точек строят для выборок малого объема. Для больших выборок строят корреляционные таблицы, в которых информация представляется в упорядоченном виде. По расположению информации в таблице также можно установить направление действия и форму связи (рис. 3.2).

Парная корреляция – это связь между двумя признаками, один из которых является факторным (фактором), а другой – результативным.

В случае линейной корреляции зависимость между случайными величинами выражается уравнением прямой Корреляционная связь

Возможны случаи нелинейной зависимости, уравнения могут быть вида Корреляционная связьили вообщеКорреляционная связь

Корреляционная связь

Рис. 3.2. Связь вида корреляционной таблицы с выборочным коэффициентом корреляции и математической моделью

а – линейная модель; б – нелинейная модель (последние две таблицы).

Если устанавливается зависимость между тремя и более случайными величинами, то в этом случае имеем дело с множественной корреляцией.

3.5. Теснота корреляционной связи

В случае линейной зависимости между двумя признаками тесноту связи характеризуют коэффициентом корреляции

где Корреляционная связь— корреляционный момент случайных величин (СВ)Корреляционная связь; Корреляционная связьКорреляционная связь— среднеквадратичные отклонения СВ Корреляционная связь.

Корреляционный момент – это математическое ожидание произведения центрированных СВ Корреляционная связьи Корреляционная связь: Корреляционная связь. Для независимых СВ, Корреляционная связь=0, следовательно, и Корреляционная связь, в остальных случаях Корреляционная связьЕсли Корреляционная связь, то корреляция положительная, если Корреляционная связь, то — отрицательная. Оценкой коэффициента корреляции является выборочный коэффициент корреляции Корреляционная связь, который обладает свойствами коэффициента корреляции (рис.3.1 и рис. 3.2). Эти коэффициенты называют еще соответствующими парными коэффициентами корреляции, например, выборочный парный коэффициент корреляции.

Коэффициент парной корреляции является безразмерной величиной и его значение не зависит от выбора единиц измерения рассматриваемых признаков. Близость к нулю значения коэффициента парной корреляции свидетельствует об отсутствии линейной связи признаков, но не об отсутствии связи между ними вообще. Последняя часть рис. 3.1 поясняет это положение – точки разбросаны по всему корреляционному полю, но концентрируются вокруг окружности. Следовательно, коэффициент парной корреляции близок к нулю, но признаки явно связаны друг другом. Поэтому в случае равенства нулю коэффициента парной корреляции нужно не говорить сразу о независимости признаков в данный период, а построить более сложную модель их связи, учитывающую хотя бы нелинейную зависимость между этими признаками.

В случае нелинейной зависимости тесноту связи устанавливают теоретическим корреляционным отношением.

При исследовании зависимостей между случайными переменными Х и Корреляционная связьобычно ограничиваются изучением зависимости одной из них и условным математическим ожиданием другой, т.е.Корреляционная связьилиКорреляционная связьгдеКорреляционная связь— математическое ожидание случайной величиныКорреляционная связьпри условии, что случайная величинаКорреляционная связьприняла значениеКорреляционная связь

Условное математическое ожидание Корреляционная связьслучайной переменнойКорреляционная связь, рассматриваемое как функцияКорреляционная связь, т.е.Корреляционная связь, называется функцией регрессииКорреляционная связьнаКорреляционная связь.

На практике часто предпосылки корреляционного анализа нарушаются: один из признаков оказывается величиной не случайной или признаки не имеют совместного нормального распределения, но статистическая зависимость между ними существует. Для изучения связи между признаками в этом случае существует общий показатель зависимости признаков, в основу которого заложено понятие общей (или полной) дисперсии.

Полной называется дисперсия (рассеянность значений) признака относительно его математического ожидания. Для результативного признакаКорреляционная связь полная дисперсия записывается в виде

Полную дисперсию можно разложить на две составляющие, одна из которых характеризует влияние признака Корреляционная связьнаКорреляционная связь, другая – влияние прочих признаков:

Первое слагаемое обозначают Корреляционная связьи называют дисперсией функции регрессии относительно математического ожидания признакаКорреляционная связь. Эта дисперсия измеряет влияние признакаКорреляционная связьнаКорреляционная связь. Второе слагаемое обозначаютКорреляционная связьи называют дисперсией признакаКорреляционная связьотносительно функции регрессии или остаточной дисперсией, которая измеряет влияние наКорреляционная связьпрочих признаков.

Разделив обе части равенства (3.3) на полную дисперсию, получим

где Корреляционная связь— теоретическое корреляционное отношение, значения которого находятся в диапазоне от 0 до 1 и которое является показателем тесноты группировки точек около кривой регрессии независимо от ее вида. Корреляционное отношение, полученное по выборке, называют выборочным корреляционным отношением.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *