Коэффициент корреляции фехнера онлайн. Коэффициент корреляции знаков фехнера и некоторые ранговые коэффициенты

Краткая теория

К простейшим показателям тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г.Фехнером. Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков.

Если ввести обозначения: – число совпадений знаков отклонений индивидуальных величин от средней, – число несовпадений знаков отклонений, то коэффициент Фехнера можно записать таким образом:

Коэффициент Фехнера может принимать различные значения в пределах от -1 до +1. Если знаки всех отклонений совпадут, то и тогда показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда и коэффициент Фехнера будет равен -1, что дает основание предположить наличие обратной связи.

Пример решения задачи

Условие задачи

Имеются данные о поголовье крупного рогатого скота по 12 сельхозпредприятиям на 1 января и среднегодовом надое молока на одну корову. Определите частоту связи между этими факторами, используя коэффициент корреляции Фехнера.

№ п/п сельскохозяйственных предприятий 1 1.2 35.8 2 1.6 30.0 3 2.8 34.8 4 1.8 31.3 5 2.9 36.9 6 3 37.1 7 1.6 27.9 8 1.7 30.0 9 2.6 35.8 10 1.3 32.1 11 2 29.1 12 3.3 34.3

Решение задачи

Составим расчетную таблицу:

№ п/п сельскохозяйственных предприятий Поголовье крупного рогатого скота на 1 января, тыс.голов Среднегодовой надой на одну корову, кг 1 1.2 35.8 1.44 1281.64 42.96 2 1.6 30 2.56 900 48 3 2.8 34.8 7.84 1211.04 97.44 4 1.8 31.3 3.24 979.69 56.34 5 2.9 36.9 8.41 1361.61 107.01 6 3 37.1 9 1376.41 111.3 7 1.6 27.9 2.56 778.41 44.64 8 1.7 30 2.89 900 51 9 2.6 35.8 6.76 1281.64 93.08 10 1.3 32.1 1.69 1030.41 41.73 11 2 29.1 4 846.81 58.2 12 3.3 34.3 10.89 1176.49 113.19 Итого 25.8 395.1 61.28 13124.15 864.89

Коэффициент Фехнера можно вычислить по формуле:

Число совпадений знаков отклонений индивидуальных величин от средней, , - число несовпадений знаков отклонений

1.2 35.8 1.6 30 2.8 34.8 1.8 31.3 2.9 36.9 3 37.1 1.6 27.9 1.7 30 2.6 35.8 1.3 32.1 2 29.1 3.3 34.3
Знаки отклонений от средней Совпадение ( или несовпадение знаков 1 - + b 2 - - a 3 + + a 4 - - a 5 + + a 6 + + a 7 - - a 8 - - a 9 + + a 10 - - a 11 - - a 12 + + a

Обычно такое значение показателя тесноты связи характеризует сильную зависимость, однако, следует иметь в виду, что поскольку коэффициент зависит только от знаков и не учитывает величину самих отклонений и от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.

На цену сильно влияет срочность решения (от суток до нескольких часов). Онлайн-помощь на экзамене/зачете осуществляется по предварительной записи.

Заявку можно оставить прямо в чате, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Различные признаки могут быть связаны между собой.

Выделяют 2 вида связи между ними:

  • функциональная;
  • корреляционная.

Корреляция в переводе на русский язык – не что иное, как связь.
В случае корреляционной связи прослеживается соответствие нескольких значений одного признака нескольким значениям другого признака. В качестве примеров можно рассмотреть установленные корреляционные связи между:

  • длиной лап, шеи, клюва у таких птиц как цапли, журавли, аисты;
  • показателями температуры тела и частоты сердечных сокращений.

Для большинства медико-биологических процессов статистически доказано присутствие этого типа связи.

Статистические методы позволяют установить факт существования взаимозависимости признаков. Использование для этого специальных расчетов приводит к установлению коэффициентов корреляции (меры связанности).

Такие расчеты получили название корреляционного анализа. Он проводится для подтверждения зависимости друг от друга 2-х переменных (случайных величин), которая выражается коэффициентом корреляции.

Использование корреляционного метода позволяет решить несколько задач:

  • выявить наличие взаимосвязи между анализируемыми параметрами;
  • знание о наличии корреляционной связи позволяет решать проблемы прогнозирования. Так, существует реальная возможность предсказывать поведение параметра на основе анализа поведения другого коррелирующего параметра;
  • проведение классификации на основе подбора независимых друг от друга признаков.

Для переменных величин:

  • относящихся к порядковой шкале, рассчитывается коэффициент Спирмена;
  • относящихся к интервальной шкале – коэффициент Пирсона.

Это наиболее часто используемые параметры, кроме них есть и другие.

Значение коэффициента может выражаться как положительным, так и отрицательными.

В первом случае при увеличении значения одной переменной наблюдается увеличение второй. При отрицательном коэффициенте – закономерность обратная.

Для чего нужен коэффициент корреляции?

Случайные величины, связанные между собой, могут иметь совершенно разную природу этой связи. Не обязательно она будет функциональной, случай, когда прослеживается прямая зависимость между величинами. Чаще всего на обе величины действует целая совокупность разнообразных факторов, в случаях, когда они являются общими для обеих величин, наблюдается формирование связанных закономерностей.

Это значит, что доказанный статистически факт наличия связи между величинами не является подтверждением того, что установлена причина наблюдаемых изменений. Как правило, исследователь делает вывод о наличии двух взаимосвязанных следствий.

Свойства коэффициента корреляции

Этой статистической характеристике присущи следующие свойства:

  • значение коэффициента располагается в диапазоне от -1 до +1. Чем ближе к крайним значениям, тем сильнее положительная либо отрицательная связь между линейными параметрами. В случае нулевого значения речь идет об отсутствии корреляции между признаками;
  • положительное значение коэффициента свидетельствует о том, что в случае увеличения значения одного признака наблюдается увеличение второго (положительная корреляция);
  • отрицательное значение – в случае увеличения значения одного признака наблюдается уменьшение второго (отрицательная корреляция);
  • приближение значения показателя к крайним точкам (либо -1, либо +1) свидетельствует о наличии очень сильной линейной связи;
  • показатели признака могут изменяться при неизменном значении коэффициента;
  • корреляционный коэффициент является безразмерной величиной;
  • наличие корреляционной связи не является обязательным подтверждением причинно-следственной связи.

Значения коэффициента корреляции

Охарактеризовать силу корреляционной связи можно прибегнув к шкале Челдока, в которой определенному числовому значению соответствует качественная характеристика.

В случае положительной корреляции при значении:

  • 0-0,3 – корреляционная связь очень слабая;
  • 0,3-0,5 – слабая;
  • 0,5-0,7 – средней силы;
  • 0,7-0,9 – высокая;
  • 0,9-1 – очень высокая сила корреляции.

Шкала может использоваться и для отрицательной корреляции. В этом случае качественные характеристики заменяются на противоположные.

Можно воспользоваться упрощенной шкалой Челдока, в которой выделяется всего 3 градации силы корреляционной связи:

  • очень сильная – показатели ±0,7 — ±1;
  • средняя – показатели ±0,3 — ±0,699;
  • очень слабая – показатели 0 — ±0,299.

Данный статистический показатель позволяет не только проверить предположение о существовании линейной взаимосвязи между признаками, но и установить ее силу.

Виды коэффициента корреляции

Коэффициенты корреляции можно классифицировать по знаку и значению:

  • положительный;
  • нулевой;
  • отрицательный.

В зависимости от анализируемых значений рассчитывается коэффициент:

  • Пирсона;
  • Спирмена;
  • Кендала;
  • знаков Фехнера;
  • конкорддации или множественной ранговой корреляции.

Корреляционный коэффициент Пирсона используется для установления прямых связей между абсолютными значениями переменных. При этом распределения обоих рядов переменных должны приближаться к нормальному. Сравниваемые переменные должны отличаться одинаковым числом варьирующих признаков. Шкала, представляющая переменные, должна быть интервальной либо шкалой отношений.

  • точного установления корреляционной силы;
  • сравнения количественных признаков.

Недостатков использования линейного корреляционного коэффициента Пирсона немного:

  • метод неустойчив в случае выбросов числовых значений;
  • с помощью этого метода возможно определение корреляционной силы только для линейной взаимосвязи, при других видах взаимных связей переменных следует использовать методы регрессионного анализа.

Ранговая корреляция определяется методом Спирмена, позволяющим статистически изучить связь между явлениями. Благодаря этому коэффициенту вычисляется фактически существующая степень параллелизма двух количественно выраженных рядов признаков, а также оценивается теснота, выявленной связи.

  • не требующих точного определения значение корреляционной силы;
  • сравниваемые показатели имеют как количественные, так и атрибутивные значения;
  • равнения рядов признаков с открытыми вариантами значений.

Метод Спирмена относится к методам непараметрического анализа, поэтому нет необходимости проверять нормальность распределения признака. К тому же он позволяет сравнивать показатели, выраженные в разных шкалах. Например, сравнение значений количества эритроцитов в определенном объеме крови (непрерывная шкала) и экспертной оценки, выражаемой в баллах (порядковая шкала).

На эффективность метода отрицательно влияет большая разница между значениями, сравниваемых величин. Не эффективен метод и в случаях когда измеряемая величина характеризуется неравномерным распределением значений.

Пошаговый расчет коэффициента корреляции в Excel

Расчёт корреляционного коэффициента предполагает последовательное выполнение ряда математических операций.

Приведенная выше формула расчета коэффициента Пирсона, показывает насколько трудоемок этот процесс если выполнять его вручную.
Использование возможностей Excell ускоряет процесс нахождения коэффициента в разы.

Достаточно соблюсти несложный алгоритм действий:

  • введение базовой информации – столбец значений х и столбец значений у;
  • в инструментах выбирается и открывается вкладка «Формулы»;
  • в открывшейся вкладке выбирается «Вставка функции fx»;
  • в открывшемся диалоговом окне выбирается статистическая функция «Коррел», позволяющая выполнить расчет корреляционного коэффициента между 2 массивами данных;
  • открывшееся окно вносятся данные: массив 1 – диапазон значений столбца х (данные необходимо выделить), массив 2 – диапазон значений столбца у;
  • нажимается клавиша «ок», в строке «значение» появляется результат расчета коэффициента;
  • вывод относительно наличия корреляционной связи между 2 массивами данных и ее силе.

Следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации.

Он основан на сравнении поведения отклонений индивидуальных значений каждого признака ( и ) от своей средней величины. При этом во внимание принимаются не величины отклонений , а их знаки («+» или «-»). Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений () и несовпадений ().

Коэффициент Фехнера ()рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

. (9.12)

Очевидно, что если знаки всех отклонений по каждому признаку совпадают, то и тогда . Это характеризует наличие прямой связи. Если все знаки не совпадают, то , а , что характеризует обратную связь. Коэффициент Фехнера, как и любой другой показатель тесноты связи, может принимать значения от -1 до +1.

Пример 9.3 . Имеются следующие данные о росте восьми пар братьев и сестер (таблица 9.2).

Таблица 9.2 - Данные о росте восьми пар братьев и сестер

Рост брата, см Рост сестры, см


Определить тесноту зависимости между ростом братьев и сестер на основе:

а) коэффициента Фехнера;

б) коэффициентов корреляции рангов Спирмэна и Кендэла.

Решение:

а) Рассчитаем средние величины и :

Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений () и несовпадений ():

.

Коэффициент Фехнера ()рассчитывается по формуле 9.8:

.

По величине коэффициента Фехнера () можно сделать вывод о весьма тесной зависимости между и .

б) По уже имеющимся данным (графы 1-2 таблицы 9.2) для нахождения коэффициентов корреляции рангов Спирмэна и Кендэла построим таблицу 9.3.

Таблица 9.3 – Расчетные значения, необходимые для исчисления коэффициентов корреляции рангов Спирмэна и Кендэла

Подсчет баллов
«+» «-»
6,5 6,5 1,5 1,5 6,5 6,5 -0,5 -1 -2 2,5 -0,5 -1,5 0,25 6,25 0,25 2,25 - -

В данном примере отдельные значения и повторяются. При ранжировании повторяющихся значений, им присваивается ранг, рассчитанный как средняя арифметическая из суммы мест, которые они занимают по возрастанию.

Расчет рангов показан в графах 3 и 4.

Для случая повторяющихся рангов есть особые скорректированные формулы и для коэффициента Спирмэна, и для коэффициента Кендэла. Однако на практике часто пользуются приведенной ранее формулой Спирмэна и для случая повторяющихся рангов, поскольку ошибку она дает весьма малую:

.

Формула коэффициента Кендэла для повторяющихся рангов имеет вид:

,

где , как и раньше, a и -показатели, корректирующие максимальную сумму баллов и определяемые по формуле , где - число повторяющихся рангов в соответствующем ряду и :

Так как значения рангов идут строго в возрастающем порядке, то следим лишь за поведением . После первой пары значений рангов, где в шести случаях идут значения и ни одного случая, где . Это означает, что в графу 7 мы ставим число «6», а в графу 8число «0». Далее после второй пары значений рангов, где в четырех случаях идут значения и ни одного случая, где . Это означает, что в графу 7 мы ставим число «4», а в графу 8число «0». ». В случае, если бы после второй пары значений рангов, где в трех случаях шли бы значения и два случая, где - это означало бы, что в графу 7 мы ставим число «3», а в графу 8число «2» и т.д.

Расчет и показан в графах 7 и 8. По результатам подсчетов .

Отсюда коэффициент корреляции рангов Кендэла:

По величине коэффициента () можно сделать вывод о весьма тесной зависимости между и , т.е. рост сестры весьма зависим от роста её брата.

Говоря о расчете коэффициента Кендэла, следует еще раз подчеркнуть, что если наблюдаемые единицы совокупности записаны неупорядоченно по одному из признаков (таблица 9.2.), то после ранжирования значений и , ранги одного из признаков, например , следует переписать, расположив их строго в порядке возрастания (или убывания), а для второго признака сохранить значения рангов, соответствующие значениям каждого в исходных данных (таблица 9.3).

Коэффициент конкордации

Корреляция рангов ()может определяться не только для двух, но и для большего числа показателей (факторов). Исчисляемый в этом случае показатель именуется коэффициентом конкордации ()и рассчитывается по формуле:

, (9.13)

где - количество коррелируемых факторов;

Число наблюдений;

- сумма квадратов отклонений суммы рангов по факторам от их средней арифметической, т.е.

а) или, что по значению тоже самое, (9.14)

б) где - ранг -го показателя. (9.15)

Коэффициент конкордации часто используется в экспертных оценках для определения согласованности мнений экспертов в распределение мест (рангов) между исследуемыми факторами или объектами по их приоритетности.

Пример 9.4. Пусть имеются следующие данные по пяти фирмам (графы 1-4 таблицы 9.4).

Таблица 9.4 – Исходные данные и промежуточные расчеты коэффициентов конкордации

Фирма Прибыль, тыс. руб. Стоимость оборотных средств, млн. руб. Затраты на 100 руб. продукции, руб. Ранги факторов Сумма рангов Квадрат суммы рангов
2,0 2,5 1,8 2,2 2,4
Σ

Определить тесноту зависимости между с помощью коэффициента конкордации.

Решение:

1. Ранжираем каждый и трех показателей (графы 5-7).

2. Находим сумму рангов по каждой строке (графа 8) и общую сумму пяти строк

3. Возводим в квадрат сумму рангов в каждой строке и находим сумму пяти строк (графа 9):

.

4. Находим , используя формулу 9.11:

.

5. Рассчитаем коэффициент конкордации:

Учитывая малое значение коэффициента конкордации, можно сказать, что зависимость между рассматриваемыми показателями весьма незначительна.

Существуют и другие коэффициенты для измерения тесноты зависимости (коэффициенты ассоциации и контингенции ; коэффициент взаимной сопряженности Пирсона ; коэффициент Чупрова ), которые применяются достаточно редко.

Непараметрические методы

Применение корреляционного и регрессионного анализа требует, чтобы все признаки были количественно измеренными. Построение аналитических группировок предполагает, что количественным должен быть результативный признак. Параметрические методы основаны на использовании основных количественных параметров распределения (средних величин и дисперсий).

Вместе с тем в статистике применяются также непараметрические методы , с помощью которых устанавливается связь между качественными (атрибутивными) признаками . Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет только об установлении наличия связи и измерении ее тесноты.

В практике статистических исследований приходится иногда анализировать связи между альтернативными признаками , представленными только группами с противоположными (взаимоисключающими) характеристиками. Тесноту связи в этом случае можно оценить, вычислив коэффициент ассоциации.

Для расчета коэффициента ассоциации строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:

a b a+b
c d c+d
a+c b+d a+b+c+d

Применительно к таблице «четырех полей» с частотами и коэффициент ассоциации выражается формулой:

. (9.16)

Коэффициент ассоциации изменяется от -1 до +1; чем ближе к +1 или -1, тем сильнее связаны между собой изучаемые признаки.

Если не менее 0,3, то это свидетельствует о наличии связи между качественными признаками.

Пример 9.5 . Имеющиеся данные о росте отцов и сыновей представлены в таблице 9.5.

Таблица 9.5 - Распределение отцов и сыновей по росту, чел.

Рост сына Рост отца Всего
Ниже среднего Выше среднего
Ниже среднего
Выше среднего
Итого

Подсчитаем коэффициент ассоциации по данным таблицы 9.5:

Поскольку , между ростом отцов и сыновей существует корреляционная связь.

Если по каждому из взаимосвязанных признаков выделяется число групп более двух, то для подобного рода таблиц теснота связи между качественными признаками может быть измерена с помощью показателя взаимной сопряженности А.A. Чупрова:

(9.17)

где - число возможных значений первой статистической величины (число групп по столбцам);

Число возможных значений второй статистической величины (число групп по строкам);

Показатель взаимной сопряженности (определяется как сумма отношений квадратов частот клетки таблицы распределения к произведению итоговых частот соответствующего столбца и строки).

Вычтя из этой суммы единицу, получим .

Коэффициент взаимной сопряженности А.А. Чупрова изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых признаков.

Пример 9.6. Данные об уровне образования членов 100 семей приведены в таблице 9.6.

Таблица 9.6- Распределение семей по уровню образования мужа и жены

Примечание: частоты - верхние строки; их квадраты (в скобках) - средние строки; квадраты частот, деленные на суммы частот по столбцу - нижние строки; в итоговых столбцах - сумма частот, сумма результатов деления (А), а также результат деления нижнего числа на верхнее - последний столбец (В).

Тогда , .

Коэффициент взаимной сопряженности А.А. Чупрова:

.

Его значение показывает заметную связь между уровнями образования мужа и жены при формировании семьи.

Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

При корреляционному связи вместе с исследуемым фактором или несколькими факторами при множественной корреляции на результативный признак оказывают влияние и другие факторы, которые не учитываются или не могут быть точно учтены. При этом действие их может быть направлена как в сторону повышения результативного признака, так и в сторону ее снижения. Итак, исследование связи происходит в условиях, когда эта связь в большей или меньшей степени затушевывается противоречивой действием других причин. Поэтому одна из задач корреляционного анализа состоит в определении тесноты связи между признаками, в определении силы воздействия исследуемого фактора (факторов) на результативный признак.

Теснота связи в корреляционному анализе характеризуется с помощью специального относительного показателя, который получил название коэффициента корреляции.

При парной линейной зависимости теснота связи определяется с помощью линейного коэффициента корреляции

Коэффициент корреляции находится в пределах от 0 к ±1. в Если коэффициент корреляции равен нулю, то связь отсутствует, а если единице, то связь функциональная. Знак при коэффициенте корреляции указывает на направление связи ("+" - прямой "-" - обратная). Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее.

Квадрат коэффициента корреляции называется коэффициентом детерминации (г2). Он показывает, какая доля общей вариации результативного признака определяется исследуемым фактором. Если коэффициент детерминации выраженный в процентах, то его следует читать так: вариация (колебания) зависимой переменной на столько-то процентов обусловлена вариацией фактора.

Между линейным коэффициентом корреляции (г) и коэффициентом полной регрессии (Ь) связь:

Следовательно, зная коэффициент корреляции (г) и значения средних квадратических отклонений по х и в можно определить коэффициент регрессии (Ь) и наоборот, зная коэффициент регрессии (Ь) и соответствующие средние квадратические отклонения можно вычислить коэффициент корреляции (г).

При парной линейной зависимости коэффициент корреляции и коэффициент полной регрессии имеют одинаковые знаки (плюс, минус).

Линейный коэффициент корреляции предназначен для оценки степени тесноты связи при линейной зависимости. Для случаев нелинейной связи между признаками используется другая формула коэффициента корреляции, которая следует из правила сложения дисперсий:

Из приведенного равенства видно, что чем больше влияние фактора на результативный признак, тем в большей степени ее значение дисперсии ("м.гр) приближается к значению общей дисперсии результативного признака.

Соответственно, чем больше "м.гР и меньше ае.гр тем связь между признаками будет теснее и наоборот. Следовательно, отношение межгрупповой (факторной) и общей дисперсий используется для оценки тесноты связи между признаками. Формула коэффициента корреляции имеет вид:

Учитывая, щосг2я = о-а-огля!>, формулу коэффициента корреляции можно представить как

Обе формулы коэффициента корреляции применяются для расчета тесноты связи при любой форме связи.

Из правила сложения дисперсий видно, что значение коэффициента корреляции находится в пределах от 0 до 1. Знак коэффициента корреляции с формулы не выводится. Если изучается связь между двумя признаками (парная простая корреляция), то направление связи (знак перед г) определяется непосредственно за знаком перед коэффициентом регрессии линейного уравнения.

При парной криволинейной зависимости, теснота связи при линейной зависимости, определяется с помощью специального показателя, аналогичного рассмотренному выше коэффициента корреляции г.

Этот показатель (чтобы подчеркнуть его принадлежность к криволинейного связи) обозначают символом иг и называют индексом корреляции:

Числовое значение индекса корреляции аналогичное коэффициенту корреляции: если иг = 1 - связь функциональная, если иг = 0 - связь отсутствует; чем иг ближе к единице, тем связь между признаками теснее.

Если известны коэффициенты регрессии уравнения связи, то индекс корреляции можно определить по другой, более простой формуле. Так, при параболической зависимости формула индекса корреляции может быть представлена как

Теснота связи при множественной корреляции определяется с помощью коэффициента множественной корреляции (ее) и коэффициента множественной детерминации (її2). По содержанию они аналогичны коэффициентам корреляции и детерминации при парном связи. их вычисления основывается на сравнении межгрупповой (факторной) и общей дисперсий:

Эта формула может быть применена для определения тесноты связи при любой форме связи.

Величина рч. изменяется от 0 до 1 и рассматривается как положительная, поскольку при множественных зависимостях связь результативного признака с одними факторами может быть положительным, а с другими - отрицательным.

Для случая зависимости результативного признака от двух факторов формула коэффициента множественной корреляции имеет вид

где Ги - парные линейные коэффициенты корреляции.

Приведенная формула применяется для определения тесноты связи при линейной зависимости.

Для определения тесноты связи между результативным признаком и каждым фактором при исключены влияния других факторов определяют частные коэффициенты корреляции, которые характеризуют "чистая" влияние фактора на результативный признак. Для их расчета используются парные коэффициенты корреляции.

В случае зависимости результативного признака от двух факторов (х1 и х2) можно рассчитать три коэффициента частичной корреляции:

1) между в и х1 при исключении влияния х2:

Коэффициенты корреляции при парных и множественных связей, а также индекс корреляции - это относительные величины, поэтому они могут быть использованы для сопоставления тесноты связи по нескольким явлениях, которые анализируются.

Следует иметь в виду, что показатели тесноты связи зависят от размаха варьирования изучаемых признаков. Чем больше вариация переменных, тем выше будет величина показателей тесноты связи.

Определим тесноту связи между исследуемыми признаками для нашего примера. Поскольку между продуктивностью коров и уровнем кормления имеет место линейная связь, тесноту связи определим с помощью линейного коэффициента корреляции

Коэффициент корреляции показывает, что между продуктивностью коров и уровнем кормления имеет место тесная (сильная) связь.

Коэффициент детерминации г2 = 0,93442 = 0,8731 показывает, что 87,31% общего колебания продуктивности коров обусловлено различиями в уровне кормления, а остальные 12,69% (100 - 87,31) - другими факторами, которые в данном случае не было учтено.

Коэффициент корреляции можно найти и по другим формулам.