Показатели тесноты связей

6 Июн 2014 | Автор: | Комментариев нет »

Содержание

Введение 3
1. Показатели тесноты связей 4
2. Линейная корреляция 6
Заключение 15
Список литературы 16

Введение

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

1. Показатели тесноты связей

При изучении корреляционной связи важным направлением анализа является оценка степени тесноты связи.
Понятие степени тесноты связи между двумя признаками возникает вследствие того, что в реальной действительности на изменение результативного признака влияют несколько факторов. При этом влияние одного из факторов может выражаться более заметно и четко, чем влияние других факторов. С изменением условий в качестве главного, решающего фактора может выступать другой [2, c. 155].
При статистическом изучении взаимосвязей, как правило, учитываются только основные факторы. А вопрос необходимо ли вообще изучать более подробно данную связь и практически ее использовать, решается с учетом степени тесноты связи.
Зная количественную оценку тесноты корреляционной связи, таким образом, можно решить следующую группу вопросов:
• 1) необходимо ли глубокое изучение данной связи между признаками и целесообразно ли ее практическое применение;
• 2) сопоставляя оценки тесноты связи для различных условий, можно судить о степени различий в ее проявлении в конкретных условиях;
• 3) последовательное рассмотрение и сравнение признака у с различными факторами (х1, х21, …) позволяет выявить, какие из этих факторов в данных конкретных условиях являются главными, решающими факторами, а какие второстепенными, незначительными факторами;
Показатели тесноты связи должны удовлетворять ряду основных требований:
• 1) величина показателя степени тесноты связи должна быть равна или близка к нулю, если связь между изучаемыми признаками (процессами, явлениями) отсутствует;
• 2) при наличии между изучаемыми признаками (х и у) функциональной связи величина степень тесноты связи равна единице;
• 3) при наличии между признаками (х и у) корреляционной связи показатель тесноты связи выражается правильной дробью, которая по величине тем больше, чем теснее связь между изучаемыми признаками (стремится к единице);
• 4) при прямолинейной корреляционной связи показатели тесноты связи отражают и направление связи: знак (+) означает наличие прямой (положительной) связи; а знак (-) – обратной (отрицательной).
Для характеристики степени тесноты корреляционной связи могут применяться различные статистические показатели: коэффициент Фехнера (КФ), коэффициент линейной (парной) корреляции (r’), коэффициент детерминации, корреляционное отношение ( ), индекс корреляции, коэффициент множественной корреляции (R), коэффициент частной корреляции (r’) и др.
В данном вопросе рассмотрим коэффициент линейной корреляции (r) и корреляционное отношение ( ).
Более совершенным статистических показателем степени тесноты корреляционной связи является линейный коэффициент корреляции (r), предложенный в конце XIX в. [2, c. 157]
При расчете коэффициента корреляции сопоставляются абсолютные значения отклонений индивидуальных величин факториального признака х и результативного признака у от их средних. Однако непосредственно сопоставлять между собой эти полученные результаты нельзя, т.к. признаки, как правило, выражены в различных единицах и даже при наличии одинаковых единиц измерения будут иметь различные по величине средние и различные вариации. В этой связи сравнению подлежат отклонения, выраженные в относительных величинах, т.е. в долях среднего квадратического отклонения (их называют нормированными отклонениями).

2. Линейная корреляция

Одной из основных мер связи в корреляционном анализе является линейный коэффициент корреляции.
Парный линейный коэффициент корреляции. С помощью парного линейного коэффициента корреляции измеряется теснота связи между двумя признаками. Линейный коэффициент корреляции чаще всего рассчитывается по формуле

где xi и yi - значения признаков х и у соответственно для i-ro объекта, i=1, .., n; n - число объектов;  и  - средние арифметические значения признаков х и у соответственно.
Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Равенство коэффициента нулю свидетельствует об отсутствии линейной связи. Равенство коэффициента -1 или +1 показывает наличие функциональной связи. Знак «+» указывает на связь прямую (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «-» - на связь обратную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака) [1, c. 90].
Проверка значимости парного линейного коэффициента корреляции. Коэффициенты корреляции, как правило, рассчитываются для выборочных данных. Чтобы распространить полученные частные результаты на генеральную совокупность, приходится допустить некоторую ошибку, которую можно оценить с помощью средней квадратической ошибки. Средняя квадратическая ошибка для парного линейного коэффициента корреляции достаточно большой выборки вычисляется по формуле

где ρ - коэффициент корреляции генеральной совокупности; n - объем выборки.
В математической статистике доказано, что если признаки х и y распределены по нормальному закону, то в достаточно больших выборках коэффициенты корреляции можно считать распределенными нормально со средним значением ρ и средним квадратическим отклонением σr (нормальное распределение рассмотрено в гл. 4). Этот факт используется для построения доверительных интервалов коэффициента корреляции в генеральной совокупности, а также для проверки значимости выборочных коэффициентов корреляции, т. е. для проверки того, могло ли данное значение r получиться в выборке из некоррелированной генеральной совокупности (ρ=0) в силу простой случайности.
Очевидно, чем больше отклонение r от ρ, тем менее вероятно, что оно случайно. Так, для нормального распределения вероятность того, что выборочное значение r отличается от ρ больше чем на 3σr, меньше 0,01, т. е. величина нормированного отклонения

может превысить значение 3 лишь в одном случае из ста.
Если  , т. е. происходит маловероятное событие, предположение о некоррелированности признаков необосновано и коэффициент корреляции считается значимым. Если же  , коэффициент корреляции считается незначимым.
Доверительные интервалы для парного линейного коэффициента корреляции. После расчета выборочного коэффициента корреляции (r) и его средней квадратической ошибки (σr) устанавливается уровень достоверности выводов или доверительная вероятность. Для больших выборок соответственно выбранной вероятности Р по таблице нормального распределения определяется параметр t. Верхняя граница интервала получается прибавлением к выборочному коэффициенту корреляции tσr, нижняя граница-вычитанием tσr. Формула средней квадратической ошибки содержит неизвестный на практике генеральный коэффициент корреляции. Обычно в расчетах его заменяют выборочным коэффициентом корреляции [6, c. 82].
Важнейшей предпосылкой использования корреляционного анализа является нормальность распределения признаков в генеральной совокупности. Нормальность распределения или, по крайней мере, близость распределения к нормальному необходима для корректного проведения проверки значимости связи и вычисления доверительных интервалов.
Проверка значимости парного линейного коэффициента корреляции для случая малой выборки. Необходимо учитывать два ограничения. Во-первых, они верны для коэффициента корреляции генеральной совокупности и замена последнего выборочным коэффициентом корреляции является искусственным приемом. Риск заменить генеральный коэффициент корреляции существенно отличным от него выборочным коэффициентом увеличивается с уменьшением объема выборки п. Во-вторых, при выборках небольшого объема распределение выборочного коэффициента корреляции может значительно отличаться от нормального, а нормальность распределения является важнейшим условием корректного использования доверительных интервалов и проверки значимости коэффициентов.
Таким образом, при малых объемах выборок (практически при n<50) изложенная выше методика определения доверительных интервалов и проверки значимости коэффициентов корреляции неприменима (поэтому примеры 2-3 являются в какой-то мере условными). Особенно возрастают требования к объему выборки при высоких, близких к 1, значениях показателя связи генеральной совокупности.
Для малых выборок проверка значимости коэффициента корреляции осуществляется так: вычисляется фактическое значение tф величины t, подчиняющейся распределению Стьюдента:

и сравнивается с табличной или критической величиной tкр, зависящей от числа k=n-2, где n-объем выборки, и от выбранной степени достоверности Р. Если , то приходят к выводу о наличии связи; если tф<tкр, то гипотеза об отсутствии связи не отклоняется.
Понятие о частной и множественной корреляции. С помощью парного линейного коэффициента корреляции выявляется связь между двумя признаками, один из которых можно рассматривать как результативный, другой - как факторный. Но в действительности на результат воздействуют несколько факторов. В связи с этим возникают два типа задач: задачи измерения комплексного влияния на результативную переменную нескольких переменных и задачи определения тесноты связи между двумя переменными при фиксированных значениях остальных переменных. Задачи первого типа решаются с помощью множественных коэффициентов корреляции, задачи второго типа - с помощью частных коэффициентов корреляции [6, c. 85].
Частный, или чистый, коэффициент корреляции между двумя признаками при исключении влияния третьего признака (обозначим его символом r12.3) рассчитывается по формуле (Существует алгоритм, позволяющий вычислить частные коэффициенты корреляции при исключенном влиянии двух, трех и т. д. факторов. Этот рекуррентный алгоритм используется в машинном варианте (есть стандартные программы для ЭВМ).)

где индексы при r показывают номера признаков, связь между которыми оценивается.
Частный коэффициент корреляции первого и второго признаков при исключении влияния третьего оценивает тесноту линейной корреляционной связи между первым и вторым признаками при фиксированном значении третьего признака. Другими словами, он оценивает влияние на результативный (первый) признак изменения лишь второго признака.
Оценка влияния на результативный признак изменений третьего признака при постоянных значениях второго признака определяется по формуле

Значения частных коэффициентов корреляции заключаются в тех же пределах от -1 до +1, что и значения парных коэффициентов корреляции, и так же интерпретируются.
Частные коэффициенты корреляции позволяют установить тесноту взаимосвязи между двумя признаками при исключении влияния других переменных, но для окончательных выводов необходима проверка уровня значимости частных коэффициентов корреляции.
Значимость частных коэффициентов корреляции зависит не только от величины выборочного коэффициента и объема выборки, но также и от числа введенных в исследование переменных.

Для проверки значимости частных коэффициентов корреляции вычисляют величину по формуле
где rij.k - коэффициент корреляции между i и j признаками при исключенном влиянии k-го признака; m-количество исключенных признаков, и сравнивают ее с табличным или критическим значением, соответствующим принятому уровню значимости.
Наличие связи подтверждается, если вычисленное значение tф превосходит значение tкр.
Множественный, или совокупный, коэффициент корреляции для случая трех признаков, один из которых - результативный (с номером 1) и два-факторных (с порядковыми номерами 2 и 3) рассчитывается по формуле (Для расчетов используется такая формула

пригодная для случаев, когда число признаков, совокупное влияние которых исследуется, превосходит два. Существуют стандартные программы, вычисляющие R1(23...P))

где подстрочные индексы при r показывают номера признаков, связь между которыми оценивается этим коэффициентом корреляции.
Множественный коэффициент корреляции является показателем тесноты линейной связи между результативным признаком и совокупностью факторных признаков.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1. Равенство его нулю говорит об отсутствии линейной связи, равенство единице-о функциональной связи. Указаний на то, является ли связь прямой или обратной, коэффициент не дает.
Коэффициент детерминации. Линейный коэффициент корреляции оценивает тесноту взаимосвязи между признаками и показывает, является ли связь прямой или обратной. Но понятие тесноты взаимосвязи часто может быть недостаточным при содержательном анализе взаимосвязей. В частности, коэффициент корреляции не показывает степень воздействия факторного признака на результативный. Таким показателем является коэффициент детерминации (обозначим его D), для случая линейной связи представляющий собой квадрат парного линейного коэффициента корреляции (D=r2) или квадрат множественного коэффициента корреляции. Его значение определяет долю (в процентах) изменений, обусловленных влиянием факторного признака, в общей изменчивости результативного признака.
Когда изучаемая совокупность (в виде корреляционной таблицы) разбивается на группы по одному (факторному) признаку х, то для каждой из этих групп можно вычислить соответствующие групповые средние результативного признака  . Изменение групповых средних от группы к группе свидетельствует о наличии связи результативного признака с факторным, а примерное равенство групповых средних-об отсутствии связи. Следовательно, чем большую роль в общем изменении результативного признака  играет изменение групповых средних (за счет влияния факторного признака), тем сильнее влияние этого признака. Величина  (вариация признака у) складывается из изменения групповых средних, обусловленного влиянием факторного признака, т. е. из межгрупповой или факторной вариации (S2факт) и из вариации признака внутри групп, обусловленной другими причинами, - внутригрупповой или остаточной (S2ост). Поэтому отношение

является мерой степени влияния факторного признака на результативный. Значение квадратного корня из этого отношения измеряет «направленную связь» (x→y) в общем виде и носит название корреляционного отношения (ηy/x).
Корреляционное отношение вычисляется по формуле

Величины Sфакт2 и Sy2 вычисляются по формулам:

где  - среднее значение у в i-й группе;  - общее среднее; ni - объем i-й группы; k - количество групп; n - объем совокупности  .
Корреляционное отношение в отличие от линейного коэффициента корреляции не указывает, является ли связь прямой или обратной. Однако нередко уже по виду исходной таблицы можно решить этот вопрос. Промежуточные расчеты также помогают определить, является связь прямой или обратной: если с ростом факторного группировочного признака растут групповые средние результативного признака, то связь-прямая, если же с увеличением факторного признака значения групповых средних уменьшаются, то связь-обратная.
Как показатель тесноты связи корреляционное отношение имеет более универсальный характер, чем линейный коэффициент корреляции, поскольку его использование не ограничивается случаями линейной связи, а факторный признак может быть не количественным, а ранговым и даже номинальным.
Квадрат корреляционного отношения, выраженный в процентах, и коэффициент детерминации, как он определен выше, имеют одинаковый смысл, только при расчете коэффициента детерминации используется предположение о линейной связи между факторным и результативным признаками, тогда как при вычислении корреляционного отношения вопрос о форме связи не ставится.
Возвращаясь к примеру 8, оценим полученные в нем результаты. Корреляционное отношение, выражающее степень тесноты связи, оказалось равным 0,31, а квадрат корреляционного отношения в процентах (коэффициент детерминации) -9,9%.
Таким образом, возраст ухода в отставку зависит от имущественного положения, но в целом в небольшой степени: колебания имущественного положения только на 9,9% объясняют колебания возраста ухода в отставку. Причем, поскольку с увеличением количества крестьян у владельцев средний возраст ухода в отставку уменьшается, то связь между этими признаками - обратная.
Линейный коэффициент корреляции является показателем взаимной связи между признаками, но не указывает, какой из них результативный, а какой - факторный. В этом отношении от него выгодно отличается корреляционное отношение, которое позволяет выявить это соотношение. Для этого вычисляются два корреляционных отношения, сравнение которых и помогает определить правильное распределение «ролей» между признаками.
Коэффициент корреляции и корреляционное отношение являются эффективным средством выявления связи между различными количественными признаками и определения ее тесноты. Коэффициент детерминации дает представление и о степени воздействия одних факторов на другие. Однако решение вопроса о тесноте связи нередко упирается в вопрос о форме связи. Кроме того, знание формы связи дает развернутое представление о влиянии различных факторов на результативный признак, а также возможность прогнозирования изменений результата при тех или иных комбинациях значений факторов.
Выявление формы связи осуществляется с помощью методов регрессионного анализа.

Заключение

Понятие степени тесноты связи между двумя признаками возникает вследствие того, что в реальной действительности на изменение результативного признака влияют несколько факторов. При этом влияние одного из факторов может выражаться более заметно и четко, чем влияние других факторов. С изменением условий в качестве главного, решающего фактора может выступать другой.
Важнейшей предпосылкой использования корреляционного анализа является нормальность распределения признаков в генеральной совокупности. Нормальность распределения или, по крайней мере, близость распределения к нормальному необходима для корректного проведения проверки значимости связи и вычисления доверительных интервалов. С помощью парного линейного коэффициента корреляции измеряется теснота связи между двумя признаками.
Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Равенство коэффициента нулю свидетельствует об отсутствии линейной связи. Равенство коэффициента -1 или +1 показывает наличие функциональной связи. Знак «+» указывает на связь прямую (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «-» - на связь обратную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака).

Список литературы

1. Григорьева, Р.П. Статистика / Р.П. Григорьева. – М.: Изд-во Михайлова, 2009. – 510с.
2. Гусынин, А.Б. Статистика / А.Б. Гусынин. – М.: Норма, 2010. – 452с.
3. Елисеева И.И. Общая теория статистики / И.И. Елисеева, М.М. Юзбашев. – М.: Финансы и статистика, 2004. – 338с.
4. Золотарев, А.А.Статистика / А.А. Золотарев. – М.: Владос, 2009. – 446с.
5. Калинин, В.А. Макроэкономическая статистика / В.А. Калинин. – М.: Дело, 2010. – 602с.
6. Сиденко, А.В. Статистика / А.В. Сиденко. – М.: Финансы и статистика, 2009. – 500с.
7. Статистика. Курс лекций. / Под ред. Л.П. Харченко, В.Г. Ионин и др. Новосибирск, НГАЭиУ, 2007. – 384с.
8. Теория статистики / Под ред. Р.А.Шмойловой. – М.: Финансы и статистика, 2007. – 580с.

(43.2 KiB, 54 downloads)

© Размещение материала на других электронных ресурсах только в сопровождении активной ссылки

Вы можете заказать оригинальную авторскую работу на эту и любую другую тему.

Контрольные работы в Магнитогорске, контрольную работу купить, курсовые работы по праву, купить курсовую работу по праву, курсовые работы в РАНХиГС, курсовые работы по праву в РАНХиГС, дипломные работы по праву в Магнитогорске, дипломы по праву в МИЭП, дипломы и курсовые работы в ВГУ, контрольные работы в СГА, магистерские диссертации по праву в Челгу.

Здесь вы можете написать комментарий

* Обязательные для заполнения поля
Все отзывы проходят модерацию.
Навигация
Связаться с нами
Наши контакты

vadimmax1976@mail.ru

8-908-07-32-118

О сайте

Magref.ru - один из немногих образовательных сайтов рунета, поставивший перед собой цель не только продавать, но делиться информацией. Мы готовы к активному сотрудничеству!