Документ взят из кэша поисковой машины. Адрес оригинального документа : http://wasp.phys.msu.ru/forum/lofiversion/index.php?t11810.html
Дата изменения: Unknown
Дата индексирования: Mon Apr 11 15:27:16 2016
Кодировка: Windows-1251
Студенческий форум Физфака МГУ > Как определить - есть ли корреляция между двумя величинами?
Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Как определить - есть ли корреляция между двумя величинами?
Студенческий форум Физфака МГУ > Наука физика > Есть проблема
kirx
Каюсь, раздолбай. 194.gif

Вопрос вот какой:
Есть две величины, нужно узнать, зависимы ли они друг от друга?
Вопрос можно упростить до "есть ли между двумя величинами линейная зависимость"?
В таком случае можно посчитать коэффициент корреляции...
Понятно, что если он близок к 1 - хорошая, корреляция, если близок к 0 - ее нет. Но как от него переидти к утверждению "Корреляция с такой-то вероятностью существует"? В Numerical Recipes про это как-то невнятно написано... mda.gif

Плиз, хэлп!
техник
Цитата
есть ли между двумя величинами линейная зависимость?


Не думаю, что на этот вопрос можно дать внятный ответ. Если коэффициент корреляции близок к 1 - точки почти на одной прямой, зависимость есть. Близок к 0 - точки разбросаны, зависимости нет. А в промежуточных случаях ответ зависит от того, чего Вы хотите... И кстати, чего? Т.е. зачем Вам это?
У нас нет (по крайней мере я не знаю) строгого определения того, что такое "зависимость есть" или "зависимости нет"... 194.gif
А чем Вас не устраивает коэффициент корреляции?
kirx
Есть "облако точек" wink.gif которое с физической точки зрения символизирует зависимость частоты пика в спектре радиоисточника от его красного смещения (т.е. расстояния до него).
Шэф видит, что точки вроде как выстраиваются в зависимость, а я не вижу. Ну шэф и отправил с заданием разобраться и ответить математически строго. smile.gif
Прикол в том, что коэффициент корреляции для этих величин = 0.50, если брать логарифм частоты пика то 0.52. 194.gif А хочется как-то однозначно ответить - "да, есть зависимость" или "нет"...
техник
Цитата
...ответить математически строго.

Боюсь, это невозможно... 194.gif
Но, видимо, у шефа есть какие-то еще (физические) причины считать, что зависимость есть?.. smile.gif
Цитата
ответ зависит от того, чего Вы хотите...

И от физики задачи тоже.
kirx
Кажись вкурил. mr47_06.gif
Если все хорошо (точек много или распределены они по гауссу или некий компромис между похожестью на гаусса и колличеством точек) то если справедлива нуль-гипотеза (что корреляции нет), тогда коэффициент корреляции R будет распределен по гауссу с дисперсией 1/N (N - кол-во точек) и максимумом в 0. Откуда можно посчитать вероятность того, что корреляция есть как
error_function(abs( r )*sqrt(N)/sqrt(2)). Йессс! 15.gif

Но боже мой, сколько ж я думал...

А корреляция там значит правда есть, причем сильная (точек 112, поэтому r=0.5 - величина значимая)!
Victor Orlov
Цитата(kirx @ 25.8.2007, 23:08) *
Каюсь, раздолбай. 194.gif

Вопрос вот какой:
Есть две величины, нужно узнать, зависимы ли они друг от друга?
Вопрос можно упростить до "есть ли между двумя величинами линейная зависимость"?
В таком случае можно посчитать коэффициент корреляции...
Понятно, что если он близок к 1 - хорошая, корреляция, если близок к 0 - ее нет. Но как от него переидти к утверждению "Корреляция с такой-то вероятностью существует"? В Numerical Recipes про это как-то невнятно написано... mda.gif

Плиз, хэлп!


Если Вы хотите получить описание расчетов кореляции и ее достоверности, то самый простой способ - почитать учебники по статистике для биологов. Там есть и формулы и очень простые примеры, и учебников таких много.
Короче, есть конкретные формулы для расчета коэффициента кореляции, нужно только иметь под рукой подходящие учебники.


"Есть "облако точек" которое с физической точки зрения символизирует зависимость частоты пика в спектре радиоисточника от его красного смещения (т.е. расстояния до него).
Шэф видит, что точки вроде как выстраиваются в зависимость, а я не вижу. Ну шэф и отправил с заданием разобраться и ответить математически строго. "

Вообще-то, если точек достаточно много, нужно проверять гипотезу не о наличии кореляции, но о том, что расположенные на графике точки изображают некую кривую, линейную или нелинейную.
Я так понимаю, если идет поиск кривой, то именно ее и нужно искать?

Еще хочу добавить - есть смысл производить анлиз данных не по простым формулам из учебников. но производить дополнительный, углубленный анализ. Например, проверять, есть ли кореляция данных с временем измерения(которая говорит о дрейфе во времени приборов). Таким способом можно уточнить данные и выявить неожиданные источники ошибок.
Developer
Если проблема не разрешилась, могу дать совет:
воспользуйтесь любым математическим пакетом статистического анализа данных, например программой MATSTAT (в поисковике наберите "скачать MatStat" и получите кучу ссылок, например ПРОГРАММЫ). Что делать далее, сообразите самостоятельно.
Если потребуется математическое обоснование выбора корреляционной зависимости, могу привести его из книг Закса Л. "Статистическое оценивание" или из Д. Химмельблау "Анализ процессов статистическими методами". Дайте знать.
Сейчас эти книги найти трудно...
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Русская версия IP.Board © 2001-2016 IPS, Inc.