LINUX.ORG.RU

Связь в объёме выборок. Коэффициент корреляции определяет связь случайных величин. Выборки порядка 10 элементов очень слабо характеризуют случайные величины, потому такие выборки не являются статистически значимыми, применение к ним корреляции глупо и беспощадно, как в данном случае.

Sadler ★★★
()

Судя по удивительным факторам типа потребления конкретного вида сыра, таких факторов в американской статистике учитывается много тысяч. Задача для юных математиков: какова вероятность, что для заданного случайного процесса, распределенного так-то или так-то, среди 10000 других случайных процессов, распределенных аналогично, найдется такой, что коэффициент корреляции превысит 0,7?

amomymous ★★★
()
Ответ на: комментарий от Sadler

Умно и беспощадно

применение к ним корреляции глупо и беспощадно, как в данном случае.

В том вся суть. На практических примерах показывают, что даже если корреляция не есть связь.

Camel ★★★★★
()
Ответ на: комментарий от amomymous

не совсем так, вернее не только в этом дело, путем нехитрых действий можно добиться таки корреляции.

а расчет доверительного интервала простой

вот для униформного (равномерного) распределения

> quantile(replicate(10000, abs(cor(runif(10),runif(10)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
       0.1%          1%        2.5%       97.5%         99%       99.9% 
0.000222844 0.004359165 0.012328025 0.705451871 0.780923348 0.875925547 
> quantile(replicate(10000, abs(cor(runif(20),runif(20)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0003583697 0.0030912105 0.0071372733 0.5124657635 0.5696694805 0.6706139475 
> quantile(replicate(10000, abs(cor(runif(40),runif(40)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0002305952 0.0019722704 0.0051904751 0.3510604859 0.3959126021 0.4898056091 
> quantile(replicate(10000, abs(cor(runif(80),runif(80)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0001128146 0.0014037680 0.0033606817 0.2553804486 0.2935347848 0.3630672287 
> quantile(replicate(10000, abs(cor(runif(160),runif(160)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0001155407 0.0010698378 0.0028514426 0.1769473121 0.1982203957 0.2591366271 

вот для нормального

> quantile(replicate(10000, abs(cor(rnorm(160),rnorm(160)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
7.126369e-05 1.046382e-03 2.519494e-03 1.744682e-01 1.970613e-01 2.513146e-01 
> quantile(replicate(10000, abs(cor(rnorm(80),rnorm(80)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
       0.1%          1%        2.5%       97.5%         99%       99.9% 
0.000163023 0.001237335 0.003400758 0.251145561 0.281187752 0.343897099 
> quantile(replicate(10000, abs(cor(rnorm(40),rnorm(40)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0001619024 0.0017688440 0.0044686763 0.3560561050 0.4022809408 0.4846859203 
> quantile(replicate(10000, abs(cor(rnorm(20),rnorm(20)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
       0.1%          1%        2.5%       97.5%         99%       99.9% 
0.000253103 0.003173217 0.007130947 0.502590458 0.564555156 0.674575442 
> quantile(replicate(10000, abs(cor(rnorm(10),rnorm(10)))), probs= c(0.001, 0.01, 0.025, 0.975, 0.99, 0.999))
        0.1%           1%         2.5%        97.5%          99%        99.9% 
0.0003034625 0.0047771272 0.0125505369 0.6970147719 0.7578671165 0.8510448492 

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.