|
|
| Тема |
Re: Вариация [re: enchoj_enchoj] |
|
| Автор |
noTeHHEgaP (пристрастен) |
|
| Публикувано | 16.04.14 21:23 |
|
|
|
"Тогава, когато разполагаме с данни само за стойностите Хi, какво ни дава право да смятаме, че те са стойности на една случайна променлива, а не на много такива променливи?"
Не е необходимо да приемем, че това са стойности на една случайна променлива. Най-често приемаме, че това сa стойности на i различни променливи, като тези променливи са независими и с идентично разпределение (i.i.d. - independent and identically distributed). Това е необходимо условие за Central Limit Theorem, и тази теорема естествено е в основата на тия статистически теории, които се опитваш да ревизираш.
Първо, условието променливите да са i.i.d. не винаги е толкова абсурдно, колкото май ти се опитваш да го представиш, и много често е напълно приемливо от практическа гледна точка.
Второ, има редица статистически тестове които могат да проверят дали данните, с които работиш, отговарят на условията на CLT: non-parametric tests for independence & autocorrelation, Kolmogorov-Smirnov tests for identical distributions. Не е нужно да "приемем" условията на CLT без проверка.
Трето, дори и след проверката да установим, че едно (или повече) от условията не са изпълнени, съществуват генерализации на CLT: например, CLT с променливи които са идентично разпределени, но не са независими. Или - което изглежда е близко до твоя пример с урните - CLT за променливи, които са независими, но имат различни (не-идентични) разпределения (виж Lindeberg-Feller Central Limit Theorem).
Въпросите, които задаваш, имат смисъл в основата си, но не мисля, че си достатъчно запознат със съществуващата теория по темата - доста хора преди теб са задавали подобни въпроси и са развивали теорията задълбочено в тази насока. Най-вероятно затова ти отговарят от разни списания, че вижданията ти, дори и да са правилната посока, не представляват "научен принос."
| |
| |
|
|
|