|
Тема
|
за експертите по статистика
|
|
Автор |
noTeHHEgaP (новак) |
Публикувано | 14.08.07 00:27 |
|
някой наясно ли е откъде идва тоя rule of thumb който определя че central limit theorem "важи" за sample size n>30?
примерно ако имаме популация N, и от нея вземем sample n. трябва да построим confidence interval около mean of the sample - грешката е Z*sigma/sqrt(n) където sigma е st dev на целия population. на практика sigma за популацията е неизвестно, така че се замества със "s" - st dev of sample (unbiased estimator). съответно за да можем да кажем че s (st dev of sample) и sigma (st dev of population) са заместими, на много места казват че трябва да имаме sample size n>30. откъде накъде 30 някой има ли представа. за sample size n<30 обикновено се използва Student-t distribution (вместо normal), но тогава пък трябва да знаем че популацията е с гаусова дистрибуция априори, така че в общия случай не важи. ако някой има идея моля да се произнесе
PS. егати и кашата от български и англисйки дето съм замесил в тва изложение но се разбира горе долу мисла
A friend in need is a friend indeed,
a friend with weed is better...
| |
Тема
|
Re: за експертите по статистика
[re: noTeHHEgaP]
|
|
Автор | zaphod (Нерегистриран) |
Публикувано | 14.08.07 08:24 |
|
според мене защото 2/корен(30) е много близо до 1/е
| |
|
Mislia che pri n>30 student t-distribution e mnogo blizko do normalnoto.
| |
Тема
|
Re: за експертите по статистика
[re: zaphod]
|
|
Автор |
noTeHHEgaP (новак) |
Публикувано | 14.08.07 19:55 |
|
ти мое да са будалкаш но при кви точно условия има сходимост s -> sigma за да може да се замести в CLT (s = st dev of sample, sigma = st dev of population). ясно е че n=30 някой го е измъкнал от задника си но как може човек да направи тест с който да демонстрира че за дадения sample size, CLT e добро приближение
A friend in need is a friend indeed,
a friend with weed is better...
| |
|
X = Parent Population; n = size of sample, M = mean of population, Sigma = st dev of population, S = st dev of sample, Y = sample means. А, и като пиша X ~ Normal имам в предвид "the distribution of X is normal".
1. X ~ Normal, Sigma = known => (Y-M)/(Sigma/Sqrt(n)) ~ N(0,1) for all n.
2. X ~ Normal, Sigma = unknown => (Y-M)/(S/Sqrt(n)) ~ Student t for all n. If n is large, then (Y-M)/(S/Sqrt(n)) -> N(0,1) (because Student t is approximately Normal for large sample sizes n).
3. X ~ Unknown, Sigma = known => (Y-M)/(Sigma/Sqrt(n)) -> N(0,1) for large n (Central Limit Theorem)
4. X ~ Unknown, Sigma = unknown => (Y-M)/(S/Sqrt(n)) -> N(0,1) for large n
така, ся ако някой e запознат би ли обяснил по-подробно как от 3 следва 4.
A friend in need is a friend indeed,
a friend with weed is better...
| |
Тема
|
Re: за експертите по статистика
[re: noTeHHEgaP]
|
|
Автор | zaphod (Нерегистриран) |
Публикувано | 15.08.07 10:26 |
|
не се будалкам. значи нали знаеш че по разни разпределения 1/е се слага като гранична зона за мерене на ширината на разпределението. не че виждам пряко връзката, но ми се струва че нещо такова е.
| |
|
|
|
|