http://vetterok.livejournal.com/ ([identity profile] vetterok.livejournal.com) wrote in [community profile] useless_faq2007-09-27 10:39 am

(no subject)

Почему при расчете среднего для популяции количество степеней свободы равно N, а для выборки N-1 (именно один, а не 2 или полотора и тп), а ?

[identity profile] berillii.livejournal.com 2007-09-27 03:15 pm (UTC)(link)
Как хорошо, что у меня из негуманитарных учебных дисциплин только КСЕ и высшая математика раз в месяц.

[identity profile] sentiment-ru.livejournal.com 2007-09-27 03:22 pm (UTC)(link)
для оценки дисперсии или сркв отклонения генеральной совокупности берут n-1 так как учитывают, что в выборку в силу ее малости случайно не вошли большие величины и иначе оценка дисперсии ген совокупности будет чуть занижена

[identity profile] aafin.livejournal.com 2007-09-27 03:22 pm (UTC)(link)
Низачет ;(~

Вы имеете в виду - при расчёте дисперсии?

[identity profile] sanitareugen.livejournal.com 2007-09-27 04:02 pm (UTC)(link)
Среднее всегда получается делением суммы на N.
А вот в формуле для дисперсии такое используется, чтобы получить несмещённую оценку.
Полученная по выборке оценка является случайной величиной, имеющей матожидание, дисперсию и т.п. Одним из естественных требований к оценке является то, что её матожидание должно равняться истинному значению (это не единственный, и даже не всегда оправданный критерий, но во многих случаях он осмыслен). Это и называется "несмещённость".
Появляется такой эффект оттого, что при расчёте дисперсии мы вычисляем сумму квадратов отклонений от матожидания, а если матожидание у нас неизвестно, то в качестве его оценки берётся среднее.
Найдём эту сумму (здесь x_=(x1+x2+...+xN)/N - среднее)
Отдельное её слагаемое есть (xi-x_)2 и, расписывая его, видим, что под квадратом в него входит xi с весом (1-1/N), поскольку xi входило в среднее, и все прочие слагаемые среднего с весом 1/N. Возводя в квадрат, приводя подобные и суммируя, получаем, что сумма квадратов равна (N-1)S, где S - матожидание квадрата отклонения от среднего. Т.е. для получения несмещённой оценки надо делить не на N, хотя у нас и N слагаемых, а на (N-1).
Пояснить это можно тем, что среднее как бы "сползает" от истинного матожидания в сторону значений нашей выборки, тем самым уменьшая отклонения по сравнению с отклонениями от матожидания, и компенсируем это уменьшение в числителе уменьшением знаменателя формулы оценки дисперсии.
Если же нам доступно истинное значение матожидания, мы такой поправки не производим, и делим на N.