Н.Д. Кликунов (klikunov_nd) wrote,
Н.Д. Кликунов
klikunov_nd

Categories:

Нормальное распределение или сколько же народу нужно опросить?

Продолжение записи Неравенство Чебышева или сколько же народу нужно опросить?

Большинство статистиков и математиков, за исключением всяких там Талебов и Вашего покорного слуги, убеждены в валидности так называемой центральной предельной теоремы. Она звучит так:
При влиянии на исход события большого количества независимо действующих факторов вероятность его наступления подчинена нормальному или гауссовскому распределению
Гауссовское распределение - это такой "колокол" который обязательно нужно построить самостоятельно в Excel любому, кто интересуется статистикой.
Нормальное распределение - вещь более детерменированная по сравненю с неравенством Чебышева. Смысл работы с ним состоит в определении вероятности "попадания" в интересующее нас пространство событий, что на практике сводится в определении конкретной площади под этим самым "колоколом" Гаусса.
Так вот, если мы исходит из консервативной оценки, т.е. максимальной дисперсии в биноминальном распределении равной 1/4, погрешности оценки не превышающей 0,05, нормального распределения и различных допусков разброса значений, то алгоритм определения минимального числа опрошенных респондентов будет выглядеть следующим образом:

или
1. Задаем погрешность, она в нашем примере равна 5%
2. Определяем вероятность, которая должна соответствовать при данной погрешности. Погрешность нужно разделить на два так как "колокол" симметричен, а функция обратного нормального распределения считает от минус бесконечности до заданного значения
3. Через функцию НОРМСТОБР получаем значение z количество стандартный отклонений, на которые нужно уйти вправо от ожидаемого среднего значения.
4. Задаем допуск, я его обозначил через L  и определяем минимальную выборку.
Если нас интересует допуск плюс-минус 1%, т.е. диапазон 57-59% с вероятностью 0,95, то для этого мы должны опросить 9604 человека. Стандартная тысячам опрошенных должна интерпретироваться следующим образом:
Если распределение мнений в генеральной совокупности нормально,
если выборка сделана корректно, т.е. случайным образом, то
с вероятностью не менее 95% мы можем дать прогноз, что мнения всех участников генеральной совокупности будут лежать в диапазоне плюс-минус 3% от полученного социологамиб, или там кем еще, значения.

Обоснование логики, лежащей в основе данного алгоритма, на сайте MIT: Lecture 20: Central Limit Theorem
Tags: excel, Статистика
Subscribe

  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments