Н.Д. Кликунов (klikunov_nd) wrote,
Н.Д. Кликунов
klikunov_nd

Category:

Неравенство Чебышева или сколько же народу нужно опросить?

У нас как-то очень легко относятся к социологическим выборкам. И к проблеме отбора респондентов, и к проблеме их количества.
Взяли опросили тысячу человек и утверждают, что с вероятностью не менее 95% социологи узнали о том, как думают люди.
Если говорить о биноминальном распределении, т.е. об ответах типа "люблю-не люблю", "за-против", "да-нет", когда существует два варианта ответа, то наибольшая дисперсия ответов возникает в ситуации 50 на 50. В этом случае дисперсия становится максимальной и составляет f*(1-f)=0.25. Если исследователь исходит из подобной поляризации ответов, а этот подход называют консервативным, то по неравенству Чебышева, чтобы получить 5% погрешность, а ответы будут лежать в диапазане плюс-минус один процент (т.е. если кандидат по опросам получает 98%, то разброс составлят от 97 до 99%), то нужно опросить 50 тыс. человек
Если это в Excel делать, то вот что получится:Т.

Т.е. строго говоря, опросив 1000 человек мы можем с 5% погрешностью утверждать, что мнение по данному вопросу будет лежать плюс-минус 7 процентов от полученного посредством опроса процентного соотношения.
Это даже, если никаких манипуляций с выборкой не производить, ну там не обзванивать пенсионеров или в центре города прохожих ловить и т.д.

Для тех, кто хочет поглубже копнуть эту тему рекомендую вторую половину Lecture 19: Weak Law of Large Numbers by Prof. Tsitsiklis (MIT)- Здесь
Осторожно, английский с субтитрами:
Tags: excel, Статистика
Subscribe

  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments