Н.Д. Кликунов (klikunov_nd) wrote,
Н.Д. Кликунов
klikunov_nd

Categories:

О роли стандартного отклонения в статистике

Подключите мне приложение "Анализ данных" в Excel и я переверну мир.
А чо загоняем десять-двадцать переменных с двумя-тремя-четырьмя параметрами, проводим "корреляционный анализ", потом строим множественную регрессию. Продвинутые еще решают проблему отбраковки. Не ложится переменная в регрессию, тем хуже для переменной - отбросим ее. Подгоняем жизнь под регрессию, а надо бы наоборот
Прежде чем водить "Мерседес" нужно освоить велосипед. А велосипедом в энтом деле является статистика одной переменной. Прежде чем делать регрессию посмотрите на распределение каждой переменной. Регрессия получится, если переменные распределены нормально, т.е. колоколообразно или более менее в соответствии с функцией Гаусса.
Что нужно сделать. Найдите среднюю, найдите стандартное отклонение от средней или сигму, как ее называют. 
А далее посмотрите насколько идет разборос переменных. Бог с ними с табличными интегралами и функцией Лапласа. Сделайте хотя бы грубую оценку
Если значения попадают в диапазон значений средее плюс или минус три сигмы , то это значит (при нормальном распределении), что с вероятностью 0,997 следующее значение или прогноз окажется верным.
Далее если две сигмы, то вероятность уже 0,954
Если 1,6 сигмы, то вероятность 0,9
Если одна сигма плюс/минус, то вероятность 0,68
Далее, пусть у Вас значения по одной переменной попадают в одну сигму и значения другой тоже попадают в одну сигму. Насколько достоверна будет ваша регрессия, или там корреляция. Правильно 0,68*0,68=0,46. Не больно то высокая предсказательная сила модели получается. А если у вас регрессия от двух переменных и все они попадают в одну сигму, тогда вероятность еще меньше 0,68*0,68*0,68=0,31.
Поэтому, прежде чем садиться за эконометрику, сделайте элементарный статистический анализ одной переменной и только потом пытайтесь искать зависимости, хотя бы между двумя статистическими параметрами. 

Примером является следующее видео, правда на аглицком
Tags: Статистика, Хреньология
Subscribe

  • Дела Романа Старовойта

    Губернатор руководит Курской областью уже два с половиной года, с октября 2018. В марте журналисты воронежского отделения Коммерсанта приезжали брать…

  • Роман Старовойт как блогер

    В это воскресенье Курский Губернатор Роман Статовойт написал сразу три поста в Вконтаке (до этого эпистолярная активность была только 12 марта) В…

  • О Боге, рае, аде и Сведенборге

    Рассматривая роль Бога или божественного провидения в нашей жизни, неизбежно приходишь к логическому противоречию между понятиями…

  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments