Вопросы к Сергею Шпилькину и его ответы
Вопросы:
Смотрите, что меня смущает. В статистике две оценки. Одна, например, максимальная фальсификация. Вторая минимальная. А у Вас дается одна. Вторая проблема, собственно, связана с гауссовским распределением. А почему оно здесь должно быть гассовским? Например на территориях, привязаннях к УИКам проживает одинаковый процент бюджетников, который голосует за ЕР. В этом случае распределение будет равномерным, т.е. не виде колокола, а в виде прямоугольника. Я бы давал две оценки, одну по колоколу, что делаете Вы, вторую, исходя из гипотезы равномерного распределения. Я глупость сейчас написал?
Ответы:
Смотрите, что меня смущает. В статистике две оценки. Одна, например, максимальная фальсификация. Вторая минимальная. А у Вас дается одна. Вторая проблема, собственно, связана с гауссовским распределением. А почему оно здесь должно быть гассовским? Например на территориях, привязаннях к УИКам проживает одинаковый процент бюджетников, который голосует за ЕР. В этом случае распределение будет равномерным, т.е. не виде колокола, а в виде прямоугольника. Я бы давал две оценки, одну по колоколу, что делаете Вы, вторую, исходя из гипотезы равномерного распределения. Я глупость сейчас написал?
Ответы:
Николай, здравствуйте!
1. Точность оценивается с большим трудом, это правда. Наверное, можно устроить что-то вроде cross-validation с выкидыванием случайной половины точек. Можно однажды поиграть на чем-либо небольшом.
2. Гауссовость нигде не используется, реальный параметр малости что-то вроде ширины распределения по явке в квадрате * наклон зависимости явка-результат лидера
3. Для совокупности одинаковых участков будет биномиальный разброс как минимум; реальный разброс даже в пределах одного города не менее чем в 5 раз шире биномиального, это может быть частично групповое принятие решений, частично неоднородность участков. Но есть пара латиноамериканских стран, где можно увидеть прямо чистый биномиальный эффект.
2. Гауссовость нигде не используется, реальный параметр малости что-то вроде ширины распределения по явке в квадрате * наклон зависимости явка-результат лидера
3. Для совокупности одинаковых участков будет биномиальный разброс как минимум; реальный разброс даже в пределах одного города не менее чем в 5 раз шире биномиального, это может быть частично групповое принятие решений, частично неоднородность участков. Но есть пара латиноамериканских стран, где можно увидеть прямо чистый биномиальный эффект.