September 22nd, 2021

Вопросы к Сергею Шпилькину и его ответы

Вопросы:
Смотрите, что меня смущает. В статистике две оценки. Одна, например, максимальная фальсификация. Вторая минимальная. А у Вас дается одна. Вторая проблема, собственно, связана с гауссовским распределением. А почему оно здесь должно быть гассовским? Например на территориях, привязаннях к УИКам проживает одинаковый процент бюджетников, который голосует за ЕР. В этом случае распределение будет равномерным, т.е. не виде колокола, а в виде прямоугольника. Я бы давал две оценки, одну по колоколу, что делаете Вы, вторую, исходя из гипотезы равномерного распределения. Я глупость сейчас написал?

Ответы:
Николай, здравствуйте!
1. Точность оценивается с большим трудом, это правда. Наверное, можно устроить что-то вроде cross-validation с выкидыванием случайной половины точек. Можно однажды поиграть на чем-либо небольшом.
2. Гауссовость нигде не используется, реальный параметр малости что-то вроде ширины распределения по явке в квадрате * наклон зависимости явка-результат лидера
3. Для совокупности одинаковых участков будет биномиальный разброс как минимум; реальный разброс даже в пределах одного города не менее чем в 5 раз шире биномиального, это может быть частично групповое принятие решений, частично неоднородность участков. Но есть пара латиноамериканских стран, где можно увидеть прямо чистый биномиальный эффект.