Яков Сироткин (yakov_sirotkin) wrote,
Яков Сироткин
yakov_sirotkin

Трудности орфографии

Петербургский горизбирком опубликовал составы УИК в электронном виде и я обновил данные в проекте spbuik. Всего в УИК числится 20363 человека, но среди них есть полные тезки с одинаковыми годами рождения, записанные в два УИК сразу, сейчас их осталось 19 из 24. 27 девушек сменили фамилию по сравнению с начальными данными.

В данных горизбиркома есть 6 явных ошибок: Михайлов Игорь АнатольеИВч, Мезенцева Анна ВладМИировна, Зернова Антонина АЛКсеевна, Осипова Елена ВОадимировна, Верещагина Людмила ДмитИриевна, Бычков ДмитИрий Леонидович. Ещё Колесникова Наталья ИгорЬевна могла получить лишний мягкий знак в отчество в паспортном столе.

Также мне встретились следующие потенциальные источники ошибок: буква ё встречается 148 раз, имя Наталья — 843 раза, но и Наталия — 289 раз, отчества Валерьевна и Валерьевич встречаются 324 и 129 раз соответственно, но так же есть Валериевна — 19 раз и Валериевич — 9.

В результате публикации этих данных нашлись 5 новых УИК, которых не было в распознанных ранее сканах документов, был найден состав УИК 1237. По сравнению с начальной версией было внесено множество изменений и исправлений со стороны горизбиркома, исправлены ошибки в распознавании текста. Теперь я буду периодически проверять соответствие данных и поддерживать их в актуальном состоянии.

Update: Геннадьевич/Геннадиевич - 76/4, Геннадьевна/Геннадиевна - 289/14.
Tags: spbuik
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 3 comments