Москва

Более 2,2 тыс дорожных ям заделали в трех округах Подмосковья за неделю

Январь 2010 Февраль 2010 Март 2010 Апрель 2010 Май 2010
Июнь 2010
Июль 2010 Август 2010 Сентябрь 2010
Октябрь 2010
Ноябрь 2010 Декабрь 2010 Январь 2011 Февраль 2011 Март 2011 Апрель 2011 Май 2011 Июнь 2011 Июль 2011 Август 2011 Сентябрь 2011 Октябрь 2011 Ноябрь 2011 Декабрь 2011 Январь 2012 Февраль 2012 Март 2012 Апрель 2012 Май 2012 Июнь 2012 Июль 2012 Август 2012 Сентябрь 2012 Октябрь 2012 Ноябрь 2012 Декабрь 2012 Январь 2013 Февраль 2013 Март 2013 Апрель 2013 Май 2013 Июнь 2013 Июль 2013 Август 2013 Сентябрь 2013 Октябрь 2013 Ноябрь 2013 Декабрь 2013 Январь 2014 Февраль 2014 Март 2014 Апрель 2014 Май 2014 Июнь 2014 Июль 2014 Август 2014 Сентябрь 2014 Октябрь 2014 Ноябрь 2014 Декабрь 2014 Январь 2015 Февраль 2015 Март 2015 Апрель 2015 Май 2015 Июнь 2015 Июль 2015 Август 2015 Сентябрь 2015 Октябрь 2015 Ноябрь 2015 Декабрь 2015 Январь 2016 Февраль 2016 Март 2016 Апрель 2016 Май 2016 Июнь 2016 Июль 2016 Август 2016 Сентябрь 2016 Октябрь 2016 Ноябрь 2016 Декабрь 2016 Январь 2017 Февраль 2017 Март 2017 Апрель 2017
Май 2017
Июнь 2017
Июль 2017
Август 2017 Сентябрь 2017 Октябрь 2017 Ноябрь 2017 Декабрь 2017 Январь 2018 Февраль 2018 Март 2018 Апрель 2018 Май 2018 Июнь 2018 Июль 2018 Август 2018 Сентябрь 2018 Октябрь 2018 Ноябрь 2018 Декабрь 2018 Январь 2019 Февраль 2019 Март 2019 Апрель 2019 Май 2019 Июнь 2019 Июль 2019 Август 2019 Сентябрь 2019 Октябрь 2019 Ноябрь 2019 Декабрь 2019 Январь 2020 Февраль 2020 Март 2020 Апрель 2020 Май 2020 Июнь 2020 Июль 2020 Август 2020 Сентябрь 2020 Октябрь 2020 Ноябрь 2020 Декабрь 2020 Январь 2021 Февраль 2021 Март 2021 Апрель 2021 Май 2021 Июнь 2021 Июль 2021 Август 2021 Сентябрь 2021 Октябрь 2021 Ноябрь 2021 Декабрь 2021 Январь 2022 Февраль 2022 Март 2022 Апрель 2022 Май 2022 Июнь 2022 Июль 2022 Август 2022 Сентябрь 2022 Октябрь 2022 Ноябрь 2022 Декабрь 2022 Январь 2023 Февраль 2023 Март 2023 Апрель 2023 Май 2023 Июнь 2023 Июль 2023 Август 2023 Сентябрь 2023 Октябрь 2023 Ноябрь 2023 Декабрь 2023 Январь 2024 Февраль 2024 Март 2024 Апрель 2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
21
22
23
24
25
26
27
28
29
30
Новости 24 часа |

Лукавые девятки: аналитик показал, как фальсифицируются данные о пандемии

Лукавые девятки: аналитик показал, как фальсифицируются данные о пандемии

Серые дилеры привезли кроссовер Kia Sportage в Россию

Ляжгинский водопад

Как поучаствовать в продаже иностранных ценных бумаг по указу №844

Сотрудники Росгвардии приняли участие в чемпионате Центрального округа по боксу.

О том, что официальная ковид-статистика в нашей стране мягко говоря выглядит странно, заметили все, и время от времени в социальных сетях и СМИ появлялись доказательства тех или иных данных. А вот директор по исследованиям компании Data Insight Борис Овчинников, внимательно следящий за российской статистикой пандемии, пошел еще дальше. Он подметил одну крайне интересную тенденцию: за последние 25 дней официальное число новых выявленных носителей коронавируса в России заканчивалось на 99: 7099 – 30 апреля, 10699 – 8 мая, 10899 – 12 мая, 8599 – 24 мая. Согласно его строгим подсчетам вероятность того, что эти данные отражают естественное положение дел, ничтожно мала: «Это в 16 раз выше математического ожидания (которое тут считается просто – 99 на конце в среднем должно выпадать один раз из 100). Насколько вероятно подобное случайное совпадение? Если кратко – оно не исключено (это все же не володинские 62,2% в Саратовской области), но крайне маловероятно (а если подробно – то ниже много цифр и рассуждений). Намного более правдоподобное объяснение - особенно если вспомнить еще и известные нам факты про странности официальной статистики на региональном уровне – что на фальсификации коронавирусной статистики в регионах накладывается еще и фальсификация на федеральном уровне, когда вместо положенного простого суммирования присланных из регионов цифр (настоящих из одних регионов, рисованных из других) придумывается число, которое будет выдано гражданам за «итого» по России, ну а дальше статистика по регионам подгоняется под это рисованное федеральное число. Немножко теоретических предпосылок. Если исходить из официальной версии, то озвучиваемое Оперативным штабом каждое утро количество новых выявленных больных в целом по России является суммой 85 независимых друг от друга величин – количества больных, выявленных в каждом регионе. При сложении 85 независимых величин (большинство из которых равно нескольким или даже многим десяткам) теоретическая вероятность получить число с 99 на конце такая же, как с 00 или 01 или любой другой парой цифр. Теперь к конкретным расчетам. Вероятность случайного совпадения легко считается через биномиальное распределение. Получается 0,011% или 1 случай на 9350 попыток. Но это вероятность выпадения 4 раза из 25 для одного конкретного числа (в данном случае для 99). Вероятность, что при 25 попытках любое число от 0 до 99 выпадет более 3 раз, составляет уже (примерно) 1,1%. Вероятность выпадения 4 раза какого-то «красивого» числа (а 99 – явно «красивое», нерядовое число) меньше – но точная оценка зависит от того, какие именно числа мы договоримся считать «красивыми». При этом надо признать, что эти оценки посчитаны для вероятности совпадения в пределах волюнтаристски выбранного мною периода (30.04-24.05), притом выбранного так, чтобы минимизировать оценку вероятности случайного совпадения. Честнее будет посчитать за независимо выбранный период. В качестве границы такого периода логичнее всего выбрать 20 апреля – тогда впервые за долгое время (с 4 апреля) количество новых случаев было меньше, чем в предыдущие 2 дня, и фактически именно с 20 апреля началась первая «полка», когда до конца месяца, до 29.04 включительно, по официальным цифрам шел линейный, а не экспоненциальный рост. Более того, общее впечатление от региональной статистики также показывает на границу второй и третьей декад апреля, как переломный момент, начиная с которого достоверность и адекватность статистики начинает быстро сокращаться. Так вот, если взять период с 20 апреля по сегодня, 25 мая (35 дней), то вероятность повторения числа «99» 4 раза из 35 составляет 0,041%. Вероятность выпадения любого двухзначного числа 4 раза из 35 – примерно в 100 раз больше, 4,0%.Снимаем подозрения? Нет, преждевременно. Кроме «99», еще только 4 двухзначных числа выпадали начиная с 20 апреля более 1 раза. И одно из этих четырех чисел – соседнее с «99», «98». То есть в 6 случаях из 35 (на самом деле даже из 28, если считать не с 20.04, а с первого появления сочетания «98» в ежедневных сводках) количество выявленных за сутки больных заканчивалось на одно из двух максимальных двухзначных чисел – или на 98, или на 99. Для сравнения – из других возможных пар соседних чисел только одна, 33 и 34, встречалась трижды (в 2 раза реже), а остальные – и вовсе от 0 до 2 раз. 6 раз «98» или «99» из 35 при теоретической частоте 2% - это уже вероятность 0,0063% (или 1 случай на 15850). Вероятность, что любая пара соседних чисел выпадет 6 раз из 35 – 0,6%. Вполне корректно (ок, на мой субъективный взгляд) мы выявили в официальных данных событие, вероятность появления которого случайно (т.е. при простом суммировании цифр из регионов без правки результата) – доли процента (0,6%). И это оценка даже без учета того, что 98 и 99 – не самые обычные числа. К этому еще стоит добавить, что за последние 35 дней ни разу количество новых выявленных больных не заканчивалось на пятерку (вероятность такого случайного невезения – 2,5%) и только один раз заканчивалось на ноль, притом сразу на два нуля (9200 16 мая). Вероятность, что за 35 дней только 1 раз выпадет число, кратное 5, - всего 0,4% (если анализировать только кейсы «вдали» от пика на 98 и 99, т.е. в диапазоне последних двух цифр от 10 до 90, то там получается 0 чисел, кратных 5, при 25 «попытках», и вероятность случайного появления такой аномалии опять-таки около 0,4%). Зато 13 раз (+6 к матожиданию) выпадали или четверки, или девятки; вероятность такой частоты отклонения от числа, кратного 5, на единицу в меньшую сторону - 1,4%. Если брать последнюю цифру (количества выявленных больных за сутки) не в десятичной, а в пятеричной системе исчисления, то вероятность такого разброса, как в данных за последние 35 дней (одна любая цифра встречается только 1 раз или реже, а другая любая цифра встречается 13 раз или чаще), составит менее 0,45%. Вероятность, что в одном наборе из 35 двухзначных чисел (который по логике должен быть распределен примерно равномерно) у нас одновременно случайно получится и пара соседних чисел с 8 попаданиями, и – для остальной части распределения - нулевая частота чисел, кратных 5, составляет 0,6% * 0,4% = 0,0024%. Или 1 случай на 42 тысячи. Если же считать, что пик частотности не случайно пришелся на два наибольших двухзначных числа (98 и 99), то оценка вероятности снижается еще в 100 раз. Тут правда надо отметить, что это расчет для конкретной комбинации странностей – а таких комбинаций, предположительно указывающих на рисование цифр, можно придумать большей одной. Но больше одной, а не тысячи Итого, у нас есть две версии: а) или это просто случайность, что в последние 5 недель (т.е. в период существенного улучшения динамики эпидемии по официальной статистике) очень часто сумма количества выявленных больных по 85 регионам дает число, заканчивающееся на 99 или 98, и при этом почти никогда не встречаются числа, кратные 10 или 5. Вероятность каждой из этих аномалий по отдельности– единицы процентов или даже десятые доли процента. Вероятность их одновременного проявления – еще меньше; б) или число выявленных за сутки больных, которое потом озвучивается гражданам, не считается через суммирование данных из регионов, а определяется сверху – в формате указания типа «покажите прирост около 8600». Дальше перед публикацией эта цифра «дезокругляется» - часто просто вычитанием единицы или двойки, что, кстати, требует дальше корректировки цифр по регионам или даже их рисования с нуля (возможно, что маскировка круглости федеральных цифр делается уже на финальном этапе, когда спущенная сверху еще круглая федеральная сумма расписана по регионам, и тогда понятно обилие 99 и 98: поменять на конце федерального числа два нолика на 99 или 98 сильно проще, чем скажем на 73 или любое другое число – меньше надо корректировать уже утвержденные цифры по регионам). Круглое число 9200 16 мая в эту логику тоже укладывается – могли однажды забыть про необходимость маскировки круглых цифр, а могли и так неуклюже попытаться изобразить естественность цифр, мол и круглые цифры должны иногда выпадать. Выбирая между двумя этими версиями, стоит учитывать, что фальсификацию статистики по выявленным больным на региональном уровне и раньше можно было считать доказанной (см. например 12 дней подряд по 96-99 выявленных в Краснодарском крае, совпадение сразу 8 регионов в один день на уровне 97-98 выявленных и т.д.). Оставался вопрос – насколько вероятно, что эти фальсификации случаются только на региональном уровне. Изначально я, кстати, полагал, что эта вероятность больше 50% - но даже если бы мы априорно оценили эту вероятность скажем в 90% (и оставили только 10% на то, что рисуют и на федеральном уровне), то после каре на 99 старина Байес нам все равно подмигнул бы: «это почти наверняка не случайность, а признак фальсификации, и фальсифицируют в том числе на федеральном уровне». Из двух вышеприведенных версий намного более правдоподобной выглядит вторая – обилие 98 и 99 в результатах вызваны попыткой замаскировать подозрительную «круглость» цифр, спущенных сверху. Какие из всего этого выводы? Похоже, что фальсификация статистики по количеству выявленных больных – это не отдельные локальные инициативы, а единая многоуровневая система, где первична придуманная общероссийская цифра, а региональные цифры уже подгоняются под нее Официальные цифры по количеству заболевших можно выбросить в мусорное ведро – нет никаких оснований считать, что они адекватно показывают динамику эпидемии. Может быть, показывают, может быть нет – неизвестно. Качество рисованных цифр невозможно и абсурдно оценивать (upd) Выявление фальсификации на федеральном уровне резко снижает для любого региона вероятность того, что по нему цифры условно честные. Цифры, например, по Москве и Новосибирску можно было рассматривать без связки с рисованием в Краснодаре - но можно ли их рассматривать без связки с рисованием федеральных цифр? Имхо нет Даже если с понедельника пойдут какие-то внешне адекватные цифры, это уже ничего не изменит – у нас (у общества) не будет оснований верить, что это они начали честно считать, а не догадались лучше маскировать свое рисование Конечно, нужны отставки и нужен независимый аудит, но я честно говоря плохо себе представляю масштаб и алгоритм действий, необходимых для восстановления доверия к официальной статистике. *** Добавлю несколько лирических деталей: Полтора месяца назад я был среди тех, кто считал, что в подсчет статистики по коронавирусу вовлечено слишком много людей на всех уровнях, чтобы ее можно было бы рисовать с потолка; 3 недели назад я был уверен, что рисуют только в отдельных регионах; и даже когда 17 мая сразу 8 регионов выдали похожие цифры 97 или 98, я это списывал на случайное совпадение мышления при рисовании цифр, а не на централизацию фальсификаций. К чему я это пишу? К тому, что я не был изначально настроен на ловлю явных артефактов рисования цифр в федеральной статистике - их появление противоречило моим ожиданиям, и их анализ и проверка существенно скорректировали мое представление о том, как может быть устроена рисовка коронавирусных цифр; С точки зрения анализа на достоверность и естественность цифр я изначально все или почти все внимание обращал именно на цифры ежедневного прироста количества выявленных больных. Потому что остальные цифры или слишком маленькие (к счастью - но это затрудняет или делает невозможными статтесты), или изначально считаются левой ногой (выздоровевшие), или являются механической суммой ежедневных приростов. И именно в том параметре, который я априорно считал ключевым, обнаружилась аномалия Я еще 8 мая обратил внимание на появление второй раз за короткое время цифры 99 на конце. Понятно, что это могло быть случайным совпадением - но уже тогда меня удивило, что совпало именно на 99. Когда 99 повторились еще раз, я уже даже собрался писать об этом - но формальный расчет вероятности давал совсем неубедительные результаты. Продолжил наблюдение. Когда через 4 дня выдали число с двумя нулями на конце, я вообще расслабился - решил, что авторы цифр спохватились, что 99 многовато и для контраста выдали круглую цифру. И тут неожиданно вчера снова выпало 99. Тут уж пришлось писать [а я мечтал вчера покопаться в поисковой статистике - увы, не получилось...»

Читайте также

Сила Сибири: Baijiahao сообщил о жесткой позиции Путина на переговорах с Си

МВД России предложило внести изменения в Уголовно-процессуальный кодекс РФ

Спорт на работе. Эксперты изучили интерес к корпоративным активностям



Новости России
Ria.city
Москва

Подключение водонагревателя в Московской области

Moscow.media


#123ru.net

В Иркутске встретили Знамя Победы, которое едет через всю страну

Rss.plus
Москва

Расторгуев без жены, Лядова без мужа. Кто, в чем и зачем пришёл на ММКФ?


Игорь Бутман

Бутман: не стоит обращать внимания на выбранную МОК музыку для россиян на ОИ


News Every Day

'Sticking his thumb in the judge's face': Michael Cohen says $1k gag order fines are joke


Москва

Установка стиральной машины в Московской области


Новости тенниса
Елена Рыбакина

Рыбакина о смене гражданства: «Я никому ничего не доказываю. В меня поверил Казахстан, чему я очень рада»


Спорт в России и мире


Новости Крыма на Sevpoisk.ru
Симферополь

В Красногвардейском районе Республики Крым проведен рейд по бывшим мигрантам

Квадратні горщики для квітів та розсади: практичний та зручний вибір

Ветаптека онлайн: відгук про інтернет-магазин vetpreparaty.com


Происшествия, события, анонсы, всё, что случилось сегодня, вчера, на этой неделе и всё, что предстоит увидеть завтра в России, в Украине, в мире — сейчас в новостях на Ru24.pro (прямой эфир, прямые публикации, прямые трансляции, мгновенные авторские публикации, полный календарный архив). Последние новости, статьи, объявления, блоги, комментарии, заметки, интервью, всё, о чём пишут, думают, говорят на русском— в режиме онлайн, здесь. Ru24.pro — всегда первые новости на русском.

Ru24.pro — реальные статьи от реальных источников в прямой трансляции (на русском) 24 часа в сутки с возможностью мгновенной авторской публикации в реальном времени и удобной для чтения форме.



Губернаторы России
Москва

Собянин назначил нового главу Стройкомплекса Москвы

Театр «У Моста» вернулся в Пермь после трехнедельных гастролей

«Динамо» (Москва) одержало победу в третьем матче полуфинала

Александр Бречалов и Игорь Маковский обсудили вопросы развития электросетевого комплекса в Удмуртской Республике

Собянин назначил нового главу Стройкомплекса Москвы


Опубликовать свою новость сейчас можно самостоятельно, локально в любом городе России и Украины, по любой тематике, на любом языке мира с мгновенной публикацией — здесь.


Музыкальные новости
Мир

Парашютный Фестиваль «Небофест 2024» состоится 26 мая в Нижнем Новгороде

Актриса Лужина рассказала правду о романе с Высоцким

В АО "Желдорреммаш" введен единый Стандарт системы неразрушающего контроля на производстве

Баста отметит свой день рождения концертом в Москве

«Он ни разу не наступил мне на ногу!»: Тина Синатра высказалась о планах Мартина Скорсезе снять фильм об ее отце


Загрузка...

Спонсоры Ru24.pro

Москва

В Москве раньше срока проснулись летучие мыши

Псковская область подала заявку на проведение ДЭГ на очередных выборах

Шапки женские на Wildberries — скидки от 398 руб. (на новые оттенки)

«А потом мир погас». Жертва молнии рассказал о боли, которую едва пережил

Как поучаствовать в продаже иностранных ценных бумаг по указу №844