Boris Lvin (bbb) wrote,
Boris Lvin
bbb

Categories:

О принципе презумпции скептицизма

Жизнь в информационной среде обрушивает на нас потоки агрегированной статистической информации. Иногда - в цифровой форме, иногда в графической. Мой принцип состоит в том, что если эта информация представляется существенной, то прежде чем ее использовать, необходимо ходя бы в самой минимальной форме понять, кем и откуда берутся агрегируемые данные, какова их природа и как осуществляется агрегирование. Конечно, догрызться до деталей удается редко, хотя бы просто за недостатком времени, но самым минимумом должно быть хотя бы представление о надежности тех людей или той институционализированной цепочки людей, которые стоят за сбором и обработкой соответствующих данных.

Например, недавно в одном фейсбучном разговоре об известном проекте "Doing Business", - известном прежде всего рейтингом стран, - снова пытался в самых коротких словах упомянуть об этих проблемах выбора исходных данных, агрегирования и т.д. (https://www.facebook.com/permalink.php?story_fbid=898700267185239&id=100011358228508).

Конечно, самый устойчивый и любимый пример - это злосчастный агрегат "ВВП". Когда мне начинают рассказывать о том, как темпы роста ВВП выросли на полпроцента в год и т.д., я обычно спрашиваю собеседника, знает ли он, что означают буквы аббревиатуры и что означает каждое слово, скрывающееся за этими буквами. И только разобравшись в этом вовсе нетривиальном вопросе (прежде всего в проблеме амортизации капитальных благ, запрятанной во первой букве аббревиатуры), можно переходить к обсуждению общих принципов расчета агрегата, учета в нем государственных расходов и доходов, внерыночных и внеденежных сделок и т.д., без чего все сравнения оказываются или заведомо тривиальными, или бессодержательными.

Но сейчас попался на глаза прекрасный пример того, как может вводить в заблуждение графическое агрегирование.

В фейсбуке увидел ссылку на очень красивую картинку, где красными точками, как утверждается, показаны населенные пункты с населением больше 1000 человек (https://www.facebook.com/photo.php?fbid=2146052402113344). Картинка настолько интуитивная, настолько яркая, что воспринимается совершенно некритически. Во всяком случае, у меня она спопервоначалу не вызвала никакого отторжения.

Но что-то торкнуло, и решил взглянуть подетальнее. И сразу наткнулся на замечательный анализ картинки, сделанный юзерами Реддита три года назад (https://www.reddit.com/r/MapPorn/comments/3tjl1t/cities_and_towns_in_europe_over_1000_inhabitants). Внимательные люди обратили внимание на чрезмерно ярко выраженную границу между Германией и Данией - и попытались разобраться. В итоге выяснилось, что данные, отраженные на карте, собраны из самых разных источников, методологически никак не согласованных друг с другом, и отражают в первую очередь особенности национального законодательства по административно-территориальному деленю. Во всех странах время от времени проходят реформы муниципального устройства. И как только большие муниципальные единицы дробят на единицы меньших размеров, на такой карте возникнет несколько новых красных точек. А как только пройдет реформа по объединению мелких единиц в крупные - число красных точек сразу же сократится.

В итоге эта же картинка, снова появившаяся на Реддите (https://www.reddit.com/r/MapPorn/comments/9oegvw/population_density_of_europe_and_its_surrounding), была быстро понижена в рейтинге (downvoted) как ненадежная.

То же самое, но короче, объясняется в записи некоего Джона Эллиджа - https://www.citymetric.com/politics/does-map-actually-show-every-european-town-over-1000-residents-2875
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 28 comments