ГИС-специалист на минималках

ГИС-специалист на минималках

На днях возник вопрос о минимальных знаниях для начинающего ГИС-специалиста. Не оцифровщика, для такой работы достаточно изучить назначение нескольких кнопок, а именно специалиста.

Начнем с базовых вещей. Необходимо понимание задач маткартографии с умением объяснить термины «система координат», «проекция» и «сфероид». Никто не требует знания формулы Молоденского или размеров большой полуоси, достаточно не бояться аббревиатуры EPSG и знать отличие между 4326 и 3857. Уметь на пальцах объяснить разницу между проекциями Меркатора и Гаусса-Крюгера.

Маткартографии должна сопутствовать общая компьютерная грамотность. Необходимо знать основные типы и форматы данных, отличать векторную графику от растровой, иметь представление о цветовых моделях, композитах и каналах. Знать организацию HTML, принцип работы каскадных таблиц и структуру си-образного кода. Желательно, что-бы человека не охватывал ступор при открытии командной строки.

Понятие «ГИС» можно разделить на четыре больших сегмента: настольные системы, веб-гис, дешифрирование и OSM. Человек должен иметь опыт создания и редактирования данных в QGIS, ArcGIS, в крайнем случае Mapinfo или Аксиоме. GRASS — это круто, но если человек разбирается только в нем и ни в чем больше, велика вероятность, что он психопат. Необходимо понимать роль атрибутивных таблиц, знать назначение калькулятора полей, уметь работать с инструментами геопроцессинга и выборки, уметь привязать растр, свободно импортировать и экспортировать данные и объяснить, в каком случае сохранять файл в геотиффе, а в каком в шейпе или геоджейсоне.

Для начала работы с веб-гис необходимо знать устройство растровых тайлов и отличие TMS от WMS. Собрать хотя-бы несколько проектов на лефлете и OpenLayers, пару часов поиграть с визуальным редактором мапбокса. Отдельным плюсом будет знакомство с тайлмилл и уж тем более с мапником.

С дешифрированием еще проще. Если человек свободно может рассказать про вегетационный индекс, большинство вопросов отпадает. Если он для конкретного примера может посоветовать что выбрать: Модис, Ландсат или Сентинель, да еще и знает, где их достать — совсем хорошо. Если знает различия между ЦММ и ЦМР — просто прекрасно, но годится и простое знание различий между ASTER и SRTM.

Знакомство с OSM можно было бы считать факультативным, если бы не два обстоятельства. Во-первых, до тех пор, пока человек не займется правками, ему на понятие лицензирования данных плевать. Во-вторых, без OpenStreetMap сейчас почти никуда. Королем джосма быть необязательно, но знать принцип тегирования объектов и специфику проекта необходимо.

Если очень постараться, то за месяц можно все освоить. Если старания не прикладывать, то хватит и недели. Все остальное либо наберется в процессе работы, либо вообще к сфере ГИС отношения не имеет (например, статистический анализ).

Самое главное, помнить о том, что работа ГИС-специалиста — историческое недоразумение. ГИС — лишь инструмент. То, что недавно казалось исключительной вотчиной геоинформатиков, сейчас переходит к сенсулятным программистам. А значит изучать все вышеназванное полезно в той же мере, что и знакомиться с бороной-суковаткой: в реальной работе применять странно, но для некоторых видов сексуальных извращений вполне подойдет.

Закон первой маски

Когда покупаешь водку, просят вначале надеть маску а после показать паспорт. Потом удивляются количеству ковидных скептиков. Ладно, зафиксируем мысль о том, что маски нужны и скопления народа опасны. Но вот перед нами кадры демонстраций из Белоруссии. Где ожидаемая вспышка заболеваний? Пусть Лукашенко — злобный диктатор и все скрыл, но тогда почему до сих пор не лежат по койкам протестующие Хабаровска?

Число заболевших растет, но это не мешает задавать вопросы, первый из которых: насколько органичен такой рост? Где число заболеваний отражает естественную динамику развития болезни, а где результат вызван особенностями тестирования и подсчета?

Так совпало, что мне надоело в очередной раз проверять степенные распределения на соответствие закону Бенфорда. Полтора века назад Саймон Ньюком изучая потертости страниц в сборниках логарифмических таблиц обнаружил любопытный феномен, который спустя шестьдесят лет обобщил Френк Бенфорд: В экспоненциальных распределениях каждое третье число начинается с единицы. Точнее, вероятность встретить единицу 30.1, двойку 17.6, тройку 12.5 и далее согласно разработанной Бенфордом формуле.

Этому закону соответствует огромное количество экспоненциальных (и как обобщенный случай — степенных) распределений. Учитывая закон и все ограничения, с помощью распределения Бенфорда можно проверить данные на естественность, поэтому использовать его приходится часто. Для автоматизации процесса я написал небольшую программу, которая проверяет частоту первых цифр из вашего распределения на соответствие распределению Бенфорда и в качестве демонстрации подключил статистику по заболеваемости ковидом в регионах России. Можете проверять любые ваши данные, хоть результаты голосования, хоть статистику по зарплате, хоть общее проективное покрытие oxalis acetosella, как в моем случае.

Ну а что-же ковид? Оказалось, что в распределениях суммарного количества заболевших наибольшие отклонения от распределения Бенфорда наблюдаются в Москве с областью и соседствующими регионами, Северном Кавказе, Татарии и Башкирии, Туве, Чукотке и Камчатке.

Распределения по количеству выздоровевших наиболее соответствуют закону Бенфорда вдоль границы с Казахстаном, юго-востоку (Приморье и Сахалин) и Северо-Западу (Карелия и Мурманская) России.

Распределения по количеству погибших от коронавируса наиболее близки к распределению Бенфорда в юго-западных, западно-уральских регионах, частично на юге Западной Сибири и в Приморье.

У меня есть предположения о причинах таких географических особенностей, но я бы хотел услышать комментарий специалиста. И это не потому, что я диссидент, а ровно напротив: я сторонник самого жестокого карантина: с применением боевого оружия и превращением всех институтов в шарашки.

Каждый день пандемии ждешь прорыва научной мысли, а вместо этого слышишь рекомендации намотать на лицо тряпку и сидеть по домам.

P.S. Спасибо всем, кто откликнулся на призыв о поиске сырых данных по заболеваемости в регионах.

Устаревшие технологии

Некоторые люди не видят смысла смысла изучать устаревшие инструменты и технологии. Возразить им тяжело, поскольку доводы про повышение культурного уровня притянуты за уши. В самом деле, к чему это старье?

Свойства задачи: важность и срочность. Свойства инструмента: стоимость, производительность и риск использования. Риск использования со временем растет, но устареть может только сама задача. Палка-копалка по сей день отличный инструмент, другое дело, что задача обработки земли подручными средствами уже давно возникает лишь в частных случаях.

Кто-то скажет, что римские числа сегодня нужны только для понтов. Однако, в челябинской, архангельской, вологодской и прочих областях, где сохранилось классическое деревянное домостроение, римские цифры применяют до сих пор, поскольку это лучший способ быстро ставить долговременный номер на венце сруба.

Нужно выбирать оптимальный инструмент для решения задачи, но наличие инструмента уже является одним из условий любой задачи, поэтому никакая технология не может устареть по определению. Отсюда, следует вывод о том, что не бывает стоимости решения проблемы, есть стоимость применения инструмента.