Мультифрактальный анализ данных OpenStreetMap в QGis

Бенуа Мандельброт в своей «Геометрии» утверждает, что понятие «фрактал» применимо исключительно к множествам, которые проявляют свойства самоподобия не менее чем на протяжении трех порядков единиц измерения. Манфред Шредер в не менее известной монографии описывает принцип расчета корреляционной размерности, приводя ее к общему виду. Там же он наглядно показывает, как неэвклидовы размерности отражают строение систем в стадии детерминированного хаоса. Аналогичным, но в более популярной форме занимается Хакен, а Федер постулирует чрезвычайно занятную мысль о взаимосвязи самоподобия с теорией перколяции. Однако, несмотря на все это, фракталом называют любой каскад дихотомических ветвлений, а под фрактальным анализом — банальное определение размерности покрытия, забывая даже то, что в оригинальном мануале она идет под названием размерности Хаусдорфа-Безиковича. Еще в одной статье на эту тему нет смысла, но процедура оценки сложности геоданных в QGis настолько проста, что заслуживает краткого упоминания даже среди всеобщей скуки.

Начнем с того, что выберем интересующую область (в моем случае это Москва, район трех вокзалов), которую обводим полигоном. Любой тулзой скачаем OSM данные на этот регион — я использовал плагин OSMDownload, но можно и просто выкачать все через overpass. После того, как данные получены, я рекомендую перевести все в спроецированную систему координат, например в EPSG:2705. Это облегчит дальнейшую работу и позволит вам избежать необходимости перевода градусов в метры для объяснения полученного результата. Я для упрощения работы использовал только точечные данные, но нет препятствий к применению этого метода для линий или даже полигонов.

После этого стандартными средствами (Вектор-выборка-регулярная сетка) строим сетки из квадратов с разной длиной стороны. Чем больше сеток и сильнее разброс площадей у их ячеек тем интереснее результат, но на практике обычно получается не более 20, а если удваивать сторону квадрата для каждой новой сетки, то и того меньше. Можно объединить все сетки в один шейп, это ускорит работу по подсчету заполненных ячеек, но замедлит расчет размерности, так что особого смысла нет. Сам подсчет ведется путем пространственной выборки полигонов сетки по принципу пересечения с точкой OSM:

Я использовал 22 сетки со сторонами квадратов 5, 10, 13, 20, 21, 34, 40, 55, 80, 89, 100, 144, 160, 200, 233, 300, 320, 377, 400, 500, 610 и 640 метров. Не стоит удивляться размерам — эту работу я проводил в рамках изучения встречаемости последовательности Фиббоначчи в геоданных и связи этой последовательности с размерностью покрытия данных. В результате были получены следующие данные:

Сторона
квадрата, м
Полное количество квадратовКоличество заполненых
квадратов
Достоверность аппроксимации
(R2)
Размерность
Хаусдорфа-Безиковича
524100143221,000,00
106050139631,000,13
133557437550,990,14
201525131150,890,22
211372830410,910,25
34525121510,860,35
40387618300,870,41
55203512900,870,50
809887600,860,62
897826500,880,69
1006515350,890,74
1442942800,890,83
1602472370,900,89
2001761480,900,96
2331171150,911,02
30077690,911,08
32070680,921,12
37748470,921,16
40048400,931,19
50035240,931,24
61020200,931,27
64020190,941,29


График функции количества заполненных клеток от масштаба клетки как и ожидалось, имеет степенной вид (R2функции аппроксимации = 0,94). Расчеты выполнены в экселе с использованием формул для расчета достоверности авппроксимации:

=ИНДЕКС(ЛИНЕЙН(LN($D$2:$D23);LN($B$2:$B23);;1);3;1)

Для расчета размерности Хаусдорфа-Безиковича:

=-1*ИНДЕКС(ЛИНЕЙН(LN($D$2:$D23);LN($B$2:$B23));1)

На основе полученной таблицы построен график мультифрактального спектра, отражающий изменение сложности данных в зависимости от масштаба (сложность точки = 0, сложность прямой = 1, сложность плоскости = 2):
график мультифрактального спектра

Сложность точечных данных OpenStreetMap возрастает по логарифмическому закону. При увеличении охвата, она стремительно возрастает до тех пор, пока сторона охвата не составит примерно 100 м (вероятно это связано с квартальной сетью), после чего скорость усложнения падает. Если продолжить это график, он должен опять пойти на спад, что следует хотя-бы из здравого смысла, но ресурсов моего компьютера для таких расчетов уже не хватит. Динамика наблюдается в северной части Москвы, но полагаю, что тенденция будет сходной для всех крупных городов.

Собственно, это и есть все интересное. Тем более, что этот пост я написал только для того, что-бы формулы расчета размерности всегда под рукой были, а то неудобно постоянно десятки графиков создавать.

К слову об источниках русловой динамики степных рек с малым течением

В наш просвещенный век каждый знает о таком явлении, как меандрирование рек. Чем сильнее изгибается русло, тем выше разность скоростей течения воды у берегов. По внешнему радиусу водный поток движется быстрее, соответственно там быстрее проистекают процессы эрозии еще более изгибая направление русла и повышая разность скоростей водного потока. Это, если хотите, прекрасный пример системы с положительной обратной связью.

Принято считать, что самой наглядной демонстрацией меандр являются космические снимки. Например, как вот этот мапбоксовский снимок реки Аксай:
aksaj

В действительности, ничего не может продемонстрировать суть меандрирования реки лучше, чем сплав по ней в солнечную погоду. Вот солнце слева от вас, а нет уже справа, нет, опять слева, нет сзади, да нет же, справа, хотя постойте, вот прямо по курсу светит… Сплавляясь весной по этой реке, я не мог не обратить свое внимание на особенности русловой динамики и даже имею кое-что сообщить вам по этому поводу.

Гидрологическая наука в лице А. Ю. Сидорчука (статья «Главные формы речных русел: меандры и разветвления«) утверждает, что: «Первоначальный изгиб русла появляется за счет гидродинамической неустойчивости прямолинейного потока». Утверждение настолько тривиальное, что создается ощущение, будто автор пытается уйти от вопроса первопричины образования изгиба водотока. В чем механика процесса зарождения изгиба, господа? Не развития, подчеркиваю, а именно изгиба? Если принять за истину, что в основе всего стоит «гидродинамическая неустойчивость», то следует признать, что такой неустойчивости присуще странное свойство сохранения ассиметричной структуры на время, достаточное, для появления разности скоростей течения, а это согласитесь, едва ли возможно.

Конечно-же, причины зарождения изгиба русла кроются не в самом водном потоке, но в связи водного потока и его русла. Неоднородности русла влияют на неоднородность потока и наоборот — это неразрывное целое. И с этой точки зрения прямолинейное русло есть система, напряженность которой прямо пропорциональна длине русла. В какой-то момент напряженность достигает максимума и линейная динамика сменяется хаотической в лучших традициях теории катастроф Рене Тома. В это сингулярное время, поводом к началу изгиба реки может быть все что угодно.

Но, хватит теории. Сплавляясь по Аксаю, я с интересом отметил, что во многих случаях, причиной появления разности скоростей водного потока у противоположных берегов являются упавшие стволы деревьев:
img_3042

Растущие по берегам деревья (большей частью тополя) падают неизменно в воду, поскольку крона их неравномерно развита и значительно более массивна с открытой стороны, обращенной к воде. Упав, дерево может достаточно долго оставаться прикрепленным корнями к субстрату, при этом замедляя течение и аккумулируя перед собой плывущие ветви и водоросли.
img_3039

Накопленный, благодаря колебаниям уровня воды ил, вкупе с разлагающимся субстратом древесины создает достаточные условия для произрастания трав, а в редких случаях даже кустарников:
img_3044

Но что еще интереснее — на реках с малым течением, коим является и Мертвый Аксай в его верховьях, основной причиной падения деревьев в воду становится не подмывание почвы, хотя таковое тоже имеет место, а банальный ветровал. В связи с этим, наиболее сильная дифференциация скорости водного потока происходит на участках реки с узкими береговыми полосами леса или множеством отдельно стоящих деревьев. Большие лесные массивы вдоль берегов служат достаточным барьером против ветра — плыть по этим участкам почти не составляет труда: топляков и коряг весьма немного. Участки же с редкостойными насаждениями по берегам исключительно труднопроходимы для лодки и порой представляют серьезную опасность для экспедитора.

Это наблюдение веско показывает, что зная инициатор какого-либо естественного процесса и руководствуясь разумным представлением о механике природных явлений мы с успехом можем решать исключительно практические проблемы, к коим несомненно относится и прокладка экспедиционных маршрутов.

С кем не бывает

Дело было так. Стою на остановке в Тосно, никого не трогаю, жду свой пазик в деревню. Вдруг, чувствую в затылке предательски закололи теплые иголки, в глазах потемнело и ноги потеряли силу как прошлогодний агар-агар. Ну все, думаю, пизда пришла. Тут бы не валиться мешком на заплеванный асфальт, сесть на лавку, принять косоносную с достоинством. А вот хрен там. Все лавки бабками заняты, хули что семь утра на дворе. К тому же дико потянуло блевать, а я ввиду врожденной интеллигентности на остановках блевать не привык, поэтому собрав остатки сил утащил свое туловище за угол и повинуясь окончательной страсти перед закрытой дверью «Евросети»изверг из себя в урну следующее:

Модель Лотки-Вольтерра, хоть и является сугубо теоретической, однако в утрированном виде описывает реальные кривые видового разнообразия, что подтверждается авторами, фамилии которых я сейчас, в таком состоянии и не вспомню. Но дело не в этом. Дело в кривых изменения численности популяций этой модели.

Окажись вы на моем месте тогда, наверняка бы все уже поняли, но в то утро божественные пиздюли предназначались мне в одно ебло, а потому придется напомнить о том, что видовое разнообразие и проективное покрытие живого напочвенного покрова связаны между собой примерно как синусоида с косинусоидой (пример грубый но наглядный). Сущность этой взаимосвязи проста: растительное сообщество есть диссипативная структура с присущей ей зависимостью структурных преобразований от интенсивности проходящего через нее потока энергии. Об этом еще в «Полевой геоботанике» писано, нехуй тут рассусоливать. Увеличение потока энергии приводит к повышению сложности системы, и обратно.

Сложность живого напочвенного покрова слагается из двух факторов: видового разнообразия и проективного покрытия. Тут, следовало бы упомянуть о важности видовой изменчивости, особенности проективного покрытия как критерия оценки и хуево проработанных концепциях вида вообще, но не до того поверьте, когда с незрячими глазами блюешь перед урной «Евросети».

Итак, количество видов и проективное покрытие. Первое не имеет верхнего предела, во всяком случае в существующей парадигме. Проективное покрытие, напротив, не может превышать ста процентов, а все возгласы о перекрытиях можно вертеть на ботаническом хую, ибо при желании вместо проективного покрытия можно рассмотреть его божественный аналог — биомассу и тут же убедиться, что рост ее ограничен физическим пространством. Короче, Склифософский: оба фактора влияют на сложность структуры живого напочвенного покрова, но раз уж область значений функции изменения проективного покрытия от объема поступающей энергии ограничена, то за ее правым пределом (за левым как вы понимаете живого напочвенного покрова вообще нет) сложность структуры зависит исключительно от видового разнообразия. Внутри области значений функции изменения проективного покрытия влияние видового разнообразия на сложность структуры незначительно при низком проективном покрытии, однако возрастает, при покрытии высоком. Проективное же покрытие, напротив по мере возрастания вносит все меньший вклад в увеличение сложности. Говоря языком Гете: «средь пышных травостоев примат разнообразья и похуй густота его сложенья, но средь редин пустынных, обилие лишь важно и до пизды нам все разнообразье».

А вот и она, великая секунда откровения: одна из немногих вещей, за которые я люблю жизнь во всех ее проявлениях. Вы только посмотрите как до кровавых мозолей на глазах похожи кривые Лотки-Вольтерра на кривые изменения видового разнообразия и обилия видов в живом напочвенном покрове! Конечно же, похожесть еще ни о чем не говорит, не тычьте художника в мольберт. Однако, в потенции, это новый взгляд на оценку структурных изменений экосистемы, включая ее животный компонент. Судите сами: те же два параметра. Количество хищников ограничено и не может превышать некоторого предела, после которого эти мудаки выжрут все и подохнут от голода.  Количество жертв тоже не может расти бесконечно, однако в рамках системы, с наличием хищника верхней границей их роста можно пренебречь.  Примитивно говоря: может быть очень много мышей и мало лисиц, но очень много лисиц и мало мышей быть не может, ибо жрать нечего.

Сразу же напрашивается сравнение проективного покрытия с хищником. Юморная, конечно, аналогия, но напомните-ка мне, а не Тильман ли развивал гипотезу о снижении видового разнообразия за счет усиления доминантной роли нескольких видов? И в чем кроется наша уверенность в том, что мы не спутали в очередной раз повод и причину происходящих процессов?

Тут-то меня и отпустило.

Метод Бенфорда в оценке достоверности данных

Метод Бенфорда в оценке достоверности данных

Друзья мои! Вы несомненно знаете больше меня о последних мировых новостях и потому разобщены и тревожны. Но сегодня, у вас будет повод отвлечься. В этот день мы все объединены единым горем утраты. Утрачена флешка, на которой я хранил для вас статью о диссипативной динамике живого напочвенного покрова. Вместе с ней пропало содержимое подарочной бутылки коньяка, мой рукописный реферат на тему «Сатанизм-как социальное явление» и весь тираж осеннего номера «Лабораторного Журнала», отпечатанный в объеме двух с половиной экземпляров. Воистину, в этот день можно посыпать голову пеплом, ибо об этот реферат я в свое время исписал четыре ручки и мне он чертовски дорог, как память о студенческих годах.

Дабы загладить боль утраты, я предлагаю вам статью из пропавшего «Лабораторного Журнала» (а где вы ее теперь прочитаете?), описывающую сущность, принципы применимости и алгоритм метода Бенфорда на примере анализа данных о площадях ООПТ России и площадях, охваченных лесными пожарами в 2009-2013 годах. Сам же я отправляюсь в келью, где буду страдать вплоть до открытия магазина.

Итак, речь пойдет об одном из статистических методах фрактального анализа — оценке бенфорд-последовательности данных. Метод довольно грубый, но в то же время чрезвычайно простой и красивый. С его помощью вы сможете проверить истинность данных, подчиненных экспоненциальному распределению.

Свое название бенфорд-последовательность получила в честь Фрэнка Бенфорда Альберта-младшего — американского инженера-электрика, физика и оптика, жившего в штатах в первой половине XX века. Однако, сам «Закон Бенфорда», он же «закон первой цифры» впервые описан за три года до его рождения американским астрономом, математиком и экономистом Саймоном Ньюкомбом. Работая в 1881 году с логарифмическими таблицами в книгах, он обнаружил, что сильнее всего истрепаны страницы на которых содержаться логарифмы чисел, начинающиеся с единицы. На первый взгляд, вероятность оказаться на первом месте в числе одинакова для всех цифр и составляет 1/9. Однако, чем выше по значению было число, состоящее из первой цифры логарифма, тем в большей сохранности находились страницы. Все это наводило на подозрение о неравномерной встречаемости первых цифр в числах.

Спустя пол-века за эту проблему взялся Фрэнк Бенфорд. Он рассчитал вероятности встречаемости цифр на первом месте в числе для различных данных. Бенфорд использовал площади бассейна 335 рек, удельную теплоемкость материалов, население городов, молекулярную массу химических соединений, номера домов и другие данные. Во всех случаях наблюдалась единая закономерность — чисел, начинающихся на единицу было примерно в шесть раз больше, чем чисел, начинающихся на девятку.  Собранная статистика позволила вывести формулу распределения вероятности появления первой цифры в числе:

P(d) = logb(d+1)-logb(d) = logb(1+1/d)

где:
b — основание системы счисления, в нашем случае b = 10;
d — первая цифра в числе;

На основе этой формулы была построена бенфорд-последовательность — последовательность вероятности появления различных цифр на первом месте числа. Рассчитанная по формуле, эта последовательность выглядит следующим образом: 30.1, 17.6, 12.5, 9.7, 7.9, 6.7, 5.8, 5.1, 4.6. Вероятность того, что на первом месте в числе окажется единица составляет 30.1%, двойка — 17,6% и так далее до девятки (4.6%).

Долгое время, эта интересная закономерность не находила никакого применения. Однако после 1997 года на нее обратили внимание и стали все активнее использовать для проверки фальсификации данных, например результатов голосования (в том числе и в России). В 1997 году М. Нигрини и Л. Миттермайер в издании «Аудит: Журнал теории и практики» опубликовали шесть разработанных математических тестов, основанных на законе Бенфорда. Тесты были успешно введены в практику аудиторской компанией «Эрнст и Янг» и позволили выявить несоответствие между реальными и заявленными данными клиентов.

Необходимо учитывать, что метод Бенфорда применим не ко всем данным. Он выдает значительные погрешности при работе с выборками для которых заданы максимальные или минимальные значения, с выборками, охватывающими только один или два порядка величин и с малыми по объему выборками.

При решении вопроса применимости метода Бенфорда обычно рекомендуют исходить из «естественности» данных (если данные получены в ходе естественного течения событий, то к ним применим метод Бенфорда). Этот критерий верен, но довольно сложен для использования. В ходе работ с бенфорд-последовательностями я пришел к выводу, что метод бенфорда работает только с данными, топологическое множество которых самоподобно, а элементы могут принимать произвольные значения.

Для проверки применимости метода необходимо аппроксимировать их показательной функцией (чаще всего используется экспонента) и убедиться, что коэффициент аппроксимации составляет 0,9 и выше. Если при этом отсутствуют правила, детерминантно определяющие значение того или иного числа, то метод бенфорда к вашим данным применим.

Алгоритм применения бенфорд-метода в программах LibreOfficeCalc и MS Excel 

1. Исходные данные

Со страницы сайта oopt.aari.ru, разработанного ФГБУ «ААНИИ» и Лабораторией геоинформационных технологий взят перечень особо охраняемых природных территорий России. Список насчитывает 8013 ООПТ, из которых 4410 войдут в нашу обработку. Это действующие или реорганизованные ООПТ, для которых есть данные по площади.

Данные по площади лесных пожаров взяты с сайта федерального агентства лесного хозяйства. Выборка охватывает данные по всем регионам России с первого квартала 2009 года по второй квартал 2013 года. Всего за этот период было охвачено лесным пожаром 949 территорий различной площади.

2. Проверка на распределение

Нам необходимо убедиться, что данные подчиняются экспоненциальному распределению. Сортируем данные по площади и аппроксимируем их экспонентой.

Lj2-24

На рисунках изображены площади ООПТ (верхний рисунок) и площади пожаров (нижний рисунок), отсортированные по значению. Ось ординат показывает площадь в гектарах.   Чем больше площадь особо охраняемой природной территории, тем меньше таких ООПТ в стране. Равно как и значительные площади подвергаются пожарам гораздо реже небольших участков.  Коэффициент аппроксимации обоих наборов данных экспонентой (синяя линия) составил 0,98.

3. Избавление от нулей

Отличительной особенностью фрактальных множеств, к которым относятся и наши данные является их масштабная инвариантность. Распределение не зависит от единиц в которых выражены величины. Будь наши данные выражены в километрах, миллиметрах или ангстремах, мы всегда будем наблюдать одинаковые закономерности.  Масштабная инвариантность позволяет нам избавиться от значений менее единицы простым умножением на 100 (в каждом конкретном случае может быть различный порядок, в зависимости от наименьшего числа в выборке. В нашем случае таким числом было 0,01). Сделать это необходимо, поскольку формула Бенфорда использует логарифмы, а потому не работает с нулевыми числами.

4. Отделение первой цифры и расчет

Методом LEFT() в LibreOfficeCalc или ЛЕВСИМВ() в Excel отделяем первую цифру из каждого числа. Получившийся столбец с первыми цифрами чисел сортируем и подсчитываем количество единиц, двоек, троек и т.д. до девяток. Вероятность встречи каждой цифры рассчитываем как отношение количества чисел, начинающихся с данной цифры к общему количеству чисел. Например, если в выборке по пожарам было 273 числа, начинающихся на единицу, а общий объем выборки 949, то вероятность того, что первой цифрой в числе будет единица составит 100%*273/949=28,8%.   В итоге у вас получится аналог вот таких таблиц (верхняя таблица — данные по площади ООПТ, нижняя таблица — данные по площади пожаров):

Lj2-25

По ним же, для большей наглядности можно построить соответствующие графики сравнения фактической и расчетной бенфорд-последовательности (вверху для площади ООПТ, внизу для площади лесных пожаров):

Lj2-252

Стобцы на графиках соответствуют фактической бенфорд-последовательности, красная линия соответствует теоретической последовательности, рассчитанной по формуле Бенфорда.

Приведенные графики свидетельствуют, что данные по площадям ООПТ России и данные по площади пожаров за 2009-2013 г. достоверны. Наибольшие ошибки приходятся на крайние значения, что связано со сложностью определения массовых (ошибки по единице) и крупных (ошибки по девятке) объектов в натуре, а также с меньшим объемом статистических данных (ошибки по девятке).

В случае, если бы анализируемые нами выборки были сфальцифицированы рандомным методом, то есть, вместо реальных значений были указаны случайные числа, фактическая и расчетная бенфорд-последовательности различались бы радикально.

P.S. Да, я знаю, что качество приведенных картинок отвратительно. Но поверьте, вы встретились с ними в странный момент их жизни.

Фрактальный анализ систем с детерминированным хаосом в популярном изложении

Фрактальный анализ систем с детерминированным хаосом в популярном изложении

Отрывок доклада: «Почему на даче третий год вместо гаоляна вырастает всякая хрень», прочитанного осенью 2010 года перед современными декадантами в поселке Рощино, где я оказался проехав свою остановку по причине того, что был абсолютно пьян.

«Наука начинается там, где начинают измерять» (Д.И. Менделеев), однако, сам процесс измерения не так прост, как это может показаться на первый взгляд. Для того что-бы измерить, скажем длину, первое что необходимо — это определиться в минимальных бинарных единицах измерения. Бинарных — значит далее не делимых. Каждый из нас рассчитывал такие единицы измерения на школьном уроке физики, когда измерял цену деления прибора.

Едва ли в тот момент мы осознавали, насколько важны вычисленные значения. На первый взгляд, от того, какой инструмент мы выберем для измерения, зависит только точность полученных данных. Чем точнее прибор, чем меньше его цена деления, тем более точный результат мы сможем получить.

Этим же правилом руководствовался английский математик Ричардсон. Проверяя гипотезу зависимости частоты войн от протяженности границ Ричардсон сравнил длину Испано-Португальской и Португальско-Испанской границы. Как ни парадоксально, но граница со стороны Португалии оказалась больше на 240 километров. Тот же эффект наблюдается при сравнении любых других границ разных по площади государств.

Дело в том, что вопреки нашим убеждениям, понятие «абсолютно точное измерение» лишено всякого смысла. Линейные, площадные и объемные величины, а следовательно и все остальные единицы измерения (напомню, тот же вес измеряется в длине отклонения пружины весов, то есть в тех же сантиметрах, которые потом переводятся в килограммы по заранее определенному соотношению) не имеют абсолютно точных значений. Чем точнее прибор тем большую величину он показывает. Длина границы, измеренная сантиметровой линейкой будет больше длины границы, измеренной метровой линейкой. Границы Португалии меньше испанских, измеряли португальцы их более подробно, увеличив этим свою сухопутную границу более чем на две сотни километров.

Более того, в природе нет геометрически правильных объектов. Все что нас окружает есть не набор точек, кривых, плоскостей и объемных тел, а нечто среднее между ними. Звучит непривычно, но строго говоря, трехмерный мир о котором мы знаем с детства есть не более чем выдумка, ничего общего не имеющая с реальностью. Мир не просто многомерен, он бесконечно многомерен. И каждая размерность в абсолютном большинстве случаев является дробным числом и, вдобавок, зависит от того, на каком диапазоне масштабов мы производим вычисления.

Рассматривая подобные объекты в 70-х годах ХХ века, Бенуа Мандельброт предложил понятие «фрактал» и принципы описания и работы с такими объектами. Фрактал есть множество, состоящее из элементов, каждый из которых подобен целому множеству. Основным свойством фрактальных объектов является степенное увеличение их размеров при линейном изменении минимальных единиц измерения.

Фрактальная геометрия помимо инструмента для описания сложности структур позволила численно выражать степень хаотичности системы.

В экологии до сих пор встречаются апологеты детерминизма и индетерминизма. Первые считают, что зная начальное положение всех компонентов системы мы можем спрогнозировать дальнейшую динамику на неопределенно большое время. Вторые убеждают их в хаотичности происходящих в мире явлений и процессов. И тем и другим следует перечитать «Эффект бабочки» Брэдбери — рассказ, ярко иллюстрирующий теорию детерминированного хаоса.

Напомню, главный герой рассказа отправившись в прошлое наступает на бабочку. Последняя не становиться кормом для хищника. Хищник не делает того, что смог бы и судьба всего мира начинает лавинообразно изменяться. В результате главный герой возвращается в совсем другой мир, с другими ценностями и законами.

Динамика природных систем крайне зависит от начальных условий. Так же как в «Эффекте бабочки», незначительное изменения начальных условий приводит к кардинальному расхождению между расчетными и реальными значениями. Вы можете округлить сотый знак после запятой и, тем самым, вместо увеличения числа видов получить его прогнозное исчезновение. Мы не можем делать длительные прогнозы погоды поскольку появление любого циклона может зависеть от того, сколько вздохов вы сделаете читая этот текст.

На верблюда можно нагрузить много соломы. В то же время нет метода оценить, какая же соломинка переломит его спину. Так же мы можем долго воздействовать на экосистему, но нет информации, через какую сломанную ветку проникнет инфекция, которая впоследствии перекинется и уничтожит весь ослабленный лес.

Анализ таких процессов невозможен без использование теории фракталов. Чем больше вид графика зависит от выбранных единиц измерения, тем сильнее динамика зависит от начальных величин, тем ближе «последняя соломинка» и сильнее опасность гибели экосистемы.

Теоретически, возможно разработать метод подмены временных и пространственных осей. Если в одной точке местности у нас болото, а в другой сосняк с лишайниками, то при переходе от одной точки к другой мы будем наблюдать такие же изменения, какие бы происходили с болотом во времени при замене болотных условий произрастания на условия лишайникового сосняка. Фрактальный анализ позволяет определить те единицы измерения условий, в которых можно планировать максимальную нагрузку без риска уничтожения сообществ.

Нельзя оценить количество соломинок, которое выдержит верблюд, но можно разбить все сено на охапки таким образом, что-бы исключить попадание охапки с критичной соломиной на хребет бедного животного. Невозможно разработать предельно-допустимые нормативы, но для каждой последующей партии выбросов есть способ оценить степень риска уничтожения природного сообщества.

Конечно же, это утрированное описание. Говорить о динамике без упоминания фрактальности времени (да, событие измеренное часами длится дольше чем измеренное годами), нечетких вычислений, золотого сечения и определения жизни как явления довольно сложно. Проводя аналогию с Р. Брэдбери можно сказать, что данная работа позволяет связать между собой опасность негативных изменений в будущем с размером сапогов главного героя. Да, как ни парадоксально, но рождение, выбор и смерть каждого из нас зависят от бесконечно ничтожной ерунды. Такой вот забавный природный факт.

Фрактальный анализ сложности горизонтальной структуры напочвенного покрова

Фрактальный анализ сложности горизонтальной структуры напочвенного покрова

Эта статья была написана в 2009 году и уже устарела — появились новые данные, новые результаты. В статье не рассмотрены методы связанные с размерностями высоких порядков, методы поканального анализа растров. Ни слова об алгоритмах сжатия jpeg. Данных — кот наплакал. И вообще, кругом говно. Есть только одна причина, по которой я ее публикую. Постройте аналог таблицы 7 по данным (В.Н. Федорчук и др., 2005) или любым другим. Построили? Ну вот, потому-то и публикую.

Каждый тип растительного сообщества характеризуется своим особым типом обмена вещества и энергии (Полевая геоботаника, 1959). Анализ структуры растительности позволяет оценить этот тип обмена, и как следствие, определить растительное сообщество.

Цель работы — определить факторы, влияющие на сложность горизонтальной структуры напочвенного покрова.

Для достижения цели разработан метод фрактального анализа фотоизображений напочвенного покрова, основанный на понимании напочвенного покрова как диссипативной структуры.

Материалы и методы

В 2008 году в лесопарке «Пискаревка» (Санкт-Петербург) заложено 80 учетных площадок размером 0,25 кв.м. Преобладающий тип леса на обследованной территории – смешанный березняк (6Б4С) черничный. Возраст древостоев 60 лет, отдельные деревья имеют возраст до 150 лет. На каждой учетной площадке сделана фотография лесного полога (вертикально вверх), живого напочвенного покрова (вертикально вниз). Описано общее и повидовое проективное покрытие травяно-кустарничкового и мохово-лишайникового ярусов, мощность и покрытие подстилки, мощность гумусового горизонта.

При анализе данных, описанные виды травяно-кустарничкового яруса делились на 4 эколого-ценотические группы (А.А. Егоров и др., 1997; «Иллюстрированный определитель…», 2000; В. Ю. Нешатаев, А. А. Егоров, 2006):
1. Лесные виды, характерные для ненарушенного леса черничной серии типов (В.Н. Федорчук и др., 2005), такие как Vaccinium vitis-idaea, Vaccinium myrtillus и др.
2. Луговые виды (Trifolium pratenseLathyrus pratensis и др.)
3. Сорные виды (Plantago majorTaraxacum officinale и др.).
4. Опушечные, неморальные, прибрежные и прочие виды, такие как Geum urbanum, а так же светолюбивые лесные злаки (например, Avenella flexuosa).

Для каждой из эколого-ценотических групп рассчитывалась степень доминирования (индекс Симпсона) («Методы…», 2002).

Сложность структуры напочвенного покрова на учетных площадках (0,25 кв. м) определена на основе анализа фотоизображений, полученных в ходе полевых работ. На первом этапе фотографии были обрезаны по контуру учетной площадки и переведены из формата jpeg в формат bmp (256-цветовая палитра) с разрешением 22,97 х 22,97 см (650 х 650 пикселей), что в реальности соответствует площадке размером 50 х 50 см (рис.1).

Рис.1. Обрезка фотографии по контуру учетной площадки и преобразование ее в формат bmp-256 (650х650 пикселей).

Рис.1. Обрезка фотографии по контуру учетной площадки и преобразование ее в формат bmp-256 (650х650 пикселей).

Затем полученное изображение сохранялось в виде негатива формата bmp (черно-белый) (рис.2).

Рис.2. Преобразование негатива фотографии в формат bmp-ч/б (650х650 пикселей).

Рис.2. Преобразование негатива фотографии в формат bmp-ч/б (650х650 пикселей).

При этом травы и кустарнички отображаются в виде закрашенных контуров (злаки отображаются в виде узких полос, толщиной 1-3 пикселя). Мхи отображаются в виде группы крупных точек размером 4-15 пикселей. Неоднородности подстилки (сборки, разрывы) отображаются в виде отдельных точек, размером 1-4 пикселя. Однородные участки подстилки отображаются в виде белого фона.

После этого, полученное изображение было покрыто сетью клеток определенного масштаба и подсчитано количество клеток, в которых граничили между собой черный и белый пиксели (рис.3).

Покрытие1Рис.3. Покрытие изображения клетками различного масштаба. Граничные клетки залиты красным цветом (увеличено, показан левый нижний угол рисунка 2.).

Рис.3. Покрытие изображения клетками различного масштаба. Граничные клетки залиты красным цветом (увеличено, показан левый нижний угол рисунка 2.).

Размер клеток с каждым новым покрытием возрастал. Изображение покрывали 10 раз. Минимальная площадь одной клетки 0,01см2 (418609 клеток), максимальная 0,60 см2 (4186 клеток).

Зависимость между площадью одной клетки и количеством клеток содержащих в себе черный и белый пиксель аппроксимировали степенной функцией.

Размерность Хаусдорфа-Безиковича (фрактальная размерность) рассчитана с использованием полученного уравнения регрессии по формуле:

 D = -N;
где N- показатель степени в уравнении регрессии (y = ax^N).

Обычно для природных систем характерен целый ряд размерностей. Такие системы носят название мультифракталов. Показатель размерности при их изучении зависит не только от сложности анализируемой структуры, но и от параметров клеточного метода (Иванов и др., 2006). Для анализа мультифракталов применяют кривую спектра фрактальных размерностей (Федер, 1991; Шредер, 2001; Божокин, Паршин, 2001; Мандельброт, 2002; Шурганова и др., 2002). Чтобы выразить этот спектр численно, разработана формула отношения области охваченной мультифрактальным спектром к площади, ограниченной топологическими размерностями, между которыми заключены все фрактальные размерности спектра:

Формулагде Z- показатель сложности структуры;
Dt –Топологическая размерность. Равна 0 в нижней границе области фрактальных размерностей (равна 0 в случае Dt* a), равна 1 в верхней границе области фрактальных размерностей (равна 1 в случае Dt* b),
f(x) — функция, наилучшим образом аппроксимирующая фрактальный спектр,
a – Нижняя граница площадей клеток покрытия, см;
b – Верхняя граница площадей клеток покрытия, см;

Показатель сложности структуры (Z), вычисленный таким образом назван интегральной размерностью покрытия. Далее по тексту, она подразумевается под всеми упоминаниями размерности, кроме особо оговоренных случаев.

Результаты и их обсуждение

Характеристика горизонтальной структуры напочвенного покрова

Анализ показал наличие в структуре напочвенного покрова самоподобных (фрактальных) свойств. Сложность структуры определяется сочетанием проективного покрытия, видового разнообразия травяно-кустарничкового яруса и мощности подстилки.

Наиболее простая структура (значение размерности – 0,65-0,7) наблюдается при высокой сомкнутости древостоя (80%) низкой мощности подстилки, малом проективном покрытии. Видовое разнообразие на таких площадках низкое (в среднем 3 вида травяно-кустарничкового яруса на одной учетной площадке). Представлены преимущественно виды лесных местообитаний (Oxalis acetosella, Vaccinium vitis-idaea, Vaccinium myrtillus, Majantemum bifolium).

При снижении сомкнутости древостоя увеличивается видовое разнообразие и проективное покрытие видов травяно-кустарничкового яруса. Снижается степень доминирования лесных видов, за счет усиления роли видов опушечнных, неморальных и прочих местообитаний. Появляются рудеральные виды (Taraxacum officinale). Увеличивается мощность подстилки (более 1 см). Значение интегральной размерности покрытия для структуры напочвенного покрова составляет 0,7-0,8.

В условиях минимальной сомкнутости древостоя проективное покрытие и видовое разнообразие достигают самых больших значений. Мощность подстилки в этих условиях максимальна. В травяно-кустарничковом ярусе из лесных видов сохраняется только седмичник европейский. Появляется Poa pratense – типичный луговой вид. Доминируют виды переходных местообитаний. Структура напочвенного покрова имеет наибольшую сложность. Интегральная размерность покрытия для таких площадок выше 0,9.

Связь сложности горизонтальной структуры с параметрами напочвенного покрова

Сложность горизонтальной структуры напочвенного покрова (выраженная через интегральную размерность покрытия) зависит от трех прямых факторов: проективного покрытия травяно-кустарничкового яруса, видового разнообразия травяно-кустарничкового яруса и мощности подстилки на учетной площадке (Таблица).

Тут должна быть таблица, которую все-равно никто не читает.

Из косвенных факторов, имеющих заметную связь с интегральной размерностью покрытия, выделяется сомкнутость древостоя, количество и степень доминирования лесных видов и видов, не относящихся к конкретным местообитаниям, произрастающих в широком диапазоне условий.

Связь сложности горизонтальной структуры с проективным покрытием травяно-кустарничкового яруса

Связь сложности структуры напочвенного покрова и проективного покрытия травяно-кустарничкового яруса наилучшим образом описывается степенным законом, поскольку общее проективное покрытие имеет верхний предел (100 %).

Изменение проективного покрытия заметно влияет на сложность структуры только на начальных этапах (рис. 4.). При проективном покрытии до 40%, увеличение проективного покрытия ведет к заметному усложнению структуры напочвенного покрова, снижение к упрощению. При проективном покрытии свыше 40 % изменение проективного покрытия незначительно сказывается на сложности структуры напочвенного покрова (рис. 4.).

Рис. 4. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и проективного покрытия травяно-кустарничкового яруса (ТКЯ) при различных значениях проективного покрытия.

Рис. 4. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и проективного покрытия травяно-кустарничкового яруса (ТКЯ) при различных значениях проективного покрытия.

Связь сложности горизонтальной структуры с видовым разнообразием

Связь интегральной размерности покрытия и видового разнообразия, теоретически должна быть линейна, поскольку верхний предел богатства видового разнообразия отсутствует. В действительности, это не совсем так (рис. 5.), поскольку существует положительная корреляция (r2 = 0,41) между количеством видов и проективным покрытием травяно-кустарничкового яруса.

Рис.5. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и видового разнообразия на учетной площадке. Причины низких значений коэффициента аппроксимации раскрыты далее по тексту.

Рис.5. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и видового разнообразия на учетной площадке. Причины низких значений коэффициента аппроксимации раскрыты далее по тексту.

Малому видовому разнообразию соответствует обычно или очень небольшое или наоборот максимальное проективное покрытие. В левой части рис. 5. видно, что площадкам с низким видовым разнообразием не характерны определенные значения фрактальной размерности. Большой разброс данных происходит от того, что в них отражена одновременно информация о площадках с высоким проективным покрытием травяно-кустарничкового яруса (увеличивающим значения интегральной размерност покрытия до 0,9-0,95) и площадках с низким проективным покрытием (значение размерности менее 0,75). Для участков с более высоким видовым разнообразием (правая часть рис. 5.) связь становится более заметной.

Связь между сложностью структуры напочвенного покрова и видовым разнообразием травяно-кустарничкового яруса частично объясняется положительной корреляцией, между количеством видов и проективным покрытием. Однако, лишь 16,8% (коэффициент детерминации) взаимосвязи между проективным покрытием и количеством видов объясняется их взаимовлиянием. Это позволяет сделать вывод о влиянии видового разнообразия на сложность горизонтальной структуры напочвенного покрова.

Сложность структуры напочвенного покрова тесно связана со степенью доминирования основной эколого-ценотической группы. При смене доминирующей эколого-ценотической группы от лесных видов к сорным, сложность структуры повышается, достигает максимума при равном доминировании разных эколого-ценотических групп и в дальнейшем снижается при усилении доминирования новой эколого-ценотической группы. Связано это с дугообразным изменением видового разнообразия при смене доминирующей эколого-ценотической группы (С.Н. Голубев, 2009).

Связь сложности горизонтальной структуры с параметрами мохово-лишайникового яруса и подстилки

Низкая связь обнаружена между интегральной размерностью покрытия и проективным покрытием мохово-лишайникового яруса и покрытием подстилки. Причиной этого является схожесть подстилки и мохово-лишайникового яруса после обработки изображений, что, несомненно, является недостатком используемого метода (данный недостаток можно исправить путем включения в анализ цветовых характеристик растра).

Между покрытием подстилки и сложностью структуры напочвенного покрова существует обратная связь. Между мощностью подстилки, проективным покрытием мохово-лишайникового яруса и сложностью структуры напочвенного покрова связь прямая. Соответственно усложнение структуры напочвенного покрова происходит при увеличении проективного покрытия мохово-лишайникового яруса и мощности подстилки. Увеличение покрытия подстилки ведет к равномерному рассеиванию по растру случайных одиночных пикселей, что снижает величину интегральной размерности покрытия.

Диссипативные свойства структуры напочвенного покрова

Для диссипативной структуры характерно усложнение при увеличении притока энергии (Г. Хакен, 1980). Аналогичное свойство наблюдается и у горизонтальной структуры напочвенного покрова. При увеличении притока энергии (снижении сомкнутости древостоя) интегральная размерность покрытия возрастает (рис. 6).

Рис.6. Возрастание сложности структуры напочвенного покрова при снижении сомкнутости. Данные сгруппированы в десять групп. Корреляция между значениями исходных данных указана в Таблице.

Рис.6. Возрастание сложности структуры напочвенного покрова при снижении сомкнутости. Данные сгруппированы в десять групп. Корреляция между значениями исходных данных указана в Таблице.

Сложность структуры изменяется и при качественных перестройках системы, к каким относятся смена доминирующей эколого-ценотической группы. В случае уменьшения притока энергии (затенения) усложнение структуры напочвенного покрова, как диссипативной структуры невозможно. Следовательно, при затенении изменения в напочвенном покрове не должны усложнять его структуру. Поскольку проективное покрытие лишь при низких значениях существенно влияет на сложность структуры, можно предположить, что, при затенении, изменение напочвенного покрова, в начале будет происходить преимущественно через снижение видового разнообразия, а в конце через снижение проективного покрытия.

В случае увеличения притока энергии (осветления) будет наблюдаться противоположная картина: вначале увеличение проективного покрытия, а затем качественная перестройка системы, в ходе которой основной причиной усложнения структуры растительности будет внедрение новых видов и постоянство или даже снижение проективного покрытия.

Подобная динамика действительно прослеживается на обследованных учетных площадках (рис.7).

Рис. 7. Динамика видового разнообразия и проективного покрытия травяно-кустарничкового яруса (ТКЯ) на учетных площадках, при изменении сомкнутости древостоя.

Рис. 7. Динамика видового разнообразия и проективного покрытия травяно-кустарничкового яруса (ТКЯ) на учетных площадках, при изменении сомкнутости древостоя.

Заключение

Метод фрактального анализа выявляет зависимость сложности структуры напочвенного покрова от трех основных прямых фактора: проективного покрытия, видового разнообразия травяно-кустарничкового яруса и мощности подстилки. Если проективное покрытие имеет низкие значения (до 40%) преимущественно от него зависит сложность структуры напочвенного покрова. Если проективное покрытие имеет значения более 40%, сложность структуры напочвенного покрова определяется другими признаками (например, видовым разнообразием травяно-кустарничкового яруса).

Главным косвенным фактором, влияющим на структуру напочвенного покрова, является степень сомкнутости древостоя.

Напочвенный покров как диссипативная структура усложняется при дополнительном поступлении энергии. При снижении количества поступаемой энергии перестройка напочвенного покрова происходит без усложнения структуры. При этом в начале снижается видовое разнообразие, в конце снижается проективное покрытие. При увеличении количества поступаемой энергии, перестройка структуры напочвенного покрова происходит в обратном порядке. В начале увеличивается проективное покрытие, в конце изменяется видовое разнообразие.

Практическая польза заключается в возможности использования данных о динамике структуры напочвенного покрова при планировании хозяйственной деятельности.

Установление типа напочвенного покрова методом фрактального анализа фотоизображений может быть полностью автоматизировано, что делает весьма ценным его практическое значение. Отличительной особенностью этого метода является выявление не отдельных деталей напочвенного покрова, а установление признаков, присущих данному типу напочвенного покрова в целом, признаков, основанных на энергетическом обмене с окружающей средой. Учитывая новизну метода и возможность совмещать его с другими методами (например, нейросетевые технологии обработки изображений), считаю разработку метода индикации напочвенного покрова путем фрактального анализа фотоизображений важной и перспективной задачей.