Мультифрактальный анализ данных OpenStreetMap в QGis

Бенуа Мандельброт в своей «Геометрии» утверждает, что понятие «фрактал» применимо исключительно к множествам, которые проявляют свойства самоподобия не менее чем на протяжении трех порядков единиц измерения. Манфред Шредер в не менее известной монографии описывает принцип расчета корреляционной размерности, приводя ее к общему виду. Там же он наглядно показывает, как неэвклидовы размерности отражают строение систем в стадии детерминированного хаоса. Аналогичным, но в более популярной форме занимается Хакен, а Федер постулирует чрезвычайно занятную мысль о взаимосвязи самоподобия с теорией перколяции. Однако, несмотря на все это, фракталом называют любой каскад дихотомических ветвлений, а под фрактальным анализом — банальное определение размерности покрытия, забывая даже то, что в оригинальном мануале она идет под названием размерности Хаусдорфа-Безиковича. Еще в одной статье на эту тему нет смысла, но процедура оценки сложности геоданных в QGis настолько проста, что заслуживает краткого упоминания даже среди всеобщей скуки.

Начнем с того, что выберем интересующую область (в моем случае это Москва, район трех вокзалов), которую обводим полигоном. Любой тулзой скачаем OSM данные на этот регион — я использовал плагин OSMDownload, но можно и просто выкачать все через overpass. После того, как данные получены, я рекомендую перевести все в спроецированную систему координат, например в EPSG:2705. Это облегчит дальнейшую работу и позволит вам избежать необходимости перевода градусов в метры для объяснения полученного результата. Я для упрощения работы использовал только точечные данные, но нет препятствий к применению этого метода для линий или даже полигонов.

После этого стандартными средствами (Вектор-выборка-регулярная сетка) строим сетки из квадратов с разной длиной стороны. Чем больше сеток и сильнее разброс площадей у их ячеек тем интереснее результат, но на практике обычно получается не более 20, а если удваивать сторону квадрата для каждой новой сетки, то и того меньше. Можно объединить все сетки в один шейп, это ускорит работу по подсчету заполненных ячеек, но замедлит расчет размерности, так что особого смысла нет. Сам подсчет ведется путем пространственной выборки полигонов сетки по принципу пересечения с точкой OSM:

Я использовал 22 сетки со сторонами квадратов 5, 10, 13, 20, 21, 34, 40, 55, 80, 89, 100, 144, 160, 200, 233, 300, 320, 377, 400, 500, 610 и 640 метров. Не стоит удивляться размерам — эту работу я проводил в рамках изучения встречаемости последовательности Фиббоначчи в геоданных и связи этой последовательности с размерностью покрытия данных. В результате были получены следующие данные:

Сторона
квадрата, м
Полное количество квадратовКоличество заполненых
квадратов
Достоверность аппроксимации
(R2)
Размерность
Хаусдорфа-Безиковича
524100143221,000,00
106050139631,000,13
133557437550,990,14
201525131150,890,22
211372830410,910,25
34525121510,860,35
40387618300,870,41
55203512900,870,50
809887600,860,62
897826500,880,69
1006515350,890,74
1442942800,890,83
1602472370,900,89
2001761480,900,96
2331171150,911,02
30077690,911,08
32070680,921,12
37748470,921,16
40048400,931,19
50035240,931,24
61020200,931,27
64020190,941,29


График функции количества заполненных клеток от масштаба клетки как и ожидалось, имеет степенной вид (R2функции аппроксимации = 0,94). Расчеты выполнены в экселе с использованием формул для расчета достоверности авппроксимации:

=ИНДЕКС(ЛИНЕЙН(LN($D$2:$D23);LN($B$2:$B23);;1);3;1)

Для расчета размерности Хаусдорфа-Безиковича:

=-1*ИНДЕКС(ЛИНЕЙН(LN($D$2:$D23);LN($B$2:$B23));1)

На основе полученной таблицы построен график мультифрактального спектра, отражающий изменение сложности данных в зависимости от масштаба (сложность точки = 0, сложность прямой = 1, сложность плоскости = 2):
график мультифрактального спектра

Сложность точечных данных OpenStreetMap возрастает по логарифмическому закону. При увеличении охвата, она стремительно возрастает до тех пор, пока сторона охвата не составит примерно 100 м (вероятно это связано с квартальной сетью), после чего скорость усложнения падает. Если продолжить это график, он должен опять пойти на спад, что следует хотя-бы из здравого смысла, но ресурсов моего компьютера для таких расчетов уже не хватит. Динамика наблюдается в северной части Москвы, но полагаю, что тенденция будет сходной для всех крупных городов.

Собственно, это и есть все интересное. Тем более, что этот пост я написал только для того, что-бы формулы расчета размерности всегда под рукой были, а то неудобно постоянно десятки графиков создавать.

Взаимосвязь видового разнообразия и проективного покрытия живого напочвенного покрова в результате диссипативного процесса в лесных сообществах Северо-Запада РФ

Тут он мне говорит: «Вы, молодой человек, необразованная охамевшая свинья. Вас пороть надо хорошенько». А я ему отвечаю: «А не пошли бы вы батенька нахуй?». Это выводит его из себя, заставляя морщинистое тело сотрясаться, извергая ругательства: «Ты что себе позволяешь? Ты как со мной разговариваешь? Ах ты ж недоносок, пьянь подзаборная, ты что, совсем охамел!?». А я опять: «Милостивый государь, не ебите мне мозг и потрудитесь проследовать в указанном направлении. То есть — нахуй».

Да, манерами я, конечно не блистаю, но ведь речь-то не обо мне. А речь сегодня пойдет о весьма любопытной закономерности в динамике видового разнообразия живого напочвенного покрова лесов северо-запада России. Про эту закономерность я собираюсь написать уже второй год (или третий?) и каждый раз судьба ставит меня перед очевидным выбором: покласть на все космический хуй и пить «Дон классику» в гараже с диаволом на пятнашке или корпеть над научными трудами. К счастью, сегодня звезды сошлись в той волшебной точке, когда я могу пить и писать одновременно, а поскольку мне через несколько часов выступать с докладом на конференции, то хули выебываться-то? Вот и решил я рассказать вам пару слов о диссипации.

Вообще, даже в Шахтах — городе весьма удаленном от мировых столиц, едва ли найдется долбоеб, который не знаком с понятием диссипативной системы. Об этом даже моя собака Лишай знала. Да и хрена ли об этом не знать? Это ведь элементарно. Согласно второму закону термодинамики, любая замкнутая система стремится к полному разпиздосу или, как минимум теоретическому сохранению энтропии. Но в мире, обуреваемом страстями, такую замкнутую систему хуй где найдешь. Даже Новая Азовка с Сидоровкой и то, медленно, но меняются к лучшему. А уж про остальные системы и говорить нечего — какую ни возьми — обязательно открыта.

А что же происходит в открытых системах? Ясен хуй — через них проходит вещество и энергия. Но если круговорот вещества достаточно легко зациклить, то энергия пройдя через систему либо запасается в той или иной форме, либо улетает к ебене матери греть другие планеты. При этом поток энергии не только сдерживает энтропию, но даже уменьшает ее, позволяя системе усложняться и приобретать новые, ранее неведомые скиллы.

Вот возьмем, к примеру, макароны. Захотели вы заточить пачку спагетти с болгарским кетчупом и жаренной колбасой. Налили воды в кастрюлю и поставили на плиту. Газ пока не зажигаете. Что происходит? Вода, постепенно перестает бултыхать у застаивается без всякого движения как администрация города в Шахтах. Энтропия возрастает, пока не достигает локального максимума. Если кто-то не понимает слово «энтропия», то не расстраивайтесь. «Энтропия» — это «пиздец» по научному. Тишь да гладь, да божья благодать.

Но вот вы зажгли плиту. Через вашу кастрюлю пошла энергия сжигаемого газа. Однородная жидкость в кастрюле тут же приобретает тепловой градиент — снизу вода теплее, чем сверху. Возникает конвективное движение, в ходе которого нагретая жидкость поднимается, а охлажденная уходит на дно. При этом в жидкости образуются теплые и холодные каналы, имеющие в сечении что-то похожее на шестиугольник. Это и есть те бульбы, которые вскакивают на поверхности закипающей воды. Официальное их название — ячейки Релея-Бенара или просто Бенара, который описал их хуеву тучу лет назад.

Особенно заебато ячейки Бенара смотрятся в застывшем виде, например в столбчатых геологических структурах. Но не о том речь. Ваша кастрюля на газу — простейший пример диссипативной системы, которая усложняет структуру при прохождении через нее потока энергии. Убавляете газ — снижаете поток энергии — упрощается структура.

Такая же хуйня происходит и в растительности. При прохождении через растительное сообщество энергии, ее структура усложняется, о чем еще пол-века назад писали умные чуваки в «Полевой геоботанике». Да и я, было дело, уделял этому внимание.

А теперь внимание. Ебните свой стакан и слушайте не отвлекаясь.

При увеличении потока энергии структура усложняется. При уменьшении потока энергии структура упрощается. В случае живого напочвенного покрова поток энергии регулируется сомкнутостью крон (конечно же, не только им, но не будем отвлекаться на всякую хуйню). От чего зависит структура напочвенного покрова? Прежде всего от количества видов (не путайте с особями, подонки)  и их проективного покрытия. Проективное покрытие — величина имеющая верхний предел в сто процентов, значит функция изменения проективного покрытия от аргумента сомкнутости есть логарифмическая функция. На функцию видового разнообразия по аргументу сомкнутости крон такого ограничения не налагается — теоретически нет верхнего предела для количества видов на ограниченной территории (во всяком случае, он охуительно велик).

Что из этого следует, вы и сами, думаю догадались: если проективное покрытие влияет на структуру, но изменяется как логарифмическая функция от освещенности, то проективное покрытие влияет на структуру только в левой части графика. По мере выполаживания функции проективного покрытия, все большее значение в структуре напочвенного покрова играет количество видов. Переводя на житейский язык — структура живого напочвенного покрова зависит большей частью от проективного покрытия в сомкнутых насаждениях и от видового разнообразия в рединах.

Теперь задержите дыхание: я буду кульминировать мою мысль.

Хуй его знает, по какому закону изменяется сложность структуры при изменении потока энергии. Поскольку сие есть тайна пока не раскрытая, возьмем Бритву Оккама и без лишней мозгоебли отрежем все варианты кроме линейного. Что это нам дает? А вот что: при смыкании верхнего яруса изменение структуры напочвенного покрова должно начинаться с резкого уменьшения видового разнообразия и плавного уменьшения проективного покрытия. По мере сгущения крон, скорость уменьшения видового разнообразия снижается, скорость уменьшения проективного покрытия возрастает. Мы получаем две асинхронные волны, по аналогии с синусом и косинусом.

Если осветлять верхний ярус, первой реакцией будет увеличение проективного покрытия, второй — изменение видового разнообразия. Все. Теперь можете ебнуть еще стакан.

Собственно, об этом я уже писал в статье посвященной фрактальному анализу напочвенного покрова несколько лет назад. Но там данных было мало и вообще работа смотрелась несолидно. И вот, наконец-то, я осуществил давнюю мечту и сравнил между собой данные по количеству видов и проективному покрытию травяно-кустарничкового и мохово-лишайникового ярусов, приведенные в монографии В.Н. Федорчук, В.Ю. Нешатаев, М.Л. Кузнецова «Лесные экосистемы северо-западных районов России. Типология, динамика, хозяйственные особенности». Вообще, надо сказать — это охуеннейшая книга. Если где увидите — покупайте обязательно. Даже если наступит полный пиздец и вы не сможете ходить в лес — с помощью одной этой книги вы сможете лет двадцать писать ежегодно новые и актуальные лесоведческие статьи (нахуй они нужны только, но это другой вопрос).

Small_DSCN7736

Итак, у меня было два пакетика травы 75 ампул мескалина 177 геоботанических описаний, каждое из которых сделано с повторностью в 3-10 описаний. Из них я извлек данные по сомкнутости крон, проективному покрытию травяно-кустарничкового, мохово-лишайникового яруса и количество видов в сообщетве. Я сложил покрытия ярусов живого напочвенного покрова. Во-первых, потому что мы не можем учитывать только один произвольно выбранный ярус, а во-вторых, потому что искренне считаю, что всякое необоснованное деление растительности на ярусы есть хуйня на постном масле.

Собственно: данные готовы. Если теория верна, то графики изменения видового разнообразия и проективного покрытия относительно изменения сомкнутости будут асинхронны друг другу. Старик Карл Пирсон вместе с коллегами указывает на наличие обратной связи между суммарным проективным покрытием и видовым разнообразием. И надо сказать весьма заебатой связи: коэффициент корреляции составляет -0,50261 при том, что для преодоления критического значения коэффициента корреляции при уровне значимости 0,01 было достаточно обнаружить тесноту связи |0,15|.

Не будем же тянуть Линнея за яйца. Вот график.

GeoDissipatio1

Зеленый график — суммарное проективное покрытие живого напочвенного покрова. Красный график — количество видов в живом напочвенном покрове (для визуального масштаба умножено на два). По горизонтальной оси — сомкнутость древостоя в процентах.

— Нихуя не видно! Че там посредине-то?

— Говно-вопрос. Вот вам центральная вырезка с сомкнутостью от 60 до 80 процентов. Удвоенное количество видов в живом напочвенном покрове показано розовой толстой линией, суммарное проективное покрытие напочвенного покрова показано зеленой.

GeoDissipatio2

Собственно, здесь положено торговать еблом и писать заключение, как это принято в научном мире. Но мне лень хуйню всякую писать. Придумайте сами что-нибудь.

P.S. Excel-файл с расчетами и графиками.

Метод Бенфорда в оценке достоверности данных

Метод Бенфорда в оценке достоверности данных

Друзья мои! Вы несомненно знаете больше меня о последних мировых новостях и потому разобщены и тревожны. Но сегодня, у вас будет повод отвлечься. В этот день мы все объединены единым горем утраты. Утрачена флешка, на которой я хранил для вас статью о диссипативной динамике живого напочвенного покрова. Вместе с ней пропало содержимое подарочной бутылки коньяка, мой рукописный реферат на тему «Сатанизм-как социальное явление» и весь тираж осеннего номера «Лабораторного Журнала», отпечатанный в объеме двух с половиной экземпляров. Воистину, в этот день можно посыпать голову пеплом, ибо об этот реферат я в свое время исписал четыре ручки и мне он чертовски дорог, как память о студенческих годах.

Дабы загладить боль утраты, я предлагаю вам статью из пропавшего «Лабораторного Журнала» (а где вы ее теперь прочитаете?), описывающую сущность, принципы применимости и алгоритм метода Бенфорда на примере анализа данных о площадях ООПТ России и площадях, охваченных лесными пожарами в 2009-2013 годах. Сам же я отправляюсь в келью, где буду страдать вплоть до открытия магазина.

Итак, речь пойдет об одном из статистических методах фрактального анализа — оценке бенфорд-последовательности данных. Метод довольно грубый, но в то же время чрезвычайно простой и красивый. С его помощью вы сможете проверить истинность данных, подчиненных экспоненциальному распределению.

Свое название бенфорд-последовательность получила в честь Фрэнка Бенфорда Альберта-младшего — американского инженера-электрика, физика и оптика, жившего в штатах в первой половине XX века. Однако, сам «Закон Бенфорда», он же «закон первой цифры» впервые описан за три года до его рождения американским астрономом, математиком и экономистом Саймоном Ньюкомбом. Работая в 1881 году с логарифмическими таблицами в книгах, он обнаружил, что сильнее всего истрепаны страницы на которых содержаться логарифмы чисел, начинающиеся с единицы. На первый взгляд, вероятность оказаться на первом месте в числе одинакова для всех цифр и составляет 1/9. Однако, чем выше по значению было число, состоящее из первой цифры логарифма, тем в большей сохранности находились страницы. Все это наводило на подозрение о неравномерной встречаемости первых цифр в числах.

Спустя пол-века за эту проблему взялся Фрэнк Бенфорд. Он рассчитал вероятности встречаемости цифр на первом месте в числе для различных данных. Бенфорд использовал площади бассейна 335 рек, удельную теплоемкость материалов, население городов, молекулярную массу химических соединений, номера домов и другие данные. Во всех случаях наблюдалась единая закономерность — чисел, начинающихся на единицу было примерно в шесть раз больше, чем чисел, начинающихся на девятку.  Собранная статистика позволила вывести формулу распределения вероятности появления первой цифры в числе:

P(d) = logb(d+1)-logb(d) = logb(1+1/d)

где:
b — основание системы счисления, в нашем случае b = 10;
d — первая цифра в числе;

На основе этой формулы была построена бенфорд-последовательность — последовательность вероятности появления различных цифр на первом месте числа. Рассчитанная по формуле, эта последовательность выглядит следующим образом: 30.1, 17.6, 12.5, 9.7, 7.9, 6.7, 5.8, 5.1, 4.6. Вероятность того, что на первом месте в числе окажется единица составляет 30.1%, двойка — 17,6% и так далее до девятки (4.6%).

Долгое время, эта интересная закономерность не находила никакого применения. Однако после 1997 года на нее обратили внимание и стали все активнее использовать для проверки фальсификации данных, например результатов голосования (в том числе и в России). В 1997 году М. Нигрини и Л. Миттермайер в издании «Аудит: Журнал теории и практики» опубликовали шесть разработанных математических тестов, основанных на законе Бенфорда. Тесты были успешно введены в практику аудиторской компанией «Эрнст и Янг» и позволили выявить несоответствие между реальными и заявленными данными клиентов.

Необходимо учитывать, что метод Бенфорда применим не ко всем данным. Он выдает значительные погрешности при работе с выборками для которых заданы максимальные или минимальные значения, с выборками, охватывающими только один или два порядка величин и с малыми по объему выборками.

При решении вопроса применимости метода Бенфорда обычно рекомендуют исходить из «естественности» данных (если данные получены в ходе естественного течения событий, то к ним применим метод Бенфорда). Этот критерий верен, но довольно сложен для использования. В ходе работ с бенфорд-последовательностями я пришел к выводу, что метод бенфорда работает только с данными, топологическое множество которых самоподобно, а элементы могут принимать произвольные значения.

Для проверки применимости метода необходимо аппроксимировать их показательной функцией (чаще всего используется экспонента) и убедиться, что коэффициент аппроксимации составляет 0,9 и выше. Если при этом отсутствуют правила, детерминантно определяющие значение того или иного числа, то метод бенфорда к вашим данным применим.

Алгоритм применения бенфорд-метода в программах LibreOfficeCalc и MS Excel 

1. Исходные данные

Со страницы сайта oopt.aari.ru, разработанного ФГБУ «ААНИИ» и Лабораторией геоинформационных технологий взят перечень особо охраняемых природных территорий России. Список насчитывает 8013 ООПТ, из которых 4410 войдут в нашу обработку. Это действующие или реорганизованные ООПТ, для которых есть данные по площади.

Данные по площади лесных пожаров взяты с сайта федерального агентства лесного хозяйства. Выборка охватывает данные по всем регионам России с первого квартала 2009 года по второй квартал 2013 года. Всего за этот период было охвачено лесным пожаром 949 территорий различной площади.

2. Проверка на распределение

Нам необходимо убедиться, что данные подчиняются экспоненциальному распределению. Сортируем данные по площади и аппроксимируем их экспонентой.

Lj2-24

На рисунках изображены площади ООПТ (верхний рисунок) и площади пожаров (нижний рисунок), отсортированные по значению. Ось ординат показывает площадь в гектарах.   Чем больше площадь особо охраняемой природной территории, тем меньше таких ООПТ в стране. Равно как и значительные площади подвергаются пожарам гораздо реже небольших участков.  Коэффициент аппроксимации обоих наборов данных экспонентой (синяя линия) составил 0,98.

3. Избавление от нулей

Отличительной особенностью фрактальных множеств, к которым относятся и наши данные является их масштабная инвариантность. Распределение не зависит от единиц в которых выражены величины. Будь наши данные выражены в километрах, миллиметрах или ангстремах, мы всегда будем наблюдать одинаковые закономерности.  Масштабная инвариантность позволяет нам избавиться от значений менее единицы простым умножением на 100 (в каждом конкретном случае может быть различный порядок, в зависимости от наименьшего числа в выборке. В нашем случае таким числом было 0,01). Сделать это необходимо, поскольку формула Бенфорда использует логарифмы, а потому не работает с нулевыми числами.

4. Отделение первой цифры и расчет

Методом LEFT() в LibreOfficeCalc или ЛЕВСИМВ() в Excel отделяем первую цифру из каждого числа. Получившийся столбец с первыми цифрами чисел сортируем и подсчитываем количество единиц, двоек, троек и т.д. до девяток. Вероятность встречи каждой цифры рассчитываем как отношение количества чисел, начинающихся с данной цифры к общему количеству чисел. Например, если в выборке по пожарам было 273 числа, начинающихся на единицу, а общий объем выборки 949, то вероятность того, что первой цифрой в числе будет единица составит 100%*273/949=28,8%.   В итоге у вас получится аналог вот таких таблиц (верхняя таблица — данные по площади ООПТ, нижняя таблица — данные по площади пожаров):

Lj2-25

По ним же, для большей наглядности можно построить соответствующие графики сравнения фактической и расчетной бенфорд-последовательности (вверху для площади ООПТ, внизу для площади лесных пожаров):

Lj2-252

Стобцы на графиках соответствуют фактической бенфорд-последовательности, красная линия соответствует теоретической последовательности, рассчитанной по формуле Бенфорда.

Приведенные графики свидетельствуют, что данные по площадям ООПТ России и данные по площади пожаров за 2009-2013 г. достоверны. Наибольшие ошибки приходятся на крайние значения, что связано со сложностью определения массовых (ошибки по единице) и крупных (ошибки по девятке) объектов в натуре, а также с меньшим объемом статистических данных (ошибки по девятке).

В случае, если бы анализируемые нами выборки были сфальцифицированы рандомным методом, то есть, вместо реальных значений были указаны случайные числа, фактическая и расчетная бенфорд-последовательности различались бы радикально.

P.S. Да, я знаю, что качество приведенных картинок отвратительно. Но поверьте, вы встретились с ними в странный момент их жизни.

Фрактальный анализ систем с детерминированным хаосом в популярном изложении

Фрактальный анализ систем с детерминированным хаосом в популярном изложении

Отрывок доклада: «Почему на даче третий год вместо гаоляна вырастает всякая хрень», прочитанного осенью 2010 года перед современными декадантами в поселке Рощино, где я оказался проехав свою остановку по причине того, что был абсолютно пьян.

«Наука начинается там, где начинают измерять» (Д.И. Менделеев), однако, сам процесс измерения не так прост, как это может показаться на первый взгляд. Для того что-бы измерить, скажем длину, первое что необходимо — это определиться в минимальных бинарных единицах измерения. Бинарных — значит далее не делимых. Каждый из нас рассчитывал такие единицы измерения на школьном уроке физики, когда измерял цену деления прибора.

Едва ли в тот момент мы осознавали, насколько важны вычисленные значения. На первый взгляд, от того, какой инструмент мы выберем для измерения, зависит только точность полученных данных. Чем точнее прибор, чем меньше его цена деления, тем более точный результат мы сможем получить.

Этим же правилом руководствовался английский математик Ричардсон. Проверяя гипотезу зависимости частоты войн от протяженности границ Ричардсон сравнил длину Испано-Португальской и Португальско-Испанской границы. Как ни парадоксально, но граница со стороны Португалии оказалась больше на 240 километров. Тот же эффект наблюдается при сравнении любых других границ разных по площади государств.

Дело в том, что вопреки нашим убеждениям, понятие «абсолютно точное измерение» лишено всякого смысла. Линейные, площадные и объемные величины, а следовательно и все остальные единицы измерения (напомню, тот же вес измеряется в длине отклонения пружины весов, то есть в тех же сантиметрах, которые потом переводятся в килограммы по заранее определенному соотношению) не имеют абсолютно точных значений. Чем точнее прибор тем большую величину он показывает. Длина границы, измеренная сантиметровой линейкой будет больше длины границы, измеренной метровой линейкой. Границы Португалии меньше испанских, измеряли португальцы их более подробно, увеличив этим свою сухопутную границу более чем на две сотни километров.

Более того, в природе нет геометрически правильных объектов. Все что нас окружает есть не набор точек, кривых, плоскостей и объемных тел, а нечто среднее между ними. Звучит непривычно, но строго говоря, трехмерный мир о котором мы знаем с детства есть не более чем выдумка, ничего общего не имеющая с реальностью. Мир не просто многомерен, он бесконечно многомерен. И каждая размерность в абсолютном большинстве случаев является дробным числом и, вдобавок, зависит от того, на каком диапазоне масштабов мы производим вычисления.

Рассматривая подобные объекты в 70-х годах ХХ века, Бенуа Мандельброт предложил понятие «фрактал» и принципы описания и работы с такими объектами. Фрактал есть множество, состоящее из элементов, каждый из которых подобен целому множеству. Основным свойством фрактальных объектов является степенное увеличение их размеров при линейном изменении минимальных единиц измерения.

Фрактальная геометрия помимо инструмента для описания сложности структур позволила численно выражать степень хаотичности системы.

В экологии до сих пор встречаются апологеты детерминизма и индетерминизма. Первые считают, что зная начальное положение всех компонентов системы мы можем спрогнозировать дальнейшую динамику на неопределенно большое время. Вторые убеждают их в хаотичности происходящих в мире явлений и процессов. И тем и другим следует перечитать «Эффект бабочки» Брэдбери — рассказ, ярко иллюстрирующий теорию детерминированного хаоса.

Напомню, главный герой рассказа отправившись в прошлое наступает на бабочку. Последняя не становиться кормом для хищника. Хищник не делает того, что смог бы и судьба всего мира начинает лавинообразно изменяться. В результате главный герой возвращается в совсем другой мир, с другими ценностями и законами.

Динамика природных систем крайне зависит от начальных условий. Так же как в «Эффекте бабочки», незначительное изменения начальных условий приводит к кардинальному расхождению между расчетными и реальными значениями. Вы можете округлить сотый знак после запятой и, тем самым, вместо увеличения числа видов получить его прогнозное исчезновение. Мы не можем делать длительные прогнозы погоды поскольку появление любого циклона может зависеть от того, сколько вздохов вы сделаете читая этот текст.

На верблюда можно нагрузить много соломы. В то же время нет метода оценить, какая же соломинка переломит его спину. Так же мы можем долго воздействовать на экосистему, но нет информации, через какую сломанную ветку проникнет инфекция, которая впоследствии перекинется и уничтожит весь ослабленный лес.

Анализ таких процессов невозможен без использование теории фракталов. Чем больше вид графика зависит от выбранных единиц измерения, тем сильнее динамика зависит от начальных величин, тем ближе «последняя соломинка» и сильнее опасность гибели экосистемы.

Теоретически, возможно разработать метод подмены временных и пространственных осей. Если в одной точке местности у нас болото, а в другой сосняк с лишайниками, то при переходе от одной точки к другой мы будем наблюдать такие же изменения, какие бы происходили с болотом во времени при замене болотных условий произрастания на условия лишайникового сосняка. Фрактальный анализ позволяет определить те единицы измерения условий, в которых можно планировать максимальную нагрузку без риска уничтожения сообществ.

Нельзя оценить количество соломинок, которое выдержит верблюд, но можно разбить все сено на охапки таким образом, что-бы исключить попадание охапки с критичной соломиной на хребет бедного животного. Невозможно разработать предельно-допустимые нормативы, но для каждой последующей партии выбросов есть способ оценить степень риска уничтожения природного сообщества.

Конечно же, это утрированное описание. Говорить о динамике без упоминания фрактальности времени (да, событие измеренное часами длится дольше чем измеренное годами), нечетких вычислений, золотого сечения и определения жизни как явления довольно сложно. Проводя аналогию с Р. Брэдбери можно сказать, что данная работа позволяет связать между собой опасность негативных изменений в будущем с размером сапогов главного героя. Да, как ни парадоксально, но рождение, выбор и смерть каждого из нас зависят от бесконечно ничтожной ерунды. Такой вот забавный природный факт.

Фрактальный анализ сложности горизонтальной структуры напочвенного покрова

Фрактальный анализ сложности горизонтальной структуры напочвенного покрова

Эта статья была написана в 2009 году и уже устарела — появились новые данные, новые результаты. В статье не рассмотрены методы связанные с размерностями высоких порядков, методы поканального анализа растров. Ни слова об алгоритмах сжатия jpeg. Данных — кот наплакал. И вообще, кругом говно. Есть только одна причина, по которой я ее публикую. Постройте аналог таблицы 7 по данным (В.Н. Федорчук и др., 2005) или любым другим. Построили? Ну вот, потому-то и публикую.

Каждый тип растительного сообщества характеризуется своим особым типом обмена вещества и энергии (Полевая геоботаника, 1959). Анализ структуры растительности позволяет оценить этот тип обмена, и как следствие, определить растительное сообщество.

Цель работы — определить факторы, влияющие на сложность горизонтальной структуры напочвенного покрова.

Для достижения цели разработан метод фрактального анализа фотоизображений напочвенного покрова, основанный на понимании напочвенного покрова как диссипативной структуры.

Материалы и методы

В 2008 году в лесопарке «Пискаревка» (Санкт-Петербург) заложено 80 учетных площадок размером 0,25 кв.м. Преобладающий тип леса на обследованной территории – смешанный березняк (6Б4С) черничный. Возраст древостоев 60 лет, отдельные деревья имеют возраст до 150 лет. На каждой учетной площадке сделана фотография лесного полога (вертикально вверх), живого напочвенного покрова (вертикально вниз). Описано общее и повидовое проективное покрытие травяно-кустарничкового и мохово-лишайникового ярусов, мощность и покрытие подстилки, мощность гумусового горизонта.

При анализе данных, описанные виды травяно-кустарничкового яруса делились на 4 эколого-ценотические группы (А.А. Егоров и др., 1997; «Иллюстрированный определитель…», 2000; В. Ю. Нешатаев, А. А. Егоров, 2006):
1. Лесные виды, характерные для ненарушенного леса черничной серии типов (В.Н. Федорчук и др., 2005), такие как Vaccinium vitis-idaea, Vaccinium myrtillus и др.
2. Луговые виды (Trifolium pratenseLathyrus pratensis и др.)
3. Сорные виды (Plantago majorTaraxacum officinale и др.).
4. Опушечные, неморальные, прибрежные и прочие виды, такие как Geum urbanum, а так же светолюбивые лесные злаки (например, Avenella flexuosa).

Для каждой из эколого-ценотических групп рассчитывалась степень доминирования (индекс Симпсона) («Методы…», 2002).

Сложность структуры напочвенного покрова на учетных площадках (0,25 кв. м) определена на основе анализа фотоизображений, полученных в ходе полевых работ. На первом этапе фотографии были обрезаны по контуру учетной площадки и переведены из формата jpeg в формат bmp (256-цветовая палитра) с разрешением 22,97 х 22,97 см (650 х 650 пикселей), что в реальности соответствует площадке размером 50 х 50 см (рис.1).

Рис.1. Обрезка фотографии по контуру учетной площадки и преобразование ее в формат bmp-256 (650х650 пикселей).

Рис.1. Обрезка фотографии по контуру учетной площадки и преобразование ее в формат bmp-256 (650х650 пикселей).

Затем полученное изображение сохранялось в виде негатива формата bmp (черно-белый) (рис.2).

Рис.2. Преобразование негатива фотографии в формат bmp-ч/б (650х650 пикселей).

Рис.2. Преобразование негатива фотографии в формат bmp-ч/б (650х650 пикселей).

При этом травы и кустарнички отображаются в виде закрашенных контуров (злаки отображаются в виде узких полос, толщиной 1-3 пикселя). Мхи отображаются в виде группы крупных точек размером 4-15 пикселей. Неоднородности подстилки (сборки, разрывы) отображаются в виде отдельных точек, размером 1-4 пикселя. Однородные участки подстилки отображаются в виде белого фона.

После этого, полученное изображение было покрыто сетью клеток определенного масштаба и подсчитано количество клеток, в которых граничили между собой черный и белый пиксели (рис.3).

Покрытие1Рис.3. Покрытие изображения клетками различного масштаба. Граничные клетки залиты красным цветом (увеличено, показан левый нижний угол рисунка 2.).

Рис.3. Покрытие изображения клетками различного масштаба. Граничные клетки залиты красным цветом (увеличено, показан левый нижний угол рисунка 2.).

Размер клеток с каждым новым покрытием возрастал. Изображение покрывали 10 раз. Минимальная площадь одной клетки 0,01см2 (418609 клеток), максимальная 0,60 см2 (4186 клеток).

Зависимость между площадью одной клетки и количеством клеток содержащих в себе черный и белый пиксель аппроксимировали степенной функцией.

Размерность Хаусдорфа-Безиковича (фрактальная размерность) рассчитана с использованием полученного уравнения регрессии по формуле:

 D = -N;
где N- показатель степени в уравнении регрессии (y = ax^N).

Обычно для природных систем характерен целый ряд размерностей. Такие системы носят название мультифракталов. Показатель размерности при их изучении зависит не только от сложности анализируемой структуры, но и от параметров клеточного метода (Иванов и др., 2006). Для анализа мультифракталов применяют кривую спектра фрактальных размерностей (Федер, 1991; Шредер, 2001; Божокин, Паршин, 2001; Мандельброт, 2002; Шурганова и др., 2002). Чтобы выразить этот спектр численно, разработана формула отношения области охваченной мультифрактальным спектром к площади, ограниченной топологическими размерностями, между которыми заключены все фрактальные размерности спектра:

Формулагде Z- показатель сложности структуры;
Dt –Топологическая размерность. Равна 0 в нижней границе области фрактальных размерностей (равна 0 в случае Dt* a), равна 1 в верхней границе области фрактальных размерностей (равна 1 в случае Dt* b),
f(x) — функция, наилучшим образом аппроксимирующая фрактальный спектр,
a – Нижняя граница площадей клеток покрытия, см;
b – Верхняя граница площадей клеток покрытия, см;

Показатель сложности структуры (Z), вычисленный таким образом назван интегральной размерностью покрытия. Далее по тексту, она подразумевается под всеми упоминаниями размерности, кроме особо оговоренных случаев.

Результаты и их обсуждение

Характеристика горизонтальной структуры напочвенного покрова

Анализ показал наличие в структуре напочвенного покрова самоподобных (фрактальных) свойств. Сложность структуры определяется сочетанием проективного покрытия, видового разнообразия травяно-кустарничкового яруса и мощности подстилки.

Наиболее простая структура (значение размерности – 0,65-0,7) наблюдается при высокой сомкнутости древостоя (80%) низкой мощности подстилки, малом проективном покрытии. Видовое разнообразие на таких площадках низкое (в среднем 3 вида травяно-кустарничкового яруса на одной учетной площадке). Представлены преимущественно виды лесных местообитаний (Oxalis acetosella, Vaccinium vitis-idaea, Vaccinium myrtillus, Majantemum bifolium).

При снижении сомкнутости древостоя увеличивается видовое разнообразие и проективное покрытие видов травяно-кустарничкового яруса. Снижается степень доминирования лесных видов, за счет усиления роли видов опушечнных, неморальных и прочих местообитаний. Появляются рудеральные виды (Taraxacum officinale). Увеличивается мощность подстилки (более 1 см). Значение интегральной размерности покрытия для структуры напочвенного покрова составляет 0,7-0,8.

В условиях минимальной сомкнутости древостоя проективное покрытие и видовое разнообразие достигают самых больших значений. Мощность подстилки в этих условиях максимальна. В травяно-кустарничковом ярусе из лесных видов сохраняется только седмичник европейский. Появляется Poa pratense – типичный луговой вид. Доминируют виды переходных местообитаний. Структура напочвенного покрова имеет наибольшую сложность. Интегральная размерность покрытия для таких площадок выше 0,9.

Связь сложности горизонтальной структуры с параметрами напочвенного покрова

Сложность горизонтальной структуры напочвенного покрова (выраженная через интегральную размерность покрытия) зависит от трех прямых факторов: проективного покрытия травяно-кустарничкового яруса, видового разнообразия травяно-кустарничкового яруса и мощности подстилки на учетной площадке (Таблица).

Тут должна быть таблица, которую все-равно никто не читает.

Из косвенных факторов, имеющих заметную связь с интегральной размерностью покрытия, выделяется сомкнутость древостоя, количество и степень доминирования лесных видов и видов, не относящихся к конкретным местообитаниям, произрастающих в широком диапазоне условий.

Связь сложности горизонтальной структуры с проективным покрытием травяно-кустарничкового яруса

Связь сложности структуры напочвенного покрова и проективного покрытия травяно-кустарничкового яруса наилучшим образом описывается степенным законом, поскольку общее проективное покрытие имеет верхний предел (100 %).

Изменение проективного покрытия заметно влияет на сложность структуры только на начальных этапах (рис. 4.). При проективном покрытии до 40%, увеличение проективного покрытия ведет к заметному усложнению структуры напочвенного покрова, снижение к упрощению. При проективном покрытии свыше 40 % изменение проективного покрытия незначительно сказывается на сложности структуры напочвенного покрова (рис. 4.).

Рис. 4. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и проективного покрытия травяно-кустарничкового яруса (ТКЯ) при различных значениях проективного покрытия.

Рис. 4. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и проективного покрытия травяно-кустарничкового яруса (ТКЯ) при различных значениях проективного покрытия.

Связь сложности горизонтальной структуры с видовым разнообразием

Связь интегральной размерности покрытия и видового разнообразия, теоретически должна быть линейна, поскольку верхний предел богатства видового разнообразия отсутствует. В действительности, это не совсем так (рис. 5.), поскольку существует положительная корреляция (r2 = 0,41) между количеством видов и проективным покрытием травяно-кустарничкового яруса.

Рис.5. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и видового разнообразия на учетной площадке. Причины низких значений коэффициента аппроксимации раскрыты далее по тексту.

Рис.5. Связь интегральной размерности покрытия (сложности структуры напочвенного покрова) и видового разнообразия на учетной площадке. Причины низких значений коэффициента аппроксимации раскрыты далее по тексту.

Малому видовому разнообразию соответствует обычно или очень небольшое или наоборот максимальное проективное покрытие. В левой части рис. 5. видно, что площадкам с низким видовым разнообразием не характерны определенные значения фрактальной размерности. Большой разброс данных происходит от того, что в них отражена одновременно информация о площадках с высоким проективным покрытием травяно-кустарничкового яруса (увеличивающим значения интегральной размерност покрытия до 0,9-0,95) и площадках с низким проективным покрытием (значение размерности менее 0,75). Для участков с более высоким видовым разнообразием (правая часть рис. 5.) связь становится более заметной.

Связь между сложностью структуры напочвенного покрова и видовым разнообразием травяно-кустарничкового яруса частично объясняется положительной корреляцией, между количеством видов и проективным покрытием. Однако, лишь 16,8% (коэффициент детерминации) взаимосвязи между проективным покрытием и количеством видов объясняется их взаимовлиянием. Это позволяет сделать вывод о влиянии видового разнообразия на сложность горизонтальной структуры напочвенного покрова.

Сложность структуры напочвенного покрова тесно связана со степенью доминирования основной эколого-ценотической группы. При смене доминирующей эколого-ценотической группы от лесных видов к сорным, сложность структуры повышается, достигает максимума при равном доминировании разных эколого-ценотических групп и в дальнейшем снижается при усилении доминирования новой эколого-ценотической группы. Связано это с дугообразным изменением видового разнообразия при смене доминирующей эколого-ценотической группы (С.Н. Голубев, 2009).

Связь сложности горизонтальной структуры с параметрами мохово-лишайникового яруса и подстилки

Низкая связь обнаружена между интегральной размерностью покрытия и проективным покрытием мохово-лишайникового яруса и покрытием подстилки. Причиной этого является схожесть подстилки и мохово-лишайникового яруса после обработки изображений, что, несомненно, является недостатком используемого метода (данный недостаток можно исправить путем включения в анализ цветовых характеристик растра).

Между покрытием подстилки и сложностью структуры напочвенного покрова существует обратная связь. Между мощностью подстилки, проективным покрытием мохово-лишайникового яруса и сложностью структуры напочвенного покрова связь прямая. Соответственно усложнение структуры напочвенного покрова происходит при увеличении проективного покрытия мохово-лишайникового яруса и мощности подстилки. Увеличение покрытия подстилки ведет к равномерному рассеиванию по растру случайных одиночных пикселей, что снижает величину интегральной размерности покрытия.

Диссипативные свойства структуры напочвенного покрова

Для диссипативной структуры характерно усложнение при увеличении притока энергии (Г. Хакен, 1980). Аналогичное свойство наблюдается и у горизонтальной структуры напочвенного покрова. При увеличении притока энергии (снижении сомкнутости древостоя) интегральная размерность покрытия возрастает (рис. 6).

Рис.6. Возрастание сложности структуры напочвенного покрова при снижении сомкнутости. Данные сгруппированы в десять групп. Корреляция между значениями исходных данных указана в Таблице.

Рис.6. Возрастание сложности структуры напочвенного покрова при снижении сомкнутости. Данные сгруппированы в десять групп. Корреляция между значениями исходных данных указана в Таблице.

Сложность структуры изменяется и при качественных перестройках системы, к каким относятся смена доминирующей эколого-ценотической группы. В случае уменьшения притока энергии (затенения) усложнение структуры напочвенного покрова, как диссипативной структуры невозможно. Следовательно, при затенении изменения в напочвенном покрове не должны усложнять его структуру. Поскольку проективное покрытие лишь при низких значениях существенно влияет на сложность структуры, можно предположить, что, при затенении, изменение напочвенного покрова, в начале будет происходить преимущественно через снижение видового разнообразия, а в конце через снижение проективного покрытия.

В случае увеличения притока энергии (осветления) будет наблюдаться противоположная картина: вначале увеличение проективного покрытия, а затем качественная перестройка системы, в ходе которой основной причиной усложнения структуры растительности будет внедрение новых видов и постоянство или даже снижение проективного покрытия.

Подобная динамика действительно прослеживается на обследованных учетных площадках (рис.7).

Рис. 7. Динамика видового разнообразия и проективного покрытия травяно-кустарничкового яруса (ТКЯ) на учетных площадках, при изменении сомкнутости древостоя.

Рис. 7. Динамика видового разнообразия и проективного покрытия травяно-кустарничкового яруса (ТКЯ) на учетных площадках, при изменении сомкнутости древостоя.

Заключение

Метод фрактального анализа выявляет зависимость сложности структуры напочвенного покрова от трех основных прямых фактора: проективного покрытия, видового разнообразия травяно-кустарничкового яруса и мощности подстилки. Если проективное покрытие имеет низкие значения (до 40%) преимущественно от него зависит сложность структуры напочвенного покрова. Если проективное покрытие имеет значения более 40%, сложность структуры напочвенного покрова определяется другими признаками (например, видовым разнообразием травяно-кустарничкового яруса).

Главным косвенным фактором, влияющим на структуру напочвенного покрова, является степень сомкнутости древостоя.

Напочвенный покров как диссипативная структура усложняется при дополнительном поступлении энергии. При снижении количества поступаемой энергии перестройка напочвенного покрова происходит без усложнения структуры. При этом в начале снижается видовое разнообразие, в конце снижается проективное покрытие. При увеличении количества поступаемой энергии, перестройка структуры напочвенного покрова происходит в обратном порядке. В начале увеличивается проективное покрытие, в конце изменяется видовое разнообразие.

Практическая польза заключается в возможности использования данных о динамике структуры напочвенного покрова при планировании хозяйственной деятельности.

Установление типа напочвенного покрова методом фрактального анализа фотоизображений может быть полностью автоматизировано, что делает весьма ценным его практическое значение. Отличительной особенностью этого метода является выявление не отдельных деталей напочвенного покрова, а установление признаков, присущих данному типу напочвенного покрова в целом, признаков, основанных на энергетическом обмене с окружающей средой. Учитывая новизну метода и возможность совмещать его с другими методами (например, нейросетевые технологии обработки изображений), считаю разработку метода индикации напочвенного покрова путем фрактального анализа фотоизображений важной и перспективной задачей.