Одним из важнейших объектов исследования в отечественном лесоводстве являются постоянные пробные площади — ограниченные территории, на которых раз в несколько лет производится замер высоты, диаметра и других биометрических показателей деревьев. Попутно при этом описывают живой напочвенный покров, закладывают почвенные прикопки и фиксируют прочие наблюдения. В теории, эти данные накапливаются год за годом, а их анализ дает возможность проследить динамику развития растительного сообщества, что необходимо для объективного прогноза и экстраполяции данных.
На практике эти пробные площади нахуй никому не нужны. Как и отечественное лесное хозяйство, которое издревле держалось на подневольных, а когда люди закончились, накрылось пиздой в которую глянуть страшно. Погуляйте по дождливой лесной дороге — сразу поймете, почему единственным возможным видом достойного заработка в лесу являются концентрированные рубки средствами крупных лесопромышленных компаний.
Не думайте, что я вещаю из глубин пессимизма и депрессии. Наоборот, меня такая ситуация радует и любые попытки позитивных изменений я встречаю тревожным скепсисом: про возрождение лесного хозяйства в России обычно вспоминают отправляясь на постройку очередного ГУЛАГа.
Но хотя бы сегодня, давайте забудем про разных пидарасов и окунемся в мир статистики. Тем более, что процесс исследования постоянных пробных площадей, даже при отсутствии в нем всякого смысла, остается очень увлекательным занятием. Примерно как онанизм. Поэтому давайте уединимся и пока никто нас не спалил, посмотрим на данные сплошных перечетов древостоя, проведенные на одной из постоянных пробных площадей в Ханты-Мансийском автономном округе Западной Сибири.
Перечеты проведены разными исследователями в 2002 (З.Я. и В.З. Нагимовы), 2008 (Г.М. Кукуричкин) и 2018 году на ограниченной площади в 0,4 гектара. Все деревья на площади пронумерованы, на каждое дерево нанесена линия на высоте которой измеряется диаметр ствола. Изначально, эта высота должна составлять ровно 1,3 метра, но спустя шестнадцать лет, уровень ее колеблется между 1.0-1.7 м от шейки корня. Предположительно, это можно объяснить динамикой микрорельефа, хотя состояние пробы в целом создает впечатление того, что при закладке создатели были в говно пьяны. Древостой сложен лиственницей, пихтой, кедром, елью и березой, развит подрост и подлесок, живой напочвенный покров представлен лесными кустарничками и видами эвтрофных местообитаний (кислица, аконит, майник и др.). Если не смотреть на породный состав — типичный буреломный кисличник.
Первое, что необходимо сделать перед началом любой работы — привести все данные в машиночитаемый вид. Отдельно замечу: не в электронный, а именно в машиночитаемый, пригодный для автоматической обработки. Все эти бесконечные ворды, пдф-ы и эксели в девяносто девяти случаях из ста представляют собой богомерзкую хуету, которая для анализа пригодна ничуть не лучше, чем запись в полевом дневнике. При этом неизбежна стандартизация данных. В итоге разношерстные тексты сводятся в единую таблицу вот такого вида:
ele;num;d02;h02;l02;d08;d18;h18;l18 abies;1;19;NA;TRUE;20;21;NA;TRUE picea;2;38;NA;TRUE;38;37;NA;FALSE abies;3;12;NA;TRUE;12;13;NA;TRUE
В таком виде собранные данные пригодны для обработки хоть вручную, хоть в Экселе, SPSS или любом отличном от брэйнфака языке. Мы воспользуемся R.
Перед тем, как вникать в статистику, посмотрим на размеры выборки. При первом перечете описано 307 деревьев (на самом деле 308, но у елки №278 не указан диаметр, поэтому будем считать ее незафиксированной). При последующих перечетах добавилось еще шесть новых деревьев (включая ель №278). Рассчитаем, как распределяются 313 деревьев по породам с учетом количества усохших и выпавших деревьев:
В перечете 2008 года отсутствует информация о разделении деревьев на живые и усохшие, поэтому данные этого года представлены одним числом — общим количеством учтенных стволов. Данные 2002 и 2018 года представлены операцией вычитания, в которой уменьшаемое — число всех деревьев породы, вычитаемое — число сухих деревьев, разность — число живых деревьев.
За шестнадцать лет в насаждении активно выпадает елка, кедр и береза (тут нельзя забывать об эффекте низкой базы, см. 200% сохранности неопределенных пород). Любой нормальный лесовод на этом бы завершил свои изыскания, но мы продолжим наши статистические фрикции.
Для того, что-бы оценить качество исследуемых данных, сравним между собой их наиболее значимые части — подеревные перечеты. Логично предположить, что при неизменных данных график зависимости значений диаметров текущего перечета от значений диаметров прошлого перечета будет представлять собой идеальную прямую которая проходит под углом сорок пять градусов. В реальности всегда есть отклонения от такой прямой. Даже при неизмеряемой величине радиального прироста, диаметры могут как увеличиваться (за счет неравномерности окружности ствола, ошибок округления при измерении), так и уменьшаться (за счет отслаивания коры, указанных выше или других причин). Однако эти изменения при качественно выполненной работе всегда невелики. При одностороннем замере диаметров встречаются отклонения до пяти сантиметров с единичными отклонениями до 10 см (при измерении стволов неправильной формы).
Я не могу объяснить изменение диаметра стволов на двадцать пять сантиметров за шесть лет иными причинами, кроме разъебайства исследователей. Очевидно, что это грубые ошибки наблюдения, поскольку в перечетах 2008-2018 года таких выбросов не наблюдается (за исключением одного кедра). При финальной обработке данных, такие значения должны быть удалены из выборки, однако, в данный момент делать это некорректно. В ситуации, когда два наблюдения противоречат друг другу (стабильность и разброс измеренных величин) даже в самом примитивном подходе необходимо третье наблюдение. Тем более, что выбросы наблюдаются преимущественно в измерениях кедров и пихт, а для берез, лиственниц и елей нехарактерны.
Тем не менее, следует помнить, что все нижеприведенные рассуждения основаны на анализе исходных странных данных, поэтому всякая интерпретация результата должна быть подвержена великому сомнению.
Прежде чем перейти к описательной статистике, необходимо протестировать данные на нормальность. Без этого мы не имеем права делать сложный анализ. Да что анализ, даже сравнивать между собой средние значения без теста нормальности недопустимо. Существует около двух десятков популярных тестов на нормальность — заебешься тестировать, поэтому мы ограничимся лишь наиболее подходящими тестами по совету А.И. Кобзаря («Прикладная математическая статистика». — М.: Физматлит, 2006. — 816 с.). Для этого оценим, насколько распределения отличаются от гауссовской палатки с помощью коэффициентов ассиметрии и эксцесса:
В качестве наиболее универсальных критериев нормальности наших данных используем критерии Шапиро-Уилка и Андерсона-Дарлинга. Можно было бы ограничиться лишь Шапиро-Уилка, но этот тест плохо работает на больших выборках. Действующий ГОСТ Р ИСО 5479-2002 не рассматривает применение критерия Шапиро-Уилка для выборок свыше пятидесяти наблюдений, что создает препятствия для оценки нормальности распределения диаметров елок и пихт.
Полученные значения асимметрии и эксцесса сами по себе отражают динамику развития древостоя (преобладание крупных или мелких деревьев, изменение количества средних по диаметру деревьев). Для наглядности, представим ядерную плотность этих распределений на фоне доверительной полосы соответствующего нормального распределения. В верхнем ряду изображений показаны распределения для всех деревьев породы, живых и усохших (три маленькие картинки), в нижнем только для живых деревьев (две большие картинки).
Самые интересные процессы наблюдаются у пихты. В 2002 году в древостое преобладали деревья диаметром 10-25 см с ассиметричным распределением. Спустя шестнадцать лет ассиметрия уменьшилась в семь раз. В настоящее время элемент леса дифференцируется на две группы: деревья с преобладающим диаметром 10-15 см и деревья диаметром 20-25 см. Предпосылки к бимодальному распределению наблюдались еще в перечете 2002 года (еще раз указываю на странность тех данных), однако лишь в перечете 2018 года бимодальность проявляется явно. Это может быть связано с изреживанием элемента: часть пихт (левый пик распределения) достигла предельных возможностей развития. Эти деревья угнетаются, замедляются в росте и постепенно будут выпадать. Напротив, правая часть распределения представлена наиболее перспективными и жизнеспособными особями. Со временем это должно привести к разделению пихты на два элемента леса: угнетенные деревья 4-го и 5-го класса Крафта и нормально распределенный второй ярус древостоя.
В еловом элементе за время наблюдений выпала большая часть деревьев диаметром 30-40 см и значительная часть тонких деревьев менее 20 см. Это привело к увеличению преобладающего диаметра (мода распределения) примерно на пять сантиметров. В отличие от пихты, ель не проявляет бимодального распределения, что вероятнее всего свидетельствует о неспособности занимать в данных условиях доминирующее положение. Текущая динамика позволяет предположить, что меньшая часть деревьев из правой части распределения сохранит свое положение во втором ярусе, в то время как основная часть перейдет в низкие классы Крафта. В конечном итоге, ель будет представлять собой разнородную примесь в разных ярусах
Распределение берез по диаметру внешне напоминает нормальное распределение и за время наблюдений сохранило свою форму, за исключением смещения коэффициента ассиметрии в область отрицательных значений (усыхание деревьев с диаметром ствола менее 20 см). Впрочем, берез на пробе к 2018 году осталось лишь полтора десятка (меньше половины процента), поэтому информативность данной выборки переоценивать не стоит.
Кедр за шестнадцать лет сохранил суббимодальное распределение по диаметрам, однако его ассиметрия утроилась за счет выпадения деревьев толще 20 см. К настоящему времени ярко выделяется преобладающая мода в диапазоне 15-25 см. Вероятнее всего со временем бимодальность и ассиметрия в распределении будет расти, количество деревьев существенно снизится: отдельные деревья займут промежуточный ярус между лиственницей и пихтой, большая же часть кедров останется угнетенной во втором ярусе.
Распределения еловых, кедровых и, частично пихтовых стволов прямо не соответствуют кривой Шарлье, однако имеют сходство с распределением в насаждениях, где длительное время производят выборочные рубки, направленные на уборку отстающих в росте деревьев (Н.П. Анучин, 1982). В отличии от них, у лиственницы распределение с изначально отрицательной ассиметрий за время наблюдений еще больше сместилось в правую область. Равномерное снижение количества деревьев при уменьшении диаметра сменилось небольшим прогибом в диапазоне 20-40 см, что компенсировало выпадение деревьев толще 60 см.
При проверке распределения диаметров на нормальность воспользуемся p-значением 0.01. Классическое p=0.05, несмотря на его популярность не выдерживает критики, особенно в биологических исследованиях, где выборки представлены небольшим числом наблюдений (да, истинная причина в обосновании дальнейших параметрических методов, но я согласен с теми, кто даже 99% точность считает недопустимо низкой).
Диаметры елей, берез, кедров и лиственниц распределены нормально во всех выборках, исходя из обоих тестов. При последнем наблюдении p-значения елок существенно увеличены, а критерий Андерсона-Дарлинга значительно снижен, что косвенно говорит о нормализации элемента леса.
Сложнее обстоит дело с пихтами. В 2002 году их распределение существенно отличалось от нормального по тесту Шапиро-Уилка и соответствовало нормальному по тесту Андерсона-Дарлинга. Данная выборка превышает сотню наблюдений, поэтому тест Шапиро-Уилка мы можем проигнорировать, но даже в этом случае нормальность распределения наблюдается лишь для всей совокупности деревьев (живых и мертвых). При наблюдениях 2008 и 2018 года нормальность всей совокупности подтверждается обоими тестами, причем, как в случае с елями, вероятность случайного распределения существенно возрастает к настоящему времени. При этом выборка измеренных диаметров живых деревьев остается далекой от нормального распределения.
Полученные результаты дают нам основание сравнивать между собой средние значения диаметров пород в разные годы наблюдения, за исключением живых деревьев пихты. В последнем случае мы вынуждены использовать для сравнения медианные значения и не можем достоверными параметрическими методами выявить изменение величины радиального прироста.
Средние значения диаметров всех деревьев (живых и мертвых) за время наблюдения возросли у ели, лиственницы, кедра (кроме 2008 г.), березы (кроме 2008 г.) и снизились у пихты. При этом средние диаметры живых елей и кедров снизились. Однако, ни одно из этих изменений нельзя назвать статистически достоверным. В этой связи, приходится признать, что значимых изменений радиального прироста за шестнадцать лет зафиксировать не удалось.
Распределение диаметров пород выравнивается (подтверждается снижением интерквартильного размаха и дисперсии на 10-30 процентов) вокруг средних значений. Максимальные значения диаметров снижаются, минимальные возрастают. Одновременное выпадение наиболее крупных и мелких деревьев свидетельствует об увеличении однородности насаждения и его несформированности. Однако, окончательный вывод о динамике развития древостоя по существующим данным делать недопустимо.
Еще меньшей информативностью обладают данные по высотам. Измерение высот — чрезвычайно трудоемкий процесс с большой вероятностью субъективных ошибок. Над его улучшением трудились Ленхорд, Ланг, Лайер, Таката, Видеманн, Филипп, Гогенадль, Вейзе, Кренн, Лорей, Митерлих, Жан Парде, Продан и другие выдающиеся исследователи, но результат высотных замеров как был, так и остается хуетой в подавляющем большинстве исследований. Это связано со сложностью распознавания вершины дерева (и самим понятием «вершины»), микрорельефом, трудностью выставления точного базисного расстояния, несоответствием отбираемых деревьев распределению по диаметру и ряду других причин.
Несоответствие диаметров 2002 и 2008-2018 годов заранее вызывает подозрение в плохом качестве проведенной измерительной работы при закладке пробы. Это подтверждают и графики распределения высот по диаметрам. Конечно же, за шестнадцать лет могли произойти видимые изменения, но едва ли они могут иметь столь радикальный характер. Вероятнее предположить, что наблюдаемые изменения являются следствием погрешности и распиздяйства.
Это предположение подтверждает и описательная статистика. Поскольку число модельных деревьев каждой породы составляет максимум полтора-два десятка наблюдений, для оценки нормальности распределения достаточно применить только критерий Шапиро-Уилка. За исключением лиственницы в перечете 2018 года, все остальные выборки распределены нормально, но их средние значения не выявляют достоверных различий.
Таким образом, за период наблюдений 2002-20018 г. на пробной площади не отмечено достоверных изменений средних диаметров, высот, а значит и запасов у элементов леса. Запас продолжает быть необычайно высоким: принимая значение видовых чисел за 0.5, он составляет 452.5 кубометра живой древесины на гектар (лиственница — 270 куб.м, ель — 60 куб.м, кедр — 50 куб.м, пихта — 57.5 куб.м, береза — 15 куб.м). Это значение почти идентично запасу, рассчитанному в 2002 году (466 куб.м), хотя замечу, что в статье З.Я. и В.З. Нагимовых сумма запасов у пород (504 куб.м в таблице и 524 куб. м в тексте статьи) превышает запас на пробной площади: существенно разнятся по запасам ель (в статье 148 куб. м) и береза (в статье 15 куб. м). Запас, определенный в 2008 году идентичен текущему запасу.
Анализ изменения распределений по диаметру елей, кедров и в меньшей степени пихт указывает на процессы изреживания наиболее отстающих в росте деревьев. У пихты и кедра наблюдается небольшая бимодальность распределения в отличии от ели, что косвенно свидетельствует о меньшем потенциале елового элемента в становлении древостоя. Отмечаются слабые процессы нормализации в распределении диаметров у пород, что говорит о повышении его однородности и текущем активном процессе формирования древостоя (хотя это видно визуально и без всяких вычислений).
При рассмотрении выводов, следует помнить про вероятностный характер любых интерпретаций. Во многом это следствие необычных данных 2002 года (вероятно, включающих в себя значительные ошибки), но основная причина в том, что делать однозначные заключения о динамике развития растительного сообщества на основании трех наблюдений может только некомпетентный мудак.