Велик и могуч

Велик и могуч

В старинном споре о русскости тех или иных слов, единственный разумный подход озвучила писательница Татьяна Никитична Толстая. Если слово подчиняется правилам русского языка, то он русское. Компьютер, онлайн, менеджер, ресерч — безусловно русские слова. Шоу, жабо, метро — нерусские. Фраза «менеджериха ресерчила в онлайне» непривычна, но вполне укладывается в нормы языка, а вот «мы устроили шоу» — это иноязычная хрень.

Любопытно, что четкого деления на русские и нерусские слова нет, поскольку полно частично обрусевших слов. Например, «парсить». Попробуйте сделать из этого глагола существительное, а лучше в уменьшительно-ласкательной форме. При этом «парсить» и «распарсить» означают совершенно разные вещи.

Кто-то наверняка уже догадался, что этот текст не про лингвистику. Но если думаете, что намекаю на этнические проблемы, то ошибаетесь. Всего-навсего, хотел показать, как у одного и того-же объекта могут проявиться свойства дискретности и континуальности в зависимости от контекста. Несложная игра ума приводит к простым вопросам: дискретно ли время? Дискретно ли пространство?

А как быть с дискретным пространством, промежутки между элементами которого бесконечно малы? А еще когда бесконечно малы сами элементы? И вообще, останется ли понятие дискретности прежним, если в качестве метрики разрывов использовать не меру, а мощность множества?

Действительно, велик и могуч русский язык.

Двойное удовольствие

Двойное удовольствие

Человек, который желает поумничать, непременно вспоминает принцип бритвы Оккама, суть которого — не выдумывать разную хрень без веских на то причин. Нет сомнений — принцип важен и выручал не раз. Но сильнее всего он помог тем, что был изобретен лишь семь столетий назад. Знай о нем наши предки, все бы совершенно иначе получилось.

— Давайте у той зверюги, которая детей сожрала, щенят отберем и за несколько тысяч лет приручим — будут наши пещеры охранять.
— Ты еще предложи вон ту желтую фигню на палке принести, а потом на ней мамонта жарить.

Или ацтекский вариант: «Пока ты с игрушками развлекался, мы весь день булыжник тащили».

На всякую бритву непременно найдется свой Курт Гедель с теоремами о неполноте. Сравнивать философию с математикой сомнительно, а использовать результаты сравнения в быту еще сомнительнее, но опыт подсказывает: бывают ситуации, решить которые логическим способом нет никакой возможности. Приходится на основе интуиции предлагать разную хрень до тех пор, пока нужное решение не будет найдено. Заодно изменится и научная парадигма.

В любой момент времени найдется верное, но недоказуемое утверждение. А вместе с ним миллионы недоказуемых и неверных. Главное выбрать правильный подход и не считать утверждения самоценными.

— А мы говорим, что Земля плоская!
— Да я согласен хоть на форму банана, если вы скажете, что это дает и как объяснить тысячи других наблюдаемых вещей.

Молодец Курт Гедель. Теперь умничаешь так же, а удовольствия в два раза больше. Да и бриться веселее стало.

Аналитические способности

Аналитические способности

Поздняя осень — самое благоприятное время для оценки своих аналитических способностей. Налейте в термос горячего чаю, оденьтесь потеплее и шагайте вдоль реки или поля пока не увидите мурмурацию — стаю птиц в виде большого подвижного облака. Зрелище завораживает, но давайте в рамках анализа посмотрим на детали.

С тех пор как Рейнольдс в 1987 году предложил классическую модель мурмураций, мода на изучение согласованных движений постоянно растет. В девяносто пятом появилась модель Вичека, в две тысячи седьмом модель Кукера-Смейла — наиболее популярная сегодня. Кукер и Смейл описали мурмурацию как набор объектов, каждый из которых выбирает собственную скорость на основе средневзвешенной разницы в скоростях соседей, а вес каждой оценки зависит от удаленности соседей от объекта.

Дополнения к модели Кукера-Смейла публикуют каждый год. Тут вам и система с иерархиями, и топология переключения, и прочие математические экзерсисы. Не то, что-бы полет птиц всех уж так завораживал, тут скорее интересы практического рода: модель Кукера-Смейла оказалась крайне важной в теории машинного обучения.

Когда мурмурирующее облако захватывает преграду, часть птиц перестает видеть соседей, что можно представить как потерю пакета данных. Изучение этого вопроса Сетинкаем, Иши и Гаякавой в 2017 году пригодилось в области кибербезопасности и сетевом управлении динамическими системами. Да кто из нас не видел съемок группового запуска дронов и не слышал истории о миллионах беспилотных автомобилей на дорогах.

Если не рассматривать популярность, что остается общего между клеточным автоматом Крейга Рейнольдса, машинным обучением, теорией детерминированного хаоса, фрактальной геометрией Мандельброта и даже гладкими отображениями Уитни? Ничего из перечисленного не использует концепцию анализа. Новая парадигма исследований — синтез. Не разбить сложный объект на множество простых, а из простых объектов собрать сложный. И не просто сложный, а сложный эмергентно, то есть обладающий свойствами, которые нельзя получить сложением свойств составляющих объект частей.

Монополия аналитиков завершается. Это не значит, что они исчезнут, но и главными не будут. Если бы вместо данных мы говорили про кирпичи, пришлось бы признать: ситуация, при которой на каждого умеющего строить дом приходятся сотни тех, кто умеет дома разбирать, склонна к изменениям.

На практике это приведет к тому, что придя на работу в качестве специалиста по анализу данных вы услышите неожиданный ответ: «Анализировать у меня и секретарша может, ты мне данные синтезируй». А все почему? Правильно — за птицами надо было наблюдать.

Мысль о структурах

Мысль о структурах

Разглядывал старый снимок, невесть когда сделанный зимой из вертолета. На снимке пойма реки в Западной Сибири, уже и не помню какой (если кто подскажет — буду благодарен). Но дело даже не в снимке и не в реке.

Размышляя о различиях в структурных формах, образованных аллювиальными, делювиальными, пролювиальными, элювиальными и прочими процессами неизбежно вспоминаешь похожие визуальные образы. Это наталкивает на главный вопрос: возможно ли встретить среди устойчивых структур любую произвольную комбинацию элементов? Или даже больше: как связана динамика системы с ее структурой?

Нет, я не о гистограммах Шноля говорю. Это исследование удивительно и вызывает массу сомнений, особенно в части объяснения. Я скорее предполагаю, что в природной среде существуют структуры, устойчивость которых не зависит от их физической природы. Это может быть русло реки, ветвь дерева, сосулька, трещина — все что угодно, но при наличии определенной формы можно заранее предсказать дальнейшую динамику этой структуры. Нечто вроде планера из клеточного автомата Конвея.

Если подойти более практично, то вопрос можно рассмотреть в области дешифрирования спутниковых снимков. Очевидно, что рядом с произвольно выбранным пикселем можно встретить пиксель произвольной яркости. Но если мы возьмем больший охват, верно ли будет утверждение о том, что какую бы область на снимке мы не взяли, в ней всегда существует ненулевая вероятность встретить произвольную комбинацию пикселей? На первый взгляд ответ очевиден — конечно да, может быть какая угодно комбинация. Но если вдуматься, это утверждение равносильно мысли о том, что открыв свежий Сентинель вы прочитаете на нем свое имя и рассказ про то, как с велосипеда упали.

И потом, разве не указывает мысль о равной вероятности появления любой структуры на хаос в системе? С другой стороны, я давно шучу о том, что любое значение яркости пикселя следует воспринимать вероятностно, подобно атомной орбитали. Все потому, что разглядывая пиксель самого свежего снимка вы уже влияете на актуальное значение яркости. Незначительно влияете, но в нашем мире детерминированного хаоса размер вообще значения не имеет.

Тут мысль переключается на алеатику и размышления Б.В. Гнеденко о природе вероятности, но пожалуй все это необходимо жестко пресечь. Тем более, только что вспомнил: этот снимок я сделал в ванной после того как лодку мыл.

Живые системы. Часть 4

Добавим к системе пространств SX, SY третье пространство SZ, аналогично тому, как мы добавили простарнство SY к пространству SX. В такой системе пространств объекты возникают не только относительно каждого пространства, но и относительно друг друга. Иначе говоря, появляется наблюдатель — объект пространства SZ — взаимосвязь между пространствами SX и SY. Наблюдение — это состояние объекта при котором у него как части пространства изменяется относительная энергия (условия перехода из одного состояния в другое) и/или относительное количество возможных состояний.

Подобную систему назовем динамической. В ней происходят наблюдаемые изменения, поэтому введем понятие времени. Время — это размер области пересечения пространств с наблюдателем. Важно отметить, что если пространство может быть отрицательным (хотя пока мы не рассматривали этот вопрос, ответа на него нет), то время — это всегда положительная величина. Это «объем» области пересечения пространств.

Если аналогичным образом добавить четвертое пространство ST, получим систему пространств, которую будем именовать материальной или просто материей. Материя — это система объектов, включающая наблюдателя и наблюдаемый объект во времени. Несмотря на наличие четырех пространств, такая система и есть тот самый двумерный мир, в котором что-то происходит: две координаты определяют пространство, одна время и еще одна — наблюдателя.

Добавив еще одно пространство мы получим пространственно-временную систему, в которой пространство задано тремя координатами. Такая система наиболее близка нашему восприятию мира, но еще раз подчеркну: она формируется пересечением не четырех, а пяти пространств (одно время, три пространства и наблюдатель). Мы вольны добавлять любое количество пространств, но во всякой системе без вырождения одно пространство всегда будет скрытым. В бытовом смысле это можно представить в виде трехмерного мира, который мы можем наблюдать лишь в виде двумерной проекции.

Для иллюстрации концепции пятимерного пространства предлагаю отвлечься от абстракных примеров и рассмотреть более прикладную ситуацию. Задайтесь вопросом: каков ваш уровень владения языком зуриби? Очевидно, что этот вопрос не имеет смысла, поскольку рядом с вами сейчас нет собеседника, а значит нет общения как процесса, нет того, что можно измерить (одно пространство).

Внезапно появляется человек готовый к диалогу. Возникает сущность для измерения, но нет критериев оценки. Общаетесь вы на уровне эксперта или на уровне человека, которому в школе попался туристический разговорник? Те, кого абстракции пугают, возразят: «Я же могу сравнить скорость подбора слов, длину и разнообразие предложений». Но кто сказал, что на языке зуриби следует говорить быстро и разнообразно? Это пример системы с двумя пространствами: есть что измерять, но нет для этого инструмента.

Лишь с появлением второго собеседника вы можете оценить свой уровень владения языком (система с тремя пространствами). Но если зададитесь вопросом: насколько быстро вы овладеваете языком, вам потребуется четыре собеседника: две группы с двумя собеседниками, одна из которых служит метрикой. Это пример динамической системы пересечения пяти пространств, в которой одним из пространств являетесь вы как наблюдатель.

Возникают вопросы: откуда появляются новые пространства и что заставляет их объединяться? Понятно, что это лишь иная интерпретация старых: что было до Большого Взрыва и почему он произошел? Однако, прежде чем дать на них ответ, я считаю необходимым еще немного остановиться на концепции пятимерного пространства, дав его геометрическую иллюстрацию. С одной стороны, это послужит извинением за вульгарный пример с языком зуриби, а с другой, позволит лучше понять специфику пересечения пространств. В любом случае, без такого описания классификация элементарных частиц и фундаментальных взаимодействий окажется невероятно запутанной.

Живые системы. Часть 3

Прежде мы упоминали объект не конкретизируя его сущность. Такое допущение искупается тем, что мы рассматривали одномерное пространство, в котором помимо самого этого пространства более ничего нет. В самом деле, если пространство — это линейная совокупность состояний и условий перехода из одного состояния в другое, то мы не в силах выделить сущность, которая одновременно была бы частью пространства и при этом изменяла бы свойства пространства, в том смысле, что пространство с объектом должно принципиально отличаться от пространства без объекта.

Обозначим пространство о котором мы говорили ранее как SX и представим, что одновременно с ним существует еще одно пространство SY с аналогичными свойствами. Пока мы знаем про SX и SY лишь то, что каждое из них представляет собой множество состояний и условий перехода между состояниями.

Как SX и SY взаимосвязаны между собой? Существует три варианта такой взаимосвязи: полностью идентичны, частично взаимосвязаны и абсолютно невзаимосвязаны. Первый вариант возвращает нас к ситуации с одним пространством. Последний вариант не помогает в характеристике объекта: если пространства абсолютно независимы, то их следует рассматривать по отдельности, что опять-же возвращает нас к ситуации с одним пространством. Остается второй вариант — пространства частично взаимосвязаны.

Частичная взаимосвязь пространств может быть двусторонней, в том смысле, что оба пространства взаимно влияют друг на друга и односторонней, когда одно пространство влияет на другое, оставаясь неизменным. В обоих случаях мы можем ввести понятие объекта — участка пространства, на котором изменяется совокупность состояний и/или условий перехода из одного состояния в другое под воздействием иного пространства. Другими словами: объект — это участок SX на котором взаимосвязь SX с SY вызывает изменение количества возможных состояний SX и/или условий перехода между состояниями SX.

Участок пространства SX на котором взаимосвязь SX с SY не оказывает влияния на SX назовем осью симметрии пространства SX относительно пространства SY. Остальной участок пространства назовем областью пересечения SX и SY, подразумевая под этим, что все объекты обязательно находятся в области пересечения и никогда не могут возникать на оси симметрии.

Подобным образом мы можем бесконечно увеличивать количество пространств, при этом у них может быть бесконечное количество осей симметрии. В самом простом случае для возникновения объекта необходима одна ось симметрии, наличие области пересечения и минимум два пространства. С некоторой степенью вульгарности это можно представить в виде квадратного резинового листа у которого при растяжении одного края растягивается другой, но точка пересечения сторон (вершина угла листа) остается точкой и не может быть деформирована.

Главная особенность подобного «двумерного» мира — статичность. Каков бы ни был ваш лист по размеру, он всегда будет изгибаться на всем своем протяжении. Невозможно оценить как изгибается одна сторона при сгибе другой.

Занятно в этой связи то, что бесконечные иллюстрации четырехмерного пространства на примере двумерного существа на листе в который вонзают карандаш из третьего измерения абсолютно несостоятельны. В двумерном мире не только не может быть существ, но и вообще не может быть никаких изменений.

Представьте Вселенную в которой существует только две точки. Очевидно, что эти точки не будут двигаться относительно друг друга, более того, относительно друг друга они даже не будут существовать. Для того, что-бы объекты появились относительно друг друга, необходима некоторая метрика, эталон, объект для сравнения. Это как измерять длину двух отрезков линейкой которая пропорционально растягивается при переходе от одного отрезка к другому.

Представьте, что вы видите очень удаленный объект. Движется он или стоит на месте? Ответить на этот вопрос можно лишь сравнив его с некоторым третьим предметом.

Живые системы. Часть 2

Предлагаю на время забыть о физике, биологии и окружающем мире вообще. Вместо этого рассмотрим некоторую абстрактную S, которая может принимать значения s1, s2, …, sn при соблюдении некоторых условий E. Другими словами: S меняет значение с s1 на s2 при условии e1, а с s2 на s3 при условии e2 и так далее.

Назовем полную совокупность состояний S — пространством состояний S. На бытовом языке: пространство состояний — это область, в любой точке которой может оказаться некоторый объект, хотя бы теоретически.

По аналогии с пространством, назовем совокупность условий перехода между состояниями S — пространством энергий S. Еще раз подчеркну — не ищите этому физический смысл. Мы лишь строим некоторую мысленную конструкцию. Пространство энергий — это область, для попадания в каждую точку которой существуют достаточные условия.

Представьте себя в центре пустыни. Если вы S, то ваше пространство состояний — вся пустыня и даже весь мир, но ваше пространство энергий заключено в радиусе пары десятков километров вокруг вас. Это область до границы которой вам хватит сил. Пример вульгарный, но наглядный. Ниже я буду употреблять слово «пространство» без прилагательных, подразумевая под этим совокупность пространства состояний и пространства энергий.

Здесь возникает несколько важных теоретических вопросов. Вопрос первый: мы сейчас говорим о пустом пространстве, но возможно ли оно без объекта? Я полагаю, что в вырожденном теоретическом случае да. По большей же части пространство невозможно без объекта, более того, объект — это необходимое, но недостаточное условие существования пространства. Подробнее мы рассмотрим это утверждение позже.

Второй вопрос: обладает ли пространство структурой? У пространства состояний выделить структуру возможно, но сейчас я не вижу для этого оснований. Напротив, пространство энергий обладает симметрией, поскольку каждому условию прехода S из одного состояния в другое, можно поставить в соответствие несоблюдение этого условия. Однако, отмечу, что всякая структура может формироваться лишь при наличии в пространстве объекта, о сути которого я скажу позже.

Приведу прежнюю аналогию. Если пустыня вокруг вас бесконечна, то ваше перемещение по ней не имеет значения: вы всегда остаетесь в центре бесконечности. Но чем дольше вы идете (чем больше выполняется условий вашего перемещения), тем сильнее отличие текущих условий от изначальных. Но при этом вы всегда присутствуете в пустыне, становясь ее центром. Лишь объект структурирует пространство.

Вне зависимости от наличия структуры у пространства изменений, общее пространство, за счет структуры пространства энергий всегда будет структурировано. Биективность общего пространства — вопрос незатронутый, но, надеюсь, нам еще выпадет шанс к нему обратиться. Сейчас стоит обратить внимание на факт того, что каждое новое состояние S требует выполнения все большего количества условий. Если для достижения состояния s2 необходимо условие e1, то для достижения состояния s3 необходимы условия s1 и s2.

Вопрос о том, исчерпывается ли взаимоотношение пространства состояний с пространством энергий вышесказанным до конца не ясен. Наконец, последний вопрос: насколько равномерно пространство в том смысле, что s1 эквивалентно sn, а e1 эквивалентно en? Пока я исхожу из идеи эквивалентности, но не настаиваю, полагаясь на дальнейшие изыскания в этом вопросе.

Итак, мы дали определение пространству состояний (все возможные состояния) и пространству энергий (все условия прехода из одного состояния в другое). За счет пространства энергий совокупное пространство всегда обладает структурой, но при условии наличия в этом пространстве некоторого объекта, которому присущи изначальное положение и набор условий. Достижение каждого последующего состояния требует все большего количества условий. Это дает нам ключ к пониманию природы времени, материи и наблюдателя.

Живые системы. Часть 1

Я никогда не собирался быть художником, но всегда хотел уметь рисовать. Особенно впечатляют быстрые и точные зарисовки, которые могут быть более содержательны, чем любая фотография. Года не проходило без того, что-бы я не пытался развить в себе художественный навык, но тщетно. Несколько месяцев назад я предпринял очередную попытку: каждый день перед сном (если я спал в этот день) закрывая глаза заставлял мозг рисовать в воображении простые геометрические фигуры: точку, прямую, плоскость. Я полагал, что освоив этот базовый урок смогу перейти к большему. Идея невероятно глупа, поскольку привела лишь к тому, что я в очередной раз начал размышлять о свойствах многомерных пространств и роли в них наблюдателя. Даже перечитал свою неопубликованную монографию «Живые системы в растительности», обнаружив там пару занятных мест.

«Живые системы» были написаны во время моей работы кочегаром — лучшее занятие для умственного труда: нет изнуряющей работы, постоянно тепло и всегда в избытке одиночество и романтика. К сожалению, это стоило мне карьеры, но случись возможность я повторил бы все заново. Удовольствие от найденных закономерностей было одним из самых больших в моей жизни. Пожалуй даже самым большим.

Полагаю, пришло время вернуться к этому вопросу и дать формализованное определение жизни. Не уверен в результате, но процесс увлекательный, а потому я решил показать его вам. Даже если будет скучно, я получу стимул формулировать идеи максимально вменяемым образом. Сегодня все так быстро меняется — хороший шанс быть первым, кто получит премию Абеля за серию постов в интернете. Ладно, шучу, мне достаточно и нобелевки.

Это размышление о том, что такое жизнь. В монографии я ссылался на зменитую фразу Шредингера: «Деятельность живого организма нельзя свести к проявлению обычных законов физики». Но давайте не будем самонадеянными и рассмотрим логику повествования как занимательный пример игры ума.

Перед тем как начать, я обязан предупредить: в тексте неминуемо возникнут слова: красота, гармония, важность и тому подобные. Я употребяю их лишь по причине того, что не знаком с адекватной альтернативой, а изобретать новые термины без нужды считаю плохим тоном. Эти слова позволяют легче понять сказанное. Дабы окончательно снять непродуктивную критику, я заявляю, что все написанное ниже есть лишь некоторый умственный экзерсис. Будем считать это специфическим жанром художественной литературы.

Итак, начнем. Вы замечали, что у понятия «жизнь» есть огромное количество определений, но все они звучат чрезвычайно слабо? Обычно жизнь описывают как состояние материи, которой присущи ряд признаков: рост и развитие, размножение, реакция, метаболизм и другие. С этим трудно поспорить, но давать определение описывая признаки подходяще скорее нерадивому студенту, чем ученому. Не выдерживает критики даже утверждение о том, что отличие живого от неживого в клеточном строении или генетическом коде. С тем же успехом можно предположить, что феномен жизни присущ лишь объектам, которые обладают пятипалой кистью. Про то, в какой мере должны присутствовать признаки для признания объекта живым даже говорить страшно. Любой организм содержит в себе явно неживые компонеты, но можно ли считать живым биогеоценоз, в состав которого живые компонеты входят? Феномен смерти дискретен или континуален?

Анри Пуанкаре

Месье Пуанкаре, крутите барабан

Отдавая себе отчет в том, что весь нижеследующий текст может оказаться беспросветной хуетой, либо тривиальным знанием у профессиональных статистиков, я все-же рискну поделиться с вами некоторым математическим экзерсисом.

Со времен Виболда и Ришаля де Форневаля теория вероятностей достигла потрясающих успехов, железно доказав свою эффективность в решении производственных и научных задач. Несмотря на это, меня не покидает мысль о том, что во всех этих расчетах кроется какая-то наебка. Взять хотя-бы игнорирование влияния наблюдателя на эксперимент. Или даже основу основ — само определение вероятности, достаточно невнятное, сведенное к текстовому описанию отношения успешных событий к общему количеству событий наблюдаемых.

Мы настолько привыкли к удобству математики, что часто забываем ее основную суть: всякие вычисления производятся не над самими объектами, а над их математическими моделями. Школьное «одно яблоко плюс одно яблоко равно два яблока» не имеет отношения к реальности: расчеты ведутся над образами этих яблок, этакими идеями яблок платоновского мира. Реальность же такова, что при идентичных операциях сложения одному достается 400 грамм яблок, а другому 100 грамм сморщенных сухофруктов. Не будем вдаваться тут в проблемы нуль-меры и количественных измерений, иначе в рассуждениях мы не сможем дойти до логического финала.

Подобно яблокам, классический пример с подбрасыванием монетки крайне теоретизирован: считая вероятность, мы совершенно не принимаем в расчет ложиться ли монетка головой орла кверху или перевернутой решкой, какой стороной ударяется монетка и бесчетное количество других факторов. Если уж рассматривать проблему вероятности, то явно на каком-то другом примере.

В недавней бытовой переписке решив сослаться на идеи Б.В.Гнеденко я освежил, к своей радости, модель рулетки Анри Пуанкаре, которая служит прекрасным инструментом для изучения сути вероятности. Представим себе круг, поделенный на сектора и стрелку, которая свободно вращается в этом круге. Или же равнозначный круг, который обращается вокруг неподвижной стрелки (элемент 1 на рисунке). Физической реализацией такой модели является известный барабан из «Поля Чудес». Но для простоты мы оставим на нем лишь два сектора (A и B), каждый из которых будет занимать ровно половину круга. Какова вероятность того, что стрелка остановится в одном из секторов?

Диск Пуанкаре и пыль Кантора

Классический подход говорит нам не только о равной вероятности обоих исходов, но и о том, что их сумма равна единице (исходя из формулы 2). Если с первым утверждением можно согласиться, то второе содержит в себе элемент лукавства. Действительно, сумма вероятностей будет равна единице, но лишь в том случае, когда мы используем очень грубый подход в оценке результата.

Поскольку вероятность — это прежде всего свойство события, определимся с перечнем событий, которые возникают в модели Пуанкаре и причинами их вызывающими. Очевидно, что последние связаны исключительно с физическими свойствами модели, а именно шириной стрелки (элемент 3. на рисунке) и зоны перехода от сектора A к сектору B. В идеальном случае, оба этих значения будут равны нулю, но в реальности мы сталкиваемся с тремя видами событий (4.):

  1. Ширина стрелки больше одного из секторов. При каждом обращении стрелка будет указывать одновременно на два сектора. В этом случае классическое понятие вероятности теряет смысл, поскольку вероятность указания стрелки на каждый из секторов равен единице (P=1+1=2);
  2. Ширина стрелки равна одному из секторов. Здесь вероятность имеет смысл, но принципиально не может быть определена, поскольку совпадая ровно с сектором, мы не можем гарантировать того, что условие 1. не нарушится при более детальной оценке. Вообще, такое событие требует отдельного рассмотрения и трепетного подхода к определению числа как такового.
  3. Ширина стрелки меньше одного сектора. В этом случае возможны два варианта:
    3.1. Стрелка шире области перехода между секторами. В этом случае мы не можем говорить о возможности расчета вероятности, поскольку в нашей модели возможно событие, указанное в пункте 1. — стрелка одновременно указывает на два сектора.
    3.2. Стрелка уже области перехода между секторами. И в этом случае мы можем получить указание стрелки на два объекта сразу (если она остановится в переходной зоне между двумя секторами.

Во всех случаях классический подход к определению вероятности (P=m/n) лишен смысла, поскольку имея два возможных события мы не принимаем в расчет ситуацию, когда эти события выполняются одновременно (либо в иной трактовке — не выполняется ни одно из событий). В случае с монеткой — мы полагаем, что вероятность выпадения одной из сторон составляет 0,5, игнорируя возможность того, что монетка встанет на ребро (сломается, укатится, зависнет в воздухе…). Стандартное понимание вероятности подразумевает, что Pa+Pb = 1, в то время как для реальности соответствует запись Pa+Pb+Pab = 1.

Обычно, событие Pab настолько редко, что им можно пренебречь. Но что, если оно более вероятно, чем суммарное наступление событий Pa и Pb? Представим себе, что наш круг разделен на сегменты по принципу пыли Кантора: круг делится пополам на сегменты A и B, затем из каждого сегмента часть меняет значение на противоположное, после этого часть этой части меняет значение и так итеративно до бесконечности? Как рассчитать вероятность события, которое при детальном рассмотрении оказывается множеством разных событий?

Обратимся к нашей формуле P=m/n на примере измерения длины отрезка (элемент 6. на рисунке).

Формула вероятности

Не вдаваясь в топологические подробности (их легко можно посмотреть в работах Мандельброта, Шредера, Федера, Хаусдорфа, Минковского и других авторов) кратко замечу, что всякое геометрическое измерение можно представить как покрытие объекта элементарными (неделимыми) метриками единичной величины. В этом случае размер объекта будет равен количеству таких метрик в степени размерности (точка а0, прямая a1, площадь а2 и т.д.).

В том случае, когда количество метрик конечно, вероятность конгруэнтна размеру: если на десяти отрезках три «ложатся» на объект, то длина отрезка = 3, а вероятность его обнаружения в метрике 3/10. При этом вероятности так же присуща размерность, как и расстоянию. Соответственно, формула P=m/n — есть лишь частный случай для a=1, а в общем виде формула вероятности выглядит как P=(m/n)a. В справедливости этого утверждения легко убедиться на примере расчета вероятности заполнения некоторого поля плоскостью (элемент 7. на рисунке)

Но как быть, если число метрик не ограничено? Как измерить длину отрезка, образованного отсечением прямой, разбитой на канторову пыль? Соответственно, как рассчитать вероятность встречи этой пыли в одной из метрик? Иными словами, поскольку каждая метрика является опытом («есть в нем объект или нет»), то как рассчитать вероятность если число опытов бесконечно? Я не вижу иного способа, кроме асимптотического.

Но более самого расчета длины/вероятности интересно то, что размер метрики является отношением возможного числа опытов (объем пространства измерений) к числу проведенных опытов (формула 9.) Нехитрые математические манипуляции показывают, что вероятность события, равно как и размер объекта в пространстве определяются формулой 10. Причем в ситуации, когда N=n, т.е. проведены все возможные опыты, формула принимает частный вид P=m/n.

Но хватит теории, давайте на практике посмотрим, как работает данная формула. Для этого воспользуемся классическим опытом с монеткой. В нынешний век генераторов псевдослучайных чисел подбрасывание монетки выглядит архаично, но простите меня — я охотнее верю в то, что могу держать руками. Особенно после успешных опытов с рандомными числами. В качестве инструмента исследования взята пятидесятирублевая монета, выпущенная тридцать пять лет назад:

Монета 50 рублей

В таблице приведены результаты бросаний монетки. Единица — орел, ноль — решка. Задача выглядит следующим образом: мы подбросили монетку 25 раз и получили некоторую вероятность выпадения орла. Какова вероятность выпадения орла после пятидесяти бросков?

В классическом случае (P=m/n) вероятность выпадения орла после 25 испытаний составила примерно 0,6. Проследив тренд мы можем предположить, что к пятидесятому броску эта вероятность немного возрастет (до 0,63). При расчете по предложенной формуле, вероятность выпадения орла на двадцать пятом броске составила примерно 0,36 и к пятидесятому увеличится до 0,48

Здесь и далее синяя линия — накопленная вероятность по классической формуле, красная линия — накопленная вероятность по формуле 10.

Согласен, что рассчитывать регрессию в табличном редакторе — последнее дело, но в данном случае нам не столько интересны полученные значения, сколько различие в подходах к оценке вероятности. И все-же явно видно, что ни первый, ни второй тренд не отличаются достоверностью: слишком сильное влияние оказывает первый замер, который в обоих случаях дает вероятность, равную единице. Картина несколько меняется, если это наблюдение исключить:

Теперь вероятность в обоих случаях примерно одинакова (0,82), но обратите внимание на коэффициенты достоверности аппроксимации.

В реальности после пятидесяти бросков монеты изменение вероятности выпадения орла происходило следующим образом:

Принципиальным отличием предложенного метода от классического определения вероятности является то, что при первых наблюдениях формула 10. не выдает значительных величин вероятности. Если в классическом случае у нас может быть лишь два варианта исхода события, то здесь число вариантов не определено и под вероятностью понимается возможность конкретного результата в опыте. Проще говоря, классический метод отвечает на вопрос: какова вероятность, что выпадет орел, а не решка. Предложенный метод отвечает на вопрос: какова вероятность, что выпадет орел, а не наступит любое другое событие. Поэтому нельзя рассматривать низкую вероятность выпадения орла в первых опытах как знак того, что решка может выпасть с высокой вероятностью. С высокой вероятностью может произойти все что угодно. По мере того, как орел выпадает все чаще, вероятность его выпадения растет, приближаясь к значению 0,5.

Рассмотрим более практичный пример, связанный с прогнозом вероятности изменения температуры воздуха в городе Шахты. За прошедшие дни декабря была отмечена следующая температура воздуха: -3, -2, -1.5, -1.29, 0.29, -0.17, -0.25, -1.4 градусов. Средняя температура составила -0.97 градусов. Подсчитаем вероятность того, что в ближайшие дни наступит потепление. Для этого переведем данные о температуре в бинарный вид (0 — холоднее -0.97 градусов, 1 — теплее -0.97 градусов): 0,0,0,0,1,1,1,0.

Классическая формула через неделю обещает нам потепление с высокой вероятностью (0,91). Предложенная формула 10. говорит о том, что потепление через неделю скорее маловероятно (0,32). Конечно же, не стоит относиться к такому прогнозу серьезно (я еще не окончательно сошел с ума). Предложенный пример следует рассматривать исключительно как полушутливое использование данных с показательным распределением. Во всяком случае, пока не будет доказано обратное.

Из всего сказанного ценна не столько формула, которую нужно всячески критиковать и тестировать, сколько важные соображения:

  1. Теория вероятностей это лишь математическая модель и не стоит об этом забывать. Реальность гораздо сложнее и многограннее, чем безальтернативный выбор из двух вариантов (вспоминается аксиома Эскобара).
  2. Классическая теория вероятностей не работает в ситуациях, когда пространство событий нечетко, либо имеет дробную топологическую размерность. Более того, вероятность наступления события зависит от выбранных единиц измерения
  3. Рассматривая два события в привычной трактовке вероятности, не учитывается эмергентная связь между ними.
  4. Вероятность может применяться и применяется для оценки размеров, но лишь в случае измерения Эвклидовых фигур.
  5. Важно не только количество проведенных опытов, но и то, сколько опытов предполагается, либо возможно провести (объем пространства измерений). Если мы получили одинаковый результат в десяти опытах, вероятность такого результата неодинакова для случая, если опытов предполагалась всего десять и случая с тысячами опытов.

В этом месте, я полагаю, разумно прервать наши размышления о природе вероятности и объявить рекламную паузу.

P.S. Ян, спасибо за файл.

Субъективные вычисления

Субъективные вычисления

Где моя милая маска с розовыми щечками? Я хочу сыграть с вами в одну игру. Представьте на некоторое время, что в мире не существует такого понятия как число. Никакого количественного анализа, теории чисел и кватернионов. Никакой интервальной арифметики и ферматистов. Только здравый смысл, под которым люди подразумевают формальную и символическую логику. Если что и осталось от чисел, так это значки арабских цифр, которые никакого математического смысла не несут. Но не беспокойтесь. Через десять секунд после начала игры, вы непременно умрете, если не сумеете найти возможность вычисления производной единой функции страдания. Игра началась.

Десять секунд. Что здесь? Авторучки которые не пишут, остывшие батареи, светодиодная реклама и домофон. Обозначим авторучки как A, батареи как B, светодиоды как C, а домофон как D. Еще есть духовные скрепы, они в последнее время всегда с нами, их обозначим как E. Итого, имеем множество {A,B,C,D,E}, каждый элемент которого является аргументом функции страдания людей. Для формализации, назовем каждый из этих элементов объектом (obj), содержащим разные характеристики и их значения. Например:

obj A = {название: авторучки, материал: пластмасса, производство: Китай, …};

Наверняка существуют характеристики, которые присущи всем объектам без исключения. Например, название, оно же — принадлежность к определенному множеству объектов (Y). Если есть принадлежность к множеству, значит она имеет некоторое значение истинности (μ). Более того, названий и соответствующих им значений истинности может быть сколь угодно много…

Девять секунд. Что еще? Трансфинитное число (Ν), поскольку мы всегда имеем некоторый порядок в натуральном множестве, кардинал (card), факторизация (Φ). Иными словами:

obj A = {{Y1: μ1, Y2: μ2, …, Yn: μn}, Ν: ν, card: κ, Φ: [φ1, φ2, …, φn]};

Функция принимает на вход каждый такой объект. Но результат этой функции — страдание, то есть явление не только не сравнимое, но еще и различное для каждого человека. Это можно представить так, будто у каждого человека есть своя собственная субъективная функция страдания. Обозначим ее как sub(A), где A — объект, поступающий на вход функции.

Восемь секунд. Кто здесь? Безрукий инвалид (sub1), активистка ЗОЖ (sub2), урбанист (sub3) и я (sub4). Введем шкалу страдания, как ответ субъекта на объект (sent): ужасно (Ter), плохо (Mal) и безразлично (Nor). Для этого отбросим всякую мораль и будем максимально циничны. Безрукому инвалиду неисправные авторучки и светодиоды не представляют проблемы. Холодные батареи и домофон отвратительны, а скрепы просто плохи. Такие же наблюдения проведем над всей группой, составив таблицу значений всех субъективных функций по аргументу объектов:

Субъект\ОбъектA (авторучки)B (батареи)C (светодиоды)D (домофоны)E (еще и скрепы)
sub1 (инвалид)NorTerNorTerMal
sub2 (активистка ЗОЖ)NorTerNorTerMal
sub3 (урбанист)NorNorNorTerMal
sub4 (вы)MalMalNorTerMal

Страдание у всех связано с разными факторами, или по другому: значение разных субъектов по одному объекту может, но не обязано совпадать.

Семь секунд. Прежде чем искать производную, необходимо выделить саму универсальную функцию страдания. Это значит, что мы должны учитывать только те объекты, которые имеют одинаковое воздействие. Плохие авторучки для вас и безразличные батареи для урбаниста не приводят к аналогичным значениям у других субъектов. Но все субъекты одинаково реагируют на домофоны, светодиоды и духовные скрепы. Или по другому:

sub1(С) = sub2(D) = sub3(Е) = sub4(С) = Nor;

sub1(С) = sub2(D) = sub3(Е) = sub4(С) = Ter;

sub1(С) = sub2(D) = sub3(Е) = sub4(С) = Mal;

К каким множествам принадлежат эти объекты? Что у них общего? В общем случае, любой объект входит во все множества универсума, но с разной истинностью. Например, все эти объекты относятся ко множеству продуктов питания с ничтожной истинностью. Мы вольны рассматривать любые множества, но поскольку времени мало…

Шесть секунд. Объекты не приносят выгоды, не принадлежат субъектам, создают неудобства, постоянно на виду и появились относительно недавно. Список можно продолжать бесконечно, но пока остановимся на нем. Необходимо понять, какие из этих множеств, как свойств объекта влияют на функцию страдания, а какие включены сюда ошибочно. Для этого составим таблицу в которой на пересечении результата субъекта по объекту и множества, входящего в объект укажем значение истинности множества по шкале: сильно (For), средне (Med), слабо (Inf). Светодиоды своим светом создают неудобство, иногда они раздражают, но в целом они связаны со значением Nor средне (Med). Иначе это можно выразить так: оба заявления о том, что светодиоды влияют и о том, что не влияют на нормальное состояние скорее ложны. То, что светодиоды создают неудобство это не ложь, но и не истина. Правильно назвать ее полуправдой.

Для остальных множеств повторим аналогичную процедуру оценки истинности:

Множество\ОбъектY1 — Не приносят выгодыY2 — Не принадлежат имY3 — Создают неудобстваY4 — Постоянно на видуY5 — Появились недавно
sub(C) = Nor (светодиоды)ForForMedForFor
sub(E) = Mal (еще и скрепы)ForForInfInfMed
sub(D) = Ter (домофоны)MedMedForForFor

Теперь, необходимо нарисовать простейший график зависимости силы страдания от истинности принадлежности объекта множеству…
График страдания

Пять секунд. Так, видно, что субъективная функция страдания по принадлежности объектов множествам Y1 и Y2 (не приносят выгоды и не принадлежат им) ведет себя одинаково. Если истинность объектов снижается, то возрастает степень страдания от них. Другими словами, чем правдивее утверждение, что домофоны, светодиоды и скрепы принадлежат и выгодны окружающим людям, тем выше величина страдания этих людей.

Иначе себя ведет себя функция по принадлежности объектов множествам Y3, Y4 и Y5. Если утверждения о том, что объекты создают неудобство, постоянно на виду и появились недавно абсолютно истинны, то субъект возвращает радикальные значения (ужасно и нормально). Если же ложность этих утверждений повышается, страдания смещаются в область средних значений.

Четыре секунды. Противоречивое влияние множеств Y3, Y4 и Y5 на величину страдания говорит нам о том, что они найдены не самым удачным образом. Нам необходимо либо разложить их на подмножества и повторить процедуру, либо найти иные множества для рассмотрения, например множество объектов, которые издают звук. Очевидно, что для светодиодов значение истинности принадлежности к этому множеству будет соответствовать μ = Inf, для духовных скреп μ = Inf, для домофонов μ = Med.

Так мы можем подобрать наиболее подходящие свойства объектов, которые как раз и определяют для нас результат субъективной функции страдания по этому объекту. Более того, мы вольны подобрать любое количество самих объектов, главное, что-бы мнение всех людей по ним совпадало. Число объектов для каждого субъекта бесконечно, но познавательную ценность имеют лишь объекты, субъекты по которым конгруэнтны.

Три секунды. Фактически, в данном случае мы используем аксиому о том, что объективность есть не противоположность, а частный случай субъективности. Если есть субъективное значение по каждому вопросу, то мы можем представить его как функцию, в которой вопрос будет аргументом. При этом, у каждого будет своя подобная функция, все вместе составляющие множество субъективных мнений. Из пересечения области значений всех таких функций мы можем выделить объективное подмножество значений функции, а область определения указанных функций в границах объективного подмножества будет в нашем случае набором универсальных объектов, с которыми все функции взаимодействуют с одинаковым результатом.

Это вторая аксиома, лежащая в основе субъективных вычислений. Первая, как вы верно догадались, представляет собой утверждение об отсутствии количественного подхода. Или по другому: любое количественное измерение есть лишь более формализованная качественная оценка. А как же комплексные числа? — спросите вы. А никак — отвечу я. А еще лучше за меня ответил Эйлер (Полное введение в алгебру) четверть тысячелетия назад:

Две секунды.

«Квадратные корни из отрицательных чисел не равны нулю, не меньше нуля и не больше нуля. Отсюда ясно, что квадратные корни из отрицательных чисел не могут находиться среди возможных (действительных, вещественных) чисел. Следовательно, нам не остается ничего другого, как признать их невозможными числами. Это приводит нас к понятию чисел, по своей природе невозможных и обычно называемых мнимыми или воображаемыми, потому что они существуют только в воображении.»

Субъективные вычисления представляют собой часть ряда: булева логика — фаззи логика — субъктивна логика, в котором вначале вводится метрика для каждого объекта, затем добавляется метаметрика, отражающая качество метрики, а в итоге вводится понятие субъекта как функции, построенной по принципу «черного ящика», принимающей на вход метрики с метаметриками и выдающими недетерминированный результат.

Одна секунда. Мы говорили, что в качестве объектов мы вольны использовать любые множества (если ответы субъектов конгруэнтны). Значит мы можем провести факторизацию объектов и подставить их части в качестве аргументов (кстати, тонкий вопрос, возможно, тут я не прав, поскольку существуют проблемы эмергентности). График функции страдания по новым объектам выглядит в нашем случае так:
Функция страдания

Размером кружков показана величина истинности принадлежности объекта страдания к множеству объектов с единой величиной страдания. Ну а как же производная? Вспомним, производная есть предел отношения приращения функции к приращению аргумента при котором последний стремится к нулю, в нашем случае отсутствию. Оценить производную при конечном числе аргументов невозможно, что значит, что производную мы можем рассчитывать только по функции аппроксимации, впрочем, как и в случае с обычным исчислением.

Впрочем, все это уже не имеет значения, потому что вы умерли. Время вышло.