Доклад

Логика, лингвистика, история, онтология

Уважаемые коллеги!
В моем выступлении присутствуют две темы. Одна из них, как представляется, имеет некоторую корреляцию с исследованиями микробиолога Олескина Александра Владимировича, доклад которого был здесь представлен в мае. Если кратко, суть его исследований в том, что у микроорганизмов, которых вокруг нас неизмеримое множество, присутствуют средства коммуникации, в результате чего, происходит их социализация, что нельзя не учитывать при исследовании разумной составляющей человека, поскольку есть предположение, что в качестве элементной базы разум использует не только нейроны, как это традиционно считается, но и вовлекает в свои процессы ту самую, социализированную микробную среду. Если принять такое предположение, то следует признать, что наше сознание имеет более широкую локализацию, причем "физические границы" индивидуальности оказываются размытыми. Другое следствие - в распространении информации участвуют не только традиционные каналы, но и микробная среда, которая охватывает весь земной шар. Такие выводы могут стать подарком экстnасенсам и иным представителям "эзотерических наук".

Я далек от биологии, потому принимаю на веру информацию исследователей. Большую часть своей активной жизни я занимался разработкой так называемых логических схем, потому хорошо представляю, как устроен компьютер. А компьютер сейчас является одним из самых вероятных претендентов на роль новой разумной сущности. Именно на этом я бы и хотел сейчас остановиться.

В компьютерной технике известна теорема, согласно которой, компьютер любой сложности может быть построен из логических элементов только одного типа, реализующего очень простую логику, типа "2И-НЕ". Огромные схемы можно представить как совокупность связанных между собой этих простых одинаковых элементов. И если компьютер будет способен мыслить, это значит, что будет мыслить структура, состоящая из множества простых элементов с функцией, которую легко можно воспроизвести любым способом. Естественно, такую функцию способен воспроизводить и сам человек. Если посмотреть внимательно на такую модель, где логические функции исполняют люди, можно увидеть, что такой компьютер существует уже не одну тысячу лет. Именно так устроено государство. В нем каждый элемент - человек связан со многими другими элементами и выполняет определенную функцию, сложность которой намного превосходит то, что требуется от простейшего логического элемента, лежащего в основании компьютера. Государство много сложнее самого сложного компьютера и потому можно уверенно предположить, что оно представляет собой самостоятельно мыслящую субстанцию, возможно, имеющую собственные цели. При этом, едва ли кто-нибудь пытался наладить контакт между человеком и этим мыслящим объектом. Подданные государства, включая его правителя вместе со всеми властными структурами являются не более чем инструментами этого "мыслящего существа", не имея никакого представления о его истинных целях, поскольку контакта с ним нет.

Здесь надо отметить, что проблема контакта между двумя разумными сущностями весьма непростая. Для ее понимания можно рассмотреть, как происходит контакт между компьютером и человеком.

Пусть, например, компьютер встроен в систему управления самолетом, в которой задействован человек. Компьютер добывает разнообразную информацию о параметрах полета и выводит ее на экран в форме, удобной для восприятия пилотом, - в виде картинок и цифр. На основании этой информации пилот выбирает необходимые режимы, передает с пульта управления соответствующие сигналы. Здесь надо отметить, что форма представления информации была адаптирована для восприятия человеком, ибо изначально она поступает от датчиков в виде напряжений, импульсов и прочих сигналов. Программа преобразует сигналы в картинки и цифры. Соответственно, управляющие воздействия человек задает в удобной для себя форме, - в виде угла поворота штурвала, включения определенных тумблеров. Компьютер преобразует сигналы от человека к другому виду, в котором его способны "понять" устройства управления. Т.е вся эта цепочка ориентирована на восприятие человека. Более того, человек должен пройти специальную подготовку, чтобы разбираться во всем этом многообразии сигналов. Неспециалист не сможет управлять системой. Если же человек будет исключен из контура управления, необходимости в адаптациях не будет, входные сигналы по определенному алгоритму сразу преобразуются в управляющие.

Преобразование сигналов, - это подбор подходящего языка для перевода исходной информации. Необходим переводчик. Чем сложнее система, тем труднее понимание языка ее внутренних процессов. Так, например, если вывести всю информацию из компьютера в виде напряжений во всех узловых точках, то при такой самой полной информации едва ли можно будет понять задачу, которую в данный момент решает компьютер. Т.е. основная задача для контактов между разумными существами, - установить соответствие понятий, выраженных разными способами.

Компьютерная модель дает возможность предположить, что для интеллектуальных проявлений не требуется нечто очень сложное, для этого достаточно самых простых взаимодействий между элементами, составляющими структуру. Для интеллекта необходима структура, ее элементы могут быть любого типа. При создании человеком новых структур, происходит воплощение человеческого разума в неких формах, его перенос на другие материальные носители. Возникает вопрос, - насколько необходим начальный интеллект, роль которого здесь человек исполняет? Во всяком сдучае, плоды человеческой деятельности мы понимаем как трансляцию собственного интеллекта и едва ли мы будем готовы признать, что наши творения содержат больше тог, что мы в них вложили.

Завершаю первую часть предположением о том, что интеллект должен быть весьма распространен, поскольку для его возникновения необходимы весьма простые элементы и функции, но вот обнаружение разума - задача непростая. Поискам источников интеллектуальных проявлений, лишенных внешних влияний, посвящена вторая часть моего выступления.

Быть может, самым простым проявлением разумного начала, можно считать процесс выявления общих признаков у разнородных элементов и объединение однородного в соответствующие группы. Во всяком случае, подобный принцип лежит в основании человеческого языка, - у разных предметов и явлений выявляется нечто общее, что воплощается в слово. После выделения характерных признаков, происходит причисление элемента к определенному типу. Это не что иное, как задача классификации. Язык начинается с классификации явлений окружающего мира.

Случилось так, что мне пришлось решать задачу классификации для практического применения. В рамках одного из проектов требовалось вновь поступающие случайные тексты произвольного содержания направлять в соответствующую рубрику. В начале это выполнялось вручную, затем, при нарастании объема, возникла необходимость написать программу, которая автоматически направляла бы текст в нужный раздел. В результате, после ряда экспериментов, мне удалось найти алгоритм удовлетворительной классификации. Он был основан на расчетах, выполняемых по эмпирически выведенной формуле. Разделение текстов по содержанию происходило настолько четко, что у меня появилось желание запатентовать в какой-то форме алгоритм или опубликовать статью на эту тему. По этому поводу, наконец, с большим опозданием, я принялся изучать вопрос, - какие на данный момент имеется наработки (это было в 2008-м году). Оказалось, что алгоритм, по которому можно получить цифру, обозначающую релевантность двух текстов, в лингвистике известна (метод "TF-IDF"). Я сравнил две формулы, - известную и ту, что получилась у меня. В них участвуют одинаковые исходные данные, однако моя формула, полученная совершенно независимо, на основании практического исследования, несколько отличается от употребляемой в матлингвистике. В моей формуле присутствует константа, равная одной пятнадцатой. Я потратил немало времени, чтобы ее исключить, однако, ничего не получилось, в окончательном варианте она осталась. Потом обнаружил, что ее значение равно константе Ципфа для русского языка. Следовало бы убедиться, хотя бы эмпирически, в том, что это действительно так, для чего необходимо провести исследование для других языков, где эта константа другая. Задача превышает мои возможности, хотя вопрос интересный. Положительный результат расширил бы понимание сути константы и повысил бы точность вычислений, выполняемых по известной формуле. Она не зависит от языка и, возможно, хороша для английского, а для других языков необходима некоторая корректировка. Статью я опубликовал в журнале "Инновации" №8 за 2008-ой год. В Интернете ее можно посмотреть по адресу: https://cyberleninka.ru/article/v/vychislenie-informatsii-soderzhascheysya-v-tekstah

Итак, применяя несложный алгоритм, можно судить о содержании произвольного текста. При этом, в алгоритме участвуют только цифры, он не учитывает семантику слов, грамматику, фразы, предложения, - ничего "специфического языкового", в нем только частоты повторения и значимость конкретного слова в языке. Оказалось, что этого достаточно, чтобы сравнить тексты по содержанию, т.е. сделать некоторый вывод о его смысле. Такая ситуация провоцирует дальнейшие эксперименты, в которых можно отвлечься от источника, откуда получены эти цифры и рассматривать текст как некую систему, состоящую из элементов - слов и сопоставлять ее с другими системами. Прежде всего, с иноязычными текстами.

Данный алгоритм должен давать представление о содержании текстов незнакомого языка, для чего необходим только словарь. В принципе, система может быть и совсем другая, нелингвистическая, и если найти аналогии в ее элементах, можно попытаться определить смысл этой системы, сопоставляя ее с текстами на разные темы. Т.е. можно предположить, что, совершенно формально можно вычислять смысл музыкального произведения или живописного полотна. Задача сводится исключительно к идентификации составляющих их элементов. Можно пойти дальше и пытаться искать смыслы систем любого рода, - физических, или, например, социальных. Это выглядит фантастически, однако есть в этом некоторая логика. Одна из других "фантастических" задач - это попытаться найти скрытые смыслы текстов, они тоже могут оставлять формальные следы. Но даже простые задачи такого направления весьма трудоемкие. Я занимался массивом из 500 случайных текстов Интернета на русском языке, длиной от 50 до 10 тысяч слов. Исследование заняло целый год при весьма плотной загрузке. Здесь надо заметить, что успех формальных методов поиска смысла может говорить о том, что сам смысл - явление формальное, т.е. он исходит из глубин бытия.

Продолжение данной работы было такое. Если в первом исследовании существовал каталог в котором следовало разместить случайные тексты, то далее на основании того же алгоритма я попытался написать программу, которая сама создает такой каталог. Задачу поставил так: "Имеется неорганизованный массив из 500 текстов. Программа выбирает случайный текст, пропускает его через алгоритм сравнения со всеми текстами массива, выявляется текст с наибольшим значением параметра "степень соответствия", и если оно превышало некоторый пороговый уровень, тексты объединялись в единый раздел. Далее процесс повторяется, но в нем участвуют только свободные тексты и вновь образовавшиеся разделы, которые для алгоритма выглядят как единый текст.

Запустив процесс, я уже не вмешивался в его течение и только наблюдал результаты. Разделы расширялись, объединялись и распадались. Причиной распада было то обстоятельство, что после каждого изменения раздела, выполнялась по тому же самому алгоритму проверка всех входящих в него текстов на соответствие изменившейся общей тематике. Тексты, для которых значение параметра соответствия получалось ниже порогового значения, из раздела исключались и в следующих циклах они уже выступали как свободные элементы системы и участвовали в испытаниях на соответствие тематике очередного случайно выбранного текста или раздела системы.

Результаты получились весьма интересные. Система текстов, начиная свое развитие от абсолютно хаотического состояния, постепенно нормализовалась, в ней возникали разделы, которые все более соответствовали каталогу, который был предварительно составлен на основании интуиции, т.е. на основании человеческого разума. В алгоритме присутствовала операция сравнения текущего каталога с этим эталоном. Изменение параметра соответствия отображало направление развития системы и зависимость этой истории от параметров алгоритма. В зависимости от параметров, развитие происходило по схожему сценарию. Начиная с хаоса, происходила постепенная нормализация, которая после определенного числа итераций достигала максимума, после чего было несколько вариантов:
1. медленная или быстрая деградация, которая на некотором уровне завершалась, после чего состояние системы не изменялось.
2. циклическое повторение состояний на уровне ниже максимального.

Таким способом мне удалось определить параметры алгоритма, при которых соответствие было максимальным. Оказалось, что более всего история развития оказалась зависимой от весьма субъективных условий, - от граничных значений параметра соответствия, при которых текст входит в раздел и значений, при которых он должен его покинуть. Я манипулировал этими значениями, допуская разные варианты, - "войти труднее, чем выйти", или наоборот. Каждый раз история получалась разная. В итоге, мне удалось установить эти значения, они не были равными.

Конец истории выглядел так.
В одном из вариантов (с крайними значениями границ), развитие начиналось также, как и с другими параметрами. Вскоре возникал некий раздел, который стал поглощать все тексты и в конце концов, поглотил все разделы и все свободные тексты. Для дальнейших изменений уже не было формальных причин, - все свободные тексты переместились в этот всеохватывающий раздел. В другом варианте оставалось несколько активных разделов, которые объединялись между собой, затем снова распадались. Разделы, которые я назвал неактивными, не участвовали в этом процессе, поскольку у них параметр соответствия был ниже границы при всех возможных взаимодействиях. Еще одна история длилась бесконечно. В ней я не наблюдал цикличности, но параметр соответствия "рукотворному каталогу" колебался возле некоторого уровня. Приходилось прерывать процесс.

Таковы результаты. Естественно, я проводил аналогии между развитием этой лингвистической системы и другими, - физическими, социальными, поскольку в качестве данных для обработки выступали массивы чисел, которые в системах разного типа могли иметь разные интерпретации. Особенно интересно было бы подвести под алгоритм системы государственные или самую большую из всех известных, - смоделировать историю развития Вселенной. В течение двух - трех лет я пытался найти алгоритм каталогизации, при котором конечное значение будет максимальным, однако этого получить не удавалось, система в своем развитии достигала максимума, а затем деградировала, - медленно, быстро, сильно или слегка. В моем исследовании был эталон, что давало возможность фиксировать этот максимум. Однако, внутренних признаков этого максимума мне найти не удалось, итог работы посчитал неудачным и лет шесть назад исследования прекратил. Одна из причин была такова, что пришло понимание, - все эти истории переходили от развития к деградации из-за конечности системы, в квази-бесконечной, все могло бы быть по-другому. Здесь, однако, можно возразить - в реальном мире систем с бесконечным числом элементов нет, потому рано или поздно конечность, подчиняясь некому системному закону, неизбежно перейдет от прогрессивного развития к деградации. Параметры конкретной системы определяют ее историю. Не столько историю развития, как ее конца. Этап прогрессивного развития для разных систем выполняется схоже. Различаются достигаемый максимум и формы деградации.

Еще один вывод из исследования получается такой. Если каталогизацию можно считать признаком проявления разума, то придется признать его существование на уровне физико-математическом, т.е. считать его свойством материи, поскольку в моих исследованиях присутствовали только числа, субъективность завершалась на этапе подготовки эксперимента.

В принципе, я думал и о том, что были бы интересны исследования с воздействием субъективного фактора на ход истории, - например, вмешательство в процесс при определенных условиях. В исследовании статус всех текстов был одинаковый. Однако, можно было бы некоторым из них придать особые свойства. Наконец, в испытаниях, текст, попавший в раздел, теряет свободу абсолютно, как элемент он исчезает из системы и существует в ней лишь в связанном состоянии, только как часть раздела. Здесь тоже можно было бы проиграть разные варианты "системной свободы". Т.е. данное направление способно породить многообразие экспериментов и, соответственно, результатов. Подробнее результаты исследования приведены в статье по адресу: http://monitor-em.narod.ru/txx/tx92_3.htm

11.09.2016

В начало