Физика и лингвистика, процессы консолидации.

Согласно установивштися представлениям, образование планетной системы присходит из первоначального "газопылевого облака". В некоторых точках этого облака спонтанно возникали нерегулярности, которые благодаря повышенной гравитации притягивали к себе все новые частицы вещества, тем самым увеличивая свою массу и силу своего притяжения... Так происходила консолидация материи.

Наука физика давно и основательно проработала вопросы гравитацирнного взаимодействия физических объектов. В 19 веке были попытки использовать эти методы при исследовании взаимодействий систем нефизических, в частности, социальных. В свое время К.Маркс подверг эти попытки резкой критике, с которой нельзя не согласиться. Однако, рискнем нарушить табу, и попробуем представить в физических понятиях процессы консолидации (классификации) текстов, т.е. продуктов скорее интеллектуальных, нежели физических. В качестве оправдания нам будет служить то обстоятельство, что математика применима к объектам любой природы, развитие очень разных объектов может происходить по одинаковым законам, исследование предмета можно заменить исследованием модели. Это оправдано также тем, что в данном исследовании мы попытались исключить субъективный фактор, и результат определяет исключительно соотношения, существующие в "объективной реальности", в качестве которой может выступать как множество текстов так и множество частиц материи. Законы консолидации зависят от отношений элементов, но не от их материального содержания.

Пусть имеется конечное множество объектов, каждый из которых состоит из набора разнообразных частиц. Одинаковые частицы обладают свойством взаимного притяжения. Сила притяжения частицы к объекту зависит от массы частицы и массы всего объекта. При взаимодействии двух объектов силы притяжения, вызываемые входящими в них частицами, складываются. Свободные частицы и объекты перемещаются в пространстве и взаимодействуют между собой - они объединяются в большие и малые образования, которые при определенных условиях распадаются.

Рассмотрим один из возможных сценариев развития такой системы.

В исходном состоянии все частицы сосредоточены в едином замкнутом пространстве. При их взаимодействии происходит объединение частиц с наибольшим значением силы взаимного притяжения. Процесс объединения происходит таким образом, что участвующие в нем частицы теряют свою самостоятельность. Они образуют новый объект, но могут при определенных условиях могут из него выйти. Свойства объекта определяются исключительно тем, какие и сколько в него вошло частиц. Далее это новое образование участвует во внешних взаимодействиях как самостоятельный объект. Если взаимодействующий объект уже состоит из некоторого количества частиц, после его трансформации (объединения) происходит вытеснение из вновь образовавшегося объекта частиц, величина связи которых с объектом невелика. Имеется граничное значение величины связи, ниже которого частица покидает объект. Назовем это значение коэффициентом распада.

Т.о., броуновское движение частиц поророждает процессы слияния и распада, при котором происходит образование новых объектов различной массы. В этом движении действует закон сохранения частиц - частицы не распадаются, но при объединении их элементы составляют единое целое - новый объект. Вновь образующийся составной объект по своим сойствам отличается от элементарной частицы только своей массой (количеством элементов). Вошедшие в объект частицы растворяются в нем, но при трансформациях объекта могут снова "материализоваться" и выйти за его пределы. В конце концов вся система приходит к состоянию равновесия, при котором имеется несколько крупных устойчивых объектов, вобравших в себя большинство частиц и некоторое количество частиц, не имеющих постоянной привязки к определенному объекту. Количество образующихся стационарных объектов определяется коэффициентом распада. При нулевом значении этого коэффициента сформируется только один объект, включающий все имеющиеся частицы.

Другой сценарий развития (преобразования) системы может начинаться с одного объекта, соответствующего нулевому коэффициенту распада и содержащего все частицы. При установке ненулевого значения коэффициента этот объект начинает распадаться и система приходит к новому устойчивому состоянию.

Такова "физика" этого процесса. Возможны и другие сценарии. Проведем теперь "семантическую" привязку (интерпретацию) рассмотренной модели к процессу классификации тексов. В качестве "частиц" здесь выступают отдельные тексты определенного содержания. "Элементы частиц" - слова текстов. "Скопления частиц", объекты - это разделы образующегося каталога. "Сила притяжения" - значение относительной информации сравниваемых текстов или разделов, которое вычисляется по формуле, приведенной в тексте "От лингвистики к социальным процессам"

Коэффициент распада определяется следующим образом. По формуле (1) вычисляется информация раздела каталога (группы текстов на определенную тему) относительно каждого текста. Тексты внутри раздела ранжируются по значению этой относительной информации, которое нормируется. Тексты, имеющие нормированное значение относительной информации менее "коэффициента распада" из раздела исключаются и образуют новый раздел.

По алгоритму, соответвсвующему первому сценарию, было обработано 500 текстов разнообразного содержания.

Другой сценарий был такой.

В пустое ограниченное пространство последовательно, один за другим случайным образом вбрасываются объекты множества. Объект, попадающий в пространство взаимодейчтвует с другими имющимися там объектами и соединяется с тем из них, сила притяжения к которму максимальна.

Исследование поведения системы говорит о том, что оно зависит не столько от сценария, и даже не от закона взаимодействия, но более всего от заданных констант.

29.11.2008
Ханов О.А.
В начало