Вычисление информации, содержащейся в текстах

Комментарии к статье

2010.03.2012, ocipete:
А какое отношение всё это имеет к смыслу? Ну, Вы классифицируете наборы единиц по их близости к эталонным наборам. Таким же образом можете классифицировать наборы детских конструкторов. Но это ведь не значит, что в наборе деталек конструктора есть смысл!

2010.03.2012. О.Ханов:
В данном случае "эталонные наборы" (тексты) обладают известным (априорным) смыслом. Указание на определенный эталон позволяет перенести этот смысл на испытуемый текст. Можно дать количественную оценку степени соответствия.

В "наборах деталек конструктора" тоже может быть смысл, а именно - модель, которая получится при сборке. И точно также мы можем говорить о том, к чему тяготеет случайно попавший в наши руки набор.

2010.03.2012. ocipete
Нет, смысл - это структура, а не простое множество элементов. Смысл содержится в чертеже, а не в наборе деталек. А из одного набора деталек можно собрать часто бесконечное число моделей.

2010.03.2012. О.Ханов:
Согласен, смысл - не простое множество элементов. И тем не менее... Я бы не поверил в результат, если бы не его многократное повторение. Остается вспомнить слова (ныне непопулярного) персонажа: "Течение воды - пена сверху и глубокие течения внизу. Но и пена есть отражение сущности".

Не посягая на безусловность определяющего влияния структуры на содержание текста, хочу заметить:

1. Определенные элементы могут создавать структуры только определенного типа. (Зеркально - конкретная структура привлекает для своей актуализации не произвольные элементы, а только те, что ей лучше подходят). Тем более, при условии многообразия элементов.
2. В конкретной структуре имеются конкретные количественные соотношения между образующими ее элементами.

Создаваемая этими обстоятельствами уникальность "набора деталек" конкретной структуры оказывается достаточной для ее идентификации (с некоторой точностью) по этому набору.

Метод не претендует на суждения о каких-либо свойствах текста, кроме одного - о его принадлежности к определенной группе, т.е. решает задачу классификации. Здесь некоторое удивление может вызывать абсолютная (математическая) формальность этого действия, результат которого представляется осмысленным.
В начало