|
Анализ содержания текстов |
Другие темы |
Задача поиска информации в Интернете остается актуальной. Существует большое разнообразие методов поиска, основанных на определении ключевых слов с учетом грамматики, контекста, трансформаций слов, статистики, и т.д. Вместе с тем, непосредственное вычисление количественного значения информации при этом используется нечасто.
Предлагается алгоритм на основе модифицированной формулы Шеннона для вычисления относительной информации, содержащейся в текстах (статья опубликована в журнале "Инновации" N8, 2008 г.).
На сайте представлены результаты ранжирования текстов, выполненного предлагаемым алгоритмом.