История одной публикации.
В течение года, с февраля
2006-го я работал охранником на Коломяжском ТК.
Работа была неприятная до отвращения. Снова пришлось наблюдать обратную сторону
человеческой жизни во многих ее проявлениях. Но было в этой работе и нечто
положительное. С 11 вечера до 4-х утра я оставался один в караульном помещении
и все, что от меня требовалось - не спать и сообщать, куда следует, если что-то
будет не так.
Ночь, тишина, праздность и одиночество способствуют размышлениям,
материализация которых при других условиях не получается. У меня накопилось
немало тем, требующих спокойной и основательной
проработки.
Одной из таких тем было
обоснование моего основного занятия – реализации проекта "Информационная
система", чем я занимался с 1994 года. Результата (финансового), в который
я верил, и который по моим представлениям должен быть немалый, не было.
По
сути, я человек неверующий. Моя вера обязательно должна быть основана на
знании. Но знание - величина относительная, подвижная, и с определенной
регулярностью следует приводить это знание в порядок, раскладывая по полочкам
вновь поступаюшие факты.
Я готов был потерять свою
веру, прекратить свои занятия, но для этого мне надо
было доказать их абсолютную
бесперспективность.
И каждый раз, когда я добросовестно пытался получить такой
результат, логика говорила мне совершенно обратное. Я
не сомневался в логике, но в конце концов стал
сомневаться в свей собственной психике, подозревая ее в шизофренических
склонностях.
Тем не менее, я снова
попытался осмыслить основания своей деятельности. На этот раз я стал копать
глубже. Тема получилась такая. "
Я занимаюсь информационной системой. Для
того, чтобы понять, какая она должна быть, и зачем она
нужна, надо понять - что такое информация, и какова ее роль в нашей жизни и
вообще в мире, в котором мы живем". Мне хотелось получить логическое доказательство неизбежности этой темы, берущей
свое начало в физическом мире. Все, что идет от природы, обоснований не
требует. И я решил проследить физические основы информации, проанализировать
информационные процессы, происходящие в физике, в неживой природе. И вот, в
одну прекрасную ночь, я понял, что в неживой природе информационные процессы не происходят, к информации
причастно только живое и разумное. Для меня это было серьезным и важным
открытием.
Из того, что я смог осмыслить и из этого смог записать, получилась
работа "Этюды об информации".
Параллельно продолжал продвижение
информационной системы. На Коломяжском ТК установил
монитор общего пользования, который не приносил доход, но и не требовал больших
вложений. Он был хорошим полигоном для отработки системы.
На каком-то этапе я
столкнулся с задачей автоматической классификации текстов. Этим я занимался
вручную, но такой способ не вписывался в концепцию, надо было непременно
процесс автоматизировать. Почему-то была уверенность в том, что это возможно. Я
попытался написать соответствующую программу. Понятия "ключевые
слова", "частота употребления слова" общеизвестны, и мне
показалось, что этого достаточно для составления алгоритма классификации. Но
быстро обнаружил, что это не так, и стал думать, чего здесь не хватает.
Достаточно случайно эти размышления совпали по времени с философским
исследованием информации как таковой. Слово, текст были человеческими носителями этой информации. Т.е. оказалось,
что я занимаюсь одним и тем же в двух очень разных измерениях - отвлеченные
философские построения и совершенно конкретная практика. Такой симбиоз не
слишком совместимого оказался эффетивным,
и через некоторое время я уже понимал, каким должен быть искомый алгоритм.
Из
"общего отвлеченного" следовало, что смысл каждого отдельного слова
зависит от всей языковой среды. Появление здесь нового слова, нового текста в
какой-то мере изменяет все эти элементарные смыслы, и это обстоятельство надо
как-то учитывать. На передний план выступало понятие "относительная
информация", из которого следовало произведение частот. Этого было
достаточно для удовлетворительной классификации.
Все лето 2007-го года я
шлифовал алгоритм, надоедал всем (Сергею,
Ю.Ф., Березницкому) своими проблемами. Мне
почему-то казалось, что это должно быть интересно всем, и очень удивляло
ощущение, что это не так.
К концу августа алгоритм устоялся окончательно, любые
его изменения ухудшали результат. В итоге получилась довольно простая,
логически оправданная формула, дававшая неплохой результат. Ее простая логика,
ее прямая связь с формулой основоположника теории информации Шеннона, говорили
о том, что она хорошо известна всем, кроме меня. Мне пришлось самостоятельно выводить ее по причине своей
неосведомленности в этой области, по причине некоторой природной тупости
(понимание чего-либо известного дается с трудом) и (как следствие) врожденной
ленивости что-либо искать и находить.
Было любопытно разыскать эту
формулу в теории информации, и я стал копать. Довольно быстро обнаружил, что
такая формула неизвестна и не используется. Это меня немало удивило, с
удвоенным вниманием я продолжал раскопки, но так и не нашел. Но если такая
простая и важная формула неизвестна, то непременно следует объявить о ее
существовании, т.е. опубликовать статью или оформить этот материал как
изобретение, патент. Я не исключал ни тот, ни другой вариант. С патентом все
немного сложнее - это долго, стоит денег и результат
не предопределен.
Статью написал быстро, стал
искать журнал. Интернет дал мне список существующих журналов. Выбирал по
признакам: не Москва, журнал научный, но не специализированный. Я не специалист
и, возможно, что-нибудь важное не знаю. С другой стороны, неспециалисту
читающему легче понять неспециалиста пишущего.
В конце концов
я обнаружил, что выбора нет. Есть только один журнал, который удовлетворяет
всем этим признакам. Это журнал "Инновации", редакция которого
располагается на территории ЛЭТИ. Попытка - не пытка. Поехал в редакцию, отдал
рукопись.
(Это было 20.09.07)
Тем временем...
В процессе работы у меня
получился довольно тонкий инструмент, позволявший оценить результат. И
все-таки, эта оценка не была надежной. Он была основана на субъективных
ощущениях "похоже-непохоже". Я стал
подозревать себя в предвзятости, в утрате "чувства реальности". Тем
более, что я такое уже достаточно подробно наблюдал со
стороны (Рудик и еще несколько подобных "сумашедших"). По моим же наблюдениям, такой человек
сам ничего не замечает, а критику не воспринимает. К тому же, мало кто говорит
правду, "как есть", дабы не обидеть человека, во всех других
отношениях совершенно нормального.
По этому поводу, очень
осторожно, я попросил Сергея непредвзято оценить результаты моей работы. Он
(вероятно) не понял истинный смысл моей просьбы, обстоятельного ответа я не услышал.
Тогда я сделал сайт с результатами своей работы и 29.08.07 отправил Сергею
эл. письмо,
где (как мне кажется) более четко обозначил свои (психические!) проблемы.
В нем были такие слова: "К примерам и их комментариям прошу отнестись серьезно
Нет у меня уверенности в справедливости утверждений - тени Рудика,
"экономиста", писателя - космолога (список можно продолжить)
бродят где-то рядом..."
Сергей посмотрел сайт,
прислал письмо с обстоятелной и уничтожающей
критикой. Писмо начиналось словами "Ну,
держись...". Но в конце было
сказано: "Призраков Рудика и (прочих) я не
увидел".
Таким образом, я получил достаточно четкий ответ на не очень
четко заданный вопрос. Если бы Сергей действительно увидел психическую
аномалию, то я бы не получил такой "разнос" своего сайта. Слова и
темы были бы совсем другие.
Меня это порадовало, сомнения были заглушены, и я
принял решение статью пытаться публиковать.
В октябре 2008 года статья
"Вычисление информации, содержащейся в текстах" была опубликована в
журнале "Инновации" N8.
1.12.08