Интерсервер. На пути к реализацииИнформация, связанная с человеком17.08.2012 Ханов О.А.1. Дата и место рождения. 2. Список людей, которые упоминают в своих текстах данного человека (имя сопровождается датой). 3. Список имен, которые упоминает в своих текстах данный человек (имя сопровождается датой). 4. Список прямых родственников с указанием степени родства. 5. Родственники родственников (сюда войдет, например, двоюродная сестра моей сводной сестры) 6. Списки (например, "Участники соревнования" или "5-б класс 111 школы"), в которых упоминается данный человек. 7. Все фотографии, на которых изображен данный человек. 8. Список людей, изображенных на фотографиях вместе с данным человеком 9. Список людей, изображенных на фотографиях, опубликованных данным человеком. 10. Список людей, опубликовавших изображение данного человека. 11. Полный список имен, связанных с данным человеком. 12. Полный список текстов, опубликованных данным человеком. 13. Все фотографии, опубликованные данным человеком. 14. Список объектов, упоминаемых данным человеком в текстах. 15. Объекты, в связи с которыми упоминается данный человек (например, в тексте: директор клуба Иванов...) 16. Объекты на фотографиях вместе с изображением данного человека. 17. Объекты на фотографиях, опубликованных данным человеком. 18. Даты, связанные с данным человеком. 19. События, связанные с данным человеком. 20. Теги, связанные с данным человеком. 21. Возможные псевдонимы данного человека. 22. Работа и др. информация ИменаАвтор, упоминающий имя, может для этого имени заполнить профиль по той же форме, как это делается для авторов (фото, год и место рождения и т.д.). Но прежде следует посмотреть, нет ли уже заполненного профиля данного человка - он может упоминаться другим автором. Если есть, и если автор согласен с приведенными в нем данными, то вместо заполнения профиля он может нажать кнопку "добавить ссылку", по которой упоминаемое в данном тексте имя привязывается к уже имеющемуся профилю.Таким образом, для упоминаемых имен организуется "Именная страница" - аналог "личной страницы автора". На именной странице собираются тексты разных авторов, содержащих сюжеты с данным человеком. Следует предоставить возможность давать здесь ссылки на другие ресурсы, в которых речь идет об этом человеке. Может случиться так, что упоминаемый в публикациях человек является зарегистрированным автором memoclub. Думаю, что не следует объединять именные и личные страницы. В личной информация, исходящая от данного человека, в именной - информация других об этом человеке. Работа в рамках сервера Мемоклуб23.08.2012 Ханов О.А., письмо С.О.Я бы хотел передать Ю.Ф. свои соображения о том, как следует довести сервер до "минимальной кондиции". Тогда некоторые его вопросы потеряют смысл. Т.е. прежде чем обсуждать, мне обязательно надо выдать свои замечания. Но прежде чем это сделать, я бы хотел увидеть твое независимое мнение по поводу сервера. Если наши взгляды в значительной степени совпадает, то можно двигаться дальше. Список замечаний я пришлю тебе, если услышу твое мнение. Все, что там есть - это самый необходимый минимум, здесь отступать некуда. После их осуществления можно пытаться сделать тот самый "сервер над серверами" в рамках сервера memoclub. Все это возможно, если Ю.Ф. согласится, а программист сможет исполнить. И то и другое - под большим вопросом. Ю.Ф., однако, уже готов искать другого исполнителя. Если будут большие проблемы с самим Ю.Ф., то придется делать независимый сервер, в котором Ю.Ф. может участвовать на тех же условиях, на которых участвую я в memoclub. Т.о., предстоит важная встреча, само проведение которой и ее содержание сейчас зависит от тебя. Мне интересно также твое мнение по всем упомянутым "организационным" вопросам Просьба - зарегистрироваться на memoclub (под своим именем, а если не хочешь - под псевдонимом) и выложить свою рецензию на Солярис как комментарий к тексту. Для меня это действие в некотором смысле "политическое". ____________ Колеса твои привез, а свои увожу на дачу. Уеду завтра. Был в гараже, больше никаких причин посещать это место нет (кроме попыток получить компенсацию, что весьма вероятно). Если таковая будет, готов вложить ее в "независимый сревер" с участниками: ты, я, Ю.Ф. и (вопрос?) - Гриша. 28.08.2012. Ханов О.А. - С.О. Завтра будет встреча с Ю.Ф. по разбору наших замечаний. Есть в них одна тема, которую мы единодушно оцениваем, как выполненую безобразно, это - "Поиск". При том, что я считаю, что она должна быть главной и свое название имеет по недоразумению. Она вписывается в формулу "Люди, годы, жизнь" (роман И.Эренбурга). В связи с этим, хочу предложить Ю.Ф. и тебе такой вариант - мы (ты и я) берем этот раздел себе для полной самостоятельной проработки и делаем его так, каким он должен быть. На сервере memoclub потерялась "социальность", которая, собственно, и могла бы принести доход. У конкeрентов (mirpamyaty) с этим все в порядке, - при том, что структура сделана безобразно. Они (в частности) имеют такие фишки: "войти через facebook, vkontakte и т.д.". Хорошо бы понять, как это делается. И все-таки, я склоняюсь к тому, что надо делать тот самый сервер, который всех объединит. Кстати, по образу и подобию сделать можно не один сервер, а сколько угодно - объединять можно по разным признакам. Концепт Интегратора13.09.2012 Ханов О.А. - С.О.Последние 20 лет я занимался сбором, систематизацией и распространением информации. Это принимало разные формы. Раньше приоритетным был сбор и распространение (пейджинг и мониторы), сейчас - систематизация. Едва ли я когда-нибудь займусь чем-то другим, поэтому при любом раскладе буду продолжать эти занятия. Предложение по концепту. Вынести реализацию функции "Поиск" за пределы memoclub, организовать независимый ресурс с условным названием "Интегратор". С memoclub он будет работать также, как с любым другим ресурсом, т.е. без доступа к базе данных. Задача - собирать ссылки по обозначенной теме, искать и находить связи. Есть объективные причины для создания ресурса независимого. Перечисляю. 1. Одна из важных задач memoclub - обеспечить высокую посещаемость. Переходы с сервера на другие ресурсы нежелательны (посетитель может не вернуться). Т.е. memoclub и интегратор по функциям не совмещается - первый притягивает посетителя и старается оставить его как можно дольше не сайте, второй - сразу отправляет на другой ресурс. 2. На proza.ru есть много текстов по заданной тематике, которые были бы интересны для memoclub. Однако, предложить авторам копировать свой текст еще на один ресурс смысла нет и непонятно, как объяснить им - зачем? Поисковики цепляются за один вариант, копии они отбрасывают (проверил). Интегратор позволит совместить все опубликованное в разных местах в единое целое. 3. Ссылки не затрагивают авторские права, поэтому их можно применять без ведома и без согласия самого автора (поисковики согласия не просят). 4. Интегратор может работать не только с текстами, но и с фотографиями. Кроме того, существует много ресурсов, предлагающих найти родственников, с ними тоже можно работать. Интрегратор и Мемоклуб не заменяют, а дополняют др. друга. Хостинг может быть один и тот же или разный, но в любом случае базы данных остаются автономными. Взаимодействие между ресурсами осуществляется перекрестными ссылками и через почтовый ящик. Имеются два входа на Интегратор - как раздел memoclub (переход по кнопке "Поиск" на соответствующую страницу Интегратора) и прямой вход (например, по адресу "20век.рф"). Предложения по организации. 1. Сделать самостоятельно все, что можно, а что не получается - нанять программиста. Эксплуатационные расходы составляют примерно 2 т.р. в год (хостинг и доменное имя). Все расходы в пределах 50 т.р. я готов взять на себя, если больше - можно поговорить с предполагаемым инвестором. 2. Я готов освоить команды PHP и выполнять конкретные задания. 3. Учредители - ты, я и Ю.Ф. (возможны другие варианты). Проект некоммерческий, но если будет доход, он распределяется поровну. Задача кажется актуальной - она в русле структуризации Интернета. Сейчас предлагается конкретная тема, но она может быть произвольной. Отработав данную тему, можно приниматься за другую. Вопрос. Интересен ли тебе такой вариант? О сайте со ссылками.13.09.2012 Ханов О.А. - С.О.Вижу примерно такое рекламное сообщение. _________________ Мы собираем ссылки на сайты, которые вам показались интересными. Сайты на любую тему, связанную с реальными событиями, людьми, организациями и т.д. Это может быть повествование о давних событиях, о людях, которых уже нет, или о том, что произошло совсем недавно. Единственное пожелание - нам бы хотелось иметь ссылки на невыдуманные истории, насколько это вообще возможно. Мы будем пытаться смотреть на каждое событие с разных сторон, глазами разных наблюдателей. Регистрация на нашем сайте не требуется. Для облегчения работы по поиску связей просим заполнить для каждой публикуемой ссылки небольшой формуляр с перечнем событий, имен, дат и объектов, упоминаемых в источнике, на который вы даете ссылку. Среди того, что уже есть на сайте, вы можете попытаться найти знакомые имена или объекты. Возможно, здесь упоминается событие, участником которого вы были сами. Если вы хотите добавить собственный рассказ, это можно сделать по адресу memoclub.ru (ссылка с этого сайта здесь появится автоматически). ______________ Сайт выглядит так. Главная страница. Люди, годы, события, объекты, тэги. Последние поступления (здесь не сами ссылки, а новые люди, события, даты...). Форма для ввода ссылки ("формуляр") Далее - соответственно, переходы на страницы со списками имен, событий, объектов, или на календарь. Ссылки без описания при такой организации нигде не видны. ________________ Для начала можно набрать несколько сотен ссылок из memoclub, proza, mirpamyati, litsovet, livejournal, vkontakte и т.д. Это даст тысячи имен, сотни дат и событий. Собирать будем ссылки на тексты и фотографии - они укладываются в одну и ту же форму описания (люди, даты...). Сайт проще, чем memoclub (баз меньше, редактор проще, а сканированием пока не занимаемся). Фактически это тот самый раздел "Поиск", но сделанный правильно. Важное отличие от всяких других сетей - обезличенный ввод. Я не вижу причин для регистрации, поскольку тексты практически не вводятся, т.е "авторского" почти нет. Желающих оставить ссылку при таких обстоятельствах не будет много. Но, если на сервере будет материал, читателей будет достаточно. Некоторый (небольшой) их процент все-таки станет поставщиком информации. Предполагаю, что какое-то время придется исключительно самостоятельно набивать туда ссылки. Другой источник - memoclub, где процедура "формуляров" предусмотрена и адрес каждой такой публикации будет автоматически направляться на Интегратор. Ссылками занимаются многие. Сервер, состоящий только из ссылок, (прочитал) называется портал. Увлекается ссылками фейсбук и вконтакте. Тематические ссылки дает jank mail (одно время меня ими забросал Абрамсон). Мы будем отличаться м.б. более глубокой классификацией. Чем-то похожим занимаются поисковики, они выдают список ссылок на заданную тему. Наша тема так широка, что ее практически нет. Вотличие отпоисковиков, мы не задаем темы. а выделяем темы в том, что у нас оказалось, т.е. проводим систематизацию. Ее первый уровень выполняет человек, далее работает программа. 17.09.2012 Ханов О.А. - С.О. Продолжение (предложений). Поскольку то, что хочется сделать как самостоятельный сервер, мало отличается от режима "Поиск" на memoclub, можно сначала все сделать там, а потом вынести. Отличия второго варианта от первого: 1. Охватываемая "территория" - весь Интернет, в отличие от одного сервера memoclub. 2. Наличие формы для ввода ссылок, доступной любому (незарегистрированному) посетителю. Все это можно было бы попросить сделать программиста, но я бы пока подождал давать такое задание, а сначала запросил бы у него всю информацию, необходимую для самостоятельной работы. Во время встречи он говорил о том, что информацию передаст, но этого не случилось, видимо нужен запрос. Цель такая - быть в курсе того, что и как будет сделано на самостоятельном сервере. Иначе будет постоянная и полная зависимость от программиста, платить надо будет все время, как это получилось у Ю.Ф. (1600 или 1800р/мес.). Т.е. предложение такое - попытаться разобраться, как это сделать и сделать, если получится. Если не получится, сделать "полусамостоятельно" - в тесном контакте с программистом. У Ю.Ф. "добро" на самостоятельную работу с разделом "поиск" получено. Потом этот раздел после некоторых преобразований может составить основу нового сервера. Если нет у тебя возражений и нет отторжения этой работы, вопрос/просьба - мог бы ты составить список данных, которые надо получить от программиста? 20.09.2012 Ханов О.А. - С.О. Память совсем плоха. Вспомнил вдруг, что еще несколько писем назад сам же предложил не интегрировать базы данных Интегрптора и Мемоклуб. Cогласился, когда вспомнил. В связи с этим, не очень-то надо было запрашивать базы, программы и структуры. Но потом подумал, что информация полезная. Пользу вижу такую: 1. Можно посмотреть, насколько это все читаемо/нечитаемо, можно ли разобраться, если будет такая необходимость. А она может появиться, когда закончатся деньги у Ю.Ф. для оплаты услуг программиста, а доход еще не подойдет. 2. Большой интеграции не будет, но малая может быть полезна. Имея информацию, можно говорить не только о там, что надо сделать, но и предложить - как. Так, на живых примерах, мне удалось внедрить тему "сборники". 3. Режим "Поиск" в Мемоклубе надо либо удалить, либо довести его до какого-нибудь приемлемого состояния. Мне кажется, можно поработать здесь немного вместе с программистом. Удалить - плохо, совсем не останется места для формуляров, которые хотелось бы активно использовать. В связи с этим, отправляю тебе все, что получил. Посмотри своим опытным глазом - есть ли там что-нибудь понятное (хоты бы в том смысле, какие программы чем занимаются), или без WordPress - лес густой, непроходимая чаща? 09.10.2012 С.О. - Ханову О.А. Это как раз понятно. Не понятно какой формуляр, поиск, вывод результата. 10.10.2012 Ханов О.А. - С.О. О формулярах. М.б. речь идет о том, что на странице http://monitor-em.narod.ru/memo/i.htm открывается при выборе "Загрузить фото". Слова желтого цвета = активные действующие ссылки. При выборе "Загрузить фото" открывается хорошо знакомая тебе форма с полями "Адрес, Люди, Место...", где вместо фото можно показать сайт в уменьшенном масштабе, на который дается ссылка. С текстами все очень похоже. Поиск м.б. не очень нужен. Вместо поиска можно сделать предъявление (=вывод результата) того, что есть - списки людей, мест, календарь и т.д. Эти списки (людей, мест...) можно организовать (например) также, как сделано у тебя в фотоальбоме - с алфавитом и переходом по букве. При такой организации у тебя многое есть готовое, нужна некоторая адаптация. 11.10.2012 Ханов О.А. - С.О. По поводу интегратора. Меня сегодня разбудила мысль о том, что авторские сборники не нужны. Если кто-нибудь этого захочет - на Мемоклуб есть все необходимое, а здесь пусть будут только ссылки на эти сборники. Сам Интегратор состоит из множества сборников. Каждое имя - сборник, каждый объект - сборник, тег - тоже сборник. Для имени, формирующего сборник надо бы сделать "профиль". Для человека в профиле будет: фото, годы жизни, место рождения, место проживанния, родственники, родословная, биография (события жизни), люди, связанные с человеком, объекты, события, даты, сайт, имя "в контакте" и т.д. Информацию хорошо бы не вводить, а брать "из открытых источников" - из Интернета. Откуда брать - найти можно, а что и как брать - надо думать. 11.10.2012 С.О. - Ханову О.А. Таки что делать? Нет сборников - не нужна авторизация. Тогда нужен или нет автор поста? Как сохранять сам пост? С утверждением (цензом) - без утверждения? Как раскидывать информацию по базам? Проверять поля? Как проверять? Если новое слово = уже существующему - выводить предупреждение? Как быть, если по сути одно и то же называют разными именами? Это надо находить? Какой алгоритм? 11.10.2012 Ханов О.А. - С.О. - Сейчас трудно сказать "как это должно бы быть", процесс появления нового - это движение вперед, назад, бывает - по кругу. Потому принцип таков - сделать то, что не вызывает вопросов, а что вызывает - сделать самый простой вариант. Есть такое впечатление, что все авторское можно вынести за пределы портала. Предполагаю, что сами авторы появятся не быстро, долгое время это будет просто механизм для набивки ссылок, сопровождаемых небольшим описанием и вывод (показ) этой информации, сгруппированной по разным признакам. Потому на данный момент (а м.б. и навсегда) получается: - автор не нужен - пост сохраняется без утверждения "Пост" - это несколько слов (имена, даты...), которые Некто извлекает из сайта и записывает в базу рядом с адресом этого сайта. Этим могла бы заниматься и программа типа Поисковик. Мне кажется, на данный момент было бы хорошо так: начинаем вводить слово (имя) - выходит подсказка - слова, начинающиеся с набранных букв, которые есть в базе. Можно выбрать, если такое слово есть, или набирать дальше. Это равносильно "предупреждению-проверке". Не знаю, как делается, но встречается часто (например, при наборе интернет-адреса в Mozila Firefox). Впоследствии должен быть механизм распознания лиц, псевдонимов и однофамильцев. Механизм непростой, но это потом. Пока можно считать одинаково написанное принадлежащим одному и тому же, а объединять или разъединять вручную. Т.е. главный критерий - простота (все равно потом будет все иначе). Я бы сделал кнопку "показать". Т.е. вводится адрес, нажимается эта кнопка, после чего в окне показывается сайт введенного адреса и только после этого начинается заполнение "формуляра". Если адрес не существующий, то ничего не происходит. Это отсечет неживые адреса, т.е. будет тем самым "цензом". У базы ссылок вижу такие поля: - адрес, - идентификатор адреса, - перечни идентификаторов имен, объектов, дат, тэгов, событий, связанных с этим адресом. Естественно, название "поле" здесь условно. Их количество заранее неизвестно, потому поля придется писать в строках или базу разбивать на несколько баз. Кроме того, есть базы имен, объектов, дат, событий... 11.10.2012 Ханов О.А. - С.О. Предложения по изменению (того, что вижу) 1. Разделы "Рубрикатор" и "Подборки" - убрать. Все по той же причине - каждое слово (=тег) это и есть рубрика и подборка. А еще потому, что с рубриками определиться очень непросто. Тэги надо будет организовать в рубрики, но это потом. 2. На странице "Добавить запись": 2.1. Вместо "Дата" поставить поле "Даты" с произвольным написанием и количеством (упоминаемых дат). 2.2. Переименоваь раздел "Описание" в "Событие" (или "Тема") - т.е. то же самое, но более конкретно заданное. 2.3. Добавить поля: - Автор - Дата публикации ____________ Утром (на 12-00) еду на дачу одним днем. 12.10.2012 Ханов О.А. - С.О. Всегда знал, что на дачу ездить полезно (в электропоезде, взяв с собой ручку и бумагу). Копирую сейчас то, что понял к середине пути (у тебя м.б. понимание случилось раньше). - Мы делаем некоторый инструмент для систематизации и постараемся его сделать хорошо. Но это получится именно то, что нужно для успешных продаж - легко найти товар и показать/рассмотреть его со всех сторон. И когда мы поставим этот инструмент, им попытаются воспользоваться именно так, соблюдая при этом все наши правила. Например, некто даст ссылку на сюжет о том, что Брюс Уиллис предпочитает одеколон "Красная Москва", его имя будет значится в списке упоминаемых имен и т.д. Укрощение обычно эффективнее запрещения, поэтому будет полезно создать раздел "Реклама" и направлять туда всех желающих (за деньги, конечно). Рекламные разделы могут естественным образом вырасти из тэгов. Тем не менее, придется, вероятно, сделать "черный список", куда заносить адреса злостных нарушителей. Никогда не хотел заниматься рекламой, но она меня преследует, начиная с оптовых баз. Там я хорошо прочувствовал, насколько тонка и условна граница между рекламой и информацией. В идеале, хорошо бы давать рекламу, вызывающую интерес, а не отторжение. Не знаю, как правильно определяются эти понятия. Смотреть (пока) не буду, попытаюсь определить, как понимаю. С точки зрения получателя, реклама - это информация, которую он не запрашивал. С точки зрения передатчика, реклама и информация не различаются. Поскольку изначально получателю реклама не нужна, она настойчива и даже навязчива, всеми способами пытается добиться его внимания. "Мягкий" способ - пробудить интерес, начиная издалека. Или увидеть (понять) интерес и предложить... Что же касается рекламы, "выползающей из тэгов", есть большая и не очень проработанная тема "иерархия понятий". Обычно она решается интуитивно, мы ее тоже будем решать (так же). Переходя от общего к конкретному, надо подробно описать предмет и дать примеры реализации, а это уже имеет признаки рекламы... Из твоего письма от 31.05.2012: "Все это начинает напоминать проекты типа Price.ru (до этого проект напоминал Vkontakte.ru и Proza.ru) с расширенным функционалом и спектром товаров. Кстати, функции прайса можно оставить. Более того, можно вести архив цен на продукты (товары, услуги) - это не только интересно, но многим будет полезно в бизнесе. Тут же можно подстыковать модуль "мода" и т.п..." Как-то мы подошли к одному и тому же - явно с разных сторон (я этого не только не хотел, но и "видит Бог, сопротивлялся"). Сл-но, рекламная тема здесь сидит глубоко, от нее никуда не деться. Естественное для нашего (основного) варианта предложение: "Здесь вы можете дать ссылку на свой сайт" - Это реклама! По поводу регистрации. Я не исключаю, что дойду до мнения о том, что вообще никому не позволять оставлять ссылки - только проверенным и своим, а также серверам по договору. Т.е надо бы еще поработать над концепцией. Или, наоборот, - сделать что-нибудь и потом подумать. Когда уже что-то есть, думается лучше и правильнее. Мне бы хотелось как можно быстрее сделать хотя бы самый простой "ссылочный вариант", чтобы закрыть вопрос (идущий от Ю.Ф.) о привлечении в Мемоклуб имеющихся там (их уже достаточно много) знакомых мемуаристов. _________ Из Википедии: Реклама - информация, распространенная любым способом, в любой форме и с использованием любых средств, адресованная неопределенному кругу лиц и направленная на привлечение внимания к объекту рекламирования. Информация - сведения о чем-либо, независимо от формы их представления. ________ Новый memface у меня почему-то не открывается, письмо отправлю, попробую все перегрузить. 14.10.2012 Ханов О.А. - С.О. Страница "Добавить запись". Надо бы здесь дать прямой выход на поисковики (google и yandex). (Фантазия: Хорошо бы, чтобы результат поиска открывался в своем окне, а сбоку оставалась бы кнопочка "Запомнить адрес" и еще, чтобы глядя на сайт, заполнять формуляр). ______________ Базы данных можно делать в универсальном формате, которой легко учитывает любые изменения. Пример. База ссылок, поля: - адрес (о ком речь?) - тип информации (о чем?) - содержание (что именно говорится?) Пример записей (вместо названий тут конечно могут быть идентификаторы).
База сопровождается базой имен, мест, дат, событий, тэгов и базой "типы информации в базе ссылок", в которой перечислены все возможные поля базы ссылок (если делать ее в виде одной таблицы). Такой вариант удобен тем, что: 1. если надо добавить поле, это делается простым добавлением строки в список "типы информации", все остальное (включая старые записи) не изменяется. 2. новую информацию об имеющейся ссылке можно дополнить в любое время и поставить ее в конец списка (никакая сортировка здесь не требуется) 3. база компактна - показаны только те поля, по которым есть информация. Кроме ссылок, как мне кажется, по такому принципу следует сделать (как минимум) и базу имен (много характеристик, которые могут дополняться и многие из которых останутся пустыми). Соображение. Интернет-адреса сейчас длинные, их надо тоже заменить идентификаторами. Т.е. основная база (ссылок) будет состоять из трех колонок цифр/. Проблема. Сайт по одному адресу может быть описан разными людьми - как фото и как текст и описан по-разному (один одно увидел, другой другое). - Значит, надо давать им разные идентификаторы. Но здесь может выплыть какая-то неприятность. - Не вижу какая, но чувствую, что может/. 15.10.2012 Ханов С.О. Посмотри сюда: http://xml.yandex.ru/examples.xml На работе у меня это не получится сделать. ______________ 15.10.2012 Ханов О.А. Посмотрел, прочитал: "XML выдача предоставляет вам результаты поиска в структурированном виде, после чего вы можете делать с ними что угодно - наложить свой дизайн, запустить поиск по интересующим вас темам..." "Яндекс.XML - это готовый поиск, который можно использовать для своих нужд с минимальными усилиями." Понял: - Это средство для поиска. Но у нас (пока) нет поиска! По моим представлениям, задача такова: - отображаются списки - люди, объекты, календарь..., посетитель выбирает из того, что есть, и уходит. Для пополнения базы заполняется форма. Заполняем пока ее сами, наружу не выносим. Поиск при этом полезен как вспомогательное средство для набивки базы, но здесь достаточно обычного поисковика. Мне кажется, когда дело дойдет до сканирования, надо будет вспомнить об XML. Но сейчас опасаюсь, что в этом можно утонуть. Для работы я бы взял готовую базу от memoclb (люди, теги, объекты...). Можно отработать ее визуализацию, разные режимы, потом добавить пополнение базы через форму и на время успокоиться - набивать и думать о новых задачах. По большому счету, все можно было бы сделать через memoclub. Это возможно "технически" - немногого там не хватает. Но это не проходит "концептуально" и совершенно нереально организационно. Потом м.б. надо будет сделать: - запросы к базе по нескольким признакам (например, имя + место). - взаимодействие с серверами - разрешить пополнение базы еще кому-нибудь - проработать "коммерческую" часть - потом много чего можно сделать Но все это не тот поиск, о котором XML. "Тот" поиск полезен как вспомогательное средство для набивки базы - это обычные поисковики. Возможно (и даже - наверняка), будет задача для настоящего поиска, но пока не вижу. Пока вообще трудно рассчитывать на программу - только на человека, и даже - не на случайного человека. 16.10.2012 Ханов С.О. Перед использованием - Удали БД Такой вариант реализации базы: таблица 1: id URL видимость (да/нет) доступность ссылки (да/нет) дата последней удачной проверки доступности ссылки таблица 2: id URL тип информации (определяется по заполнению поля) содержание (из заполненного поля) дата записи - текущая дата имя автора видимость (да/нет) 16.10.2012 Ханов О.А. - С.О. Из нового (в порядке убывания "очевидности"): 1. сведения об авторе, 2. доступность, 3. видимость. 1. Колонку "Сведения об авторе" можно не обсуждать. Она впишется в любую концепцию. В "обезличенном" варианте это будет необязательный для заполнения параметр. 2. Доступность. Как понимаю, это - признак существования адреса (он есть и доступен всем). - Возражений нет. Изначально, при вводе все адреса "Доступны", но они действительно могут исчезнуть, поскольку живут своей самостоятельной жизнью. Потом можно будет подумать о том, что не надо ли делать у себя копии, пока они еще живы? Но это вопрос очень принципиальный (концептуальный), вызывает много вторичных проблем, т.е. решать его - не сейчас. 3. Видимость. Как понимаю это о том, что ссылка есть в базе, но никому не видна, как будто и нет ее. Сначала мне признак показался лишним по двум причинам: а). Пусть у нас ссылка не видна, но сайт-то существует, мы его не можем заблокировать. Т.е. "невидимость" ограниченная. б). Ссылка не будет видна, если не будет никакого ее описания (люди, даты...) - ей будет негде проявиться, т.к. нет у нас такого раздела как "новые ссылки" - есть только типа "новые имена". Пытался я придумать ситуацию, когда это все-таки нужно. Соображения такие. Это неверно, что мы не даем никакой новой информации, ссылаясь на существующее. Два адреса, просто поставленные рядом, могут сказать очень многое. Кому-то это может не понравится... Дальше можно написать несколько сюжетов. Вывод - Пусть признак будет (по умолчанию, конечно, видимость должна быть хорошая). Итог: - Да будет так! (И стало так?) Новое загрузил, запустил. Удалось даже "проверить адрес", но только один раз. Второй раз - нет. Повторял в том чиле и первый введенный, но реакция была та же - "не удается проверить". //Перед самой отправкой посмотрел еще раз и подумал, что последние 4 колонки Таблицы 2 упакуются в первые три (idURL, тип информации и ее содержание) 16.10.2012 С.О. Хостинг от Denwer http://timeweb.ru/services/hosting/tariffs/?i=3955&a=0001 Поглянь, может чего интересное. х. 16.10.2012 Ханов О.А. - timeweb знаком. Бываю на нем часто, поскольку здесь располагается хостинг memoclub 17.10.2012 С.О. Все плохо с датой. Из каких соображений это - поле, где можно указать несколько дат? Как это учитывать при выборке? Все-таки дата может быть только одна. Она может быть неточной, но единственной. С неточными датами тоже все не просто. Не понятно, как их выбирать. Еще есть проблема с повторяющимися событиями. День рождения. День Космонавтики. _________ 17.10.2012 Ханов О.А. Из нового увидел календарь. В фейсбуке по этому поводу нажал бы кнопочку "Мне нравится". Слово "Дата" заменил бы на "Сегодня". Внизу можно будет написать, куда ведет эта дорога (с названием "Календарь"). - Это когда-нибудь, потом. _____________ Какие бывают даты. Для Фото: Дата съемки и дата публикации, больше никаких. Для текстов: Дата написания, дата публикакции, упоминаемые даты (их может быть много). Для человеков и для объектов - тоже много. ___________ От неточных дат никуда не деться. Даты можгут определяться и так: "в середине 20-го века", "лет сорок назад". Какой-никакой, а все же указан период, другой информации нет. Вероятно, надо один раз подумать о том, что как интерпретировать - вариантов не слишком много. _______________ С повторяющимися событиями проблема та же, что и с повторяющимися именами. Пока хочу закрыть глаза и не видеть, принять принцип: одинаково написанное одинаково. Кроме того, одинаковым считается то, что таковым обозначено вручную "разумным существом". Придется какое-то средство для этого иметь. Потом надо будет делать механизмы проверки тождества, он будет полу-ручной, полу-программный. Большой он, сложный и не очень проработанный даже концептуально, потому - потом. ================ Посмотрел внимательнее календарь. Увидел, что "Дата" - выбранная дата, не сегодняшняя (сначала не заметил). На всякий случай, отмечаю небольшое расхождение - в числах при выборе (например) месяца август. 17.10.2012 Ханов О.А. Программист прислал цифры по заполнению сервера на данный момент (26 авторов, порядка 100 текстов разного объема), они таковы: Размер бд=13.87 мб нагрузка 3.37 ср дисковая квота 238 мб/4000 мб (6%) почтовая квота 0 гб/10u, (0%) Не понял - что такое "квота", "нагрузка"? Верно ли, что 6% от 4000 мб занимают эти 100 текстов? (238/4000=6%, 13.87/4000=0.35%) Timeweb недавно удвоил объем с 2-х гб до 4-х за оплаченные 1600 руб/год. 17.10.2012 С.О. Квота - выделенный объем. Да, это 100 текстов занимают 6%. Поскольку сидят в базе с фиксированными полями и обвесом. Нагрузка - не знаю. Но странное число 3,3. Сайт не раскрученный, ему бы 0 занимать. Подправил календарь. Пора писать запросы к базе, но нет понимания как информацию структуризировать. 18 10 2012 ХО Как я представляю вывод. Начинаем, например, с человеков. В memoclub мне нравится, как выглядит "визитная карточка" автора (см. http://memoclub.ru/author/bort1/) Изменил бы я ее так. Вместо слова "Автор" написать ФИО. Справа от фото: - год рождения или годы жизни - если есть такие данные (если нет, то и слов никаких нет). - место рождения - личные сайты (если есть таковые) Внизу - так же, краткая информация. Если ничего из этого нет, в "визитке" остается только ФИО. Ниже визитной карточки - так же, как в примере - активное названия сайта (ссылки), где есть информация об этом человеке. Здесь же м.б. несколько слов о сайте (например: "фотографии" или "текст" - такая информация у нас будет). Откуда брать эту информацию? Кажется, придется это делать вручную. 1. Загрузить фото можно на memoclub, там ему присвоят адрес, на который мы можем сослаться. Пример: http://memoclub.ru/wp-content/uploads/2012/10/Foto0495-Merkin1-e1350417557371.jpg 2. Вводить годы жизни и краткую информацию о человеке придется тоже по некой форме, чем-то похожей на форму для ввода ссылок. Т.е. где-то должна бы быть кнопка "дополнить информацию о человеке", которой можно воспользоваться в любое время. (Т.е. сначала появляется имя, упомянутое в неком тексте или надписи на фото, а потом это имя обрастает подробностями) Об авторах memoclub информация есть, надо будет потом поговорить о том, как она будет попадать в нашу базу автоматически. Есть и у конкурентов, у них это выглядит так: http://familytales.ru/user/profile.php?prof=1980 (страница пользователя) или вот так: http://familytales.ru/innards/innard.php?innard=215 (страница памяти) М.б. с ними тоже можно будет о чем-нибудь договориться (есть контакт). Но это все потом, пока надо рассчитывать на ручной ввод. 18.10.2012 С.О. Что-то не опять перестаю понимать концепт. С моей т.з. форма ввода информации уже сделана (ее, конечно, можно и нужно доработать - вопрос как?). Форма содержит URL и список того, что в нем лежит по группам "время-люди-объекты-другое". Ссылки не займут много места, поэтому дизайн сделан в виде записной книжки. Нет никакого смысла делать альтернативный ввод данных по всем позициям (фотография, место учебы, дата дембеля, увлечения и т.п.) - все уже написано. Именно поэтому есть и ссылка. Если это все продублировать - тогда можно остаться в собственной системе и ссылка будет не нужна. С другой стороны, не имея полной информации о ссылки - ее не найти и не предложить. Это противоречит предыдущему абзацу. Первоначальная идея интегратора была в том, чтобы сайты сами выдавали информацию о своем содержимом. Роль интегратора - в систематизации полученной информации и построении рубрикатора в автоматическом режиме. Именно этого пока нет на Гугле и Вконтакте. Однако сейчас сайты сами ничего не будут предоставлять. Эту информацию придется забивать в свой сайт руками. Вопрос как и что именно? Что касается мемоклуба - это сопутствующий ресурс, который вписывается в концепцию "все храниться вне". Профиль автора можно попробовать извлечь по ссылке и записать в собственной базе - но опять вопрос - что именно и как размещать? Итак, основным вопросам - как был так и остается вопрос структуризации и хранения информации. Сейчас форма ввода закидывает все в базу как есть - "универсальным" способом что взял, то и положил. Вряд ли это хороший вариант. Во всяком случае, мне не понять даже как сделать запрос, к примеру, периода с 1980 г по 2012г и что я должен получить в ответ. В общем, я не понимаю, что надо делать. Может, это проще понять исходя и того, что бы хотелось видеть в итоге? Или сначала надо подвести под задачу филосовский базис. Допустим, я не согласен, что дат может быть много. Дата съемки - событие. Дата публикации - другое событие. Одно событие может иметь только одну дату, как объект - иметь только один адрес. Но человек, явление, фотография могут быть причастны ко многим событиям и объектам. Тут уже как минимум надо определиться что является ключевой информацией, а что сопутствующей - человек, событие или ссылка. Грубо говоря, если привязываться к событиям, то это: 1. база дата, описание, событие, URL. 2. база предмет, id события 3. база ФИО, id события Если привязываться к человеку, то это: 1. база ФИО, описание, URL 2. база дата, событие, id ФИО 3. база предмет, id ФИО К URL: 1. база описание, URL 2. база дата, событие, id URL 3. база предмет, id URL 4. база ФИО, id URL Текущий вариант близок последнему. Он хорош тем, что отвечает требованию поиска "объект поиска" -> результат в виде URL, Из этого следует, к примеру, что поле "дата" надо показывать рядом с полем "событие" - чтобы упаковать их в базу правильным образом. Все поля (ФИО, предмет) надо растаскивать и поэлементно записывать в базу (одну с признаком, или персональную) Однако не совсем правильный это вариант - привязываться к URL. Например, тут нет связи ФИО - событие. Связь через URL - неочевидна, поскольку один и тот же URL может описывать много событий. К тому же такая реализация похожа на Гугль. Похоже, надо делать универсальную базу с перекрестными ссылками. Как? Попробовал придумать модель взаимоотношения вещей. Получилось как-то так: Иерархия мира: 1. Все является тегом, кроме самого тега 2. На все можно сослаться, кроме тега 3. С людьми происходят различные события 4. События происходят во времени 5. В событиях участвуют объекты Получается какая-то такая таблица: Время События Люди Объекты Теги URL Время нет Общая тема Ледниковый период повторялся в: События прямая 7 ноября 1917 г - Великая октябрьская соц. революция нет Общая тема Причиной вымрания динозавров являлось: Люди Нет, Через события Мой ДР 28.10.72 прямая В 1992 г я вернулся и армии нет Общая тема Авраам родил Иакова: Объекты Нет, Через события Дата выпуска моей машины 2003г прямая ВОВ была танковая Нет, Через события В этом доме в 1861г проживал нет Общая тема Классицизм в архитектуре проявляется : Теги прямая ДР, Застой, Ельцин прямая ДР, Застой, Ельцин прямая ДР, Застой, Ельцин прямая ДР, Застой, Ельцин нет URL ??? прямая Строительство ЗСД, Фонтанка № Прямая Иван Иванов в контакте Прямая Анонс смартфонов Nokia нет нет Общая тема Подборка ссылок <ремонт в доме> Одной очевидной неочевидной связью является "общая тема". Т.е. авторская "подборка" или нечто, вычисленное автоматически по степени похожести. Данная тема сейчас не рассматривается. Формально, из таблицы получается 10 баз: 1. Событие, дата 2. ФИО, id события 3. Объект, id события 4 .Тег события, id события 5. Тег даты, id даты, 6. Тег ФИО, id ФИО, 7. Тег объекта, id объекта 8. URL Событий, Id события 9. URL ФИО, id ФИО, 10. URL объектов, id объекта 24.10.2012 Ханов О.А. Заработало! Сделал две записи. Увидел: Измения есть в разделе "Записи" (кнопка слева) На странице, открывающейся по ссылке вижу надпись "Всего записей: 4". Активные: слева - "Запись...", справа - адрес. При нажатии на любой из адресов открывается новое окно с адресом "MemFace..." Нажимаю "Запись N4". - Неверно листаются "<< Prev Next >>" - Не изменяются введенные данные (я решил, что сейчас буду корректировать) - Активная ссылка вверху тоже ведет в "Двадцвтый век". Увидел изменения в разделе "Календарь" - внизу надписи "Найдено:..." 25.10.2012 С.О. Изменения - календарь. Пока нет возможности посмотреть выборку, но есть возможность ее задать. Навигация полная, больше ничего не собираюсь по этому поводу делать. В принципе, могу подсветить даты разным цветом в зависимости от информации по ссылкам, но непонятно как. 4 темы дают 16 комбинаций. Кроме как кодировать наклонной штриховкой из 4-х цветов ничего не придумать. Завтра добавлю кнопку "посмотреть выборку" - будет полноценный фильтр по дате. Открывать буду в новом окне, как и записи. С одной стороны - "полный" экран (вернее - чистое поле) с другой - выборка сохраняется в старом окне (с ней еще можно работать). 25.10.2012 Ханов О.А. Посмотрел календарь. Не думаю, что надо менять цвет в зависимости от информации - ее, надеюсь, будет много, разноцветной. 26.10.2012 Ханов О.А. Соображения по поводу коммерческой части. У нас будет естественный раздел для сбора информации рекламного характера, это "Теги". Тег "Кофеварка", например, изначально это предполагает - там следует ожидать информацию о том, каки К. бывают, какие для чего использовать и, конечно, где можно купить. И в других разделах будет место для рекламы. Пример. Основатель некой фирмы - человек, его биография естественным образом ляжет в раздел "Люди", а его биография не может не содержать информацию о деятельности фирмы. То же самое в разделе "Объекты". Магазины - тоже объекты. Организация - тоже объект, хотя и другого рода. В правилах надо будет записать, что рекламная информация должна быть содержательная, но не эмоциональная. И даже не "сопоставительная" (у нас лучше скорость, объем...). Объективные статьи по поводу сравнения вариантов полезны, но мы не занимаемся публикациями, и будем отправлять желающих туда, где это можно сделать (естественно, в соответствующий раздел Мемоклуба). Рекламная информация должна быть платной. Поскольку часто трудно бывает разделить рекламу и информацию, я (сегодня) склоняюсь к закрытому доступу, который предоставляется: - проверенным добывателям хороших (правильных) ссылок - бесплатно или даже за зарплату от нас, - серверам - по договору, за оплату, - желющим регулярно давать свои рекламные сообщения (фирмы и рекламные агенства) - по договору, - желающим "разово" дать рекламу своего продукта - мы сами составляем текст. Договор предполагает существование юридического субъекта. Думаю, что поначалу мы найдем, к кому присоседиться, а потом (если сложится) надо будет оформлять. Наша реклама будет принципиально отличаться от рекламы, на которую ориетируется memoclub, - это будет прежде всего информация, размещенная в своем разделе, она не появится там, где ее совсем не ждут. Поэтому ее зависимость от посещаемости будет более слабая, поскольку "информационные свойства" сообщения интересны не только источнику, но и самому серверу. Мы будем готовы (вначале) размещать рекламу бесплатно или за символическю плату. - В memoclub такое не пройдет - в любом случае реклама там будет мешать восприятию информации, а даром помеху внедрять нехорошо. ______________ Изменения видел, но пока их "внешние" проявления невелики. Далее "научная фантастика". Мысли бродят на тему дополнительной информации (пока только) о вводимом человеке. Было бы полезно записать "Иванов И.И." и добавить его роль в упоминаемом сюжете (повар, начальник, шахматист...). Это было бы полезно в дальнейшем - при опознании одинаковых субъектов, о которых идет речь в разных источниках. Но не понимаю - как лучше вводить доп. информацию (например, заключать в скобки). И понимаю, что эта информация создаст большие проблемы для ее укладывания в базу, поскольку один и тот же человек может выступать в разных ипостасях ("то акдемик, то герой, то мореплаватель, то плотник"). Поэтому, вероятно, эту тему надо оставить на потом, несмотря на неизбежные трудности ее внедрения в готовый продукт. У даты тоже есть признаки (повторяюсь) - дата создания, публикации, последней корректировки, упоминаемые даты. Но все это тоже - после. Занимаюсь (в частности) преобразованием формата, который дают авторы-знакомые Ю.Ф. в нужную форму. В последней такой публикации в оригинале к тексту прилагался фотоальбом, который не был принят, поскольку МК занимается все-таки текстами. Мне кажется, не следует пренебрегать возможностями narod.yandex.ru, который предлагает неограниченные пространства бесплатно, с хорошей (открытой) структурой размещения файлов. - Но это я уже смотрю "за горизонт", за пределы Интегратора, вспоминая фотопроект. 27.10.2012 Ханов О.А. 1. "Запись N..." Имя автора - формуляра? сайта? 2. Вопрос: Может ли один и тот же автор заполнить несколько формуляров на один Интернет-сайт? - Это полезно для такой компоновки: перечисляются люди и объекты, имеющие отношение к одному событию, к другому будут привязаны другие люди (на одном сайте могут быть описания разных событий) 3. Календарь. Фраза "Найдено в выбранном дне" для меня звучит плохо. Лучше (при точном переводе) что-нибудь такого типа: "Для выбранной даты обнаружено:". 4. Есть обнаруженные записи, имеющие отноношение к выбранному месяцу. Надо сделать тоже самое для целого года. (Для старых событий будет упоминаться только год, а иногда еще крупнее - период, типа: "Начало века") 5. "Добавить запись" в окне после ее проверки, в поле "Описание URL:" URL - неверный=последнему введенному. 6. Проверить не удалось, вопрос: Очень длинный адрес - переносится ли (частично) на другую строку? 28.10.2012 Ханов О.А. Раздел "Люди" (аналогично - другие) 1. Если на одно имя выпадает более 1-го раза, не отправлять на сайт и на "Запись", а отправлять на "именную" страницу, где перечислены все ссылки для данного имени. М.б. сделать по разному - оставить это страницу, как есть, а при входе по букве сделать по-другому. 2. В разделе "Записи" мне кажется, лучше показывать не логин, а "Событие" 31.10.2012 Ханов О.А. Посмотрел, увидел: Запись N8. Имена на одну и ту же букву, записанные в одной строке, показываются все вместе, т.е. не разделяюися (см. имена на букву "П"). То же самое - с объектами (см. запись 7 и объекты на "Л") Важно: Каждое имя должно занимать одну строку. Причина: В грядущих версиях предполагается работа с именами - с каждым отдельно, но не с группой имен. Сейчас, пока у нас нет объединения одинаковых лиц, пусть они будут записаны рядом. 31.10.2012 С.О. У меня другие записи, поскольку другая база. Каждая строка - это ИД записи (он же URL, он же формуляр) - это вопрос принципиальный. Мы ищем только ссылки, ничего больше => не может быть двух строк с одним номером => нельзя разнести имена, если они ссылаются на одну ссылку. Чтобы работать как-то иначе, надо как-то иначе организовывать БД. Если в одном формуляре будет записано Петров А и Петров Б через запятую, а поиск будет по букве П, то будут показаны оба в одной строке. Вообще говоря, это случайность. Я хотел вывалить вообще все, что записано в поле. Это давало бы более емкое представление о ссылке. Что касается работы с именами, то в дальнейшем можно из каждого имени сделать ссылку, и ее уже детализировать отдельно от остальных. А вообще, это другая задача. Под нее и интерфейс должен быть другой. Что касается вытаскивания формуляров из МК. Пока разбираюсь с базой. Вообще, выло бы проще, если бы программист выгрузил бы файл с полями через разделитель. Да и универсальньней это, чем делать импорт копии базы МК в Денвер, потом запускать скрипт, выкладывающий файл, который потом загружать на наш сервер. 31.10.2012 С.О. Что-то мне перестает нравится идея выуживания информации из базы. Лучше все-таки договориться с Программистом об интерфейсе. _________________ 31.10.2012 Ханов О.А. Не поддается база - не надо тратить время. То, что я увидел, похоже на несколько первых строк, которые выдаются при наезжании мыши на название текста. Но если так, то не понятно, зачем для этого нужна база, почему не достаточно SQL? ___________ По предыдущему письму (забыл, что сервер еще не запущен и мы видим разное). Цитата: "Каждая строка - это ИД записи (он же URL, он же формуляр)" Я понимаю (понимал) это так. Есть ID ЗАПИСИ. В каждую запись входят имена, объекты и т.д. (Для простоты изложения ограничусь только именами). Каждому имени, входящему в запись сопоставлен один и тот же ID ЗАПИСИ. Кроме ID ЗАПИСИ у каждого имени есть свой ID - ID ИМЕНИ. Каждому ID ИМЕНИ можно сопоставить: - Официальное название (например, Иванов Иван Петрович) - Перечень псевдонимов (Иванов И.П., Ванька, Петрович...) - Перечень ID ЗАПИСЕЙ, в которые этот ID ИМЕНИ входит (Это поле не обязательно, но может быть удобным). Т.е. я предполагал, что кроме базы записей есть база (список) всех упоминаемых имен и этот список отображается в разделе "Люди". Отображается так. Если данное имя упоминается только в одной ссылке, она тут же и приводится. Если же ссылок для этого имени много, то имя активно и по переходу выходим на "именную" страницу, где перечислены все эти ID ЗАПИСИ, а впоследствии и вся другая информация для этого человека (его связи с объектами, датами и т.д.). (Можно, конечно, попытаться обойтись без базы имен и извлекать имена из базы записей командой типа "select distinct", но это как-то сложнее) Сейчас сделано: имя - ссылка. - Пусть будет так. Но есть предположение, что мы все-таки до конца не согласовали концепт. Я вижу его так. 1. Это сервер о времени, людях, событиях, объектах, а также о самых разных областях "окружающего мира", которые задает раздел "Тэги". Это не сервер об Интернете. 2. И потому ссылки имеют служебное значение - в них дается информация о выбранном человеке, событии и т.д. Я даже предполагал такую ситуацию, что человек есть, а ссылки на него нет (пока). По этому поводу в письме от 18.10 я и говорил о возможности заполнения "визитной карточки", в которой может быть (например) только имя. 3. В такой концепт не вписывается фраза: "Это давало бы более емкое представление о ссылке". - При выборе имени, от ссылки трубуется только информация об этом человеке, все остальное надо бы убрать как спам! Итог такой. Существующий задел (MemFace) на сегодняшний день удовлетворяет (пока) разным концептам. Т.е. надо остановиться и попытаться этот концепт более четко определить. Если вдруг окажется, что здесь есть две задачи (или более), не перекрывающие на 100% др. друга, то надо решать ту, к которой "душа лежит" (или м.б. обе, оформив их как разные серверы, как это предполагается с Интегратором и Мемоклубом - вариантов много, - "хороших и разных"). 31.10.2012 С.О. С структурированием информации у меня уже возникали проблемы. Однако потом (поговорив с тобой) проблемы пропали. Собственно, решением вопроса стал концепт первичности ссылки (и описания). Итогом любого поиска является ссылка на внешний ресурс. Этот ресурс описывается в терминах "люди-объекты-события-теги". Если это не так, то не было никакого смысла начинать добавление записи с проверки URL а также привязывать к нему внутреннюю синхронизацию. Сейчас это реализовано так: 1. есть таблица-реестр, в который заносится новая запись (автор, ссылка). Id этой записи уникален. 2. еще есть таблицы имен, тегов и т.п. в которые заносится информация из соответствующих частей формы, и снабжается уникальном ID-ом записи. В принципе, все можно было бы держать в одной таблице, но показалось, что так проще делать выборки. Информация из полей "Вася, Федя, Степа" растаскивается "в столбик" с одинаковым ID-ом записи. Это ее немного структурирует и не дает перемешаться. Перед занесением информации в таблицу предполагается (но не реализовано) проверять наличие в таблице похожей информации. Это в дальнейшем упростит создание полноценных таблиц имен (официальных), объектов и т.п. На данном этапе данный вопрос не рассматривается. Основная задача - сохранение исходной записи в максимально первозданном виде. Насколько понимаю, сейчас стоит задача свернуть повторы. Т.е. если "Вася" упоминается в десяти ссылках, не выводить все десять, а вывести только Васю? ____________ 01.11.2012 Ханов О.А. Структура, которую вижу в этом письме, сответвует тому, что сидит у меня в голове - расхождений нет. Есть только один вопрос (в тексте явного ответа не нашел) - в таблицах имен, тегов и т.п. кроме уникального ID записи имеются ли уникальные ID имени, объекта и т.д.? Если да, то к структуре базы нет никаких вопросов, остальное можно делать как угодно, а потом изменять и наращивать. Вопрос возник из-за фразы: "...нельзя разнести имена, если они ссылаются на одну ссылку. Чтобы работать как-то иначе, надо как-то иначе организовывать БД". - Почему? - если есть собственные ID у имен, тегов и прочего. По поводу сбора всех "Вася" в одну кучу, - это, конечно, хорошо, и в конце концов, их надо будет собрать. Но если есть сейчас сложности, - пусть будут пока разнесенные. Меня больше беспокоят Вася и Виктор через запятую, которые срослись как сиамские близнецы, - так сильно, что их никак не разъединить. 01.11.2012 Ханов О.А. Да, мне действительно нравится вариант "Вася, надено 2 (посмотреть)". По ссылке "посмотреть" выходим на страницу, целиком посвященную Васе, на которой впоследствии можно отразить связи Васи с Виктором, Иваном, Петром Петровичем, а также с институтом ЛЭТИ, Театром Музкомедии, городом Биробиджан и т.д.. То же самое - с объектами, событиями, датами и тегами. Ссылка первична в том смысле, что это основной источник информации. Мы занимаемся предъявлением этой информации, добавляя вручную (пока) немножко своей (в "формулярах"). 01.11.2012 Ханов О.А. Юрий Федорович предлагает убрать из memoclub формуляры, т.е. описания публикаций (люди, объекты, даты и т.д.), т.к. их мало кто заполняет. Я и сам хотел ему это предложить по причине плохого исполнения режима "Поиск" (где эта информация должна бы работать), но пока не согласился. Ликвидация формуляров, с одной стороны, дает дополнительное оправдание Интерсерверу, с другой - теряется причина для особого взаимодействия Интерсервера и memoclub. Что лучше - не знаю. М.б., поговорить с Ю.Ф, на эту тему, и формуляры у него оставить, а Поиск - убрать. Пример оформления страницы типа "Вася" (у конкурентов Ю.Ф.): http://familytales.ru/innards/innard.php?innard=179 02.11.2012 C.О. Ну, тут несколько соображений. 1. Формуляры не заполняют, потому, что это необязательно и "сбоку" от интерфейса. Возможно, если сделать многоступенчатую форму ввода, то это исправит положение. Добавить запись, далее форма "перечислите людей", "перечислите объекты", и в конце "вставить текст". 2. После ввода текста можно попробовать натравить программу, которая выудит из него даты и все слова с большой буквы. Дальше предлагать клиенту немного отредактировать список и после этого дать ему кнопку "записать". Однако я понимаю, что для ЮФ формуляр действительно не нужен. Он делает прозу.ру - ничего больше. 02.11.2012 Ханов О.А. По поводу программы, которую "можно натравить". Имен и их производных, на самом деле, не очень много. Фамилии, отчества тоже повторяются. Есть признаки принадлежности к разряду фамилий и отчеств (Имя+"ов", "вич"). Если иметь базу реальных ФИО, то многое можно опознать автоматически. Базу реальных ФИО (согласно концепту) создает и наращивает Интерсервер. То же - с объектами и, (самое простое) - с тегами. (Все это, конечно, темы будущих занятий). Ю.Ф. действительно все более сползает в "Прозу". Этому способствует то обстоятельство, что привлеченные авторы приносят готовые тексты книг, уже напечатаных в бумажном варианте. Все больше упоминаний о "литературности" и о форме, есть разделение того, что я выложил на сервер на "литературное" (где есть интрига) и чисто "информационное". В этом он, однако, солидарен со своим конкурентом - familytales, который говорит о приоритете литературности и предлагает услуги по литературной обработке идей (не пишу "воспоминаний" поскольку они прямым текстом предлагают авторам не сторониться фантазий). При всем моем уважении к литературной форме, я, однако, склоняюсь к приоритету содержания. Собственно, Интерсервер не видит форму, он пытется рассмотреть содержание. Для меня образец - Достоевский, который не писал красиво, а иногда писал плохо. Но это немногие замечают, а те, кто заметил - прощают. Другой образец - Маяковский, который из словесного мусора делал хорошую лирику. Что же касается "интриги", - голые факты, выложенные в определенной последовательности, могут дать хорошую интригу. Интерсервер будет заниматься извлечением и связыванием фактов - будет там много интриги и много неочевидной (т.е. новой) информации. 02.11.2012 С.О. - Ханову О.А. Как-то так. Базу надо удалить. Пока не развернуть "Найдено записей, подробнее о..." Посмотри для начала "помощь". 02.11.2012 Ханов О.А. - С.О. Все посмотрел, и ... сказать нечего! Т.е. нигде не споткнулся, все укладывается в мои представления (на данный момент). ___ Посмотрел отложенное в сторону письмо из налоговой и увидел надпись "оплатить до 6.11.2012". Получается: 3645(Вектра)+2816(Ауди)=6466. Личные карточки04.11.2012. Ханов О.А. - С.О.Еще одна (пока еще немного смутная) идея. Для каждого человека, кроме ссылок, где он упоминается, хотелось бы иметь ему посвященную страницу (фото, биография, годы жизни и т.д.). Такой вариант (создать личную страницу некого родственника или знакомого) мы тоже можем предложить. Т.к. эта страница требует редактора, ее надо размещать не у нас, а на memoclub. При выборе в нашем списке такого имени переходить не на нашу внутреннюю страницу с перечнем ссылок, а на какую-то внешнюю, где все это будет и куда будут добавлены выявленные нами ссылки. Т.е. все, что потребуется для этой услуги на нашем сервере - добавить механизм изменения (вручную) адреса перехода для выбранного имени. У нас же по-прежнему остаются только ссылки, ничего больше. В начало |