Про жж-шный поиск.
Apr. 5th, 2015 05:58 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Пришел к выводу что яндексовский поиск совсем нихрена не ловит мышей в ЖЖ.
Когда мне потребовалось найти собственный пост 2005 года, ни оно, ни тот якобы поиск, который в шапке ЖЖ (а на самом деле там ссылка на гугль) не смогло мне его найти.
Пришлось искать банальным grep-ом по сохраненной копии ЖЖ. В связи с этим я решил, что надо бы эту самую сохраненную копию поддерживать в более актуалльном состоянии.
Прикрутить что-ли ее обновление по крону и xapian-овский индекс к ней приделать?
Одно плохо - эта копия у меня делается довольно старой версией ljsm, которая в разворачивании тредов полагалась на внешний сервис, а тот сервис давно умер.
В результате комментарии сбэкпалены далеко не все. Ну не то, чтобы я очень по этому поводу переживал, но интересно есть ли решения лучше.
Задача - создать копию ЖЖ на своем локальном диске, чтобы было возможно больше информации (включая комментарии, вставленные со сторонних сайтов изображения и т.д) и чтобы всё это можно было смотреть браузером как статический сайт.
Когда мне потребовалось найти собственный пост 2005 года, ни оно, ни тот якобы поиск, который в шапке ЖЖ (а на самом деле там ссылка на гугль) не смогло мне его найти.
Пришлось искать банальным grep-ом по сохраненной копии ЖЖ. В связи с этим я решил, что надо бы эту самую сохраненную копию поддерживать в более актуалльном состоянии.
Прикрутить что-ли ее обновление по крону и xapian-овский индекс к ней приделать?
Одно плохо - эта копия у меня делается довольно старой версией ljsm, которая в разворачивании тредов полагалась на внешний сервис, а тот сервис давно умер.
В результате комментарии сбэкпалены далеко не все. Ну не то, чтобы я очень по этому поводу переживал, но интересно есть ли решения лучше.
Задача - создать копию ЖЖ на своем локальном диске, чтобы было возможно больше информации (включая комментарии, вставленные со сторонних сайтов изображения и т.д) и чтобы всё это можно было смотреть браузером как статический сайт.
no subject
Date: 2015-04-05 06:23 pm (UTC)Гугл действительно не видит (https://www.google.com.ua/search?q=vitus-wagner.livejournal.com+%D0%A2%D0%B0%D0%BB%D0%BB%D1%8D&ie=utf-8&oe=utf-8&gws_rd=cr&ei=P3whVZa0OsaRsAHiw4CQCg#q=site:vitus-wagner.livejournal.com+%D0%A2%D0%B0%D0%BB%D0%BB%D1%8D+%D0%BE%D1%84%D0%B8%D1%86%D0%B5%D1%80), удивительно.
Хотя, конечно, локальный бэкап блога хочется иметь независимо от того, хорошо ли он проиндексирован поисковиками.
no subject
Date: 2015-04-05 06:39 pm (UTC)no subject
Date: 2015-04-06 07:57 am (UTC)no subject
Date: 2015-04-06 08:00 am (UTC)no subject
Date: 2015-04-06 08:02 am (UTC)no subject
Date: 2015-04-06 12:59 pm (UTC)