Про распрделеленную флибусту
Oct. 3rd, 2024 11:25 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вообще по-моему близким к идеалу протоколом для синхронизации многочисленных личных и семейных электронных библиотек является NNTP.
Пишешь список групп (категорий и жанров) которые тебе интересны, твой сервер стучится к соседскому и спрашивает "а вот GROUP такая-то у тебя есть?" Тот отвечает "IHAVE и список идентифкаторов произведений (в оригинальном NNTP - статей, здесь кни)". Наш сервер "О, SENDME вот это, вот это и вот это (а остальное у меня уже есть)" При этом есть и cancel messages, и понятие supercedes.
У fb2 правда аналог понятия supercedes встроенный. Там есть version.
Но вообще с заменой книги на "улучшенную и исправленную" надо быть осторожным. В распределенной системе наверняка заведутся копирасты, заменяющие текст на ссылку "купите вот здесь" и цензоры, по разным оображениям вырезаюищие те или иные куски.
Ну и вообще в качестве IHAVE вполне может выступать уже существующая система OPDS-каталогов. Нужно только к своей библиотеке приделать робота, который будет шариться по списку OPDS-каталогов и скачивать всё, что по его мнению может хозяина заинтересовать.
Но в распределенной системе существенно актуальной будет задача поиска информации. Это при наличии такого центрального хаба, как флибуста было хорошо. Все заливали книги на флибусту, а потом все скачивали с торрентов ежемесячные обновления. Это гарантировало что при относительно разумных затратах места и траффика у всех будет всё.
А вот как быть в распределенной системе? Держать весь каталог библиотеки в DHT? Как-то многовато по-моему будет. Особенно если учесть что для каждой книги придется держать довольно длинный список узлов, где она доступна. Или достаточно держать список групп? Жанров и категорий не так много. А там если тебе захотелось редкую книгу ну будешь перебирать сотни и тысячи серверов с данной группой. пока не найдешь такого, где она есть.
Потому что если попытаться организовать более-менее постоянный бэкбон (как было в юзнете), то скорее всего по нему начнут наносить удары. Как по распространителям нежелательной (не важно по соображениям копирайта или соображениям цензуры) информации.
no subject
Date: 2024-10-03 10:02 am (UTC)Зато авторов дофига.
А без поиска/фильтра по автору - деньги на ветер.
no subject
Date: 2024-10-03 10:27 am (UTC)Поиск (по локальному хранилищу) и синхронизация (локального хранилища с удаленным) это задачи немножко разные.
no subject
Date: 2024-10-03 07:03 pm (UTC)Дожить бы, конечно, до тех светлых времен когда это станет актуально.
no subject
Date: 2024-10-04 04:19 am (UTC)Список жанров у нас зафиксирован в XML-схеме. Категории тоже где-то зафиксированы. То есть это не динамически создается.
Вообще список жанров и категорий вещь такая, копирайтом не облагающася, так что непонятен интересант этой атаки.
Ну и механизмы демократического контроля над созданием групп вообще говоря и в юзнете, и в fido уже отработаны.
no subject
Date: 2024-10-04 07:36 am (UTC)no subject
Date: 2024-10-04 07:45 am (UTC)На большинстве таких ресурсов вообще толком не читали XML-сехму fb2. (скорее всего даже языка, на котором она написана - не знают). Мошкову в свое время я даже здесь высказывал претеннзии на что он сказал что-де ему генератор fb2 законтрибутили и внутрь он не лазил.
Лично меня в таких fb2 больше всего раздражает не жанр (после того как книга попала ко мне в избранную коллекцию я уже ориентируюсь не по жанру. а автору-заглавию-серии) сколько разбиение на главы и отсутствие нормальных сносок. А это правится только вручную.
Кстати вот систему краудсурсинга издательского процесса - корректрура, верстка и т.д. надо как-то продумывать. Тут видимо придется опираться на опыт википедии.