Проблема 404
Oct. 30th, 2014 03:25 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вот тут
jolaf расстраивается по поводу исчезновения полезной информации из интернета.
Вообще-то чеширнет исходно задумывался и для борьбы и с этой проблемой тоже. Если информация копируется с узла на узел, то кто-нибудь, всегда будет отводить для хранения истории по определенной теме больше ресурсов чем другие. Средства запросов на поиск информации на других узлах в протоколе предусмотрены.
Осталось только взять и написать. К сожалению, как раз до этого руки хронически не доходят.
Хорошо хоть всю криптографическую базу недавно доделал. Но тестов на модуль identity (единстыенный из написанных) так и не написал пока.
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Вообще-то чеширнет исходно задумывался и для борьбы и с этой проблемой тоже. Если информация копируется с узла на узел, то кто-нибудь, всегда будет отводить для хранения истории по определенной теме больше ресурсов чем другие. Средства запросов на поиск информации на других узлах в протоколе предусмотрены.
Осталось только взять и написать. К сожалению, как раз до этого руки хронически не доходят.
Хорошо хоть всю криптографическую базу недавно доделал. Но тестов на модуль identity (единстыенный из написанных) так и не написал пока.
no subject
Date: 2014-10-30 01:32 pm (UTC)По-моему, там обсуждается проблема не потери информации, а накопления несовместимости. Если "информация" -- это это сайт-CMS со своей базой, и скриптами, то рано или поздно он перестанет работать, потому что сменится версия MySQL или PHP, или что нибудь в таком духе. А решать технические проблемы будет уже никому не интересно.
Если это электронные документы в более менее стандартных форматах (txt, pdf, DejaVu), то они хранятся в коллекциях десятки лет и доступны через торренты. Они никуда исчезнуть не могут, и никакой проблемы в этом нет.
Я сам держатель ролевого сайта в мемориальной фазе. Хостинг и домен я регулярно оплачиваю, сайт -- на движке медиавики -- пока еще дышит, но только на чтение. При попытке отредактировать страницу данные портятся. Но разбираться почему так мне совсем не хочется.
no subject
Date: 2014-10-30 01:52 pm (UTC)no subject
Date: 2014-10-30 01:52 pm (UTC)в котором ключевые - не технические, а психологические - см. хотя бы
http://jolaf.livejournal.com/668544.html?thread=10948480&style=mine#t10948480
no subject
Date: 2014-10-30 02:01 pm (UTC)no subject
Date: 2014-10-30 02:12 pm (UTC)Я пробовал, поверь.
Я видел людей, которые пробовали.
Барьер здесь именно психологический.
Пример смешной: http://qkowlew.livejournal.com/27200.html
и реакция - Чтож ты для хомячков линк не вставил.
Грузите отсюда, пушистенькие вы мои. :-)
Бесполезно.
Периодически опять происходит одно и то же - люди просто не воспринимают объяснений сложнее "тыкнуть мышкой в веб интерфейсе" и "поставить вот эту программу"
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-10-30 02:30 pm (UTC)vitus и inkelyad очень правильно пишут. В идеальном интернете сам базовый протокол должен обеспечивать, что если я получил с некого узла некий материал, то
а) тем самым создана еще одна копия, к которой остальные участники сети могут обратится.
б) я могу пользоваться этим материалом, при этом от меня не требуется специальных познаний в области сайтостроительства (не требуется знать, как разворачивать сайт на медиавики из бэкапа).
no subject
Date: 2014-10-30 04:00 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-10-31 12:27 am (UTC)юзер десктопа может воткнуть еще один диск. а что делать ноутбучникам?
при этом делить данные по типам тоже не вариант - лет через 50 те же ролики понадобятся исследователям поп-культуры и порноискусства начала 21 века.
(no subject)
From:no subject
Date: 2014-10-30 03:18 pm (UTC)no subject
Date: 2014-10-30 04:21 pm (UTC)no subject
Date: 2014-10-30 05:23 pm (UTC)Причём в этой горе есть дополнительные "спайки" - неоднородности, порождённые не только набором этих горных пород, но и "сервисами-прокладками". Зависимости от услуг, от времени, от законодательства, от воли умных людей и идиотов.
При любых построениях надо осознавать, что мы сейчас ведём речь о сохранности снежинки, сверкающей на этом леднике, при условии, что эти горы ВСЁ ВРЕМЯ ТРЯСЁТ.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-10-30 07:23 pm (UTC)Вон я тут давеча писал что
Все электронные магазины имеют примерно одинаковое workflow, примерно одни и те же каталоги продукции etc. Там, не считая дизайна, 3-4 оси кастомизации с 5-6 вариантами на каждой. Вполне по зубам стандартной софтине со стандартным форматом данных.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-10-30 04:04 pm (UTC)Если оно как-то автомагически (предусмотрено протоколом) самореплицируется, это другое дело, конечно.
no subject
Date: 2014-10-30 05:19 pm (UTC)no subject
Date: 2014-10-30 07:19 pm (UTC)Правда не уверен, что это где-то кроме ЖЖ-шных дискуссий описано.
no subject
Date: 2014-10-30 08:23 pm (UTC)(no subject)
From:no subject
Date: 2014-10-30 05:45 pm (UTC)А вот раньше, во времена диалапа, стояла у меня какая-то кеширующая прокся на винде, которая прям всё всё записывала и потом можно было вообще не замечая оффлайна сидеть через неё на уже посещенных страничках.
no subject
Date: 2014-10-30 09:38 pm (UTC)no subject
Date: 2014-10-30 09:47 pm (UTC)Хотя конечно может быть самое правильное будет, это отлавливать изменения в DOM'e, натравливать на них какой-нибудь xmldiff(от того же react например) и хранить себе спокойно отдельно и оригинал, и diff, а ключом первичным датувремя и урл считать. Зря я наверно боюсь такое замутить.
no subject
Date: 2014-10-30 09:54 pm (UTC)Ну и скриншота есть дата снятия, что однозначно привязывает его к моменту чата или версии документа. Так что и тут не вижу проблемы особо.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-10-31 07:18 am (UTC)А графических программ способнрых справитсья с картинкой 1920x108000 на свете очень мало. (да и большая часть графических форматов. как ни странно имеет ограничение в 65535, а то и 32767 пикселов вертикального размера).
no subject
Date: 2014-11-01 09:26 am (UTC)Сейчас они позволяют в САМОМ ДЕЛЕ закешировать (а не испортить показ!) менее чем 5% из обходимых пользователями этих фирм страниц в современном интернете.
Интернет изменился.
no subject
Date: 2014-10-30 08:20 pm (UTC)no subject
Date: 2014-10-30 09:40 pm (UTC)Можно что-то такое делать в i2p, например, что б избежать претензий всяких личностей, любящих деньги больше, чем здравый смысл.
no subject
Date: 2014-10-31 01:54 pm (UTC)Бонус Vimeo в том, что можно скачать прямо исходный файл, не пережатый для веб-плеера.