Не 1/1000, а целых полтора процента. Это я еще не посчитал другие типичные ошибки, вроде разнобоя в спеллинге имен авторов и названий серий (которые реально достатют при работе с этими файлами в андроидном fbreader), некорректно размеченные секции (что мешает навигации по оглавлениям), нераспознанные слова (кстати второй по частоте источник non-well-formedness после замены кавычек-елочек на знаки больше-меньше), всякую фигню в виде попавших при сканировании в текст в виде абзацев номеров страниц.
no subject
Date: 2017-01-23 07:04 am (UTC)