Прошу советов.
Появилось желание оцифровать книжку (сборник статей Фейерабенда - издание, правда, полное говно, но осуществленный г-дином Никифоровым буквально в прошлом году перевод основных работ автора, включая и перевод этой книги вполне себе приличный, насколько я могу судить), до этого имел дело разве что со слайдовой пленкой. Ознакомился с доступной по этому поводу информацией, представленной здесь: http://ru.wikibooks.org/wiki/%CE%F6%E8%F4%F0%EE%E2%EA%E0_%EF%E5%F7%E0%F2%ED%FB%F5_%F2%E5%EA%F1%F2%EE%E2 ; и, например, здесь: http://www.scagletti.ru/tbooks.html
Решил делать pdf: во-первых, потому что ленив и довольно безграмотен, а нормальная вычитка требует прямо противоположных качеств и отнимает массу времени (более того, сама книга полна ошибок, механизм OCR, насколько я понял, все еще далеко не идеален, да и то состояние, в котором пребывают тексты разномастных "свободных библиотек" редко можно назвать удовлетворительным); во-вторых, по моему скромному мнению почти любая, даже самая отвратительная верстка вкупе с самым блевотным оформлением много лучше того, во что превращает текст большинство программ для чтения fb2, epub и прочих.
Вопросов после прочтения вышеприведенных материалов стало меньше, но они, тем не менее, есть. Во-первых, об OCR. Имеет ли вообще смысл проводить распознавание текста без последующей вычитки? Если имеет, то какими средствами следует воспользоваться для распознавания и наложения OCR-слоя? Может быть, Acrobat уже всему научился? Во-вторых, о ссылках. Хотелось бы сделать ссылки на примечания, а может и на библиографию тоже, но всю информацию об этом, я, видимо, пропустил. В-третьих, о страницах. Вопрос к вашим представлениям об удобстве чтения. Допустим, для меня все было бы очевидно - работать, конечно, удобней с каждой страницей отдельно -, если бы не великое множество энтузиастов, так и оставляющих скан в виде книжного разворота. Разумеется, для обладателей планшетных компьютеров и больших мониторов все едино, а вот устройства с экранами e-ink, пусть даже самыми большими, могут доставить некоторые неудобства в связи с этим. Или может быть я ошибаюсь, и вам по какой-то причине удобней работать именно с разворотом? Короче, мне было бы интересно ваше мнение по этому вопросу.
Вот вроде и все. Если вы можете дать совет, не затрагивающий заданные вопросы, то я так же буду рад. Ах да, в данный момент доступен вот этот сканер: http://market.yandex.ru/model-spec.xml?modelid=1555647&hid=138608
Потянет?