[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: huge_typewriter.jpg -(454 KB, 1021x1533, huge_typewriter.jpg)
454 No.16573  

Ну что, предлагаю попробовать организовать уютное и неторопливое "издательство" с разделением труда на базе сего треда. Работать, я думаю, стоит по примерно следующей схеме:

  • Загораемся желанием поделиться с народом имеющейся на руках/в продаже/в библиотеке/на соседней помойке книжкой, но не имеем желания оцифровывать её в одиночку. Пишем об этом в тред.
  • Набираем необходимое количество добровольцев. Обговариваем, какой тип файла и каким образом хотим создать, распределяем между собой обязанности.
  • Собственно, работаем. Не забываем договориться о способах передачи друг другу промежуточных результатов работы.
  • Заканчиваем работу, выкладываем её в тред и на соответствующие ресурсы. Всем похуй.

Небольшой комментарий к вышеперечисленным пунктам. Информацию о способах оцифровки печатного текста можно легко нагуглить в любых количествах, поэтому здесь приведу только несколько советов и ссылок, вполне возможно что и совершенно бесполезных.
Обмениваться файлами может быть удобно через дропбокс, но здесь, разумеется, решает каждый сам - файлосвалки, облачка, торренты или еще что. Вот здесь http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07.htm можно получить основную информацию о процессе создания djvu-файлов из печатной продукции. Pdf делается точно так же, только весь этап работы, следующий за обработкой сканов происходит в программе Adobe Acrobat. Не знаю, стоит ли распознавать текст акробатом, но думаю, что в любом случае следует уделить как можно больше внимания редактуре оного, распределив его части между всей командой. То же замечание справедливо и по отношению к группам, работающим над созданием чисто текстового файла, будь это fb2, epub, mobi или что угодно. Такие файлы можно создавать, видимо, распознавая текст с сырого скана, после чего его тщательно редактируя. Затем делается собственно файл - fb2, например, вот этим http://htmldocs2fb2.narod.ru/. Да, и еще: хорошим тоном считается делать и выкладывать все возможные типы файлов (pdf и djvu для специализированной литературы; fb2, mobi, epub и все остальное для художественной), поэтому лучше, я думаю, действовать таким образом.
В заключение хочу сказать, что в нашем деле не важно с чем и как именно вы работаете, важен результат работы. По той же причине не следует никуда торопиться и торопить остальных. Расслабляемся, получаем удовольствие, обсуждаем книжки.

>> No.16575  
>Всем похуй.

Ключевая фраза стены текста выше.

>> No.16576  
Файл: iichan_ru.gif -(1 KB, 53x18, iichan_ru.gif)
1

Недавно отсканировал довольно редкий учебник, а другой человек собрал из него PDF. Если будет еще интересный материал - напишу сюда.
К чему такая капча?

>> No.16577  

Да, я еще доделал своего Фейерабенда - вставил несколько пропущенных страниц и убрал пару лишних (все в главе про теорию континуума Аристотеля). Поскольку аплоадер на либген в данный момент не работает, пусть книжка будет первой работой, выложенной в тред.
Вот, пожалуйста: http://rghost.ru/20488701

>> No.16579  

Ну если что, то я готов.

>> No.16701  

Что-то я отвлекся.
Ладно, раз желающих оцифровывать собственные книги нет, предлагаю сделать djvu/pdf из имеющегося у меня экземпляра второго, исправленного русскоязычного издания книжки Бейтсона "Разум и природа" ("Mind and nature"). В принципе, текст в интернете уже имеется, но, во-первых, распознавался он видимо с первого издания, а во-вторых, имеется исключительно в виде файла doc (скорее всего копипэйст с какого-то сайта), где некоторое количество содержащихся в книге иллюстраций, разумеется, опущено. Издана книжка в мягкой, невыразимо блевотно оформленной обложке, хотя верстка самих страничек уже не такая ужасная, да и бумага, как ни странно, вполне себе приличная, для нашего-то рынка.
Если будут желающие поучаствовать, сканы сделаю к концу следующей недели, а может и раньше. Если не будем распознавать текст, понадобится, кроме меня, два человека - один сканы обработает, другой сделает файлы и расставит в них главы (примечания там на тех же страничках).

>> No.16707  

Я думаю, тред неплохой и идея неплохая. Когда мы делали "сердце" (http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D1%80%D0%B4%D1%86%D0%B5_%28%D1%80%D0%BE%D0%BC%D0%B0%D0%BD%29), мне бы такое сильно помогло (хотя и так вышло всё удачно)

На всякий случай я предложу свои услуги. Я могу:
а) Если будет интересная мне книга - вычитка-правка
б) Могу слепить из готового текстового файла fb2, ну там чтобы всё чётко было - главы, сноски, оформление блабла
в) Есть сканер

Очень прошу: подсказать мне хорошую программу для OCR'a, желательно бесплатную, и немножко дать советов мудрых. Ну или объяснить мне доходчиво, что если я буду пользоваться бесплатными, жизнь моя превратится в анальное рабство, и с украденным файнридером я всё буду делать быстрее чуть более чем в 9000 раз.

Вообще, честно предупрежу, что мне интересно OCRить книги всяких японских авторов (ввиду того, что я увлекаюсь японской литературой), и материал у меня есть (как на русском языке, так и куча всяких книг, привезённых мной из-за границы). Но в то же время, у меня сейчас непростые времена, и времени особо нет.

Так что в целом, я всеми руками за, если чё, пишите на captaincococo@gmail.com, хули. Смогу - помогу.

Также хочется сделать замечание, что если делается какой-нибудь крупный проект, то надо его пиарить. Надо не лениться, писать в тематические сообщества в жж, может быть даже вовконтакте, готовить нормальную статью в википедии (потому что если дать чуваку книжку и сказать: "вот почитай, она крутая!", он ведь полезет в вики, нихрена не найдёт и подумает: "бля наёбывают" и читать не станет. А если будет солидная статья в вики, то он подумает что это что-то Значимое, пусть это будет хоть роман Донцовой. Ну вы понели, в общем, давайте кооперироваться.

M.H.

>> No.16710  

>>16707

>подсказать мне хорошую программу для OCR'a

Думаю, что лучше использовать файнридер. Существует еще, например, вот такой http://openocr.org/ проект, но википедия пишет, что он загнулся пару лет назад.

>Смогу - помогу.

Давай делать Бейтсона. Объем у книжки очень скромный, так что если наберется вместе со мной четыре человека, можно будет и текст распознать. С удовольствием помогу тебе с твоими вещами в дальнейшем, только давай лучше без жабберов и почт - для этого вроде тред есть.

>если делается какой-нибудь крупный проект, то надо его пиарить

Не очень понимаю зачем, честно говоря. Ежедневно оцифровывается масса прекрасной литературы, и никто её не "пиарит" - те же Фейерабенд с Бейтсоном не многим нужны, а интересующиеся и сами эти книжки найдут, просто вбив названия в поиск по нескольким библиотекам. Как пример действительно крупного проекта, в противовес моим (и твоим, кстати, тоже) оцифровкам, можно привести имеющийся в интернете двадцатичетырехтомник Нидхэма о науке в Китае - это титаническая и безусловно прекрасная работа, проводившаяся не одним десятком людей, необходимая, я полагаю, каждому синологу, но она вроде бы нигде не пиарится и пиариться не будет.
Если говорить о вопросе в смысле поиска рабочих рук, то здесь пиар только отпугнет людей - меня бы отпугнул, по крайней мере. В крайнем случае просто унесу тред на доброчан. У меня уже была похожая история с еще одним тредом примерно такого же толка - здесь энтузиасты так и не появились, а на доброчане с ним до сих пор все прекрасно.




[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]