Тема, в которой можно выкладывать отсканированные и распознанные, но невычитанные книги, которых нет в библиотеке. Для совместного достижения результаты. У кого есть оборудование, но нет время на вычитку, будут выкладывать отсканированные и распознанные книги, прикрепляя их к сообщениям. А те пользователи, у кого нет возможности сканирования книг, но есть желание и время на вычитку, помогут в окончательной обработке материалов.
З.Ы. Когда будете выкладывать конечный вариант книги, сами разбирайтесь кто именно будет выкладывать. Только без драк и ругани!
Как быть не знаю,видимо по личке придётся ссылки кидать.
На фига? Как я думаю: 1) Скан это личная инициатива участников. 2) Сканируемые куски не являются ПРОИЗВЕДЕНИЕМ или книгой. 3) По окончании скана вы - модеры, сами определитесь с окончательной сборкой и судьбой полученного результата совместной работы (например файлообменник http://ifolder.ru ) Думаю проблем не будет. Из-за ОДНОЙ книги никто бучу поднимать не станет. Завоняет, всегда можно тему скрыть. А полученный результат на файлообменнике - это же даже вовсе не на сайте! А за ссылку в теме ишшо никого не расстреляли! Конечно, вы правы, но не в этом вопросе!
Хочу добавить ложку дегтя в бочку меда Если после скана программа распознования текста не распознала текст полностью(пользуюсь FineReaderom), вычитывать надо именно в ней. Вот только размер файла в нужном расширении превышает 100 mb. Его на сайт не загрузишь. А конвертировав в обычный текст вычитывать можно неделями и ошибки остануться.
Получившийся файл в формате doc вычитывал, имея под рукой книгу.
Ты повел трудную работу. Сама программа распознав текст выделяет зелеными метками сомнительные места,которые можно откорректировать( у меня обычно это 2-3 буквы н-и и т.д. с краю). А потом я сохраняю файл в расширении FineReaderа для проверки орфографии, и только потом конвертирую в текст. А из ТХТ делаю FB2.
Quote (Митр)
По-моему, для того чтобы разные люди сканировали, распознавали и вычитывали, надо чтобы у каждого из них имелись бумажные варианты произведения.
У этих людей как раз бумажных книг и нет.
Вывод кто сканит тот и вычитывает. sadko сказал, что будет книгу потрошить для отличного скана. Я такое финансово себе позволить не могу.
В принципе, это самый лучший вариант. У "вычитальщика" будет на руках и распознанный материал, и практический книга (но в отсканированном варианте). Два минуса я уже указывал:
Quote (Митр)
размер файлов получается действительно большой.
Quote (Митр)
И при таком варианте надо, чтобы у всех был FineReader...
При таких раскладах, я просто наблюдатель, к сожалению. У меня траффик ограничен и инет - нетараплифый, как эстонннец. Может у мну ситуация с инетом изменится позже, и тады "я ваша навеки". А счас -увы! Конечно, вы правы, но не в этом вопросе!
И все таки, надо на новую скан. книгу открывать свою тему. Соотв. открыть новый раздел. Все будет намного проще, и вычитка, и скан. Конечно, вы правы, но не в этом вопросе!
Nalsh, Можете создавать темы в Новостях книжного мира. Когда раздел планировался - обсуждение скана и его обработка входили в область его охвата. Никогда в жизни не сделаю двух вещей: не буду оправдываться перед тем, перед кем я не виноват, и не буду извиняться за то, чего не делал.
Сокол, Nalsh, темы сейчас будут создаваться в этом разделе. Впоследствии, возможно, будет создан новый раздел. Денис, эта тема создана здесь, сл-но, и сопутствующие ей темы будут пока здесь.
В принципе, сработано хорошо. Вадим - молодец! Скан хороший, косяков почти не было. Все сконвертировано в "ДОК" и "ТХТ", разбито по главам - соотвессно, файлы легкие. Вычитка не сложная. Можно пробовать следующую книгу. Конечно, вы правы, но не в этом вопросе!
Всем привет! Нашел в инете скан Разумовского- Семеновой "Ошибка "2012". Джокер" Это продолжение "Игры нипочем" Искал книгу очень-очень долго.. Народ тут интересовался продолжением, помнится. Так вот, скан я преобразовал в rtf с 36 метров до 8 ))) но дальше дело не идет. нет программ соответсвующих, те , что стоят на офисном компе- не годятся. Если надо, залью куда-нить сам файл..На моем КПК нормально читается, но файл великоват))
Добавлено (10 Мар 2010, 11:20 Am) --------------------------------------------- Повесил сюда:http://gigapeta.com/dl/659299afedca4 Доведите до ума, плиз)))
Тассельхоф, Там еще есть что редактировать. Лишние пробелы, знаки абзацев, знаки переносов. Хотя и не так уж много, в среднем 1-3 очипятки на страницу. Правда я просмотрел только docx-файл Никогда в жизни не сделаю двух вещей: не буду оправдываться перед тем, перед кем я не виноват, и не буду извиняться за то, чего не делал.
Предлагаю книгу на рассмотрение: Генри Каттнер Хогбены, гномы, демоны, а так же роботы, инопланетяне и прочие захватывающие неприятности. Серия: Шедевры фантастики. Может имеет смысл набрать соответствующие рассказы с либрусека? Уж больно сборник хороший получился. Книги - корабли мысли, странствующие по волнам времени и бережно несущие свой драгоценный груз от поколения к поколению Френсис Бэкон Советую прочитать
Митр , помогу с удовольствием . Объясни в личку откуда скачать и куда потом залить . Ты сможешь понять, возможно, если окажешься достаточно силен, слаб,верен,честен,открыт,умен,нежен,жесток,несчастен,романтичен,влюблен... (с)
Nalsh, да возьми Плотниковой вторую часть - так будет нааамного быстрее. До пятницы справимся. Первые 13 глав я вычитаю, а ты вторые 11=) Митр, перекинь Nalshу тож, пожалуйста.
Nalsh, смотри и читай почту) Listik, если хочешь, можешь вычитать первые 13 глав на предмет отсутствия абзацев и некоторых пробелов. Работы там по идее не много, но она на внимательность.
У меня все несколько грустновато . Ошибок не просто много - безумно много . Пока смог осилить только половину текста. Ты сможешь понять, возможно, если окажешься достаточно силен, слаб,верен,честен,открыт,умен,нежен,жесток,несчастен,романтичен,влюблен... (с)