Crusoe ([info]crusoe) wrote,
@ 2009-03-21 13:44:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Ставлю на полку.

Полное собрание законов Российской империи
повелением государя Николая Павловича составленное.
Собрание Первое.
С 1649 по 12 декабря 1825 года.

 Санктпетербург.
Печатано в типографии II Отделения собственной Его Императорского величества Канцелярии.
1830. 

Общая информация.

1.
О ценности и значимости этого свода распространяться излишне.

2.
Полный свод законов Российской империи, первое собрание (далее ПСЗ-1) насчитывает 46 томов. Тома 42, 43 и 44 - в двух частях.

3.
Тома 1-40 - собственно, законы.
т. 41 ч.1 Указатель хронологический
т. 42 ч.1 Указатель алфавитный
т. 42 ч.2 Указатель алфавитный
т. 43 ч.1 Книга штатов. Отделение 1
т. 43 ч.2 Книга штатов. Отделение 1. Продолжение
т. 44 ч.1 Книга штатов. Отделение 2
т. 44 ч.2 Книга штатов. Отделение 3 и 4
т. 45 - Книга тарифов
т. 46 - Чертежи и рисунки.

4.
Общий объём выложенного ПСЗ-1 - 12,1ГБ (формат DJVU, фото, 600 dpi). Малое сжатие было выбрано совершенно сознательно. Иначе некоторые страницы нечитабельны (напр. таблицы в районе 1000-х страниц 22 тома).
5. Тома разбиты на куски в 50 Мб архиватором Winrar.
6. Скачивание всего ПСЗ-1 может быть оправдано одними лишь   профессиональными надобностями либо страстью к коллекционированию документов. В иных случаях, рекомендую прежде всего скачать указатели (тома 41 и 42), затем уже качать нужный том. Либо сразу брать том по имеющейся библиографической ссылке.

Прочие книги см. на



WWW.ON-ISLAND.NET
 




(Read 114 comments) - (Post a new comment)


[info]fad_gel
2009-03-22 11:41 am UTC (link)
285 Кб на страницу — все же многовато. Не уверен, что там нужно цветное кодирование.
По-моему, надо обсудить технологии. А то есть люди, которые "знают как", но мало что делают (это я про себя), и те, кто делает много, но не всегда по оптимальным технологиям.

Мог бы взять на себя обработку сканов: нарезка разворотов на страницы, выравнивание, удаление грязи. Я наловчился это делать в полуавтоматическом режиме, так что времени много не займет. И книги были бы намного легче и лучшего качества. То есть на входе -- картинка со сканера, на выходе -- обработанная картинка нужного для djvu'ирования формата и качества.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 11:55 am UTC (link)
Ну, особо грязи не видно, сканер-то превосходный, такая глубина... Но вообще можно бы попробовать. Конечно, 12 Гб по Сети не очень-то, легче заскочить с винчестером в сумке :)

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 12:09 pm UTC (link)
Здесь-то да (у меня не получается, выдрав картинки из djvu'ированного файла, оптимизировать их).

Я вообще про обработку картинок на этапе от сканера к Djvu. Просто мне показалось (умозрительно), что из исходных сканов можно было бы бы больше качества вытянуть, а потом ужать в Djvu как ч/б. Собственно, я свои услуги как раз на этом этапе предлагаю )

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 12:14 pm UTC (link)
Ой, не знаю. Мне интуитивно кажется, что ч/б было бы совершенно нераспознаваемо... Даже с такими высочайшими параметрами сканирования и то пары н/и, с/е, т/ш порой визуально неразличимы. А если убрать полутона?

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 12:40 pm UTC (link)
Картинки из этого djvu выдираются с параметрами 96 dpi, 256 colors. Dpi маловато будет.
Полутона нужно убирать, работая с исходными сканами, и при помощи специальных фильтров, а не просто Save as bitоnal image; тогда все н/и различаются. Я Scankromsator использую, некоторые — Corel. Фишка в том, что при такой методе точки на границе букв и фона обрабатываются иначе, чем в центре буквы. Поэтому удается вытянуть тонкие элементы: засечки, перекладины и т. д.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 01:01 pm UTC (link)
Я всё думаю, сколько же места занимают исходные сканы. Думаю, от 180 до 250 Гб. Хорошо бы посмотреть хотя бы на десяток страниц...

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 01:06 pm UTC (link)
Да, мне тоже любопытно.
Просто будет обидно, если из этих сканов можно вытянуть больше, чем получилось, а это потеряется. Вряд ли там меньше 200 dpi было

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 01:12 pm UTC (link)
Какие 200? Посмотрите Page Info. Там чистые 600 dpi в полноцвете.

(Reply to this) (Parent)


[info]arno1251
2009-03-22 01:10 pm UTC (link)
Кстати говоря, судя по отсутствию в индиректе bjbz - файлов, размер словаря на каждую страницу редуцирован до нуля. То есть каждая страница несёт в себе полный набор собственных глифов. Этим и объясняется такой значительный вес страницы. С одной стороны, это неплохо, потому что полураспознанные символы замыкаются внутри одной страницы и не лезут на соседние страницы, плодя там ошибки второго рода. С другой стороны, расплата идёт за счет общего веса тома. Полагаю, что при указании словаря знаков хотя бы в 20-30 кб размер тома мог бы снизиться на 50 Мб, а всего набора на 2 Гб. Это, конечно, не основание для перегенерации всего DjVu-сета :)

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 02:42 pm UTC (link)
> Это, конечно, не основание для перегенерации всего DjVu-сета :)
Да уж...

Попробовал на кошках потренироваться. Шекспир 1854 года, высокая печать, кегель мелкий (8, наверное). Из разворота, который чуть больше одной страницы Законов, как я понимаю, 39 Кб по технологии 300 dpi grey > 600 dpi b/w получилось. Это при том что PDF хуже жмет, чем Djvu.
http://fadgel.nm.ru/0001.pdf

(Reply to this) (Parent)


(Read 114 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…