Crusoe ([info]crusoe) wrote,
@ 2009-03-21 13:44:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Ставлю на полку.

Полное собрание законов Российской империи
повелением государя Николая Павловича составленное.
Собрание Первое.
С 1649 по 12 декабря 1825 года.

 Санктпетербург.
Печатано в типографии II Отделения собственной Его Императорского величества Канцелярии.
1830. 

Общая информация.

1.
О ценности и значимости этого свода распространяться излишне.

2.
Полный свод законов Российской империи, первое собрание (далее ПСЗ-1) насчитывает 46 томов. Тома 42, 43 и 44 - в двух частях.

3.
Тома 1-40 - собственно, законы.
т. 41 ч.1 Указатель хронологический
т. 42 ч.1 Указатель алфавитный
т. 42 ч.2 Указатель алфавитный
т. 43 ч.1 Книга штатов. Отделение 1
т. 43 ч.2 Книга штатов. Отделение 1. Продолжение
т. 44 ч.1 Книга штатов. Отделение 2
т. 44 ч.2 Книга штатов. Отделение 3 и 4
т. 45 - Книга тарифов
т. 46 - Чертежи и рисунки.

4.
Общий объём выложенного ПСЗ-1 - 12,1ГБ (формат DJVU, фото, 600 dpi). Малое сжатие было выбрано совершенно сознательно. Иначе некоторые страницы нечитабельны (напр. таблицы в районе 1000-х страниц 22 тома).
5. Тома разбиты на куски в 50 Мб архиватором Winrar.
6. Скачивание всего ПСЗ-1 может быть оправдано одними лишь   профессиональными надобностями либо страстью к коллекционированию документов. В иных случаях, рекомендую прежде всего скачать указатели (тома 41 и 42), затем уже качать нужный том. Либо сразу брать том по имеющейся библиографической ссылке.

Прочие книги см. на



WWW.ON-ISLAND.NET
 




(Read 114 comments) - (Post a new comment)


[info]arno1251
2009-03-21 05:43 pm UTC (link)
Поздно!..

Сергей, а Вы не рассматривали вариант выставить всё это богатство не только для скачивания, но и онлайн?
Теоретически на народе.ру можно все тома выставить в DjVu-индирект, чтобы на каждую страницу каждого тома можно было сослаться отдельно. Это я предлагаю чисто умозрительно, конечно...

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-03-21 07:43 pm UTC (link)
Было бы хорошо, но я совершенно не владею предметом - что такое DjVu индирект, как работает, что для этого нужно. Потом вопрос заливки - как можно побыстрее залить на народ 12 гигабайт?

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-21 08:35 pm UTC (link)
Да, 12 гиг - это будет совсем непросто. Если будет время,я попробую поэкспериментировать хотя бы только с 41 томом. А там видно будет.
Пример DjVu индиректа см. хотя бы http://blat1927.narod.ru/abc.htm
Гипертекстовое оглавление ведёт на соответствующую страницу, плюс с каждой из этих страниц можно листать оригинал как в обычном DjVu. И просмотр оптимизирован под Веб - каждый раз загружается только та картинка, которая нужна, а не вся книга целиком.

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 11:41 am UTC (link)
285 Кб на страницу — все же многовато. Не уверен, что там нужно цветное кодирование.
По-моему, надо обсудить технологии. А то есть люди, которые "знают как", но мало что делают (это я про себя), и те, кто делает много, но не всегда по оптимальным технологиям.

Мог бы взять на себя обработку сканов: нарезка разворотов на страницы, выравнивание, удаление грязи. Я наловчился это делать в полуавтоматическом режиме, так что времени много не займет. И книги были бы намного легче и лучшего качества. То есть на входе -- картинка со сканера, на выходе -- обработанная картинка нужного для djvu'ирования формата и качества.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 11:55 am UTC (link)
Ну, особо грязи не видно, сканер-то превосходный, такая глубина... Но вообще можно бы попробовать. Конечно, 12 Гб по Сети не очень-то, легче заскочить с винчестером в сумке :)

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 12:09 pm UTC (link)
Здесь-то да (у меня не получается, выдрав картинки из djvu'ированного файла, оптимизировать их).

Я вообще про обработку картинок на этапе от сканера к Djvu. Просто мне показалось (умозрительно), что из исходных сканов можно было бы бы больше качества вытянуть, а потом ужать в Djvu как ч/б. Собственно, я свои услуги как раз на этом этапе предлагаю )

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 12:14 pm UTC (link)
Ой, не знаю. Мне интуитивно кажется, что ч/б было бы совершенно нераспознаваемо... Даже с такими высочайшими параметрами сканирования и то пары н/и, с/е, т/ш порой визуально неразличимы. А если убрать полутона?

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 12:40 pm UTC (link)
Картинки из этого djvu выдираются с параметрами 96 dpi, 256 colors. Dpi маловато будет.
Полутона нужно убирать, работая с исходными сканами, и при помощи специальных фильтров, а не просто Save as bitоnal image; тогда все н/и различаются. Я Scankromsator использую, некоторые — Corel. Фишка в том, что при такой методе точки на границе букв и фона обрабатываются иначе, чем в центре буквы. Поэтому удается вытянуть тонкие элементы: засечки, перекладины и т. д.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 01:01 pm UTC (link)
Я всё думаю, сколько же места занимают исходные сканы. Думаю, от 180 до 250 Гб. Хорошо бы посмотреть хотя бы на десяток страниц...

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 01:06 pm UTC (link)
Да, мне тоже любопытно.
Просто будет обидно, если из этих сканов можно вытянуть больше, чем получилось, а это потеряется. Вряд ли там меньше 200 dpi было

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-22 01:12 pm UTC (link)
Какие 200? Посмотрите Page Info. Там чистые 600 dpi в полноцвете.

(Reply to this) (Parent)


[info]arno1251
2009-03-22 01:10 pm UTC (link)
Кстати говоря, судя по отсутствию в индиректе bjbz - файлов, размер словаря на каждую страницу редуцирован до нуля. То есть каждая страница несёт в себе полный набор собственных глифов. Этим и объясняется такой значительный вес страницы. С одной стороны, это неплохо, потому что полураспознанные символы замыкаются внутри одной страницы и не лезут на соседние страницы, плодя там ошибки второго рода. С другой стороны, расплата идёт за счет общего веса тома. Полагаю, что при указании словаря знаков хотя бы в 20-30 кб размер тома мог бы снизиться на 50 Мб, а всего набора на 2 Гб. Это, конечно, не основание для перегенерации всего DjVu-сета :)

(Reply to this) (Parent)(Thread)


[info]fad_gel
2009-03-22 02:42 pm UTC (link)
> Это, конечно, не основание для перегенерации всего DjVu-сета :)
Да уж...

Попробовал на кошках потренироваться. Шекспир 1854 года, высокая печать, кегель мелкий (8, наверное). Из разворота, который чуть больше одной страницы Законов, как я понимаю, 39 Кб по технологии 300 dpi grey > 600 dpi b/w получилось. Это при том что PDF хуже жмет, чем Djvu.
http://fadgel.nm.ru/0001.pdf

(Reply to this) (Parent)


[info]arno1251
2009-03-22 05:46 pm UTC (link)
Итак, я скачал с онайлэнда 41-й том, преобразовал его в индирект "нарезку" и залил на народ, вот сюда:
http://pszri41.narod.ru/
Прикрутил нечто вроде оглавления, кусками, полностью таблицу не составлял. В идеале она должна содержать решительно все года с 1649 по 1825. То есть на выбранный год мы попасть можем напрямую одним кликом, при этом загружается максимум 350 кб (индекс и искомая страница). Далее по страницам вперёд-назад можно гулять как по обычному DjVu файлу, опять же не загружая к себе всё, только необходимые компоненты.

Конечно, "народ.ру" - это ужасно. При массовой загрузке по FTP 10-15 процентов файлов ложатся вкривь и вкось. Приходится сравнивать каталоги, доливать недостающие и неверно загрузившиеся и т.д. День ушёл на загрузку целиком :((

Посмотрите, если идея покажется продуктивной, я закончу обвязку до конца. Принимаются также пожелания и предложения.

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-03-22 06:26 pm UTC (link)
Идея, несомненно, продуктивна. Я попробовал; оглавление отправляет точно на место. Мне кажется, что стоит дробить не только по годам, но и по правлениям - внутри некоторых годов. Это может оказаться важным. Далее, удобно когда искомая страница открывается в новом окне, а оглавление остаётся в прежнем. Вот, пожалуй, все пожелания.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-23 05:16 am UTC (link)
Вот оно, ключевое слово! По правлениям, ну конечно же, а не по векам - их там на самом деле немного. Опять же можно увязнуть в споре, относить ли 1700 год к 17-му или к 18-му веку.

Сергей, посмотрите, так? Внутри правлений по годам.

1649 Алексей Михайлович
1676 Фёдор III Алексеевич
1682 Петр I и Иван V
1689 Петр I
1725 Екатерина I
1727 Петр II
1730 Анна Иоанновна
1741 Елизавета Петровна
1761 Пётр III
1762 Екатерина II
1796 Павел I
1801 Александр I

Как я понимаю, законоположения, относящиеся к Николаю I, входят уже в сборники II Собрания.

UPD. +++ удобно когда искомая страница открывается в новом окне, а оглавление остаётся в прежнем +++
Сделано.

Edited at 2009-03-23 06:36 am UTC

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-03-23 06:42 am UTC (link)
Именно так. В ПСЗ нет регентств, только цари и императоры.

Николай I и Александр II во втором своде, он в два раза больше первого. Впрочем, и небываемое бывает...

С.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-23 06:55 am UTC (link)
+++ и небываемое бывает +++
Тьфу-тьфу-тьфу! Чтобы не сгла...

(Reply to this) (Parent)


[info]arno1251
2009-03-25 04:41 am UTC (link)
Можно вопрос?
В хронологическом реестре (том 41) царствование Александра I, 1825 год, заканчивается на 30-м томе. А что же тогда находится в томах 31 – 40? Что ж, ни один документ оттуда не входит в хронологический реестр?
Могу предположить, что там заново подобраны только действующие на момент издания (1830) законы со всеми поправками. Или я ошибаюсь?

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-03-25 09:58 am UTC (link)
Арнольд, как же так? На 735 странице 41-го тома начинается 1810 год и 31 том, а всего в 41 томе 953 страницы. Последний документ 30 тома - об утверждённых фасадах, 31 декабря 1809 года. Далее, в 31 томе начинается 1810 год. Меня несколько смущает отсутствие второй части 41 тома (на титуле указано "Часть первая"), постараюсь разобраться в этом недоумении.

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-25 10:35 am UTC (link)
Бога ради, извините, не туда глянул!!! Где были мои глаза.

(Reply to this) (Parent)


[info]arno1251
2009-03-30 12:31 pm UTC (link)
Сергей, если у Вас будет время, посмотрите, пожалуйста, ещё раз:
http://pszri41.narod.ru/
Вроде бы закончил "расфасовку" обоих указателей, хронологического и алфавитного. С томом 41 мне помог [info]e_rubik. Том 42 разнёс в таблицы как по собственно алфавиту, так и по тематическому указателю.
У меня просьба: если Вы увидите там методически неверный термин, что-то будет резать глаз - сообщите, пожалуйста. Я побаиваюсь анонсировать без проверки, а у самого глаз замылился, пока делал все эти таблицы.
В дальнейшие мои планы входит детализировать "Тематический реестр", а то он скуповат как-то.

Но каков орёл Сперанский, а? Как такой объём был выполнен без компьютера, без автоматической вёрстки? Титаны.

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-03-31 11:18 am UTC (link)
Арнольд,

Я внимательно осмотрел. Что мне видится.

1. Начать с хронологического реестра. Вместо "Год издания законодательного акта" вписать в заголовок: "Ссылка (в новом окне) на акты указанного года. Открывается с начала года, далее листать средствами djvu просмотрщика)."

2 Далее алфавитный реестр. Здесь мне не кажутся нужными столбцы "Страница оглавления" и "Том". Стоит ли давать ссылки на всю последовательность страниц? Не достаточно ли дать первую, затем предоставить читателю возможность листать средствами djvu просмотрщика?

3. Тематический реестр вопросов не вызывает.

4. Перечень томов стоит перенести в конец; вопросов по нему также не появилось.

Вдобавок скажу, что Сперанский - воистину титан - проделал эту работу всего с восемью сотрудниками!

(Reply to this) (Parent)(Thread)


[info]arno1251
2009-03-31 12:08 pm UTC (link)
Сергей, спасибо за ответ!
+++
2 Далее алфавитный реестр. Здесь мне не кажутся нужными столбцы "Страница оглавления" и "Том". Стоит ли давать ссылки на всю последовательность страниц? Не достаточно ли дать первую, затем предоставить читателю возможность листать средствами djvu просмотрщика?
+++
Сначала у меня так и было. Но тут вот какое дело. Ссылка в оглавлении ведёт на страницу с перечнем ключевых слов, каждому из которых сопоставляется страница алфавитного реестра уже с подробным описанием актов. Можно, конечно, попасть на первую страницу из перечня, а потом перепрыгнуть на искомую через номер страницы; однако же сделать закладку при этом не представляется возможным, ибо в адресной строке броузера останется адрес первой страницы. При указании полного перечня адресуемых листов реестра закладку можно сделать на *любой* лист алфавитного реестра. Это особенно полезно при необходимости детально исследовать искомую тему.
Убрать оглавление вообще, оставив только ссылку на номер страницы алфавитного реестра, у меня тоже не получилось. Например, мне нужна тема "Военнопленные". При существующей разрядке алфавитного реестра я смогу попасть только на первую страницу разряда "Взятки - Вольные домы" (это 166). Далее я буду вынужден искать "Военнопленные" простым листанием djvu вплоть до страницы 211, где только и обрету искомое. Это 45 листов. Народ.ру нетороплив, что бы там ни утверждал юбиляр насчет быстрой езды, и листать мне придётся не менее получаса. А с оглавлением я до любого слова гарантированно добираюсь ровно за два щелчка: первый раз на лист оглавления, второй раз точно на ту страницу, куда показывает ссылка оглавления.
Есть только одна возможность убрать оглавление: сделать гипертекстовую разноску всего алфавитного реестра. Но это для двух томов составляет едва ли не две тысячи страниц, мне одному такая работа не под силу. Если удастся приискать волонтеров, попробую; программа в принципе написана, осталось только для каждой страницы реестров указать начальную и конечную алфавитную статью.

Остальные советы с огромнейшей благодарностью принимаю, нынче же переделаю.

Восемь сотрудников?! Вы меня убили. Фантастика.

UPD. Все остальные замечания отработал, исправил ещё несколько незначительных ошибок.

Edited at 2009-03-31 03:50 pm UTC

(Reply to this) (Parent)(Thread)


[info]crusoe
2009-04-01 07:48 am UTC (link)
Что-ж, пора анонсировать!

(Reply to this) (Parent)(Thread)(Expand)

(no subject) - [info]arno1251, 2009-04-01 08:59 am UTC (Expand)
(no subject) - (Anonymous), 2009-04-24 11:17 pm UTC (Expand)
(no subject) - [info]arno1251, 2009-04-25 04:36 am UTC (Expand)
(no subject) - (Anonymous), 2009-04-26 02:27 am UTC (Expand)
(no subject) - [info]arno1251, 2009-04-26 08:15 am UTC (Expand)

(Read 114 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…