PDA

Просмотр полной версии : Что такое DjVu?


a2z
11.10.2006, 19:29
2555

Что такое DjVu?

DjVu (произносится «дежавю́», от фр. déjà vu — уже виденное) — технология сжатия изображений, разработанная специально для распространения сканированных документов — книг, прежде всего математических, журналов и пр. — в интернете. DjVu иногда называют «тексто-графическим» форматом.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения скачивания. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовывать удобную навигацию в DjVu книгах.

Как это работает?

В DjVu применяется специальная технология, разделяющая исходное изображение на два слоя — передний план, в который помещаются чёткие детали (изображения букв) и задний план — где остаётся текстура страницы, иллюстрации и другие второстепенные детали. Передний план сохраняется с более высоким разрешением, задний — с более низким, например 300 и 100 dpi соответственно. Цветовая составляющая и для переднего и для заднего планов сохраняются в ещё более низком разрешении, например 50 или 75 dpi, что ещё более экономит место.

http://home.onego.ru/%7Earhipet2z/pictures/soft/djvu.gif

Цветной отсканированный документ разбивается на передний и фоновый план. Передний план содержит текст, линии и кривые сжатые как двутональное или низкоцветовое изображение с максимальным разрешением (используется JB2), сохраняя резкость и удобочитаемость текста. Фоновый план содержит изображения и бумажные текстуры сжатые в уменьшенном разрешении с IW44. Фоновый план, находясь под приоритетными компонентами, сглаживается для уменьшения размера. Сегментатор переднего и фонового плана сначала обнаруживает объекты резко противопоставленные их окружению и затем классифицирует их в передний или фоновый план используя несколько критериев, типа их цветовой однородности, геометрии и веса.

2552

2553 2554

Несложно догадаться где передний, а где фоновый. Передний (первое изображение) сжат JB2 и содержит всё основное, фоновый (второе изображение) сжат IW44 и ничего важного не содержит. Более того, если вы обратили внимание он очень сильно сглажен/сжат, в общем то сделано это специально, для уменьшения размера. На обычном изображении где передний план накладывается на фоновый, данное сглаживание/сжатие не очень то и бросается в глаза, а вот если бы его не было, размер файла вырос бы в два, а то и три раза. Более того обратите внимание как DjVu самостоятельно определил где у изображения важные детали, а где второстепенные. Все эти его хваленные анализы действительно работают. Ни одного названия, или даже символа не уехало на фоновый план.

В основе формата DjVu лежат несколько технологий, разработанных в AT&T Labs. Это:

алгоритм отделения текста от фона на отсканированном изображении;
вейвлетный алгоритм сжатия фона IW44;
алгоритм сжатия черно-белых изображений JB2;
универсальный алгоритм сжатия ZP;
алгоритм распаковки «по запросу»;
алгоритм «маскировки» изображений.

AT&T продали технологию LizardTech, которые пытаются использовать её для своих коммерческих интересов, но, благодаря открытости формата, для создания и просмотра документов DjVu существует свободно распространяемое программное обеспечение, доступное для различных платформ.

Вывод:
Формат DjVu крайне удобен для хранения и передачи отсканированных естественно-научных книг, где обилие формул и схем делает чрезвычайно трудоёмким их полноценное распознание.

Он стал основой для нескольких библиотек научных книг, правомерность существования некоторых из них, впрочем, вызывает сомнения с точки зрения законов об авторских правах, т.к. огромное количество книг в этом формате доступно в файлообменных сетях.

http://ru.wikipedia.org
http://djvu.sourceforge.net

Программы для чтения DjVu файлов

WinDjView 0.4.1 {Скачать (http://disk.karelia.ru/?f=arhipet2z/soft/battle_forum/WinDjView-0.4.1.exe&d=1)}

Описание:
Файлы ставшего уже достаточно популярным формата DjVu можно встретить повсеместно. В этом формате распространяются книги, чертежи, журналы, литература и документация. Главное достоинство DjVu перед тем же PDF - размер файлов. При одинаковом качестве файлы DjVu занимают гораздо меньше места. Одним из лучших средств для просмотра DjVu-файлов является утилита WinDjView. Она позволяет, осуществлять поиск по тексту (если документ редактируемый), создавать закладки, изменять масштаб страницы, выполнять разворот страниц документа с шагом 90 градусов, пролистывать страницы — как с помощью клавиатуры, так и с помощью мыши, регулировать яркость и контрастность отображаемых документов.

a2z
13.10.2006, 09:26
DjVu Browser Plug-in 6.0.0.1116 {Скачать (http://disk.karelia.ru/?f=arhipet2z/soft/battle_forum/DjVu/DjVu+Browser+Plug-in+6.0.0.1116.exe&d=1)}

2619

With the DjVu Web Browser Plug-in, you can view and navigate DjVu documents in your Web browser.

DjVu Solo 3.1 {Скачать (http://disk.karelia.ru/?f=arhipet2z/soft/battle_forum/DjVu/djvusolo3.1.exe&d=1)}

2620

DjVu® Solo 3.1 (Non-Commercial version) is the ideal tool for the individual user who needs to convert collections of paper documents into an electronic format. DjVu Solo delivers a powerful solution for creating high-quality documents with remarkably small file sizes. Now you can create compact "Image + Text" files quickly and easily, saving you time, storage space, and the costs associated with distributing and storing electronic files.

http://www.lizardtech.com

Vadim
26.10.2006, 17:57
.:: Скрытый текст<br />Вы должны войти под своим логином или зарегистрироваться и иметь 25 сообщение(ий) ::.

:)

Nurse
23.10.2008, 19:48
Программы для чтения DjVu файлов
А как самому отсканировать книгу в такой формат подскажите, пожалуйста :) .