Battle Forum

Battle Forum (http://battlefox.rooty.ru/index.php)
-   Программная - Windows (http://battlefox.rooty.ru/forumdisplay.php?f=24)
-   -   Что такое DjVu? (http://battlefox.rooty.ru/showthread.php?t=1013)

a2z 11.10.2006 19:29

Что такое DjVu?
 
Вложений: 4

Что такое DjVu?

DjVu (произносится «дежавю́», от фр. déjà vu — уже виденное) — технология сжатия изображений, разработанная специально для распространения сканированных документов — книг, прежде всего математических, журналов и пр. — в интернете. DjVu иногда называют «тексто-графическим» форматом.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения скачивания. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовывать удобную навигацию в DjVu книгах.

Как это работает?

В DjVu применяется специальная технология, разделяющая исходное изображение на два слоя — передний план, в который помещаются чёткие детали (изображения букв) и задний план — где остаётся текстура страницы, иллюстрации и другие второстепенные детали. Передний план сохраняется с более высоким разрешением, задний — с более низким, например 300 и 100 dpi соответственно. Цветовая составляющая и для переднего и для заднего планов сохраняются в ещё более низком разрешении, например 50 или 75 dpi, что ещё более экономит место.


Цветной отсканированный документ разбивается на передний и фоновый план. Передний план содержит текст, линии и кривые сжатые как двутональное или низкоцветовое изображение с максимальным разрешением (используется JB2), сохраняя резкость и удобочитаемость текста. Фоновый план содержит изображения и бумажные текстуры сжатые в уменьшенном разрешении с IW44. Фоновый план, находясь под приоритетными компонентами, сглаживается для уменьшения размера. Сегментатор переднего и фонового плана сначала обнаруживает объекты резко противопоставленные их окружению и затем классифицирует их в передний или фоновый план используя несколько критериев, типа их цветовой однородности, геометрии и веса.


Несложно догадаться где передний, а где фоновый. Передний (первое изображение) сжат JB2 и содержит всё основное, фоновый (второе изображение) сжат IW44 и ничего важного не содержит. Более того, если вы обратили внимание он очень сильно сглажен/сжат, в общем то сделано это специально, для уменьшения размера. На обычном изображении где передний план накладывается на фоновый, данное сглаживание/сжатие не очень то и бросается в глаза, а вот если бы его не было, размер файла вырос бы в два, а то и три раза. Более того обратите внимание как DjVu самостоятельно определил где у изображения важные детали, а где второстепенные. Все эти его хваленные анализы действительно работают. Ни одного названия, или даже символа не уехало на фоновый план.

В основе формата DjVu лежат несколько технологий, разработанных в AT&T Labs. Это:
  • алгоритм отделения текста от фона на отсканированном изображении;
  • вейвлетный алгоритм сжатия фона IW44;
  • алгоритм сжатия черно-белых изображений JB2;
  • универсальный алгоритм сжатия ZP;
  • алгоритм распаковки «по запросу»;
  • алгоритм «маскировки» изображений.
AT&T продали технологию LizardTech, которые пытаются использовать её для своих коммерческих интересов, но, благодаря открытости формата, для создания и просмотра документов DjVu существует свободно распространяемое программное обеспечение, доступное для различных платформ.

Вывод:
Формат DjVu крайне удобен для хранения и передачи отсканированных естественно-научных книг, где обилие формул и схем делает чрезвычайно трудоёмким их полноценное распознание.

Он стал основой для нескольких библиотек научных книг, правомерность существования некоторых из них, впрочем, вызывает сомнения с точки зрения законов об авторских правах, т.к. огромное количество книг в этом формате доступно в файлообменных сетях.


Программы для чтения DjVu файлов

WinDjView 0.4.1 {Скачать}

Описание:
Файлы ставшего уже достаточно популярным формата DjVu можно встретить повсеместно. В этом формате распространяются книги, чертежи, журналы, литература и документация. Главное достоинство DjVu перед тем же PDF - размер файлов. При одинаковом качестве файлы DjVu занимают гораздо меньше места. Одним из лучших средств для просмотра DjVu-файлов является утилита WinDjView. Она позволяет, осуществлять поиск по тексту (если документ редактируемый), создавать закладки, изменять масштаб страницы, выполнять разворот страниц документа с шагом 90 градусов, пролистывать страницы — как с помощью клавиатуры, так и с помощью мыши, регулировать яркость и контрастность отображаемых документов.

a2z 13.10.2006 09:26

Вложений: 2
DjVu Browser Plug-in 6.0.0.1116 {Скачать}

Вложение 2619

With the DjVu Web Browser Plug-in, you can view and navigate DjVu documents in your Web browser.

DjVu Solo 3.1 {Скачать}

Вложение 2620

DjVu® Solo 3.1 (Non-Commercial version) is the ideal tool for the individual user who needs to convert collections of paper documents into an electronic format. DjVu Solo delivers a powerful solution for creating high-quality documents with remarkably small file sizes. Now you can create compact "Image + Text" files quickly and easily, saving you time, storage space, and the costs associated with distributing and storing electronic files.


Vadim 26.10.2006 17:57

Скрытый текст
Вы должны войти под своим логином или зарегистрироваться и иметь 25 сообщение(ий)
Правила форума | Регистрация на форуме
Предупреждение: увидев этот блок скрытого текста, не стоит сразу бросаться набивать бессмысленные сообщения. Освойтесь на форуме, проникнитесь его атмосферой и пишите, если Вам действительно есть, что сказать. Если Модератор решит, что Вы набиваете сообщения, он удалит их все, а Вам выдаст либо предупреждение, либо сразу заблокирует Ваш аккаунт.


:)

Nurse 23.10.2008 19:48

Цитата:

Сообщение от a2z (Сообщение 32613)
Программы для чтения DjVu файлов

А как самому отсканировать книгу в такой формат подскажите, пожалуйста :) .


Текущее время: 01:07. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot