Показать сообщение отдельно
Старый 11.10.2006, 19:29      #1
a2z
Супер-Модератор
 
Аватар для a2z
По умолчанию Что такое DjVu?


Что такое DjVu?

DjVu (произносится «дежавю́», от фр. déjà vu — уже виденное) — технология сжатия изображений, разработанная специально для распространения сканированных документов — книг, прежде всего математических, журналов и пр. — в интернете. DjVu иногда называют «тексто-графическим» форматом.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения скачивания. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовывать удобную навигацию в DjVu книгах.

Как это работает?

В DjVu применяется специальная технология, разделяющая исходное изображение на два слоя — передний план, в который помещаются чёткие детали (изображения букв) и задний план — где остаётся текстура страницы, иллюстрации и другие второстепенные детали. Передний план сохраняется с более высоким разрешением, задний — с более низким, например 300 и 100 dpi соответственно. Цветовая составляющая и для переднего и для заднего планов сохраняются в ещё более низком разрешении, например 50 или 75 dpi, что ещё более экономит место.


Цветной отсканированный документ разбивается на передний и фоновый план. Передний план содержит текст, линии и кривые сжатые как двутональное или низкоцветовое изображение с максимальным разрешением (используется JB2), сохраняя резкость и удобочитаемость текста. Фоновый план содержит изображения и бумажные текстуры сжатые в уменьшенном разрешении с IW44. Фоновый план, находясь под приоритетными компонентами, сглаживается для уменьшения размера. Сегментатор переднего и фонового плана сначала обнаруживает объекты резко противопоставленные их окружению и затем классифицирует их в передний или фоновый план используя несколько критериев, типа их цветовой однородности, геометрии и веса.


Несложно догадаться где передний, а где фоновый. Передний (первое изображение) сжат JB2 и содержит всё основное, фоновый (второе изображение) сжат IW44 и ничего важного не содержит. Более того, если вы обратили внимание он очень сильно сглажен/сжат, в общем то сделано это специально, для уменьшения размера. На обычном изображении где передний план накладывается на фоновый, данное сглаживание/сжатие не очень то и бросается в глаза, а вот если бы его не было, размер файла вырос бы в два, а то и три раза. Более того обратите внимание как DjVu самостоятельно определил где у изображения важные детали, а где второстепенные. Все эти его хваленные анализы действительно работают. Ни одного названия, или даже символа не уехало на фоновый план.

В основе формата DjVu лежат несколько технологий, разработанных в AT&T Labs. Это:
  • алгоритм отделения текста от фона на отсканированном изображении;
  • вейвлетный алгоритм сжатия фона IW44;
  • алгоритм сжатия черно-белых изображений JB2;
  • универсальный алгоритм сжатия ZP;
  • алгоритм распаковки «по запросу»;
  • алгоритм «маскировки» изображений.
AT&T продали технологию LizardTech, которые пытаются использовать её для своих коммерческих интересов, но, благодаря открытости формата, для создания и просмотра документов DjVu существует свободно распространяемое программное обеспечение, доступное для различных платформ.

Вывод:
Формат DjVu крайне удобен для хранения и передачи отсканированных естественно-научных книг, где обилие формул и схем делает чрезвычайно трудоёмким их полноценное распознание.

Он стал основой для нескольких библиотек научных книг, правомерность существования некоторых из них, впрочем, вызывает сомнения с точки зрения законов об авторских правах, т.к. огромное количество книг в этом формате доступно в файлообменных сетях.


Программы для чтения DjVu файлов

WinDjView 0.4.1 {Скачать}

Описание:
Файлы ставшего уже достаточно популярным формата DjVu можно встретить повсеместно. В этом формате распространяются книги, чертежи, журналы, литература и документация. Главное достоинство DjVu перед тем же PDF - размер файлов. При одинаковом качестве файлы DjVu занимают гораздо меньше места. Одним из лучших средств для просмотра DjVu-файлов является утилита WinDjView. Она позволяет, осуществлять поиск по тексту (если документ редактируемый), создавать закладки, изменять масштаб страницы, выполнять разворот страниц документа с шагом 90 градусов, пролистывать страницы — как с помощью клавиатуры, так и с помощью мыши, регулировать яркость и контрастность отображаемых документов.
__________________
× Если вы нашли ошибку в моём сообщении, выделите её мышкой и нажмите Alt-F4 ×
× Twitter, LastFm, SCC, What.cd, Tapochek.net ×

Последний раз редактировалось a2z; 11.10.2006 в 19:35.
a2z вне форума Пол: Мужчина   Ответить с цитированием Вверх
Благодарности: 6
iva (11.10.2006), Jon (17.06.2007), Сергей Копылов (25.02.2007), seglov (11.10.2006), Starlight (26.10.2007), ZUDen` (11.10.2006)