Компьютерное обучение
Полезные компьютерные программы и обучение для новичков

Формат файлов DJVU

Формат файлов DJVU

  Сегодня рассмотрим формат с довольно интересным названием DJVU (читается как «де жа вю»). Файлы в этом формате представляют собой сильно сжатые картинки. За то, что такие файлы занимают очень мало места, они в основном используются для создания сканированных книг, журналов и т. д.

Этот формат изначально и разрабатывался для хранения разнообразных сканированных документов, которые сложно распознать. Это документы, содержащие большое количество графики, таблиц, рукописи и прочее.

Мотивом разработки формата DJVU послужило то, что большинство документов, несущих важную информацию, находилось на бумаге, и было невозможно расположить их в сети Интернет. Существующие форматы (JPEG, GIF, PNG) не позволяли добиться небольшого размера отсканированного файла при сохранении приемлемого качества. В результате отсканированные документы стало просто невозможно распространять по сети Интернет.

Этой проблемой озаботилась компания AT&T Labs, которая с 1996 года и занимается разработкой формата файлов DJVU. Этот формат позволил расположить в Интернете газеты, справочники исторические документы в высоком качестве.

Формат DJVU широко используется библиотеками и научными лабораториями, предоставляющим доступ к своим архивам через Интернет.

DJVU позволяет добиться удивительно малого размера отсканированной страницы (сравнимого с размером обычной страницы HTML) при сохранении довольно качественной картинки.

Также благодаря многослойной структуре ускоряется открытие таких файлов на слабых компьютерах. Сначала загружается один слой (текстовая маска), а затем все остальные.

Для сжатия изображений в DJVU используется специальная технология, которая разбивает изображение на три слоя: черно-белая маска, задний план и передний план. Маска – самая информативная часть, она совсем не сжимается и хранит в себе все детали исходного изображения: текст и четкие детали. Задний план содержит изображения и уже сжимается для уменьшения размера конечного файла. Передний план хранит цвет, и претерпевает самое значительное сжатие. Затем все эти слои пережимаются специальными алгоритмами. Ключевой особенностью этих алгоритмов является то, что они определяют повторяющиеся символы и хранят их только единожды.

Также для создания файла формата DJVU можно использовать не все перечисленные слои, иногда достаточно только одного, что позволяет достигнуть рекордного по размеру файла.

Часто на сжатые в формат DJVU изображения накладывается текстовый слой, который позволяет осуществлять поиск по такому документу.

Комментариев: 4

Все таки, чаще можно найти сканы в формате PDF

alikdio 2.

Необязательно. Довольно интересные и редкие сканы втречаются только в формате DJVU. А места занимают - всего ничего.

Еще есть портабельные версии этих ридеров, про них напишите, с ними удобнее работать. Если разрешите потом статью с копирайтами поставлю у себя на http://rommann.tk

vipsuccess 4.

еще б ссылку нарисовал где качнуть этот ридер, то и статья имела бы смысл...

Оставьте комментарий!

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake excaim question

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

Вы можете войти под своим логином или зарегистрироваться на сайте.

(обязательно)