Формат файлов DJVU

Этот формат изначально и разрабатывался для хранения разнообразных сканированных документов, которые сложно распознать. Это документы, содержащие большое количество графики, таблиц, рукописи и прочее.
Мотивом разработки формата DJVU послужило то, что большинство документов, несущих важную информацию, находилось на бумаге, и было невозможно расположить их в сети Интернет. Существующие форматы (JPEG, GIF, PNG) не позволяли добиться небольшого размера отсканированного файла при сохранении приемлемого качества. В результате отсканированные документы стало просто невозможно распространять по сети Интернет.
Этой проблемой озаботилась компания AT&T Labs, которая с 1996 года и занимается разработкой формата файлов DJVU. Этот формат позволил расположить в Интернете газеты, справочники исторические документы в высоком качестве.
Формат DJVU широко используется библиотеками и научными лабораториями, предоставляющим доступ к своим архивам через Интернет.
DJVU позволяет добиться удивительно малого размера отсканированной страницы (сравнимого с размером обычной страницы HTML) при сохранении довольно качественной картинки.
Также благодаря многослойной структуре ускоряется открытие таких файлов на слабых компьютерах. Сначала загружается один слой (текстовая маска), а затем все остальные.
Для сжатия изображений в DJVU используется специальная технология, которая разбивает изображение на три слоя: черно-белая маска, задний план и передний план. Маска – самая информативная часть, она совсем не сжимается и хранит в себе все детали исходного изображения: текст и четкие детали. Задний план содержит изображения и уже сжимается для уменьшения размера конечного файла. Передний план хранит цвет, и претерпевает самое значительное сжатие. Затем все эти слои пережимаются специальными алгоритмами. Ключевой особенностью этих алгоритмов является то, что они определяют повторяющиеся символы и хранят их только единожды.
Также для создания файла формата DJVU можно использовать не все перечисленные слои, иногда достаточно только одного, что позволяет достигнуть рекордного по размеру файла.
Часто на сжатые в формат DJVU изображения накладывается текстовый слой, который позволяет осуществлять поиск по такому документу.
Комментариев: 4
Все таки, чаще можно найти сканы в формате PDF
Необязательно. Довольно интересные и редкие сканы втречаются только в формате DJVU. А места занимают - всего ничего.
Еще есть портабельные версии этих ридеров, про них напишите, с ними удобнее работать. Если разрешите потом статью с копирайтами поставлю у себя на http://rommann.tk
еще б ссылку нарисовал где качнуть этот ридер, то и статья имела бы смысл...