Сканеры в задачах и картинках.

Петр Булгаков, 

Анализ современного рынка сканеров, попытка прогноза дальнейшего развития технологий сканирования. Краткое описание основных характеристик популярных моделей сканеров производства Canon, Epson, Hewlett-Packard, Genius, Umax и BenQ.

Пару лет назад в «ДК» была опубликована моя статья «Изобретение сканера», где я попытался дать прогноз — какими будут сканирующие девайсы в недалеком будущем. Вообще, давать прогнозы — дело неблагодарное. Надо иметь талант астролога или политолога — один знакомый политолог говорил, что главный секрет профессии в том, чтобы правильно расписать семь возможных сценариев развития событий, а потом грамотно объяснить, почему они пошли по восьмому.

Так и мне сейчас приходится оправдываться и рассказывать о «восьмом сценарии». Но сначала о самом прогнозе. И не только о нем, но и о методе «заглядывания в будущее» — общем законе развития систем и устройств, который применяется в ТРИЗ1.

Систему невозможно создать идеальной сразу. После изобретения чего-то нового идет бурный период развития. Те же планшетные сканеры поначалу вынуждены были сканировать изображение в три прохода, каждый раз меняя фильтры перед линейкой ПЗС, чтобы снять оригинал отдельно в красном, зеленом и синем цветах. Потом придумали, как можно справиться с задачей в один проход: наиболее распространенный вариант — установка трех линеек ПЗС и трех светофильтров для каждой. А в CIS-моделях точки, улавливающие разные цвета расположены рядом, и каждая подсвечивается своим светодиодом.

Наиболее популярны CCD-модели, в которых «фотографирующим» элементом являются приборы с зарядовой связью (ПЗС или CCD). Но не матрица, как в цифровых камерах, а длинная линейка, способная снять изображение только с одной строки оригинала.

Чтобы спроецировать на миниатюрную линейку всю линию исходного документа (оригинала) приходится встраивать в сканер довольно сложную оптическую систему, что еще больше сближает сканеры и фотоаппараты. Но в сканерах оптику приходится «возить» под стеклом, снимая по очереди заданные линии оригинала.

5000e-02.jpg

BenQ Scan to Web 5000E

Тип

 CCD

Интерфейс

 USB 1.1, SCSI

Разрешение

 1200 x 1200

Глубина цвета

 48 вход / 48 выход 

Слайд-модуль

 нет

Цветопередача

 8 баллов

Скорость просмотра и сканирования

 8 баллов

Цена

 $75

7400UTsmall_2.jpg

BenQ Scan to Web 7400UT

Тип

 CCD

Интерфейс

 USB 2.0

Разрешение

 2400 x 4800

Глубина цвета

 48 вход / 48 выход 

Слайд-модуль

 встроенный

Цветопередача

 9 баллов

Скорость просмотра и сканирования

 8 баллов

 

 поставляется с платой USB 2.0 PCI

Цена

 $130

Гораздо проще устроены CIS-модели (contact image sensor). В них линейка фотодиодов имеет ширину стекла сканера. И нет необходимости в сложной оптике (перед группами светодиодов помещается только миниатюрная линза), поэтому CIS-модели миниатюрны, обладают малой толщиной, весом и потребляют мало энергии.  Несмотря на эти достоинства, они не получили такого широкого распространения, как CCD-сканеры. Последние, как правило, обладают лучшей цветопередачей и главное (!) большей глубиной резкости. Это позволяет им сканировать изображение, оторванное от стекла сканера (например, покоробленную фотографию или текст на сгибе книги). А для CIS-моделей малейший — три-четыре миллиметра — отрыв оригинала от стекла оказывается фатальным, объект уходит из зоны резкости.

640p_ex.jpg

Canon n640p ex

Тип

 CIS

Интерфейс

 параллельный (IEEE1284 / ECP)

Разрешение

 600 x 600

Глубина цвета

 32 вход / 24 выход 

Слайд-модуль

 нет

Цветопередача

 7,5 баллов

Скорость просмотра и сканирования

 7 баллов

Сверхкомпактный

 256 x 372,5 x 39 мм; вес 1,5 кг

Цена

 $70

n1250u2.jpg

Canon n1250u2

Тип

 CCD

Интерфейс

 USB 1.1, USB 2.0

Разрешение

 1200 x 1200

Глубина цвета

 48 вход / 24 выход 

Слайд-модуль

 нет

Цветопередача

 9 баллов

Скорость просмотра и сканирования

 7,5 баллов

Цена

 $105

Подобных усовершенствований было сделано немало, и сегодня, можно сказать, сканеры практически достигли совершенства, почти как велосипеды.

Тогда появляется вопрос — куда двигаться дальше? Согласно ТРИЗ, наступает момент рождения двойной системы. Т.е. основной ее элемент дублируют, после чего функциональность заметно возрастает. Типичный пример — появление двухкассетных магнитофонов. А, что касается сканеров, здесь я не сильно ошибся — действительно появились модели Hewlett-Packard с двойной линейкой ПЗС. Одна является грубой шкалой — производит сканирование с относительно небольшим разрешением 600 dpi. Зато делает это быстро, да и используется чаще — более высокое разрешение требуется редко. Но когда потребуется, в ход идет вторая линейка ПЗС — с разрешением 1200 или 2400 dpi. Кстати, раньше это было решение для дорогих моделей, сегодня оно перекочевало в сканеры начального уровня.

Оптическое разрешение сканера в основном зависит от числа элементов в светочувствительных линейке. Если поделить число этих элементов на ширину сканера (для формата А4 это 21 сантиметр) и умножить на 2,5 (отношение дюйма к сантиметру), мы получим наивысшее оптическое разрешение в масштабе dpi (число точек на дюйм). Оно может быть ухудшено некачественной оптикой и высоким уровнем шумов в АЦП (аналогово-цифровой преобразователь), но такое случается редко — как правило, под уровень линейки ПЗС подстраивается качество остальных элементов.

Но после того как двойная система доведена до совершенства, наступает время мультисистемы, где основной элемент не просто дублируется, а «тиражируется». Пример — CD-ченджеры, которые могут крутить несколько дисков. В прогнозе я предположил, что линейка ПЗС может быть не просто удвоена, а растянута до матрицы. Тогда сканирование может производиться не узенькими полосками, но широкими. Оптическая система может передвигаться очень быстро, на лету схватывая изображение. А в идеале планшетный сканер превращается в планшетный фотоаппарат — достаточно положить на стекло оригинал и через считанные секунды оно переведется в компьютер, лишь бы интерфейс позволил быстро закачать данные (но для USB 2 и FireWire это не проблема).

Заманчиво, не правда ли? Но, боюсь, я переоценил темпы, которыми развивается производство CCD-матриц. За два года они не стали дешевыми, да и число пикселов в них еще маловато. 6-мегапикселная матрица — прямоугольник со сторонами примерно 3500 на 1700 пикселов, т.е. бОльшая сторона матрицы для формата А4 обеспечит разрешение лишь в 400 dpi.

Много это или мало? К сожалению, не очень много. Хотя во многих  сканерах по умолчанию устанавливается режим 200 dpi и в случае его принудительного увеличения драйвер предупреждает: «Разрешение для типа вывода Истинный Цвет установлено выше необходимого уровня, требуемого для наилучшего качества изображения. Изображение будет сканироваться медленнее и его файл будет намного больше необходимого. Хотите переустановить разрешение?» — позволю себе не согласиться с такой заниженной оценкой. Даже при работе с бумажными носителями, нередко приходится устанавливать 600 dpi, чтобы снизить процент ошибок при распознавании мелкого текста. Для сканирования фотографий, снятых «мыльницами», действительно, в большинстве случаев 200 dpi хватит, но если фотография сделана хорошей камерой и отпечатана на хорошей бумаге (многие фотографы специально ищут лаборатории, где можно, хоть и подороже, но качественно отпечатать снимки) тогда и 600 dpi может оказаться недостаточно, чтобы снять с фотокарточки всю информацию. А при сканировании слайдов, точно надо переходить на большее разрешение. Но это отдельная задача2.

P1250.jpg

Epson Perfection P1250 (Photo)

Тип

 CCD

Интерфейс

 USB 1.1

Разрешение

 1200 x 2400

Оптическая плотность

 3D

Глубина цвета

 48 вход / 24 выход 

Слайд-модуль

 поставляется отдельно, цена $30

Цветопередача

 9 баллов

Скорость просмотра и сканирования

 8 баллов

Цена

 $129

P2450P.jpg

Epson Perfection P2450 Photo

Тип

 CCD

Интерфейс

 USB 2.0 и IEEE-1394 (FireWire)

Разрешение

 2400 x 2400

Оптическая плотность

 3,3D

Глубина цвета

 48 вход / 48 выход 

Слайд-модуль

 встроенный

Цветопередача

 9,5 баллов

Скорость просмотра и сканирования

 9 баллов

Цена

 $344

Развитие в насыщении

Итак, пока не получается «любви и дружбы» сканеров и матриц ПЗС. Тем более производством матриц с соотношением сторон, отличным от 3х4, едва ли кто займется. Так что, скорее всего, сканеры и цифровые фотокамеры будут продолжать идти каждый своей дорогой до тех пор, пока последние не станут настолько совершенны, что первым уже не найдется применения.

Собственно, уже сегодня делаются попытки приспособить для перевода в электронный вид текста и фотографий с помощью цифровых фотокамер и даже web-камер. Но здесь появляется как минимум две проблемы. Во-первых, для многих случаев не хватает разрешения — об этом мы уже говорили. Во-вторых, для фиксации оригинала приходится придумывать какое-либо приспособление — в условиях низкой освещенности (это обычное состояние любой квартиры) недостаточно просто «показать» камере картинку, надо чтобы она «смотрела» на нее в течение, по крайней мере, двух-трех секунд. При съемке с рук изображение обязательно будет дрожать и станет нечетким. Тогда приходится искать выход — строить опору для камеры и для листа. Т.е. заново изобретать планшетный сканер.

Хотя теоретически вторую проблему можно решить и без опоры — например, если драйвер той же web-камеры будет достаточно умным, чтобы отслеживать перемещения листа и затем сшивать несколько кадров в одно изображение. Кстати, попытка создать умный сканер уже была сделана (это был очень интересный и многообещающий эксперимент), когда компания Hewlett-Packard выпустила две модели: НР CapShare 910 и CapShare 920 — ручные сканеры, которые можно было вести по листу оригинала «змейкой», чтобы перекрыть всю поверхность, но не перекашивать более чем на 45 градусов к линии движения). За перемещением по листу следили два оптических датчика, они запоминали траекторию движения (информацию для зацепки давали мельчайшие неровности и дефекты оригинала), а процессор внутри сканера в реальном времени решал задачу склейки образа оригинала по отрывочным данным.

Эта задача вполне сходна с той, что можно поставить перед web-камерой, которая должна восстанавливать изображение с листа, находящегося перед ней в человеческих руках, не установленного на специальный штатив. В теории, камера отследит все небольшие перемещениям и развороты относительно объектива и высчитает по ним точный образ оригинала. Возможно, когда-нибудь так и будет — в теории все просто. Но на практике сканеры НР CapShare «не пошли». Несмотря на всю привлекательность технологии умного сканирования, они просто не выдержали конкуренции со своими не такими умными, но и не такими дорогими собратьями.

Это не значит, что производители отказались от попыток создать сканер-интеллектуал, но об этом чуть позже. А в остальном, приходится признать, продолжается «развитие в насыщении» — постепенное улучшение характеристик: снижение веса, размеров, энергопотребления (некоторые CIS-модели даже обходятся без внешнего питания, получая энергию по шине USB); изменение дизайна, улучшение временных параметров.

Аппаратное или механическое разрешение определяется точностью механики сканера. Оно задается минимальными передвижениями оптической системы под стеклом сканера. Иногда в описаниях моделей оптическое разрешение также называют аппаратным (иногда — наоборот). Если механика и оптика дают равные величины, это и неважно. Но бывает, что в описании оставляют просто строку «Разрешение» и напротив него ставят наибольшую величину. Если в строке «Разрешение» указываются два параметра, как правило, первый означает оптическое, второй — аппаратное.

Sj2300Q2957aHiresP1.jpg

Hewlett-Packard ScanJet 2300

Тип

 CCD

Интерфейс

 USB 2.0

Разрешение

 600 x 600

Глубина цвета

 48 вход / 24 выход 

Слайд-модуль

 нет

Цветопередача

 8 баллов

Скорость просмотра и сканирования

 7,5 баллов

Цена

 $95

Sj3570Q2707aHiresP1.jpg

Hewlett-Packard ScanJet 3570c

Тип

 CCD

Интерфейс

 USB 2.0

Разрешение

 1200 x 1200

Глубина цвета

 48 вход / 24 выход 

Слайд-модуль

 входит в поставку

Цветопередача

 8,5 баллов

Скорость просмотра и сканирования

 8 баллов

Цена

 $160

Сегодня «штатное» разрешение даже для недорогих сканеров (с ценой около 100 долларов)— 1200 и 2400 dpi — прогресс налицо. Аппараты с меньшим разрешением уходят в нишу совсем недорогих устройств — порядка 50 долларов. Это область вечного застоя — наиболее дешевые сканеры пригодны в основном для перевода текста в электронный вид. Цветопередача у них, мягко говоря, неважная, а об оптической плотности можно вообще не говорить. И это тот случай, когда низкое качество оптики и механики снижают оптическое и аппаратное разрешение. Но об этом в инструкции не пишут.

Оптическая плотность — показатель оптического диапазона носителей изображения, которые сканер может обрабатывать без потери качества. Для непрозрачных носителей оптический диапазон является максимальным отношением падающего светового потока к отраженному. По сути демонстрирует, сколько градаций яркости нанесено на оригинал. Для удобства отношение потоков переводится в логарифмическую форму. Обычно обозначается числом и символом D. Если мы наблюдаем десятикратный разброс яркостей, оптическая плотность определяется как 1,0D; стократный — 2,0D; тысячекратный — 3,0D. Практическим пределом для любых носителей считают величину 4,0D. Для большинства бумажных носителей пределом является 3,0D, а большинство сканеров обладают уровнем не выше 2,5D — отчасти поэтому оптическую плотность редко можно найти среди характеристик сканеров среднего ценового диапазона (до 200 долларов).

Для прозрачных носителей оптическая плотность задает отношение падающего потока и проходящего. Оптический диапазон слайдов и негативов, как правило, выше, чем у бумажных носителей. Поэтому к сканерам, способным обрабатывать прозрачные материалы, предъявляются более жесткие требования.

Более продвинутые модели оснащаются качественной оптикой и механикой и сохраняют заявленные параметры. Собственно, массовое производство так отлажено, что при цене сканера $100 обеспечить 1200 dpi по оптике и 2400 dpi по механике не так сложно. Бывают интересные решения, когда механическое разрешение можно увеличить с 600 до 2400 dpi (технология Epson MicroStep). Разумеется, когда это необходимо, потому как времени на такое точное сканирование уходит намного больше.

Кроме высокого разрешения, многие модели сегодня могут похвастаться повышенной разрядностью цвета, как при внутренней обработке изображения — на входе, так и при передаче картинки в компьютер — и на выходе. Что касается высокой внутренней разрядности — это, вещь, безусловно, полезная. Сканер получает возможность отсечь шумы и выбрать из 48 разрядов (16 бит на каждый цвет) те, которые наилучшим образом перекрывают динамический диапазон изображения. Т.е. привязать наиболее темные области к младшим разрядам, а наиболее светлые — к старшим. Искажения цвета при этом сводятся к минимуму.

Внешняя повышенная разрядность пока используется крайне редко. Это связано не только с тем, что размеры графических файлов увеличиваются вдвое. Просто, на экране монитора повышенную глубину цвета (выражается она в увеличении числа полутонов) невозможно увидеть. Отчасти поэтому не каждый графический редактор может полноценно работать с увеличенной глубиной цвета. В том же «Фотошопе» большинство фильтров не работает с 16-битным представлением каждого цвета.

Из наиболее заметных перемен, что произошли со сканерами в последний год, можно назвать распространение интерфейса USB. LPT и SCSI модели постепенно уходят со сцены. И наиболее распространенными становятся не просто USB-сканеры, но модели с полной поддержкой USB 2.0. Что ж, если посмотреть, как резво начали выпускаться материнские платы с USB 2.0, понятно, этот стандарт станет самым популярным.

CP-Vivid7X-Slim-high.jpg

Genius Color Page HR7X Slim

Тип

 CCD

Интерфейс

 USB 1.1

Разрешение

 1200 x 2400

Глубина цвета

 48 вход / 24 выход 

Слайд-модуль

 встроенный

Цветопередача

 7,5 баллов

Скорость просмотра и сканирования

 8 баллов

Цена

 $120

Умнеют ли сканеры?

Итак, на железной части не будем долго останавливаться. Она развивается, но изменения не носят качественно нового характера. Высокое разрешение в большинстве случаев оказывается невостребованным, по крайней мере, при работе с бумажными носителями. То же самое относится и к повышенной глубине цвета на выходе. Даже появление интерфейса USB 2.0 мало что меняет, поскольку становится заметно лишь при сканировании носителей большого формата с высоким разрешением. Но для многих пользователей (мы не говорим о профессионалах) такое сканирование — редкость. С высоким разрешением приходится сканировать разве что слайды, но их площадь невелика, поэтому и конечный объем файла окажется не таким громоздким. И передача данных не составит бОльшую часть времени сканирования.

Так что имеет смысл поговорить о тех изменениях, которые действительно заметно меняют подход к сканированию. А сводятся они к изменению типа интерфейса. Отход от классического вида диалога «человек — сканер», где новичкам предлагалось несколько кнопок, а продвинутым — несколько регуляторов (яркости, контраста и гамма-коррекция) обусловлен тем, что простые операции сканирования, которые раньше считались чуть ли не таинством и эзотерическим знанием, сегодня отработаны настолько, что их можно доверить автоматике.

В большей или меньшей степени это проявляется у всех производителей, но наиболее активную позицию здесь занимает Hewlett-Packard. «Доверяй умным машинам!» — их рекламный слоган. А в пакете Precisionscan — оболочке драйверов НР даже установка разрешения спрятана в меню «Сервис». Вместо этого пользователю предлагаются пошаговые инструкции, в которых задается один параметр: тип вывода (истинный цвет, текст для распознавания, текст и изображение). А все настройки, соответствующие запросам новичка и продвинутого юзера спрятаны в систему меню, и еще расширены наиболее распространенными задачами, с которыми встречается пользователь: изменение масштаба изображения, повышение четкости, поворот на 90 градусов и т.д. В меню дополнительно можно добраться до совсем тонких настроек, вроде подбора уровня цвета по гистограмме (только в версии Precisionscan Pro).

Т.е. наиболее необходимые части графического редактора содержатся непосредственно в драйвере. При этом не надо изучать сторонние программы и в большинстве случаев достаточно пользоваться средствами основного ПО сканера. Причем, некоторые ошибки, с которыми может столкнуться, новичок просто исключаются. Например, невозможно установить разрешение 400 dpi — здесь жестко используется правило, что разрешение лучше выбирать из ряда чисел кратных максимальному разрешению. При максимальном 600 dpi лучше выбрать 300 dpi, а не 400; в первом случае произойдет лишь «выбрасывание» лишних точек — изображение будет сниматься с каждого второго фотоэлемента, а шаговый механизм — перемещать каретку двойными шагами; в случае 400 dpi драйверу придется пересчитывать картинку, искусственно менять ее масштаб, а это обычно приводит к заметным искажениям, особенно для штриховой графики.

AstraSlim.jpg

Umax AstraSlim 1200

Тип

 CCD

Интерфейс

 USB 1.1

Разрешение

 1200 x 1200

Глубина цвета

 48 вход / 36 выход 

Слайд-модуль

 нет

Цветопередача

 8,5 баллов

Скорость просмотра и сканирования

 8 баллов

Цена

 $125

Измерение IQ

Не расписывая бесконечные детали, попробуем проиллюстрировать новый подход на конкретном примере: надо отсканировать и распознать текст в сложных условиях — цветной текст на цветной обложке компакт-диска. Наша основная задача — проверить, насколько можно доверять умным машинам.

В сканерах прошлых лет с таким распознаванием приходилось повозиться, прежде чем число ошибок FineReader становилось минимальным. Приходилось подстраивать контраст, яркость, порой и гамма-коррекцию, добиваясь, чтобы символы были максимально различимы на цветном фоне. Это понятно, человек легко различает цветное на цветном, а сканеру приходится напрягаться (перевод картинки в шкалу серого иногда помогает, иногда нет — некоторые символы могут слиться с фоном).

Попробуем поставить чистый эксперимент. Сначала отсканируем по-старинке, причем не будем доводить картинку до ума — только выставим параметры, согласно требованиям FineReader (от 300 до 600 dpi). И посмотрим, сколько будет ошибок. Затем, попросим умный сканер самостоятельно справиться с задачей. И определим, насколько ошибется его программа.

FineReader справился неплохо. Причем, ему было практически все равно, распознавать цветное изображение или черно-белое, в разрешении 300 dpi или 600 dpi (последнюю проверку можно было не проводить — этот режим нужен только для распознавания мелких символов).

Когда за работу взялся сканер (эксперименты проводились на модели HP ScanJet 5440), первое впечатление было ужасным. Сканеру было указано, что надо обработать текст, и он выставил не режим «шкала серого», а строгий черно-белый растр — только черные и только белые точки. Разумеется, для черного текста на белой бумаге это идеальный режим — размер файла минимален, а условия для распознавания очень хорошие. Но то, что появилось в окошке драйвера не способен прочесть и человек. Тем не менее, результаты работы автоматики были неплохими, не хуже, чем у FineReader’а. Вероятно, встроенная OCR-программа работает не только с тем изображением, что высвечивается в окошке, но и с представлением в градациях серого цвета.

А задача распознавания страницы журнала со сложной структурой (текст, картинки, таблица) оказались автоматике не по зубам. Собственно, здесь не хватает ума не самому сканеру, а программе. Разумеется, FineReader справился с задачей намного эффективнее, хотя специальная чистка картинки тоже не производилась. Но то FineReader!

Девятый сценарий

После частичной неудачи с прогнозом, ничего не остается делать, как начинать следующий.

Поколение пользователей, привыкших к классической работе со сканером постепенно меняется на новое, что еще не «отравлено классикой». Да и те, что отравлены меняют привычки — интерфейсы нового типа уже не вызывают того раздражения, что было еще год назад.

С другой стороны, процессорную мощь сегодня просто некуда девать. Она простаивает и, по идее, ее надо срочно превращать в компьютерный разум. Ведь появились многофункциональные устройства, сделанные по подобию мини-лабов (фотографий), когда человек подключает цифровую камеру, скачивает фотографии в МФУ (без помощи компьютера), печатает превьюшки и получает «лист заказа». В нем остается только пометить галочками, какие снимки печатать, в скольких экземплярах и в каком формате. А дальше сканер МФУ считывает заказ и распечатывает фото строго по галочкам. И, кстати, не делает ошибок, как порой бывает в настоящих мини-лабах.

Две составляющие прогноза есть. А третья — это упорное желание наиболее крупных производителей сделать свою продукцию действительно умной. Коль скоро железная часть доведена до совершенство, остается рассчитывать на искусственный интеллект. В конкуренции побеждает умнейший.


1. ТРИЗ — теория решения изобретательских задач. [вернуться]

2. Задачам сканирования слайдов посвящена статья «Работа со слайдами. Маленькие советы хорошего качества». [вернуться]


Автор
Петр Булгаков

Комментарии