Компьютерра (№255) - Журнал «Компьютерра» №33 от 13 сентября 2005 года
ModernLib.Net / Компьютеры / Компьютерра / Журнал «Компьютерра» №33 от 13 сентября 2005 года - Чтение
(стр. 4)
В прошлом Кэрриер работал в знаменитой «хакерской» фирме @stake (ранее L0pht), специализирующейся на компьютерной безопасности, где возглавлял «Команду скорой помощи» и «Лабораторию цифровой криминалистики». Многие годы Кэрриер преподавал свою специфическую науку на разнообразных курсах и семинарах повышения квалификации для специалистов, а в настоящее время готовится к защите диссертации по информатике и цифровой криминалистике в Университете Пэдью.
Как пишет в предисловии сам автор, главная цель книги — упорядочить и свести воедино «низкоуровневые подробности» о системах файлов и томов жесткого диска. Хотя Кэрриер по профессии является программистом-разработчиком, он решил написать эту книгу, поскольку в море справочной литературы явно ощущалась нехватка документации, в которой различные файловые системы разбирались бы по косточкам. Подавляющее большинство цифровых улик, накапливающихся в компьютере, как известно, хранится в файловой системе. Но незнание тонкостей ее работы не позволяло «цифровому следователю» — будь он аналитиком спецслужбы, детективом, специалистом по ИТ-безопасности в корпорации или просто сотрудником бюро по восстановлению данных — эти самые улики обнаружить.
Начиная с общего обзора принципов «цифрового расследования» и основ устройства ПК, Кэрриер переходит к обстоятельному, подробно иллюстрированному описанию современных файловых систем. Как показывает опыт, эта информация является критически важной не только для отыскания улик и восстановления уничтоженных данных, но и для адекватной оценки имеющихся у аналитика инструментов. Параллельно описываются структуры хранения и представления данных, анализируются примеры образов диска, прорабатываются различные сценарии расследования. Все примеры рассматриваются с применением известных программ анализа файловой системы, причем с явным упором на инструментарий с открытыми исходными кодами — как наиболее гибкий, доверяемый и полезный в работе.
Среди важнейших тем, затронутых в книге, отметим следующие:
— сохранение «цифровой сцены преступления» и снятие «слепка» жесткого диска;
— выявление скрытых данных в Host Protected Area (служебной области жесткого диска);
— считывание исходных данных: прямой доступ против доступа через BIOS, обработка ошибок доступа;
— анализ разделов, файловых систем FAT, NTFS, Ext2, Ext3, UFS1 и UFS2;
— исследование содержимого распределенных дисковых томов (RAID и disk spanning);
— отыскание улик: метаданные файла, восстановление уничтоженных файлов, места сокрытия данных и другие хитрости;
— использование инструментария The Sleuth Kit, Autopsy Forensic Browser и других родственных программ с открытыми кодами.
Подробности о деятельности Брайана Кэрриера, о разработанных им программах анализа, а также содержательные фрагменты книги можно найти на сайте www.digital-evidence.org. В ответ на часто задаваемый вопрос, почему на обложке столь серьезного справочника помещены какие-то легкомысленные цветочки, автор отвечает примерно так: «На самом деле это вовсе и не цветы, а такие специфические животные — морские ежи, имеющие обыкновение прятаться от врагов в скалах и вооруженные ядовитыми иглами».
Автор: БЕРД КИВИ
Terralab.ru
Железный поток
Отступая от традиции «Железного потока» сообщать о готовых к продаже новинках, рискнем заглянуть в ближайшее будущее и отметим прорыв в области гибких ЖК-дисплеев. Фирма Philips Polymer Vision умудрилась сконструировать 5-дюймовый дисплей PV-QML5, который может скручиваться в трубочку диаметром всего 15 мм. Он имеет разрешение 320x240 точек, контрастность 10:1 и четыре градации яркости.
* * * Sony объявила о выпуске новых панорамных камер RPU-C2512 (настольная модель) и RPU-C3522 (потолочная модель). Камеры используют особый 360-градусный объектив и 2-Мп ПЗС-сенсор со скоростью съемки семь с половиной кадров в секунду (для передачи панорамной картинки как видео). Настольная камера обеспечивает покрытие в 38 градусов выше и 17 градусов ниже плоскости объектива, а потолочная — 66 градусов ниже плоскости. Другое новшество от Sony — бытовой DVD-плейер DVP-NS92V с поддержкой интерфейса HDMI. Благодаря фирменному алгоритму плейер умеет масштабировать видео до разрешений 1280x720p/1920x1080i. Поддерживается формат Super Audio CD. Еще одна новинка: первый в истории Sony комбинированный рекордер RDR-VX410, сочетающий возможности DVD и VHS. Рекордер поддерживает все плюсовые и минусовые форматы (правда, из двухслойных — только +R DL) и может копировать с DVD на VHS и обратно.
* * * VIA выпустила новый северный мост P4M800 Pro для процессоров Pentium 4 и Celeron. Встроенное графическое ядро S3 Graphics UniChrome Pro умеет выводить картинки на ЖК— или ЭЛТ-монитор, а также на обычный и HDTV-телевизор (до 1080p). Поддерживается частота FSB до 800 МГц, память DDR2 (533/400 МГц) и DDR (400/333/266 МГц). В связке с южным мостом VT8237R чипсет обеспечивает поддержку SATA и V-RAID (0, 1, 0+1).
* * * Fujitsu Siemens объявила о выпуске рабочей станции Celsius V830 на базе двухъядерных 64-разрядных процессоров AMD Opteron 275, 270 и 265. Системы могут иметь до двух таких процессоров и до 32 Гбайт памяти. Компьютеры поддерживают технологию AMD PowerNow! с OPM (Optimized Power Management), что позволяет уменьшать энергопотребление в зависимости от загруженности процессора. Чипсеты рабочих станций — nVidia nForce Professional 2200 и 2050, AMD 8132; до шести слотов расширения — два PCI-X 2.0, один PCI, два PCI-E x16 (SLI поддерживается) и один PCI-E x1. Дисковая система может включать в себя винчестеры объемом до 400 Гбайт с интерфейсом SATA/SATA-2 или SCSI, а также оптический привод (DVD-ROM, COMBO или многоформатный). Кстати, AMD продолжает выпускать и мобильные 64-разрядные процессоры. Фирма представила две новые модели Turion 64 — MT-40 ($359) и MT-37 ($268), которые, например, VoodooPC использовала в своих игровых ноутбуках ENVY Middleweight a:538 и a:228.
* * * Поступило в продажу многофункциональное устройство для управления документооборотом Ricoh Aficio 480W. Комбайн позволяет сканировать, печатать и копировать документы размером до 914x15000 мм; и сканер, и принтер обеспечивают разрешение 600 dpi. Скорость при любой обработке документов — до 8 страниц формата A1 в минуту. Отметим специальный режим для сканирования чертежей, встроенный сервер документов (80 Гбайт) и широкий набор опций, среди которых, например, до пяти разных устройств подачи рулонной и листовой бумаги, пленки и кальки.
* * * Philips выпускает два цифровых плейера на базе жесткого диска — HDD1630 (6 Гбайт, $200) и HDD6330 (30 Гбайт, $300). Оба можно использовать для просмотра цифровых фотографий (как в полноэкранном режиме, так и в виде миниатюрных копий), для этой цели они оснащены цветным ЖК-дисплеем с подсветкой. Плейеры оснащены FM-тюнером, имеют функцию диктофона. Время автономной работы у HDD1630 составляет 18 часов, а у HDD6330 — 15 часов, причем подзарядка аккумуляторов может идти в ускоренном режиме, при котором 70-процентный заряд достигается всего за час.
* * * Компания Pentax представила пыле/водонепроницаемую цифровую фотокамеру Optio Wpi, которая может работать под водой на глубине до полутора метров в течение 30 минут. Новинка оснащена 2-дюймовым TFT-дисплеем с разрешением 115 тысяч пикселов, 6-мегапиксельным ПЗС-сенсором и объективом с 3-кратным зумом (38—114 мм в 35-мм эквиваленте). Внутреннюю память объемом 10,5 Мбайт можно увеличить за счет подключения карт формата Secure Digital. Из других прибамбасов отметим порт USB 2.0, AV-выход и DC-вход. Габариты Optio Wpi — 102x51x22 мм, вес (вместе с батареей) -135 г. 18 сюжетных программ, 6 режимов настройки баланса белого и 10 режимов изменения параметров изображения. Возможна запись видео 320 x 240 пикселей при 30 кадрах в секунду.
* * * «Просто добавить компьютер» предлагает Samsung к своему многоформатному пишущему DVD-приводу WriteMaster SE-W164C с интерфейсом USB 2.0. Скорость чтения DVD-ROM и записи DVD+/—R одинакова — 16x. Для перезаписываемых и двухслойных дисков «плюсовые» скорости, как обычно, чуть выше: 8x DVD+RW, 5x DVD+R DL против 6x DVD-RW и 4x DVD-R DL. Фирменные технологии: SAT (подстройка скорости в зависимости от качества болванки), TAC (улучшение качества записи путем изменения направления луча), OPC (контроль мощности лазера по внешней и внутренней сторонам диска). Для снижения шума и вибраций на высоких скоростях используются технологии Magic Speed и ABS (Automatic Ball Balancing System). Привод можно устанавливать и горизонтально, и вертикально — для второго варианта в комплект входит подставка.
* * * Появилась троица новых ЖК-мониторов серии MultiSync от фирмы NEC — LCD1770VX (17 дюймов, $345), LCD1970VX (19 дюймов, $460) и LCD2170NX (21 дюйм, $1180). В две первые включена поддержка технологии NEC Ambix (они имеют и цифровой, и аналоговый входы). Максимальное разрешение 17— и 19-дюймовой моделей — 1280x1024, яркость — 250 кд/кв. м. Контрастность первой — 500:1, второй — 450:1. 21-дюймовая модель может похвастаться очень высокой контрастностью (1000:1), яркость — 300 кд/кв. м.
* * * Olympus выпустила несколько новых компакт-камер, самая интересная из которых — SP-500UZ (буковки в конце означают «Ultra Zoom»). Эта 6-Мп модель имеет объектив с 10-кратным приближением (38—380 мм в эквиваленте), отдельно можно купить телеконвертер TCON-17 (до 646 мм) и широкоугольный конвертер WCON-07 (до 27 мм). ЖК-экран — 2,5-дюймовый, камера оснащена электронным искателем. Жаль, видео слабовато (320x240@15/30), с таким объективом оно оказалось бы весьма кстати. SP-500UZ предоставляет возможности ручной настройки, 21 режим сцен, а также 143-точечный автофокус с предсказанием положения движущегося объекта на момент срабатывания затвора. Две другие камеры — SP-350 и SP-310 — практически одинаковы: объектив с 3-кратным приближением, 2,5-дюймовый ЖК-экран, поддержка видео в формате 640x480@30 (MJPEG), совместимость с вышеупомянутыми конвертерами для SP-500UZ, вот только разрешение сенсора у первой — 8 Мп, а у второй — 7,1 Мп. В качестве устройства хранения данных обе новинки, как и следовало ожидать, используют карты xD-Picture Card.
* * * Новый мультимедийный ноутбук Toshiba Qosmio G20 адресован аудио/видео-энтузиастам. Яркий (500 кд/кв. м) 17-дюймовый ЖК-экран с разрешением 1440x900 и технологией TrueBrite управляется графическим контроллером nVidia GeForce Go 6600 с 128 Мбайт видеопамяти. Ноутбук, построенный на базе чипсета Intel 915PM и процессора Pentium M 730—770 (тактовая частота до 2,13 ГГц), имеет встроенный контроллер Intel PRO Wireless B/G. Накопителей может быть три: многоформатный DVD-рекордер с поддержкой двухслойных дисков и два жестких диска объемом 100 Гбайт, причем диски можно объединить в RAID-массив программными средствами от Toshiba. Встроенные колонки поддерживают систему SRS WOW XT и SRS TruSurround XT. В комплект входит пульт дистанционного управления. Предустановленная ОС — Windows XP Media Center Edition 2005.
Автор: Андрей Сокольников.
ВОПРОС НЕДЕЛИ
К каким последствиям может привести ...
...распространение на компьютерный бизнес борьбы с «серым» импортом, подобно той, что ведется сейчас на рынке мобильных телефонов? Артем Емельянов
менеджер по маркетингу ISM Computers
К самым неприятным для простого пользователя/покупателя и самым приятным для простого продавца/дистрибьютора. Крупные компании в очередной раз отнимут кусочек рынка у более мелких, которые не смогут работать в условиях вынужденного дефицита и, как следствие, падения оборотов. Сети типа «Связного» или «DIXIS» с ба-а-альшим удовольствием встречают кризис на рынке телефонов, ибо рентабельность по мобильникам «убита» до минимума, но такой подарок (дефицит, созданный самим государством!) позволит увеличить маржу в десятки раз. А за конфискованные телефоны не волнуйтесь — они скоро вернутся к своим хозяевам, и потребителям они достанутся — правда, уже несколько по другим ценам.
Та же история и на компьютерном рынке: если будет наезд, то крупные дистрибьюторы за счет своих стоков, поддержки вендоров и зависимых от них ритейлеров (розницы) смогут продержаться достаточно спокойно. Цены, разумеется, полезут вверх. Причем процесс будет длительным, потому что перестройка и оптимизация логистических схем потребует массу ресурсов и времени. Простому пользователю это ничего кроме дефицита и повышения цен не принесет. Ну, разве что, чувство гордости за то, что его хард ввезли в Россию не как зеленый горошек.
Сергей Хорев
технический директор представительства MSI в России
Прежде всего, хотелось бы отметить, что представительство MSI является некоммерческим — основными нашими задачами являются маркетинг и техническая поддержка. Таким образом, мы избавлены от необходимости «протаскивать» контейнеры с товаром, маскируя их под смесь теннисных шариков и крышек канализационных люков. Эта «некоммерческая» позиция позволяет несколько абстрагироваться от корыстных интересов и постараться взглянуть на проблему со стороны.
Давайте задумаемся, что, собственно, происходит под лозунгом борьбы с «серым импортом». А происходит не что иное, как борьба с коррупцией. «Протаскивание» подозрительных контейнеров просто невозможно без активного содействия со стороны сотрудников таможенных органов, что осуществляется отнюдь не бескорыстно. Насколько можно судить по публикациям в прессе и рекламным объявлениям в Интернете, мы сейчас находимся в фазе универсальной коррупции: то есть нет необходимости принадлежать к некоторой финансово-промышленной группе или к семейному клану, чтобы воспользоваться услугами компаний, предлагающих «оптимизацию таможенных платежей» и «снижение затрат на растамаживание». Борьба с «серым импортом» ведёт к изменению расстановки сил на этом рынке. Если это не кампанейщина, то мы перейдём либо к фазе селективной коррупции, то есть «оптимизацию» и «снижение» будет разрешено использовать только ограниченному кругу компаний, либо фазе задавленной коррупции, когда все серьёзные участники рынка вынуждены будут отказаться от «серых схем». Соответственно, существуют 3 варианта развития событий:
Борьба с «серым импортом» — краткосрочная кампания, имеющая целью сместить очередного высокопоставленного чиновника в таможенной службе. Тогда по результатам расследования чиновник снимается, борьба прекращается, и рынок спокойно возвращается к первоначальному состоянию, розничные цены не меняются
Мы переходим в фазу уже упомянутой селективной коррупции, тогда группа компаний, которая, собственно, и была инициатором борьбы с «серым импортом», обретает решительное конкурентное преимущество и получает возможности диктовать цены, ограниченные сверху ценами «белого импорта». Розничные цены вырастут. Сам рост предсказать трудно, но, по крайней мере, он должен быть меньше чем при третьем варианте развития событий.
Государству удаётся задавить коррупцию, участники рынка отказываются от использования «серых схем» и полностью платят таможенные пошлины. Рынок претерпевает незначительные изменения и стабилизируется в новом состоянии. Розничные цены вырастут, по оценкам РБК, на 10-25%.
При любом варианте развития событий пошлины, выплаченные импортерами, будут скомпенсированы ростом розничных цен и, в конечном итоге, изъяты из кармана покупателя. И это не удивительно. Таможенные пошлины — это налог на импорт, а налоги надо платить.
Андрей Таскаев
менеджер по продукции представительства BenQ Europe B.V в России
В краткосрочной перспективе — нестабильность рынка, отсутствие ходовых позиций, повышение цен, убытки каналов. В долгосрочной — упрощение и упорядочение бизнеса.
Возможное повышение цен замедлит темпы роста рынка и в очередной раз перераспределит товарное предложение. Но главное, чтобы новые «правила игры» стали одинаковыми для всех без исключения. В противном случае это будет очередная акция, которая проблему «серости» не решит, а удар по рынку нанесет ощутимый.
Глеб Мишин
генеральный директор Acer CIS Inc.
Любое развитие рынка ИТ в сторону абсолютной легализации торговых операций является однозначно позитивным. Такой процесс, несомненно, работает на увеличение прозрачности российских компаний и увеличение инвестиционной привлекательности рынка в целом.
Однако есть несколько серьезных опасений, связанных с последствиями и методами влияния на рынок со стороны фискальных органов. Во-первых, к сожалению, наряду с откровенно «контрабандными» операциями в поле зрения, а значит, и пристального внимания органов МВД, таможни и др. попадают добросовестные импортеры, которые вынуждены выполнять множество дополнительных бюрократических процедур, что, несомненно, сказывается на доступности продукции на российском рынке. Такое положение вещей неизбежно приведет к повышению стоимости продукции, как нашей компании Acer, так и других иностранных производителей. Учитывая, что кроме отличного программного обеспечения России в области ИТ похвастать нечем, то платить за бюрократические проволочки будет конечный потребитель, в том числе и государственные органы. Поэтому хотелось бы увидеть комплексный подход к решению проблемы со стороны государства. Под этим я подразумеваю в том числе и снижение импортных пошлин на высокотехнологичную продукцию, не производимую в России, такую как ноутбуки, портативные компьютеры или ЖК-мониторы и пр.
Во-вторых, наскоками проблему не решить. В результате разовых акций «накрываются» прежде всего крупные операторы того или иного сектора ИТ, а крупные операторы, назовем их дистрибьюторами, являются своего рода санитарами леса, и так заинтересованными в максимальной чистоте своих операций. В образовавшуюся нишу, несомненно, ринется «чернуха», которая, спекулируя на дефиците продукции, постарается извлечь максимальную выгоду, абсолютно не беспокоясь о законности своего бизнеса.
Подводя черту, хочу сказать, что такие процессы должны идти только с помощью конструктивного и, конечно, продуктивного диалога между нашим правительством и индустрией. Думаю, что существующая сегодня Ассоциация предприятий компьютерных и информационных технологий (АП КИТ) вполне может явиться локомотивом такого процесса и включить в него все заинтересованные структуры и компании рынка ИТ.
Андрей Ященко
директор по развитию марки Salute
К аналогичным, я думаю. Дело в том, что существует ряд специализированных крупных таможенных брокеров, практически одинаковым образом растаможивающих схожие товары: компьютерные комплектующие, бытовую электронику, мобильные телефоны. Так что весь вопрос — в чем именно будут заинтересованы соответствующие (или не совсем соответствующие, как в случае с телефонами) органы при проведении своих рейдов.
С другой стороны, компьютерный рынок старше, чем рынок мобильных телефонов, так что и опыта по «борьбе» с таможней здесь накоплено больше, да и было время цивилизоваться. Некоторые группы товаров уже в основном растаможиваются «в белую». Тем не менее хаос на таможне (отказ некоторых перевозчиков возить грузы, задержки в оформлении грузов у более надежных перевозчиков), вкупе с конфискацией складов у крупных дистрибьюторов, в любом случае должны были бы привести к определенному дефициту на рынке.
Автор: Сергей Вильянов.
ОГОРОД КОЗЛОВСКОГО
Клёвый чтец №8, или Новый сказ о Левше
«Клёвым чтецом» я перевел-обозвал FineReader в какой-то давней своей компьютерной брошюрке, еще до начала сотрудничества с «Компьютеррой», году, кажется, аж в 96-м, то есть, по скорости того компьютерного времени, — в далеком-далеком, практически незапамятном прошлом. Это как раз была третья версия, которая, после не вполне удовлетворительных мучений со второй, показалась мне верхом совершенства и одной из Сияющих Вершин брезжущего на близком — рукой подать — горизонте Искусственного Интеллекта, взятой Высокой Наукой вкупе с не менее Высокими Технологиями. Я увлеченно тестировал «тройку», сравнивая ее с конкурентами, как отечественными, так и зарубежными, — и она, подлинная «птица», легко обходила их всех на любых поворотах.
Сейчас уж не припомню, писал ли я отдельно о версиях следующих: с четвертой по седьмую, — очень может быть, что и нет: каждая очередная, конечно, была лучше предыдущей: качество распознавания — как божились PR-менеджеры, возрастало то на пять процентов, то на одиннадцать; рос и список распознаваемых языков, — включая даже такие вполне искусственные, как языки программирования (чтобы оцифровать покрытые пылью рулоны старых листингов) или чуть ли не эсперанто; появлялись всё новые возможности в смысле сохранения верстки документа и форматов; хорошели кнопочки тулбара; — и прочее, и прочее, и прочее. Конечно, это не могло не радовать, но при удовлетворении моих реальных потребностей: распознавание обложек компакт-дисков, книжных текстов и журнальных статей, — улучшения сказывались не особенно. Впрочем, ситуация естественная: при достижении любым продуктом некоего (довольно высокого) уровня дальнейшие усовершенствования идут больше по мелочам: возьмите хоть автомобили. То есть сказывались, конечно, однако недостаточно, чтобы дать повод для отдельного «Огорода».
Но вот вышла «восьмерка» — и повод такой, похоже, дала.
Список ее отличий от «семерки», выданный на презентации, занимает десять (!) страниц, включая в себя не только чисто эстетические удовольствия вроде появившихся словарных баз для словенского и башкирского языков и добавившегося в двух ипостасях — кириллической и латинской — уйгурского[Впрочем, относительно уйгурского и башкирского — это только для меня удовольствие чисто эстетическое, а для уйгуров и башкир — практическое. А они ведь — покупатели], но и практическое: например, понимание картинок в формате компрессированного (методом LZW) tiff’а, о кочку которого я в прежние времена частенько спотыкался. Повысившаяся скорость распознавания оставила меня практически равнодушным, поскольку и раньше она не казалась недостаточной: мне ведь, слава богу, не приходится просиживать за этим занятием дни напролет, — а вот понимание гиперссылок, их проверка в процессе распознавания и перенос в текст — это представилось блестящим, едва ли не цирковым трюком, и я стал всерьез подумывать о переводе в цифровую форму всего моего многокилограммового «Огородного» архива — с целью освобождения «тещиной комнатки». Появились радости и для бюрократов, для каторжной офисной работы, — но к интересам бюрократов я всю жизнь относился с неким брезгливым равнодушием… Впрочем, всё это вполне уложилось бы в стандартные улучшения от версии к версии, если б не…
Если б не объявленная (и, как выяснилось, неплохо реализованная) поддержка распознавания документов, снятых цифровыми аппаратами! Не могу сказать, что это революция, сравнимая с прорывом цифры в фотодело, но — безусловно заметный шажок, возможно, эту революцию завершающий. И впрямь: цифровой фотоаппарат сегодня есть если не у каждого, то у каждого, скажем, третьего, и, понятно, что переснять им пару нужных страниц учебника или справочника куда удобнее, чем предполагающим специальную стационарную обстановку сканером.
Косвенно эту материю я уже задевал в прошлом «Огороде» («Восточный DocExpress»)[Поскольку вегетационный период у овощей разный, редакция решила пропустить FineReader вперед. А DocExpress как раз через недельку и поспеет. — Прим. ред], когда писал, что цифровой фотоаппарат в ряде случаев удобнее любого, даже карманного (не говоря уж о настоящем) сканера, — но не мог и не признать, что результаты распознавания после фотосъемки выходят очевидно худшими. Дело понятное: оптика универсальных аппаратов недостаточно жестка, получаемое разрешение заметно ниже, чем у сканерных картинок, освещение, как правило, недостаточное и неравномерное, и вообще… И вот, программисты из ABBYY решили попробовать приспособить программу к этим «плохим» картинкам (предупредив, что лучше снимать камерами не менее чем с четырехмегапиксельными матрицами). И приспособили.
Я провел следующий тест: взял полосу «Компьютерры» с собственным «Огородом» («Компьютерру» потому, что она напечатана на полуглянцевой, бликующей бумаге и довольно мелким шрифтом; если бумага надежно матовая, можно у фотоаппаратов включать вспышку, что сразу резко повышает качество снимка), отсканировал ее сперва недорогим планшетником (Astra 4700 от Umax), потом — безо всякого специального света, но со штатива — снял ее же Olympus’ом Е-20 (5 мегапикселов) и шестимегапиксельным Exilim’ом Pro 600 от Casio (у него есть специальный режим для съемки документов, — распознавальщики и производители цифровых фотоаппаратов идут навстречу друг другу!). Все картинки скинул на винчестер и вызвал их для распознания сначала седьмым, а потом — восьмым «Клёвым чтецом».
Сканерная картинка в обоих случаях распозналась одинаково: практически стопроцентно, только после «восьмерки» гиперссылки, при сохранении в PDF, работали! Картинку с Olympus’а «семерка» распознала процентов эдак на шестьдесят, а «восьмерка» — ну… на семьдесят. Другое дело — картинка с Casio, у которого был включен «документ-режим». Там процент «семерки» повысился до восьмидесяти, а «восьмерки» — только, может, процента на три не дотянул до сотни! То есть разница налицо, причем видно, что аппаратная составляющая тоже играет свою, и немалую, роль. Короче: чудес, разумеется, не бывает, но если подходить к проблеме с умом и пониманием — можно добиться результатов, которые «третья» версия лет восемь назад давала при картинке со сканера.
В общем, браво, ABBYY! Верной дорогой идете, товарищи! Есть шанс дожить до времени, когда цифровики будут комплектоваться FineReader’ом Lite, как сегодня комплектуются сканеры.
Покончив с изюминкой «восьмерки», перейдем к неприятному, обозначенному в заголовке как «Новый сказ о Левше». Помните, в чем там, у Лескова, была главная грустная заковыка? Левша сумел подковать микроскопическую блоху и даже на гвоздиках автограф накарябал, — а сообразить, что после подковки она перестанет скакать — на это ума не хватило. Вот и FineReader, еще с самых первых своих версий, ковать учится все изощреннее, а думать, увы, нет.
Поясню в чем дело. Сканируется, положим, задняя обложка компакт-диска со списком треков, номера которых частенько набираются каким-нибудь высокохудожественным шрифтом или заключаются в квадратики или обводы другой формы. «Клёвому чтецу», несмотря на шрифт и квадратики, удается-таки разобрать два-три (а иной раз — и пять-шесть) номеров правильно. Но догадаться, что это — нумерованный список и, следовательно, нераспознанный между «тройкой» и «пятеркой» значок вероятнее всего есть «четверка» — это уж, извините, кишка тонка. Или еще пример, с той же обложки: фамилии авторов песни, заключенные в круглую скобку, распознаются не всегда точно: «(Josea — Taub» в четырех случаях распознаны как «Qosea — Taub», а в трех оставшихся — правильно. Честное слово, семи пядей во лбу не надо иметь, чтобы — по шрифту ли, по расположению — догадаться, что эта часть двадцатидвухпозиционного списка вся заключена в скобки, а нераспознанный Qosea есть не что иное, как распознанный рядышком Josea, — а вот поди ж ты!
Не то чтобы мне было так уж трудно поправить эти несколько «замученных очепяток», — но я в толк не мог никогда взять, почему такая умная программа, разбирающая знаковую составляющую порой очень трудно идентифицируемых закорючек, пасует перед столь элементарными задачами — и на каждой презентации тупо продолжал задавать один и тот же вопрос: когда же «Клёвый чтец» хоть чуть-чуть поумнеет? Задал и на этой, и мне, наконец, было отвечено, что в «восьмерку» «интеллектуальный» модуль уже встроен, хотя как следует еще на заточен, и, вероятно, точить его будут вплоть до выхода очередной версии. Но зачатки уже есть, так что я могу попробовать проверить.
Проверил первым делом — даже еще до фотографирования. Увы, «умнеющая» (по заявлениям разработчиков) «восьмерка» повела себя — в интеллектуальном отношении — ровно так же, как глупые «семерка», «шестерка», «пятерка» — и далее вверх до начала списка. Ну, как говорится: хорошо не жили, начинать нечего…
И все же закончить «Огород» хочется на ноте оптимистической: к «восьмерке», отдельно, прилагается замечательная утилитка под названием ABBYY Screenshot Reader, которая, правда, начинает работать только после того, как FineReader зарегистрируешь (эдакий легкий шантаж). Она запускается в виде маленького продолговатого окошка, в коем качестве и может висеть на экране, не особенно мешая работать. При необходимости можно выбрать, в каком из доброго десятка распространенных форматов сохранить содранное с экрана и тут же распознанное, потом — нажать на кнопочку с изображением фотоаппарата, потом — выделить нужную область экрана и… все.
Нельзя сказать, что раньше я не пользовался FineReader’ом для распознания текстов, скажем, системных табличек или субтитров фильма, — но тогда приходилось делать это в три с половиной этапа: сохранять в буфер обмена, записывать в графический файл и уж только потом вызывать FineReader, а в него — этот графический файл. Теперь процесс стал заметно проще и много приятнее.
Особенно впечатляет дерево каталогов с раскрытым справа списком файлов, экспортированное непосредственно в Excel. Правда, и тут ум прихрамывает: в тринадцати случаях правильно распознав и спозиционировав в таблице время создания файлов, в следующих пятнадцати Screenshot Reader (а вернее, думаю, сам FineReader) зачем-то отвел под минуты отдельную колонку.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8
|
|