Ну и дела, я знала, что трекеры повсюду, но не ожидала получить по работе от одного из них такое письмо!
Цитирую:
We're having a lot of trouble with trashy graphics handling in FRE 9. We're using: DetectPictures + false, FullTextIndexDA = false, FlexiFormsDA = false, and DetectTables = true in the PageAnalysisParams. We are also detecting bold, italics, etc, text attributes. Most of the graphics are discarded, but not all. Some are chopped into random pieces, moved around, text is still being pulled out of graphics, and bottom of page artifacts are still sometimes being put into boxes. Worst case is a screen shot in the middle of a page which gets turned into Klingon hieroglyphics. Is this all because it can't differentiate between graphics and tables and text headers?ПереводУ нас тут полно проблем с тем, как Engine 9 обрабатывает мусор при сканировании. Мы используем {набор параметров}. Опции распознавания xxx {по умолчанию}. Большинство нетекстовых символов отбрасываются, но не все. От некоторых наугад откусываются кусочки, из которых извлекается текст, и часть сканерного мусора превращается в блоки. Хуже всего, когда скриншот посреди страницы преобразуется в клингонские иероглифы. Всё это потому, что не получается отличить графику от таблиц и заголовков?Спросила у начальства разрешения ответить "Recognition of Klingon is highly illogical yet fascinating".