1. OCR技術。
2. 把掃描文檔中的文字識別爲文字,而且創建一種字體儘量保持和原掃描中的顯示特性一致。
3. 把PDF無序的版面識別爲符合讀寫順序以及組織爲段落方式的結構。
4. 能夠較小的質量損失,較大的壓縮PDF文件大小。
5. 識別PDF中文本圖形圖像組合而成的表格。
6. 較快渲染PDF中含有大量元素(10萬+)的頁面,且支持編輯。
1. OCR技術。
2. 把掃描文檔中的文字識別爲文字,而且創建一種字體儘量保持和原掃描中的顯示特性一致。
3. 把PDF無序的版面識別爲符合讀寫順序以及組織爲段落方式的結構。
4. 能夠較小的質量損失,較大的壓縮PDF文件大小。
5. 識別PDF中文本圖形圖像組合而成的表格。
6. 較快渲染PDF中含有大量元素(10萬+)的頁面,且支持編輯。