PDF領域難點

1. OCR技術。

2. 把掃描文檔中的文字識別爲文字,而且創建一種字體儘量保持和原掃描中的顯示特性一致。

3. 把PDF無序的版面識別爲符合讀寫順序以及組織爲段落方式的結構。

4. 能夠較小的質量損失,較大的壓縮PDF文件大小。

5. 識別PDF中文本圖形圖像組合而成的表格。

6. 較快渲染PDF中含有大量元素(10萬+)的頁面,且支持編輯。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章