PDF領域難點

原創

2018-09-03 07:38

1. OCR技術。

2. 把掃描文檔中的文字識別爲文字，而且創建一種字體儘量保持和原掃描中的顯示特性一致。

3. 把PDF無序的版面識別爲符合讀寫順序以及組織爲段落方式的結構。

4. 能夠較小的質量損失，較大的壓縮PDF文件大小。

5. 識別PDF中文本圖形圖像組合而成的表格。

6. 較快渲染PDF中含有大量元素（10萬+）的頁面，且支持編輯。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章