文本數據抽取經驗總結

1、寫一個覆蓋大部分文檔的規則;
2、寫備用規則,定義備用變量,當主要規則抽取的字段爲空時,啓用備用變量;
3、按優先級排列抽取規則;
4、防止值覆蓋,可以在賦值前判斷變量是否爲空,若非空,則不進行賦值操作;
5、寫區間限制規則(Squeeze Theorem),用兩條規則限制抽取的文本範圍,比如行數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章