原创 wrapper的來歷

以下內容摘自文獻Chia-Hui Chang, Mohammed Kayed, Moheb Ramzy Girgis, et al. 2006. A

原创 2009年相關會議的簡要信息

Event    When  Where  Deadline ICDE 2009 25th International Conference on Data Engineering Mar 2

原创 有關信息抽取的文章列表(1)

這裏總結了近幾年來,一些知名會議上有關信息抽取的文章,不斷更新中。 [1]    Rui Cai, Jiang-Ming Yang, Wei Lai, Yida Wang, and Lei Zhang. iRobot: An Intell

原创 網上信息抽取技術縱覽

網上信息抽取技術縱覽 (Information Extraction from World Wide Web-A Survey) Line Eikvil 原著 (1999.7) 陳鴻標 譯 (2003.3) 第一章         導

原创 與網頁內容抽取相關的文獻

網頁內容抽取是指從網頁中抽取大塊內容。例如新聞正文抽取等。以下爲一些相關的文獻。[1]    Ziegler, C. & Skubacz, M. Content Extraction from News Pages Using Parti

原创 與本體(Ontology)相關的一些文章

經常有人提到本體,到底什麼是本體?和信息抽取有關係麼?這裏找了幾篇與本體相關的文章,看了也許會明白些。 [1]    Yaoyong Li, and Kalina Bontcheva. Hierarchical, Perceptron-l

原创 推薦一個查找近期會議的網站-wikicfp

 Wikicfp http://www.wikicfp.com/有很多人把各種會議的call for paper發到這個網站上。可以管理自己關注的會議

原创 用統計方法進行信息抽取的幾位研究人員

Shui-Lung Chuang 莊水龍(UIUC) 2008 Shui-Lung Chuang, Kevin Chen-Chuan Chang: Integrating web query results: holistic sche

原创 WordNet介紹和使用

Wordnet是一個詞典。每個詞語(word)可能有多個不同的語義,對應不同的sense。而每個不同的語義(sense)又可能對應多個詞,如topic和subject在某些情況下是同義的,一個sense中的多個消除了多義性的詞語叫做le

原创 相關研究組、個人主頁鏈接

http://www.cs.uic.edu/~liub/ 比較流行的抽取方法 MDR 的作者之一http://www.cs.uic.edu/~yzhai/ 比較流行的抽取方法 MDR 的作者之一http://research.micros

原创 一篇綜述:A brief survey of web data extraction tools

一篇經典綜述,scholar.google.cn上顯示該文被引用超過300次Laender, A. H. F.; Ribeiro-Neto, B. A.; da Silva, A. S. & Teixeira, J. S. A brief

原创 相關會議列表

在wikicfp上維護了一個信息抽取相關會議的列表:http://www.wikicfp.com/cfp/servlet/event.showlist?lownerid=2907&ltype=w&page=1&sortby=0還有一些更廣

原创 小議信息抽取系統的結構(1) ------by songlinhai

    小弟是從去年6月份開始研究信息抽取的,讀了不少文獻,寫了兩個半吊子的信息抽取系統,算是對信息抽取比較瞭解了。今年8、9月份就要碩士開題,我捉摸着得把自己的東西弄到一起,要不然做了的東西領導又看不見,這不白瞎了。於是我就想整個信息抽

原创 微軟亞洲研究院發表的關於信息抽取的文章

微軟亞洲研究院的文章確實在數量、質量上都算得上高產,很值得我們學習。這裏總結一下他們近幾年在知名會議上發表的和信息抽取相關的文章。 [1]    Zaiqing Nie, Yunxiao Ma, Shuming Shi, Ji-Rong

原创 一篇綜述:A Survey of Web Information Extraction Systems

第一位作者個人主頁 http://www.csie.ncu.edu.tw/~chia/ Chang, C.; Kayed, M.; Girgis,