htmlparser抽取表格

[b][color=red]原創文章:轉載請註明出處[/color][/b]

try {
Parser parser=new Parser("http://detail.zol.com.cn/260/259165/param.shtml");
// NodeFilter nodeFilter=new HasAttributeFilter("","");
HtmlPage htmlPage=new HtmlPage(parser);
parser.visitAllNodesWith(htmlPage);
TableTag tableTags[] =htmlPage.getTables();
for(TableTag tableTag:tableTags){
TableRow tableRows[]=tableTag.getRows();
for(int i=0;i<tableRows.length;i++){
System.out.println("----------------------");
TableColumn tableColumns[]=tableRows[i].getColumns();
for(int j=0;j<tableColumns.length;j++){
System.out.println(tableColumns[j].toPlainTextString());
}
}
}
} catch (ParserException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}


這是提取表格內容的一個小例子。不用解釋了,能看懂的。呵呵
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章