dom4j解析xml(sina rss xml)

首先我介紹一下dom4j解析方式和所使用的包:

\r\n

要使用dom4j讀寫XML文檔,需要先下載dom4j包,dom4j官方網站在 http://www.dom4j.org/
目前最新dom4j包下載地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip

\r\n

解開後有兩個包,僅操作XML文檔的話把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的話還需要加入包jaxen-1.1-beta-7.jar.

\r\n

以下是相關操作:

\r\n

一.Document對象相關

\r\n

1.讀取XML文件,獲得document對象.
            SAXReader reader = new SAXReader();
            Document  document = reader.read(new File(\"input.xml\"));

\r\n

2.解析XML形式的文本,得到document對象.
            String text = \"<members></members>\";
            Document document = DocumentHelper.parseText(text);
3.主動創建document對象.
            Document document = DocumentHelper.createDocument();
            Element root = document.addElement(\"members\");// 創建根節點
二.節點相關

\r\n

1.獲取文檔的根節點.
Element rootElm = document.getRootElement();
2.取得某節點的單個子節點.
Element memberElm=root.element(\"member\");// \"member\"是節點名
3.取得節點的文字
String text=memberElm.getText();
也可以用:
String text=root.elementText(\"name\");這個是取得根節點下的name字節點的文字.

\r\n

4.取得某節點下名爲\"member\"的所有字節點並進行遍歷.
List nodes = rootElm.elements(\"member\");

\r\n

for (Iterator it = nodes.iterator(); it.hasNext();) {
   Element elm = (Element) it.next();
   // do something
}
5.對某節點下的所有子節點進行遍歷.
            for(Iterator it=root.elementIterator();it.hasNext();){
                Element element = (Element) it.next();
                // do something
            }
6.在某節點下添加子節點.
Element ageElm = newMemberElm.addElement(\"age\");
7.設置節點文字.
ageElm.setText(\"29\");
8.刪除某節點.
parentElm.remove(childElm);// childElm是待刪除的節點,parentElm是其父節點
三.屬性相關.
1.取得某節點下的某屬性
            Element root=document.getRootElement();   
            Attribute attribute=root.attribute(\"size\");// 屬性名name
2.取得屬性的文字
            String text=attribute.getText();
也可以用:
String text2=root.element(\"name\").attributeValue(\"firstname\");這個是取得根節點下name字節點的屬性firstname的值.

\r\n

3.遍歷某節點的所有屬性
            Element root=document.getRootElement();   
            for(Iterator it=root.attributeIterator();it.hasNext();){
                Attribute attribute = (Attribute) it.next();
                String text=attribute.getText();
                System.out.println(text);
            }
4.設置某節點的屬性和文字.
newMemberElm.addAttribute(\"name\", \"sitinspring\");
5.設置屬性的文字
            Attribute attribute=root.attribute(\"name\");
            attribute.setText(\"sitinspring\");
6.刪除某屬性
            Attribute attribute=root.attribute(\"size\");// 屬性名name
            root.remove(attribute);
四.將文檔寫入XML文件.
1.文檔中全爲英文,不設置編碼,直接寫入的形式.
XMLWriter writer = new XMLWriter(new FileWriter(\"output.xml\"));
writer.write(document);
writer.close();
2.文檔中含有中文,設置編碼格式寫入的形式.
            OutputFormat format = OutputFormat.createPrettyPrint();
            format.setEncoding(\"GBK\");    // 指定XML編碼       
            XMLWriter writer = new XMLWriter(new FileWriter(\"output.xml\"),format);
           
            writer.write(document);
            writer.close();
五.字符串與XML的轉換
1.將字符串轉化爲XML
String text = \"<members> <member>sitinspring</member> </members>\";
Document document = DocumentHelper.parseText(text);
2.將文檔或節點的XML轉化爲字符串.
            SAXReader reader = new SAXReader();
            Document  document = reader.read(new File(\"input.xml\"));           
            Element root=document.getRootElement();               
            String docXmlText=document.asXML();
            String rootXmlText=root.asXML();
            Element memberElm=root.element(\"member\");
            String memberXmlText=memberElm.asXML();
六.使用XPath快速找到節點.
讀取的XML文檔示例
<?xml version=\"1.0\" encoding=\"UTF-8\"?>
<projectDescription>
  <name>MemberManagement</name>
  <comment></comment>
  <projects>
    <project>PRJ1</project>
    <project>PRJ2</project>
    <project>PRJ3</project>
    <project>PRJ4</project>
  </projects>
  <buildSpec>
    <buildCommand>
      <name>org.eclipse.jdt.core.javabuilder</name>
      <arguments>
      </arguments>
    </buildCommand>
  </buildSpec>
  <natures>
    <nature>org.eclipse.jdt.core.javanature</nature>
  </natures>
</projectDescription>

\r\n

使用XPath快速找到節點project.
 public static void main(String[] args){
    SAXReader reader = new SAXReader();
   
    try{
      Document  doc = reader.read(new File(\"sample.xml\"));
     
      List projects=doc.selectNodes(\"/projectDescription/projects/project\");
     
      Iterator it=projects.iterator();
     
      while(it.hasNext()){
        Element elm=(Element)it.next();      
        System.out.println(elm.getText());
      }
     
    }
    catch(Exception ex){
       ex.printStackTrace();
    }
  }

\r\n

 

\r\n

現在介紹我根據以上介紹解析http://rss.sina.com.cn/news/marquee/ddt.xml

\r\n

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

\r\n

import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpException;
import org.apache.commons.httpclient.methods.GetMethod;
import org.apache.commons.httpclient.params.HttpMethodParams;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

\r\n

import com.*.model.entity.RssChannel;
import com.*.model.entity.RssItem;

\r\n


public class RSSservice {

\r\n

  /**
  * 解析rssURL獲取RSS2.0的xml文件
  * @param is
  */
 public RssChannel parseRssXml(InputStream is)
 {
  RssChannel rssChannel = new RssChannel();
  //讀取XML文件,獲得document對象.
  SAXReader reader = new SAXReader();
  Document doc = null;
  try {
   doc = reader.read(is);
   //System.out.println(doc.selectSingleNode(\"rss/channel/title\").getText().trim());
   //獲取文檔的根節點.
   Element element = doc.getRootElement();
   //取得某節點的單個子節點並取得節點的文字
   String title = element.selectSingleNode(\"channel/title\").getText();
   if(title !=null)
   {
    rssChannel.setTitle(title.trim());
   }
   String imgURL = element.selectSingleNode(\"channel/image/url\").getText();
   if(imgURL != null)
   {
    rssChannel.setImageURL(imgURL);
   }
   String description = element.selectSingleNode(\"channel/description\").getText();
   if(description != null)
   {
    rssChannel.setDescription(description.trim());
   }
   String language = element.selectSingleNode(\"channel/language\").getText();
   if(language != null)
   {
    rssChannel.setLanguage(language);
   }
   String pubDate = element.selectSingleNode(\"channel/pubDate\").getText();
   if(pubDate != null)
   {
    rssChannel.setPubDate(pubDate);
   }
   String category = element.selectSingleNode(\"channel/category\").getText();
   if(category != null)
   {
    rssChannel.setCategory(category);
   }
   String generator = element.selectSingleNode(\"channel/generator\").getText();
   if(generator != null)
   {
    rssChannel.setGenerator(generator);
   }
   List listItem = new ArrayList();
   List nodes = element.selectNodes(\"channel/item\");
   for (Iterator iter = nodes.iterator(); iter.hasNext();)
   {
    Element itemElement = (Element) iter.next();
    if(itemElement != null)
    {
     RssItem rssItem = new RssItem();
     String itemTitle = itemElement.selectSingleNode(\"title\").getText();
     if(itemTitle != null)
     {
      rssItem.setTitle(itemTitle.trim());
     }
     String link = itemElement.selectSingleNode(\"link\").getText();
     if(link != null)
     {
      rssItem.setLink(link);
     }
     String author = itemElement.selectSingleNode(\"author\").getText();
     if(author != null)
     {
      rssItem.setAuthor(author);
     }
     String categoryItem = itemElement.selectSingleNode(\"category\").getText();
     if(categoryItem != null)
     {
      rssItem.setCategory(categoryItem);
     }
     String pubDateItem = itemElement.selectSingleNode(\"pubDate\").getText();
     if(pubDateItem != null)
     {
      rssItem.setPubDate(pubDateItem);
     }
     String comments = itemElement.selectSingleNode(\"comments\").getText();
     if(comments != null)
     {
      rssItem.setComments(comments.trim());
     }
     String descriptionItem = itemElement.selectSingleNode(\"description\").getText();
     if(descriptionItem != null)
     {
      rssItem.setDescription(descriptionItem.trim());
     }
     listItem.add(rssItem);
    }
    rssChannel.setRssItem(listItem);
   }
  } catch (DocumentException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
  return rssChannel;
 }

\r\n

//test
 public static void main(String[] args)
 {
  RSSservice rssService = new RSSservice();
  String rssUrl = rssService.getRssURL(\"sina\");
  //String RssData = rssService.getRssContent(rssUrl);
  InputStream is = rssService.getRssContent(rssUrl);
  RssChannel rssChannel = rssService.parseRssXml(is);
  System.out.println(rssChannel);
 }
}

\r\n

解析所需的包http://download.csdn.net/source/3409103下載

');insert into `ArticleContent` (`ArticleId`, `Content`) values('6605209','

 jdbc連接數據庫大全:

一、JDBC連接DB2
Class.forName("Com.ibm.db2.jdbc.net.DB2Driver");
String url="jdbc:db2://dburl:port/DBname"
cn = DriverManager.getConnection( url, sUsr, sPwd );

二、JDBC連接Microsoft SQLServer(microsoft)
Class.forName( "com.microsoft.jdbc.sqlserver.SQLServerDriver" );
cn = DriverManager.getConnection( "jdbc:microsoft:sqlserver://DBServerIP:1433;databaseName=master", sUsr, sPwd );

三、JDBC連接Sybase(jconn2.jar)
Class.forName( "com.sybase.jdbc2.jdbc.SybDriver" );
cn = DriverManager.getConnection( "jdbc:sybase:Tds:DBServerIP:2638", sUsr, sPwd );

四、JDBC連接MySQL(mm.mysql-3.0.2-bin.jar)
Class.forName( "org.gjt.mm.mysql.Driver" );
cn = DriverManager.getConnection( "jdbc:mysql://DBServerIP:3306/myDatabaseName", sUsr, sPwd );

五、JDBC連接PostgreSQL(pgjdbc2.jar)
Class.forName( "org.postgresql.Driver" );
cn = DriverManager.getConnection( "jdbc:postgresql://DBServerIP/myDatabaseName", sUsr, sPwd );

六、JDBC連接Oracle(classes12.jar)
Class.forName( "oracle.jdbc.driver.OracleDriver" );
cn = DriverManager.getConnection( "jdbc:oracle:thin:@MyDbComputerNameOrIP:1521:ORCL", sUsr, sPwd );

七、JDBC連接ODBC
Class.forName( "sun.jdbc.odbc.JdbcOdbcDriver" );
Connection cn = DriverManager.getConnection( "jdbc:odbc:" + sDsn, sUsr, sPwd );

注意:異常需要捕獲並處理;URL符合jdbc協議。

這些可以在網上也能找到。

創建一個Statement   

    •要執行SQL語句,必須獲得java.sql.Statement實例,Statement實例分爲以下3   種類型:   

      1、執行靜態SQL語句。通常通過Statement實例實現。   

      2、執行動態SQL語句。通常通過PreparedStatement實例實現。   

      3、執行數據庫存儲過程。通常通過CallableStatement實例實現。   

    具體的實現方式:   

        Statement stmt = con.createStatement() ;   

       PreparedStatement pstmt = con.prepareStatement(sql) ;   

       CallableStatement cstmt =   con.prepareCall("{CALL demoSp(? , ?)}") ;   

 

執行SQL語句   

    Statement接口提供了三種執行SQL語句的方法:executeQuery 、executeUpdate 和execute   

    1、ResultSet executeQuery(String sqlString):執行查詢數據庫的SQL語句,返回一個結果集(ResultSet)對象。   

     2int executeUpdate(String sqlString):用於執行INSERT、UPDATE或  DELETE語句以及SQL DDL語句,如:CREATE TABLE和DROP TABLE等   

     3、execute(sqlString):用於執行返回多個結果集、多個更新計數或二者組合的  語句。   

   具體實現的代碼:   

          ResultSet rs = stmt.executeQuery("SELECT * FROM ...") ;   

    int rows = stmt.executeUpdate("INSERT INTO ...") ;   

    boolean flag = stmt.execute(String sql) ;   

 

處理結果   

    兩種情況:   

     1、執行更新返回的是本次操作影響到的記錄數。   

     2、執行查詢返回的結果是一個ResultSet對象。   

    • ResultSet包含符合SQL語句中條件的所有行,並且它通過一套get方法提供了對這些   

      行中數據的訪問。   

    • 使用結果集(ResultSet)對象的訪問方法獲取數據:   

     while(rs.next()){   

         String name = rs.getString("name") ;   

    String pass = rs.getString(1) ; // 此方法比較高效   

     }   

    (列是從左到右編號的,並且從列1開始)   

 關閉JDBC對象    

     操作完成以後要把所有使用的JDBC對象全都關閉,以釋放JDBC資源,關閉順序和聲明順序相反:   

     1、關閉記錄集   

     2、關閉聲明   

     3、關閉連接對象   

          if(rs != null){   // 關閉記錄集   

        try{   

            rs.close() ;   

        }catch(SQLException e){   

            e.printStackTrace() ;   

        }   

          }   

          if(stmt != null){   // 關閉聲明   

        try{   

            stmt.close() ;   

        }catch(SQLException e){   

            e.printStackTrace() ;   

        }   

          }   

          if(conn != null){  // 關閉連接對象   

         try{   

            conn.close() ;   

         }catch(SQLException e){   

            e.printStackTrace() ;   

         }   

          }  

也可以和在一起關

          try{   

   if(rs != null){   // 關閉記錄集   

rs.close() ;   

   if(stmt != null){   // 關閉聲明   

   stmt.close() ;   

}

if(conn != null){  // 關閉連接對象   

            conn.close() ;   

 } 

 

         }catch(SQLException e){   

            e.printStackTrace() ;   

         }   

          

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章