字符串匹配問題

 

 

JSP+XML中的查找相關信息的方法是用到了indexOf方法.

具體代碼如下:

<%
    request.setCharacterEncoding(
"gb2312");
    String str 
= request.getParameter("str"); //得到想要查找的信息
    
    String file 
= "E:/message.xml";   //XML文件在E盤下
    
    SAXBuilder builder 
= new SAXBuilder();
    Document doc 
= builder.build(new FileInputStream(file));
    Element root 
= doc.getRootElement();
    List list 
= root.getChildren();
    
    Iterator iter 
= list.iterator();
    
    
while(iter.hasNext()){
        Element info 
= (Element)iter.next();
        String information 
= new String(info.getChildText("information"));
        
        
if(info.getChildText("information").indexOf((str)) != -1){  //匹配的語句
            String manager = new String(info.getChildText("manager"));
            String title 
= new String(info.getChildText("title"));
            String username 
= new String(info.getChildText("username"));
            String message 
= new String(info.getChildText("message"));
%>
    
        
<form name="form1">
            
<table bgcolor="white" align="center" width="700px" height="200px" cellspacing="1" cellpadding="1">
                
<tr><td bgcolor=#CCCCCC>發言者:<%=manager%></td><td bgcolor=#CCCCCC>Email:<%=info.getChildText("email")%></td></tr>
                
<tr><td bgcolor=#CCCCCC>發表時間:<%=info.getChildText("date")%></td><td bgcolor=#CCCCCC>電話:<%=info.getChildText("phone")%></td></tr>
                
<tr><td colspan=2 bgcolor=#CCCCCC>主題:<%=title%></td></tr>
                
<tr><td colspan=2><strong>信息內容:</strong><%=information%></td></tr>
                
<tr><td colspan=2 bgcolor=#E0DFE3>回覆人:<%=username%></td></tr>
                
<tr><td colspan=2><strong>回覆內容:</strong><%=message%></td></tr>
            
</table>
        
</form>
    
<%
        }
    }
    XMLOutputter outter 
= new XMLOutputter();
    outter.output(doc,
new FileOutputStream(file));
%>

 

在java中

有一個String,如何查詢其中是否有y和f字符?最笨的辦法就是:

  程序1:if、for語句和charAt()

class Test{
 public static void main(String args[]) {
  String str="For my money, the important thing "+"about the meeting was bridge-building";
  char x='y';
  char y='f';
  boolean result=false;
  for(int i=0;i<str.length;i++){
   char z=str.charAt(i); //System.out.println(z);
   if(x==z||y==z) {
    result=true;
    break;
   }
   else result=false;
  }
  System.out.println(result);
 }

  好像很直觀,但這種方式難以應付複雜的工作。如查詢一段文字中,是否有is?是否有thing或ting等。

  Java的java.util.regex包

  按照面向對象的思路,把希望查詢的字符串如is、thing或ting封裝成一個對象,以這個對象作爲模板去匹配一段文字,就更加自然了。作爲模板的那個東西就是下面要討論的正則表達式。先不考慮那麼複雜,看一個例子:程序2:

import java.util.regex.*;

class Regex1{
 public static void main(String args[]) {
  String str="For my money, the important thing "+"about the meeting was bridge-building";
  String regEx="a|f"; //表示a或f
  Pattern p=Pattern.compile(regEx);
  Matcher m=p.matcher(str);
  boolean result=m.find();
  System.out.println(result);
 }

  如果str匹配regEx,那麼result爲true,否則爲flase。如果想在查找時忽略大小寫,則可以寫成:

Pattern p=Pattern.compile(regEx,Pattern.CASE_INSENSITIVE); 

  雖然暫時不知道Pattern(模板、模式)和Matcher(匹配器)的細節,如果先查詢is、後來又要查詢thing或ting,我們只需要修改一下模板Pattern,而不是考慮if語句和for語句,或者通過charAt()。

  1、寫一個特殊的字符串——正則表達式如a|f。

  2、將正則表達式編譯成一個模板:p

  3、用模板p去匹配字符串str。

  注意:JDK1.4及以上才能使用這些類。

  Pattern類與查找

  ①public final class java.util.regex.Pattern是正則表達式編譯後的表達法。下面的語句將創建一個Pattern對象並賦值給句柄p:Pattern p=Pattern.compile(regEx);

  有趣的是,Pattern類是final類,而且它的構造器是private。也許有人告訴你一些設計模式的東西,或者你自己查有關資料。這裏的結論是:Pattern類不能被繼承,我們不能通過new創建Pattern類的對象。

  因此在Pattern類中,提供了2個重載的靜態方法,其返回值是Pattern對象(的引用)。如:

public static Pattern compile(String regex) {
 return new Pattern(regex, 0);

  當然,我們可以聲明Pattern類的句柄,如Pattern p=null;

  ②p.matcher(str)表示以用模板p去生成一個字符串str的匹配器,它的返回值是一個Matcher類的引用,爲什麼要這個東西呢?按照自然的想法,返回一個boolean值不行嗎?

  我們可以簡單的使用如下方法:

boolean result=Pattern.compile(regEx).matcher(str).find(); 

  其實是三個語句合併的無句柄方式。無句柄常常不是好方式。後面再學習Matcher類吧。先看看regEx:

  正則表達式之限定符

  正則表達式(Regular Expression)是一種生成字符串的字符串。比如說,String regEx="me+";這裏字符串me+能夠生成的字符串是:me、mee、meee、meeeeeeeeee等等,一個正則表達式可能生成無窮的字符串,所以我們不可能輸出正則表達式產生的所有東西。

  反過來考慮,對於字符串:me、mee、meee、meeeeeeeeee等等,我們能否有一種語言去描述它們呢?顯然,正則表達式語言是這種語言,它是一些字符串的模式——簡潔而深刻的描述。

  我們使用正則表達式,用於字符串查找、匹配、指定字符串替換、字符串分割等等目的。

  生成字符串的字符串——正則表達式,真有些複雜,因爲我們希望由普通字符(例如字符 a 到 z)以及特殊字符(稱爲元字符)描述任意的字符串,而且要準確。

  先看幾個正則表達式例子:

  程序3:我們總用這個程序測試正則表達式。

import java.util.regex.*;

class Regex1{
 public static void main(String args[]) {
  String str="For my money, the important thing ";
  String regEx="ab*";
  boolean result=Pattern.compile(regEx).matcher(str).find();
  System.out.println(result);
 }
}//ture 

  ①"ab*"——能匹配a、ab、abb、abbb……。所以,*表示前面字符可以有零次或多次。如果僅僅考慮查找,直接用"a"也一樣。但想想替換的情況。問題regEx="abb*"結果如何?

  ②"ab+"——能匹配ab、abb、abbb……。等價於"abb*"。問題regEx="or+"結果如何?

  ③"or?"——能匹配o和or。? 表示前面字符可以有零次或一次。

  這些限定符*、+、?方便地表示了其前面字符(子串)出現的次數(我們用{}來描述): x*,零次或多次 ≡{0,}

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章