在C#中可以使用正則表達式來過濾html字符,比如,在驗證用戶輸入時,爲了保證安全性,就需要過濾html字符。
using System.Text.RegularExpressions;
Regex.Replace(htmlcode ,"<[^>]+>","");
解釋一下:< 代表以 "< "開頭
[^>] 其中[^...] 就是匹配任何字符,但不許匹配^之後緊跟的字符,也就是如果"<>" 出現在字符串中,是不會去過濾的,因爲它部屬於html標記.
然後就是那個 + 號, 加號的意思就是匹配前面的至少一個搜索項
最後是 >,表示html標記以>結尾。