python正则获取html中的数字、汉字、字母

比如<em class="gitee-highlight-keyword">thinkphp</em><em class="gitee-highlight-keyword">5.1</em>开发博客系统</div>'
这个html想要获取“thinkphp5.1开发博客系统”,可以用正则表达式:
re.sub(u"\<.*?\>", “”,需要的html代码)获取
这段代码的意思是,把<>中的部分都用“”替换了,这样就只剩下thinkphp,5.1,开发博客系统了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章