Emoji表情正則匹配

原創

2019-09-04 16:54

emoji表情其實就是四位的unicode

所以我們可以通過unicode來識別emoji表情

<U+1F300> - <U+1F5FF>      # symbols & pictographs
<U+1F600> - <U+1F64F>      # emoticons
<U+1F680> - <U+1F6FF>      # transport & map symbols
<U+2600>  - <U+2B55>       # other

目標是要匹配文本兩個emoji表情中間的文字

例如

🔐testtest🔐

代碼：

readline=['🔐testtest🔐']
import re
pat=re.compile(u'['u'\U0001F300-\U0001F64F'u'\U0001F680-\U0001F6FF'u'\u2600-\u2B55]'+'(.*?)'+u'['u'\U0001F300-\U0001F64F'u'\U0001F680-\U0001F6FF'u'\u2600-\u2B55]', re.UNICODE)
for line in readline:
    print(pat.findall(line))

結果：

testtest

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

python技巧分享（四）

這是一個系列文章，主要分享python的使用建議和技巧，每次分享3點，希望你能有所收穫。 1 如何打印更易讀的類不推薦方式 class Point(object): def __init__(self, x, y):

2020-07-06 04:20:59

python技巧分享（七）

這是一個系列文章，主要分享python的使用建議和技巧，每次分享3點，希望你能有所收穫。 1 is 和 == 的區別 import os str1 = os.__name__ str2 = "os" print str1 #

2020-07-06 04:20:49

Use mutt send email attachment at linux command line

[email protected] mutt -s "h323.cap" -a h323.cap [email protected] < /dev/null

2020-07-07 21:08:40

BiTree *T與BiTree T區別

BiTree *T 傳入的是該指針的地址，等同於一個指向該指針的指針，可以改變這個指針的指向，比如一開始這個指針指向NULL，可以通過指向該指針的指針來改變該指針的指向到a,b,c隨便什麼。 BiTree T傳入的就是該指針，用於

2020-07-07 18:05:28

python: 找到dataframe某列中含有特定字段字符串的行 & 遍歷dataframe & 函數返回爲空 & 找到特定單元格

題目描述： 6.) Proving Afzal Wrong We have detoured from the original aim of this question for long enough. Compare the popu

2020-07-07 17:31:03

英國之行攻略

景點：免費：喬治廣場 | George Square 地址：George Street, Glasgow G2 1DU 格拉斯哥大教堂 | Glasgow Cathedral 地址：Cathedral Square, Castle S

2020-07-06 20:28:31

Word/WPS文檔中縮小行距

Word/WPS中，有時行距看上去太大，需要縮小行距，但是直接修改段落中的行距並沒有效果：探索一番，找到了答案（版本：WPS 2019）：選中內容，右擊-》段落， 1. 取消勾選“如果定義了文檔網格，則與網格對齊”。 2. “行距”設

小鹰信息技术服务部

2020-07-06 20:13:24

QQ，FM網盤中斷後重新下載

從 QQ網盤或者FM網盤下載東西時有時候會停止下載，然後就沒速度，如果是用IE下載的話更杯具，會默認爲你已經下載完畢，比如一個500M的文件，下載到230M時沒速度了，如果是IE的話，就會認爲下載任務已經完成，然後你就會被拒的發現實際

2020-07-06 19:49:21

JS快車下載99%的杯具與茶几

用快車下載JS的東西往往下到99%就停住了，遇到這種情況，有的人則是自認RP不佳，刪掉任務重新下，結果還是悲劇……也有的人則是放着不管，失敗了就重新開始任務，等待某一時刻RP爆發，可以連接上。今天連接不上，明天再試，不行就後

2020-07-06 19:49:21

shell技巧分享（四）

這是一個系列文章，主要分享shell（部分功能僅適用於bash）的使用建議和技巧，每次分享3點，希望你能有所收穫。 1 常用快捷鍵 Alt+Backspace：刪除光標前的一個單詞 Alt+F：移動光標到下一個空格處 Alt+B

2020-07-06 04:20:59

shell技巧分享（二）

這是一個系列文章，主要分享shell（部分功能僅適用於bash）的使用建議和技巧，每次分享3點，希望你能有所收穫。 1 ps + grep命令 $ sleep 1234 & [1] 19340 $ sleep 1234 & [2]

2020-07-06 04:20:49

事務特性及髒讀、不可重複讀、幻讀（虛讀）

事務是指邏輯上的一組操作，這組操作要麼全部成功，要麼全部失敗。事務的特性（ACID）：原子性（A）：事務是一個不可分割的工作單位，事務中的操作要麼都發生，要麼都不發生。一致性(C)：事務前後數據的完整性必須保持一致。例：A:200,B:2

稳重的二哈

2020-07-04 08:46:15

public void method()，void前面的泛型T是什麼

public <T>這個T是個修飾符的功能，表示是個泛型方法，就像有static修飾的方法是個靜態方法一樣。注意<T> 不是返回值，此處的返回值是void ，此處的<T> 表示傳入參數有泛型,<T>存在的作用，是爲了保證參數中能夠出現T這

稳重的二哈

2020-07-04 08:46:15

到現在總結的一些OI小tips

1.時間複雜度達到10^6 - 10^7已經接近超時邊緣 2.不能在函數裏開過大的數組，不然會直接RE爆掉 3.如果你的程序讓系統死機了，或者出現未知錯誤了，很有可能是你數組下標越界了（負值/開的太小），也有可能是你用的STL裏

2020-07-04 04:38:33

zip解壓中文亂碼解決與使用ant實現zip解壓縮

緣由： java對於文字的編碼是以unicode爲基礎，因此，若是以ZipInputStream及ZipOutputStream來處理壓縮及解壓縮的工作，碰到中文檔名或路徑，那當然是以unicode來處理羅！但是，現在市面上的壓縮及解

2020-07-03 21:49:47

24小時熱門文章

最新文章

最新評論文章