pandas處理文本關鍵詞命中

使用pandas中的apply提取關鍵詞

從description字段中查看命中了哪些關鍵詞並形成新的一列

圖片描述

import re
import pandas as pd
from setting import DataPath
from os import path


def mingzhong(das):
    keywords = ['p2p', '網貸', '拍賣', '衆籌', '保理', '保險', '擔保', '典當', '私募', '公募', '徵信', '期貨', '證券', '支付', '信託', '投行', '貸',
                 '借', '債', '款', '財富', '操盤手', '催繳', '催收', '抵押', '風控', '基金', '交易', '金融', '理財', '融資', '審查', '授信', '投後',
                 '投資', '外匯', '逾期', '資產', '資金管理', '信審', '初審', '內審', '複審', '終審', '面審', '風審', '分期', '風險', '質押', '股票', '信用',
                 '清算', '銀行', '信控']


    key_box = []
    for keyword in keywords:
        pattern = re.compile('.*' + keyword + '.*')
        if pattern.match(das["title"]) is not None:
            key_box.append(keyword)
            print(key_box)
    return key_box
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章