pandas处理文本关键词命中

使用pandas中的apply提取关键词

从description字段中查看命中了哪些关键词并形成新的一列

图片描述

import re
import pandas as pd
from setting import DataPath
from os import path


def mingzhong(das):
    keywords = ['p2p', '网贷', '拍卖', '众筹', '保理', '保险', '担保', '典当', '私募', '公募', '征信', '期货', '证券', '支付', '信托', '投行', '贷',
                 '借', '债', '款', '财富', '操盘手', '催缴', '催收', '抵押', '风控', '基金', '交易', '金融', '理财', '融资', '审查', '授信', '投后',
                 '投资', '外汇', '逾期', '资产', '资金管理', '信审', '初审', '内审', '复审', '终审', '面审', '风审', '分期', '风险', '质押', '股票', '信用',
                 '清算', '银行', '信控']


    key_box = []
    for keyword in keywords:
        pattern = re.compile('.*' + keyword + '.*')
        if pattern.match(das["title"]) is not None:
            key_box.append(keyword)
            print(key_box)
    return key_box
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章