對cvs文本關鍵詞進行詞頻統計

原創

2020-04-20 04:28

#-*-coding:utf-8-*-
import os
import json
data={}
with open('2009_all_keywords.txt','r',encoding='utf-8',errors='ignore') as f:
    txt_read = f.read()
    txt_read= txt_read.strip()
    txt = txt_read.split('\n')
    for row in txt:
        list_row=row.split(' ')
        list_row = [i for i in list_row if(len(str(i))!=0)]
        for word in list_row:
            word=word.strip().strip(';')
            if word in data.keys():
                data[word]=data[word]+1
            else:
                data.update({word:1})
        print('********')
        data_print = sorted(data.items(),key=lambda item:item[1],reverse=True )
        print(data_print)
        #print('********')
data_save=sorted(data.items(),key=lambda item:item[1],reverse=True )
lsobj = json.dumps(data_save)
with open('2009_word_count.txt','w',encoding='utf-8',errors='ignore') as f:
    f.write(lsobj)

作者：WangB

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pyhton_基尼指數計算

1.定義：基尼指數（基尼不純度）：表示在樣本集合中一個隨機選中的樣本被分錯的概率。注意： Gini指數越小表示集合中被選中的樣本被分錯的概率越小，也就是說集合的純度越高，反之，集合越不純。 def gini_index_

2020-07-03 05:03:47

Python繪圖佈局、圖例說明、邊界

當繪畫完成後，會發現X、Y軸的區間是會自動調整的，並不是跟傳入的X、Y軸數據中的最值相同。爲了調整區間可以使用下面的方式： ax.set_xlim([xmin, xmax]) #設置X軸的區間 ax.set_ylim([ymin, y

2020-07-03 05:03:47

fluent動網格profile文件的編寫

在fluent中指定部件運動主要有兩種方式：profile文件和UDF宏文件。當運動方程已知時，利用UDF宏指定運動非常方便，而profile方法則適合當需要指定的運動無任何函數關係的情況。標準瞬態Profile文件可表述爲以下格式：

2020-07-03 05:03:47

python list列表添加元素

Python中使用+運算符可以將多個序列連接起來；列表是序列的一種，所以也可以使用+進行連接，這樣就相當於在第一個列表的末尾添加了另一個列表。 language = ["Python", "C++", "Java"] birthday

2020-06-16 02:16:02

使用python對Apriori算法進行學習

Apriori的原理解釋：假設我們在經營一家商品種類並不多的雜貨店，我們對那些經常在一起被購買的商品非常感興趣。我們只有4種商品：商品0，商品1，商品2和商品3。那麼所有可能被一起購買的商品組合都有哪些？這些商品組合可能只有一種商品，比

2020-06-16 02:16:02

Python函數定義和調用

Python中函數的應用非常廣泛，比如 input() 、print()、range()、len() 函數等等，這些都是 Python 的內置函數，可以直接使用。除了可以直接使用的內置函數外，Python還支持自定義函數，即將一段有規律

2020-06-09 02:02:09

使用python對信息熵進行計算

在機器學習中的決策樹類算法中主要依靠信息熵的大小來選擇重要的特徵屬性作爲節點換分數據集從而獲得訓練結果 #-*-coding:utf-8-*- from math import log import operator def calc

2020-06-09 02:02:09

abaqus鑽頭鑽進模擬

在之前的文章中，筆者介紹了二維切削的模擬方法，本次筆者將介紹三維鑽頭鑽進岩石的模擬方法。步驟一：準備模型由於在abaqus中繪圖和裝配比較繁瑣，筆者選擇在solidwork中提前建好模型，並進行裝配，再以x.t格式存儲和導入abaq

2020-06-09 02:02:09

地層三壓力預測

# -*- coding: UTF-8 -*- import math import numpy as np import pandas as pd import matplotlib.pyplot as plt from pylab

2020-06-09 02:02:09

python字符串拼接、查找、分割、替換

1.字符串定義字符串：以雙引號或單引號包圍的數據 2.字符串的拼接練習： a = 'hello' b = 'world' c = a + b print(c) 運行結果：helloworld 3.字符串的查找方法 count 計

2020-06-09 02:02:09

ANSYS MESHING網格種類及區別

在ANSYS網格劃分中，存在多種網格劃分方法，如補片獨立、補片協調、多區等方法，不同的劃分方法有着不同的功能和結果，在一個複雜結構的網格劃分中，不同的網格劃分方法通過扮演不同的角色，來解決網格質量問題。下面介紹幾種網格劃分方

2020-07-03 05:03:47

solidworks靜力學分析概述

在之前的文章中，我們介紹了solidworks的流體分析模塊，本期我們將介紹solidworks的靜力學分析模塊。靜力學分析模塊是SOLIDWORKS Simulation插件下的一個子分析模塊，這個分析插件還可進行熱力分析、頻率分析、跌

2020-06-16 02:16:02

solidworks流體模擬分析概述

Solid works是一款極爲簡便的三維建模軟件，同時該軟件又集合了運動分析、靜力學分析和流體力學分析等模塊。本次我們將講解solidworks流體分析模塊。首先我們新建一個流道模型：然後加載solidworks流體分析模塊：

2020-06-09 02:02:09

ABAQUS切削模擬

步驟： 1、模型創建（岩石模型上的橫線主要是爲了劃分網格用） 2、此處省略材料設置 3、裝配將零部件裝配到如圖所示位置，並在刀尖處設置參考點 4、網格設置岩石全局種子大小設爲2，在岩石被切削部分佈置較小單元的種子，刀具與

2020-06-09 02:01:58

陶瓷杆撞擊鋁板的例子

APDL： /filename,barplate /title,Impact Of A Bar Into A Plate /PREP7 /view,,1,2,3 /plopts,info,1 /pbc,all,1 /pnum

2020-06-09 02:01:58

24小時熱門文章

最新文章

最新評論文章