【word2vec實例2】加載模型

原創

2020-02-23 17:01

current_dir = os.path.abspath('.')
w2v_file = os.path.join(current_dir, 'w2v_file_sg')
self.dic = gensim.models.Word2Vec.load(w2v_file)

for word in word_list:
    if word not in self.dic.wv.vocab:
        continue
    else:
        result = self.get_max_similar(word,sim_value)
        if result != '':
            ret.append(result)

def get_max_similar(self, word,sim_value):
    word_vec = self.dic.wv[word]
    lab1_key1=self.getKey()
    lab_key_list = lab1_key1[0]
    lab_key_lab = lab1_key1[1]
    max = 0.0
    result = ''

    for i in range(len(lab_key_list)):
        each = self.cos_sim(word_vec, lab_key_list[i])
        if each > max:
            max = each
            result = lab_key_lab[i]

    print("【"+word+"】與【類別："+result+"】,相似度爲==="+str(max))
    if max < sim_value:
        result = ''
    return result

def cos_sim(self, arrA, arrB):
    aa = arrA.dot(arrB) / (np.linalg.norm(arrA) * np.linalg.norm(arrB))
    return aa

def average(self, key_list):
    sum = 0.0
    average = 0.0
    for key in key_list:
        sum = sum + self.dic.wv[key]

    average = sum / len(key_list)
    return average

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

抽象類和接口（Java）

抽象類在介紹抽象類之前，我們先來看一段代碼： class Animal{ int age; String name; Animal(){} //Animal的構造函數 public void eatF

2020-07-07 09:29:07

棧——鏈棧和數組棧（Java）

棧（stack）又名堆棧，它是一種運算受限的線性表。限定僅在表尾進行插入和刪除操作的線性表。這一端被稱爲棧頂，相對地，把另一端稱爲棧底。向一個棧插入新元素又稱作進棧、入棧或壓棧，它是把新元素放到棧頂元素的上面，使之成爲新的棧頂元素；從

2020-07-07 09:28:56

異常1——初識（Java）

在編程過程中，我們所寫的代碼會遇到很多問題，有些語法上的錯誤或是邏輯上的錯誤我們都是可以在編譯之後或是運行之後進行更改的，然而有些錯誤是不知道什麼時候出錯，在編譯過程中我們發現了也不能更改的錯誤。那麼這個時候我們就要做相應的處理，以確保一

2020-07-07 09:28:56

異常2——深化（Java）

在異常初識中只是簡單的介紹了異常的體系和異常的解決方法，這篇文章將對異常的一些特殊情況進行介紹。 1.自己定義一個異常類進行聲明或者捕獲當我們不瞭解異常的種類或者異常中沒有我們想要的類那麼可以自己定義一個異常類，但是這個異常類要根據是編

2020-07-07 09:28:55

集合初識和用法——collection（Java）

Collection接口繼承了Iterable接口，能夠被foreach使用，是可迭代的。下面介紹它已實現的子接口：在API中它的已知子類和實現的類有很多，目前在這裏只介紹幾個它常用的子接口和collection的用法。 List接口

2020-07-07 09:28:55

內部類、object類的方法解析和基本數據的包裝類（Java）

內部類當我們在描述一個事物的時候發現，該事物中有存在另一個事物，那麼將後者稱之爲內部類，前者稱之爲外部類。就如在前面介紹的鏈棧結構，鏈表和結點就是這樣的關係。鏈表是由結點組成，所以結點類是鏈表的內部類，而鏈表是結點的外部內。但是之前都

2020-07-07 09:28:54

靜態和成員的特點（Java）

爲了更加能方便的理解我們的靜態函數、變量和成員函數、變量，通過兩個問題來詳細描述一下我們靜態和成員的特點。問題一： class Demo03{ public static void main(String[] args){

2020-07-07 09:28:54

遞歸函數（Java）

在之前講解函數內容時提到過函數自身調用自身叫做“遞歸”。那麼爲什麼要用到遞歸？，下面我們對遞歸的內容和在程序中的使用進行介紹，來說明爲什麼會用到遞歸以及何時進行遞歸。遞歸的定義及優點遞歸的定義：遞歸做爲一種算法在程序設計語言中

2020-07-07 09:28:53

集合初識和用法——List（java）

List是一種有序、提供角標、一維數據列表、允許重複元素、允許null元素的集合。它是collection的一個子接口，其已知實現的子類且常用的有ArrayList、LinkedList和Vector。下面將對List的一些方法的使用和它

2020-07-07 09:28:53

面向對象三大特點——封裝、繼承和多態

學過面向對象的我們都知道，面向對象有三大特點爲——封裝、繼承和多態。封裝之前在介紹函數時我們說一個函數就是封裝的體現，封裝就是將一類事物進行封裝成一個類，或者封裝具有獨立功能的代碼塊，封裝的好處就是明確了內外，內部的東西外部無需知道，

2020-07-07 09:28:53

IT人的職業理想

轉自 http://www.cnblogs.com/biwork/p/3346952.html 明天就是國慶節了，今天也不想幹活幹的太累了！寫一篇以前去美國出差的雜想，對比於美國50多歲的程序員和大多數50多歲國內父母的生活狀態有感

2020-06-30 02:38:50

工作慢慢累計

把自己的所思，所得慢慢積累在一起，以後會是自己不可或缺的一筆財富

2020-06-30 02:38:49

Sqlite導入xxx.db3文件

已有Sqlite數據庫的導出文件xxx.db3，如何給他導入到Sqlite數據庫中；假設你已經下載了sqlite數據庫和管理工具，解壓後複製到一個文件夾下，結構如下圖，其中不包括demodb.db3文件：執行命令： F:

2020-06-25 09:29:28

PHPStorm連接MySql時提示錯誤：java.sql.SQLException: The server time zone value ‘xx time’ is unrecognized

PHPStorm連接MySql時提示錯誤：java.sql.SQLException: The server time zone value ‘xx time’ is unrecognized 解決方案： 1.找到MySQL的配置文件，m

2020-06-25 08:30:07

JQuery爲html中標籤設置響應的事件函數

1.下面代碼實現通過jquery爲html中的button標籤、和input標籤設置響應的響應函數；其中input類型的標籤有兩個響應函數，點擊一次，會分別執行兩個響應的函數。 <html> <head> <meta ch

2020-06-25 08:30:07

24小時熱門文章

最新文章

最新評論文章