原创 torch 的 F.cross_entropy

torch中的交叉熵損失函數使用案例 import torch import torch.nn.functional as F pred = torch.randn(3, 5) print(pred.shape) target =

原创 關於nn.embedding的中padding_idx的含義

自然語言中使用批處理時候, 每個句子的長度並不一定是等長的, 這時候就需要對較短的句子進行padding, 填充的數據一般是0, 這個時候, 在進行詞嵌入的時候就會進行相應的處理, nn.embedding會將填充的映射爲0 其中padd

原创 numpy 的reshape

import numpy as np a = np.random.randn(2, 3) print(a) b = a.reshape(3, 2) print(b) # a本身形狀不變 print(a) # 但此時, a, b

原创 迴文子串的數量

647. 迴文子串 難度 中等 給定一個字符串,你的任務是計算這個字符串中有多少個迴文子串。 具有不同開始位置或結束位置的子串,即使是由相同的字符組成,也會被計爲是不同的子串 class Solution: def countS

原创 結巴 分詞及詞性

import jieba import jieba.posseg as pseg words = pseg.cut("我愛毛主席北京天安門.!") for word, flag in words: print('%s: %s'

原创 LeetCode  739. 每日溫度

LeetCode  739. 每日溫度 難度中等 請根據每日 氣溫 列表,重新生成一個列表。對應位置的輸出爲:要想觀測到更高的氣溫,至少需要等待的天數。如果氣溫在這之後都不會升高,請在該位置用 0 來代替。 class Solution

原创 jieba分詞及詞性判斷

import jieba.posseg as posseg res = posseg.cut("我是中國人") print(type(res)) for word, flag in res: print(word, flag)

原创 Python 運行時忽略warnings

只需在最開始的時候導入warnings 並執行以下指令即可 import warnings warnings.filterwarnings("ignore")  

原创 join列表的要求

再次強調, 當使用join進行拼接列表時, 列表中的元素必須都得是字符串類型的  

原创 列表是引用類型

a和b指向的是同一塊地址

原创 保存模型的 兩種方法

from sklearn.linear_model import LogisticRegression from sklearn import datasets import pickle from sklearn.externals

原创 漢語的文本通過 tfidf 進行向量轉換的案例

漢語的情況比較特殊, 並沒有分隔符, 需要自己進行分割, 這裏一般不會這樣, 而是先使用結巴分詞進行分詞, 然後再將各個分詞以逗號的格式拼接成文本, 然後在進行轉換, 將文本信息轉換成向量的格式