原创 Python進階筆記(三)深入理解序列類

3.1 py中的序列分類 第一個維度通過序列存儲數據的類型: 容器序列:list,tuple,deque; 扁平序列:str,bytes,bytearray,array.array; 第二個維度通過序列是否可變來進行區分: 可變

原创 NLP基本算法(一)-隱馬爾科夫

關於NLP相關包安裝配置,可以參考: NLP工具包安裝配置 關於分詞的應用可以參考: 自然語言處理NLP-準確分詞(應用) 隱馬爾科夫 本週更完(6.23日前)

原创 Python進階筆記(四)深入Python的set和dict

4.1 dict的abc繼承關係 dict是屬於Mapping類型 from collections.abc import Mapping, MutableMapping # a實際上並不是去繼承了MutableMapping,

原创 NLP面試題目總結

數據結構與算法相關 1. 快速排序算法 請實現快速排序算法,自行設計測試用例來說明算法的準確性,算法的時間和空間複雜度是多少?最壞的時間複雜度是多少? 快排是每次從當前考慮的數組中選擇一個元素,以這個元素爲基點,之後把這個元素放在

原创 Pytorch中torch.Tensor和torch.tensor()以及其他Tensor類型的區別

torch.Tensor()默認是torch.FloatTensor()的簡稱,創建的爲float32位的數據類型; torch.tensor()是對張量數據的拷貝,根據傳入data的類型來創建Tensor; 其他數據類型,如L

原创 LeetCode第一階段(一)【數組篇】

LeetCode 283 Move Zeros 給定一個數組nums,寫一個函數,將數組中所有的0挪到數組的末尾,而維持其他所有非0元素的相對位置。 舉例:nums = [0,1,0,3,12],函數運行後的結果爲[1,3,12,

原创 最優化方法問題總結

最近在學習得過程中感悟很大,即通過OKR的方法來形成自己學習內容中最小的閉環。另外對所謂學過的知識經常忘有了新的認識,所要做的不是以前的那套–所謂和遺忘作鬥爭不斷去重複,而是思考清楚爲什麼會遺忘,一是自己沒有真正理解,二是沒有將知

原创 個人Info

原创 CNN文本分類

使用卷積神經網絡(CNN)用預先訓練好的詞向量對句子級別的文本分類做了一系列實驗。實驗表明,一個簡單的CNN,只需少量超參數調整和靜態向量(詞向量不參與訓練),就可以在多個基準測試中取得出色的結果。通過微調特定學習任務的詞向量可以進一步提

原创 掌握Git工作流(二)--git分支管理

分支管理大綱: 分支就相當於是工廠裏的流水線,分支之間是互相不會影響的。 掌握Git工作流(一)--git基本操作 掌握Git工作流(二)--git分支管理 掌握Git工作流(三)--git工作流 一. git 分支基本操作 也可以理

原创 掌握Git工作流(三)--git工作流

實際工作流 掌握Git工作流(一)--git基本操作 掌握Git工作流(二)--git分支管理 掌握Git工作流(三)--git工作流 一. 創建倉庫 gitingnore文件是幹嗎的,當我們在開發運行.py結尾的文件時,經常會

原创 掌握Git工作流(一)--git基本操作

基本操作大綱:   掌握Git工作流(一)--git基本操作 掌握Git工作流(二)--git分支管理 掌握Git工作流(三)--git工作流 一. git 簡介 git 採用分佈式系統管理,可以方便的管理某一個目錄下的代碼

原创 關鍵詞提取

  一般來說,TF-IDF算法和TextRank算法就可以滿足大部分的關鍵詞提取任務。但是在某些場景,基於文檔本身的關鍵詞提取還不是非常足夠,有些關鍵詞不一定會顯式的出現在文檔中,對於一些需要表現出文中沒有的關鍵詞提取,即叫主題模型。 在

原创 N-GRAM文本挖掘

N-GRAM介紹: N-Gram是基於一個假設:第n個詞出現與前n-1個詞相關,而與其他任何詞不相關。(隱馬爾科夫當中的假設。)整個句子出現的概率就等於各個詞出現的概率乘積。各個詞的概率可以通過語料中統計計算得到。 假設句子T是有

原创 tensorflow遇到ImportError: Could not find 'cudart64_100.dll'錯誤解決

在安裝tensorflow的時候,當用ipython使用import tensorflow出現的錯誤 ImportError: Could not find 'cudart64_100.dll' 簡答: 仔細分析錯誤的類型、