原创 torch text -- dataset 迷魂陣

處理文本 核心 怎樣使得訓練樣本成爲一個個 batch, 也就是怎樣自己做一個迭代器,使得訓練更加方便 Fields – 你要我怎樣 在語言模型裏面,我們一般會預測下一個單詞的出現,這樣的無監督學習,天然有label。在情感分析

原创 樹常考題 ( python 實現)--- 待更新

前中後序遍歷二叉樹 6 道 ( 遞歸 + 非遞歸) 遞歸忽略 前序遍歷 準備一個 stack, 因爲是前序,頭結點要先打印,則放入頭節點後立馬彈出, 在彈出的時候查詢是否有孩子節點,按照先右後左的順序壓入棧中。 class Sol

原创 模型評價指標,精確,精準,召回真的那麼難麼?

引言 一般做機器學習任務,以預測某一個類別爲原則來評價原則。常用的術語。以病人爲例, 分爲 癌症患者, 非癌症患者, 確診的癌症患者, 誤診的癌症患者 positive :正樣本 – 癌症患者 negtive : 負樣本 –

原创 兩個棧實現堆

class CQueue: def __init__(self): self.inner = [] self.outer = [] def appendTail(self, value:

原创 二叉樹鏡像

class Solution: def mirrorTree(self, root: TreeNode) -> TreeNode: if not root: return None

原创 二維數組的查找

class Solution: def findNumberIn2DArray(self, matrix: List[List[int]], target: int) -> bool: if matrix:

原创 Pytorch -- 簡單的rnn 記不住的 api

也不太簡單的流程圖 encoder數據vectorRNN/ LSTM/ GRUdecoderoutput layer api 流程圖看到,需要幾個 layer, encoder 這裏就選擇 nn.Embedding, 循環神經

原创 從尾到頭打印鏈表

class Solution: def reversePrint(self, head: ListNode) -> List[int]: if not head: return []

原创 Scrapy筆記 4 ---- Scrapy + selenium

在第一個筆記中,我們在 https://news.qq.com/ 中看到了,進入瀏覽器中,按住F12 之後出現的網頁結構和網頁源碼並不一致,這樣會導致我們的網頁內容無法抓取。原因是我們看到的網頁是由JS 動態生成,解決這個的方法有很多

原创 Scrapy 筆記 ---- 愛之初體驗 1

安裝請查看: Scrapy 官網 PipeLine 整體架構 xpath/ css 篩選 愛之初體驗 架構 看不懂?沒關係,看文件結構 tutorial/ # project's Python modu

原创 Scrapy 筆記3 ----Item() 配置

Overview 在筆記2中,我們抓取了頁面的文章內容,問題來了,如何將擼下來的文章保存呢?其實方法很多,既然抓取到了,就可以把抓到的內容寫入本地,或者記錄下來之後,傳入數據庫,等等。這裏,我們要看一下Scrapy 框架Item 是如

原创 Scrapy 筆記2 ---- 靜態網頁(附完整代碼)

PipeLine 查看頁面結構 提取文章以及url 構造完整流程 查看頁面結構 我們要抓取的頁面在這裏:伯樂在線‘所有文章’頁面首頁 先瞅瞅長什麼樣子 看到這裏,我們要說一下大致的思路了 提取文章以及url 大致思路: 1.

原创 ubuntu python 2 3 共存

python2 ,python3 在一起真的很煩,看一下他們的運行機理吧 可見輸入命令時是軟連接到一個目錄,所以有幾個思路,把原鏈接地址改成自己想要的包,或者可以創建新的連接,取一個自己喜歡的名字 ln -s 源地址 目的地址

原创 mac 快捷鍵

基本的快捷鍵 Command是Mac裏最重要的修飾鍵,在大多數情況下相當於Windows下的Ctrl。所以以下最基本操作很好理解: Command-Z 撤銷  Command-X 剪切   Command-C 拷貝(Copy)   Com

原创 JAVA i ++ ++i 區別

public static void main(String [] args){ int i = 4; int a = i ++; int j = 4; int b = +