原创 【pytorch】利用requires_grad凍結部分網絡參數

代碼示例: import torch import torch.nn as nn class a1(torch.nn.Module): def __init__(self): super(a1, self).

原创 【深度學習】GeLU高斯誤差線性單元原理

GeLU,(Gaussian Error Linerar Units),高斯誤差線性單元 1 Gelu數學原理 G(x) = xΦ(X<=x) 其中,Φ(X)爲正態分佈。 累積分佈函數是指隨機變量XX小於或等於xx的概率,用概率密度函數表

原创 【python】python生成均勻分佈的點

import numpy as np a = np.linspace(-10,10,21) print(a) 輸出: [-10.  -9.  -8.  -7.  -6.  -5.  -4.  -3.  -2.  -1.   0.   1

原创 【linux】用grep 找出文件a中不在文件b中出現的內容

用grep 找出文件a中不在文件b中出現的內容:      grep -vf b a > 1.txt

原创 【其他】邏輯、邏輯推理概念

1 什麼是邏輯    邏輯(logic)是一個外來詞語,指的是思維的規律和規則。狹義上邏輯既指思維的規律,也指研究思維規律的學科即邏輯學。廣義上邏輯泛指規律,包括思維規律和客觀規律。 2 什麼是邏輯推理    邏輯推理是指運用邏輯(規律)

原创 【pytorch】Pytorch中的 model.train和 model.eval模式區別

model.train() :啓用 BatchNormalization層 和 dropout層 model.eval() :不啓用 BatchNormalization層 和 dropout層

原创 【python】pandas逐個遍歷sheet

import pandas as pd f = pd.ExcelFile('./data.xlsx') for i in f.sheet_names: d = pd.read_excel('./data.xlsx', shee

原创 【keras】在keras中model.fit_generator()和model.fit()有什麼區別

fit() 會將數據全部裝到內存,不適合大數據量。 fit_generator() 只是轉載部分數據,適合大數據量。

原创 【深度學習】爲什麼需要引入Attention?

如下兩句話: (1)喬布斯執掌的蘋果成爲全球市值第一的公司。 (2)山東產的蘋果,又大又圓,很好喫 。 在對蘋果這個詞進行語義理解時,有了Attention,就能通過上下文來輔助判斷。 比如第一句話的,上下文中的喬布斯和公司兩個詞貢獻很大

原创 【linux-shell】awk輸出從某列開始之後的所有列

awk -F ',' '{if(NF >= 5) {printf $1"\t"; for(i=5;i<=NF;i++) printf $i;printf "\n"}}' 1.txt > 2.txt  

原创 【linux】grep去除結果中文件名

grep -h 'abcd' *.txt 加個-h,就不顯示文件名

原创 【NLP】元學習關係分類 (meta learning relation classification)

1)用meta-learning學習深度網絡的參數;迭代次數一般150-1000。 2)微調:用常規的分類學習來學習深度網絡的參數;迭代次數一般10-30。 最終效果對比: F1平均提高19%,提高明顯。

原创 【linux-shell】sed取出第n行

sed -n '255165,255165p' 1.txt   取出第255165行

原创 【pytorch】查看torch的gpu是否可用

torch.cuda.is_available() cuda是否可用; torch.cuda.device_count() 返回gpu數量; torch.cuda.get_device_name(0) 返回gpu名字,設備索引默認從0開始

原创 【linux】掛載磁盤

1. 查看磁盤情況 : fdisk -l 2. 格式化需掛載的盤:  mkfs.ext4 /dev/sdb 3. 創建需掛載的目錄: mkdir -p /data01 4.掛載: mount /dev/sdb /data01/ 5. 修改