面向小白的深度學習論文術語

引言:剛開始看深度學習的論文,會遇到有一些沒見過的科研論文術語(例如 state-of-the-art),看得多了才能慢慢理解。

下面我列舉的一些論文術語以及評估指標,我剛開始遇到是不太懂的。我結合網絡和自己的理解給出合理解釋,供參考~

附:

一、論文

1.A-G

Ablation study
直接翻譯爲消融實驗。實際上是一種對比實驗,控制變量法。研究哪些部分對網絡性能產生,選擇一些可能的因素,分別對比去除和加上的網絡性能。

An ablation study typically refers to removing some “feature” of the model or algorithm, and seeing how that affects performance.

Anchor
字面意思是錨,CV 中是錨點或錨框,目標檢測中常出現的 anchor box是錨框,表示固定的參考框。參考:目標檢測中的Anchor

Baseline
翻譯爲基線,是研究的一個參照物。你以 baseline 爲基礎,在上面加了一些東西構成新模型,就要看看你的模型比 baseline 的性能提高了多少,你的改進有沒有效果。(在 baseline 的基礎上縱向比較)

a line serving as a basis

Benchmark
翻譯爲基準,在測試中可以比較計算機或程序的性能、可靠性的既定參考點,是評價算法好壞的一種規則和標準。(與比較牛的模型 benchmark 橫向比較)

an established point of reference against which computers or programs can be measured in tests comparing their performance, reliability, etc.

Backbone
可翻譯爲骨幹(eg. backbone network)

the most important part of something, providing support for everything else

Batch
可翻譯爲批。模型訓練的一次迭代(即一次梯度更新)中使用的樣本集。(一個批次的樣本數是 batch size)拓展:epoch,batch,iteration

a group of jobs, data, or programs treated as a unit for computer processing

End-to-end
端到端,輸入原始數據,輸出得到想要的結果,使用一個單獨的網絡模型訓練,不用考慮多階段處理。(eg. end-to-end learning, end-to-end network)

End-to-end describes a process that takes a system or service from beginning to end and delivers a complete functional solution, usually without needing to obtain anything from a third party.

Ensemble model
可翻譯爲融合模型,是一種提高模型性能的方法。

multiple diverse models are created to predict an outcome, either by using many different modeling algorithms or using different training data sets. The ensemble model then aggregates the prediction of each base model and results in once final prediction for the unseen data.

Epoch
可翻譯爲代,使用訓練集額全部數據對模型進行一次完整訓練是一個 epoch。拓展:epoch,batch,iteration

a particular period of time marked by distinctive features, events

Fine tune
翻譯爲微調(eg. fine tune a network)

to make very small changes to something in order to make it work as well as possible.

Feature map
可翻譯爲特徵圖,指 CNN 中卷積層的輸出。

The feature map is the output of one filter applied to the previous layer.

Ground truth
可理解爲設定的一個正確的真實值。圖像分類中,標籤爲 ground truth。

In machine learning, the term “ground truth” refers to the accuracy of the training set’s classification for supervised learning techniques.

2.H-N

Hyperparameter
超參數。模型參數是根據數據自動估算的,例如權重。但模型超參數是手動設置的,並且在過程中用於幫助估計模型參數,例如學習率。

3.O-T

Pipeline
直譯是流水線,論文中會稱一些框架爲 pipeline,說明這個框架分爲幾個階段。

Short connection
shortcut 翻譯爲捷徑。傳統的 CNN 在不相鄰的層間傳遞需要經過中間層,但深度殘差網絡提出在兩層之間直接連一個線,跳過了中間層,跳過的這些層就是 short connection,skip connection 就是一種跳躍式傳遞。

State-of-the-art (SOTA)
可翻譯爲最先進的,最高水平。

the latest and most sophisticated or advanced stage of a technology, art, or science.

Region of interest(ROI)
可翻譯爲感興趣區域,從圖像中選擇的一片圖像區域,裏面包含感興趣的目標。比如一個數據集類別只有人和動物,用這個數據集作目標檢測,如果一片區域有這些類別的物體,它纔是 ROI,並不是有物體就是 ROI。

samples within a data set identified for a particular purpose

Receptive field(RF)
翻譯爲感受野(感受域),指的是神經網絡中神經元“看到的”輸入區域。CNN 的 feature map上某個元素的計算受輸入圖像上某個區域的影響,這個區域即該元素的感受野。

The receptive field is defined as the region in the input space that a particular CNN’s feature is looking at.

Off-the-shelf
Off-the-shelf 是現成的意思,下面是 Quora 中的解釋,An “off the shelf” algorithm 就是別人已經實現的,庫裏直接有的算法。

Sometimes people using a machine learning algorithm implement it themselves. This is a project that might take an hour or a week of someone’s time (or more, depending on the algorithm and the skill of the person implementing it). An “off the shelf” algorithm is one that has been implemented by someone else and is available in a library. Usually this means it has been so in a fairly generic way, and usually there will be some room for improvement (e.g., by selecting or transforming features).

4.U-Z

Without bells and whistles
沒有花裏胡哨的方法(不添加不必要,冗餘的東西)

It refers to non-essential but often engaging features added to a piece of technical equipment or a computer program to make it seem more superficially attractive without enhancing its main function

二、指標

1. CV

FPS
Frames Per Second 的縮寫,翻譯爲“每秒傳輸幀數”,也就是“每秒中填充圖像的幀數(幀/秒)”

AP(Average Percision)
平均精度,指的是所有圖片內的具體某一類的PR曲線下的面積。

mAP(Mean Average Precision)
均值平均精度,指的是所有圖片內的所有類別的AP的平均值,目前,在目標檢測類裏用的最多的是 mAP。

IOU(Intersection over Union)
交併比,指的是 ground truth bbox與 predict bbox 的交集面積佔兩者並集面積的一個比率,IoU值越大說明預測檢測框的模型算法性能越好.

Top-1 error
預測輸出的概率最高的類別,是否和人工標註的類別一致,如果不一致,此時的概率。常用於 ImageNet 數據集。

Top-5 error
預測輸出的概率最高的前5個類別當中,有沒有和人工標註的類別不一致,當5個都不一致時錯誤次數佔總次數的概率。

COCO 數據集指標鏈接
不同條件下的 AP 和 AR,比如不同的 IOU,不同的大小。
論文中會把 APIOU=50 簡寫爲 AP50 ,APsmall 簡寫爲 APS
在這裏插入圖片描述

2. ML

Accuracy
準確率,正確預測的樣本數總預測樣本數的比值

Precision
精確率,正確預測的正樣本數佔所有預測爲正樣本的數量的比值

Recall
召回率,正確預測的正樣本數真實正樣本總數的比值

F1-Score
F1分數,是統計學中用來衡量二分類模型精確度的一種指標,它被定義爲精確率和召回率的調和平均數

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章