原创 部分數據集

爲防丟失,進行記錄 大學公開數據集 (Stanford)69G大規模無人機(校園)圖像數據集【Stanford】 http://cvgl.stanford.edu/projects/uav_data/ 人臉素描數據集【CUHK】 http

原创 自然語言處理的數據增強分析☞Easy Data Augmentation

自然語言處理的EDA-最簡單數據增強探索性數據分析 論文原文詳情:Easy Data Augmentation Techniques for Boosting Performance on Text Classification Task

原创 PyTorch Dataset Dataloader加載自定義多分類數據,重寫Dataset類

不多說,直接上源碼 我做的是語種分類的項目,所以直接上了,裏面有些介紹。 還是先簡要介紹,繼承torch.data.dataset,然後重寫init、len和getitem方法。 代碼如下: import os import torch

原创 Ubuntu gitlab 操作手冊

1、Ubuntu 配置 ssh Keys 打開電腦終端,生成ssh的key 輸入命令:     ssh-keygen -o -t rsa -b 4096 -C "登錄郵箱" 注意: -C 後面的郵箱,是你自己註冊的時候的郵箱 成功之後的結

原创 梯度優化講解

預防過擬合常用的方法有L1、L2正則化,Dropout 正則化、Data Augmentation、Early Stopping 等。 本文將重點介紹如何使用梯度優化來使神經網絡訓練更快更有效率。 mini-Batch 梯度下降 神經網絡