對於訓練集數據少得情況,有時需要重複使用數據,
例如列表 a=[4,5,6,7,8,,...,103],需要隨機分成80%、20%,這時就要採用截取的方法:
1、用np.random.choice(replace=False)從0到99隨機選80個數出來爲一個數組b;
2、然後c=set(range(len(a)))-set(b);
3、再將此結果使用list轉換爲數組d=list(c);
4、最後用數組截取法a[b]和a[d]來分兩個數據集
最後,使用batch_size來控制迭代次數
對於訓練集數據少得情況,有時需要重複使用數據,
例如列表 a=[4,5,6,7,8,,...,103],需要隨機分成80%、20%,這時就要採用截取的方法:
1、用np.random.choice(replace=False)從0到99隨機選80個數出來爲一個數組b;
2、然後c=set(range(len(a)))-set(b);
3、再將此結果使用list轉換爲數組d=list(c);
4、最後用數組截取法a[b]和a[d]來分兩個數據集
最後,使用batch_size來控制迭代次數
Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子) 3. 侷限性 1.文字問題 文本建模的一個問題是它很雜亂,機器學習算法之類的技術更喜歡定義明確的
講解的很清楚: https://www.cnblogs.com/wangguchangqing/p/12021638.html