原创 java自學總結

1. 面向對象和麪向過程的區別 面向過程 :面向過程性能比面向對象高。 因爲類調用時需要實例化,開銷比較大,比較消耗資源,所以當性能是最重要的考量因素的時候,比如單片機、嵌入式開發、Linux/Unix 等一般採用面向過程開發。但是,面向

原创 MapReduce編程規範-wordcount實戰 && hadoop序列化例子

一、程序分爲3部分:Mapper,Reducer,Driver 通過java實現map_reduce版本的word_count例子 1、Mapper階段 (1)用戶自定義的Mapper要繼承 org.apache.hadoop.mapre

原创 百面機器學習讀書筆記-第一章

數值型特徵歸一化 Q:爲什麼需要對數值類型的特徵做歸一化? A:對數值類型的特徵做歸一化可以將所有的特徵都統一到一個大致相同的數值區間內。常用的歸一化方法 (1)線性歸一化(min-max) (2)零均值歸一化(z-score)  z=(

原创 linux從本地上傳文件夾到gitlab

1.在本地運行ssh-keygen -t rsa -C "[email protected]" -b 4096 生成SSH. 2.cat ~/.ssh/id_rsa.pub 複製裏面的內容;之後去Gitlab項目頁面,右上角->

原创 pytroch學習-神經網絡

用torch.nn包構建神經網絡之前已經瞭解到了autograd,nn依賴於autograd來定義模型並進行求微分操作。nn.Module包含神經網絡的各個層,方法forward(input) 返回 output例如,觀察下面用於分類手寫

原创 查看電腦開關機記錄

1.右鍵“計算機” 選擇“管理”,如下圖所示: 2.選擇“系統工具”下面的“事件查看器” 下面的 “windows日誌” 選擇 “系統”,效果界面如下: 3.查看某一天的第一條記錄和最後一條記錄就是相應的開關機記錄啦~

原创 autograd自動求導機制

本文是對http://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html的部分翻譯以及自己理解的部分,如有錯誤,歡迎指正。對於pytorch中的所有神經網絡(nn)而言最

原创 windows系統BleiCorpus 數據集加載出錯

機器學習系統設計,第四章主題模型的部分,當需要從gensim加載BleiCorpus數據集時,會出現io錯誤。 大家可以到http://www.cs.princeton.edu/~blei/lda-c/ap.tgz下載ap數據,之後放在指

原创 Python數據挖掘入門與實踐一:計算支持度和置信度

import numpy as np from collections import defaultdict #First,how many rows contain our premise:that a person is buyi

原创 機器學習第一個練手程序 基於決策樹的iris數據預測

決策樹分類器易於可視化並且易於理解。 iris數據集http://archive.ics.uci.edu/ml/datasets/Iris 這個數據集是非常典型的分類人工數據集,有3類花,每個數據有4個特徵(sepal lenght,se

原创 torch學習-訓練分類器

數據:當我們需要處理圖片,文檔,音頻或者視頻數據時,可以使用python的包將數據加載到numpy數組。然後將numpy 數組轉換成torch.*Tensor對於圖片,Pillow,OpenCV對於音頻,scipy和librosa對於文本