原创 歸一化處理數據 python

源自 machine learning in action 1.原因: 例如在用 KNN 算法處理數據時,比如有兩個特徵,一個特徵的取值範圍爲0~1,另一個取值範圍爲1W 以上,那麼用歐式距離計算的話第一個特徵的影響幾乎就會微不足道,

原创 LeetCode754(Reach a number) Java 代碼.

1.題目描述: 給定一個目標整數(正、負均可)。問到達目標整數所需要的最少移動次數是多少? 移動規則:第 i次移動可以移動i 步,每一步可以向左或者向右移動(剛開始這個英文沒看仔細,結果糾結半天)。 2. 例子1: 輸入: tar

原创 KNN算法,k 鄰近(python)

1.原理 利用歐式距離計算各個特徵的相似度,歐式距離越小,相似度越大。 2.代碼: from numpy import * import operator from os import listdir def kNNClassify(

原创 python 處理 txt 文檔數據

1.工具, numpy 包, 源自 machine learning in action 2.代碼: from numpy import * def file2matrix(filename): fr = open(filena

原创 決策樹python

1.準備(linux): (1)sudo apt-get install graphviz (2)sudo pip install graphviz (3)sudo pip install pydotplus 2.評判標準(crit

原创 leetcode 695(Max Area of Island)

1.描述 給定一個二維數組,找到垂直或水平方向連續1最多的個數,也就是島的面積。 例如給定二維數組: [[0,0,1,0,0,0,0,1,0,0,0,0,0], [0,0,0,0,0,0,0,1,1,1,0,0,0], [0

原创 python基礎

1.兩種方法創建二維數組 : [ 10 11 12 20 21 22 30 31 32 ] 代碼: #!/usr/bin/python import numpy as np import matplotlib as m

原创 ARIMA差分自迴歸模型python代碼

1.差分自迴歸模型的基本思想:將預測對象隨時間推移而形成的數據序列視爲一個隨機序列,用一定的數學模型來近似描述這個序列。這個模型一旦被識別後就可以從時間序列的過去值以及現在值來預測未來值。不能對時間序列直接採取線性迴歸算法是因爲時間序列所

原创 解決jparepository.saveandflush插入不保存的情況

jparepository.saveandflush有時候想 update數據,但是發現是insert數據並沒有 update。 原因:在你的 Entity 裏面並沒有 set主鍵的字段。 解決:將Entity裏面的主鍵同樣 set到