原创 機器學習(6)——模型選擇、參數選擇

當我們使用正則化的線性迴歸方法預測房價時,發現得到的模型應用於新的數據上時有很大誤差,這時,我們可以選擇一些解決方案,例如: 上圖中的這六種解決方案都有相應的條件,如圖中藍色字體所示。 【一、迴歸模型選擇】 我們引入一類數據集,叫做

原创 可視化學習之百度echarts工具(2)

柱狀圖與折線圖學習事例 <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <title>高考2006-2014</title> </hea

原创 主機遠程管理工具之Xshell 5 ——(1)

Xshell 是一個強大的安全終端模擬軟件,可以在Windows界面下用來訪問遠端不同系統下的服務器,從而達到遠程控制終端的目的,它支持SSH1, SSH2, 以及Microsoft Windows 平臺的TELNET 協議。SSH 爲建

原创 機器學習(3)——多變量線性迴歸

【一、多變量線性迴歸模型】 多變量線性迴歸是指輸入爲多維特徵的情況,例如: 在上圖中可看出房子的價格price由四個變量(size、number of bedrooms、number of floors 、age of home)決定

原创 主機遠程管理工具Xshell 5——(2)使用密鑰認證登錄

上一篇介紹的是使用密碼登錄,這一篇主要是針對使用密鑰認證(非對稱密鑰)登錄的相關步驟(windows主機登錄到linux虛擬機): 新建密鑰對,並將公鑰保存 雙擊用戶密鑰,選擇公鑰,將公鑰保存爲文件,並命名爲id_rs

原创 機器學習(2)——單變量線性迴歸

【Linear Regression with One Variable】 1. 單變量線性迴歸模型 單變量線性迴歸是通過給出的樣本變量與輸出,預測一個變量的對應輸出,屬於監督學習。單變量與預測輸出之間的函數關係的一般化定義如下: 我們

原创 機器學習(4)——logistic regression

【一、邏輯迴歸模型】 邏輯迴歸不同於線性迴歸,它實際上一種分類方法,用於二分類問題(y=0或者1)。邏輯迴歸模型如下: 即當>=0.5時,預測輸出值y=1;否則預測輸出值y=0;且有: 【二、決策邊界】 所謂Decision B

原创 linux之vm tools安裝

vmware tools 安裝步驟: 打開VMware啓動RedHat,在VMware的上邊菜單欄單擊“虛擬機”–>安裝VMware Tool 這時RedHat中會自動掛載出一個光驅圖標,雙擊圖標,光驅裏面的文件有VMwareTool

原创 尋找兩個串的最長公共子序列

思路: 較短串從前向後比較 較長串從後往前比較 代碼實現: #include <iostream> #include <string> using namespace std; string str1="acbac";

原创 機器學習(5)——過擬合問題

下面主要總結線性迴歸與邏輯迴歸下的過擬合問題。 【過擬合問題的定義】 【過擬合問題的解決方法】 怎樣解決過擬合問題呢?兩個方法: 1. 減少feature個數(人工定義留多少個feature、算法選取這些feature) 2.

原创 Django 環境搭建

步驟: 首先安裝Python(版本:python-2.7.10,下載地址:https://www.python.org/downloads/) 上面的這個Python版本自帶pip,我們使用cmd命令進入命令行,並進入到pip.exe所

原创 數據挖掘——聚類算法kmeans整理

【 kmeans算法原理】 隨機選取k箇中心點 遍歷所有數據,將每個數據劃分到最近的中心點中(根據距離的大小進行劃分,即計算每個樣本點到所有中心點的距離,選擇距離最小的那個) 計算每個聚類的平均值,並作爲新的中心點 重複2-3,直到這k

原创 找出有序數組中的絕對值的最小值

假設數組是從小到大排序,數值可能爲負數、0、正數。 思路一 可以一次性遍歷一遍,找出絕對值最小值,此時時間複雜度爲O(N),缺點是沒有利用數組是有序的這一特點。 思路二 數組有序,可以利用二分查找的特性。中間的數是正數,往後找;中間的數是

原创 redhat中ifconfig命令無效怎麼解決

在RedHat中, 打開終端, 運行 “ifconfig” 命令, 如果給出的提示是 “command not found”, 那裏我們可以按下面的方法來解決: 輸入 ifconfig 命令的絕對路徑, ifconfig在是/sbin這

原创 可視化學習之百度echarts工具(1)

ECharts,縮寫來自Enterprise Charts,商業級數據圖表,它是一個純Javascript的圖表庫,我們在使用過程中只需要引入該圖表庫,使用它提供的一些組件,加上自己的數據,就能用了。 我在學習時選擇它推薦的“模塊化單文件