原创 機器學習相關基礎概念(基本術語)

機器學習主要任務是分類 機器學習算法有很多,最終決定使用某個機器學習算法進行分類首先要做的是算法訓練 訓練集:爲算法輸入的大量已分類數據 是用於訓練及其學習算法的數據集合 訓練集中有特徵和目標變量 特徵或者

原创 一些常用的機器學習算法

一些常用的機器學習算法 邏輯迴歸 邏輯迴歸是假設數據服從伯努利分佈,通過極大似然估計的方法,運用梯度下降算法作爲求解方法求解參數,達到對數據進行二分類或者多分類(softmax多項邏輯迴歸)目的,本質上還是線性迴歸,屬於廣義線性迴

原创 XGBoost相關常見面試題

XGBoost相關常見面試題 1 簡單介紹一下XGBoost 首先需要說一說GBDT,它是一種基於boosting增強策略的加法模型,訓練的時候採用前向分佈算法進行貪婪學習,每次迭代都學習一棵CART樹來擬合之前t-1棵樹的預測結

原创 Ubuntu修改apt鏡像源+安裝GCC

Ubuntu 18.04修改apt鏡像源 官方鏡像源實在慢的可憐,,,只怪國內牆太高,掛梯子都過不去了 遂直接換個鏡像源吧 找到 sources.list文件 先備份一下,免得改崩 sudo cp /etc/apt/sourc

原创 MACOS平臺上的MyEclipse2016安裝tomcat及一些問題解決

本來很早以前電腦上就已經裝了TomCat8.5的,結果導入到MyEclipse環境中時,最大支持8.0的,無奈只能重新下載tomcat8.0 第一步,下載安裝湯姆貓8.0 鏈接:https://tomcat.apache.org

原创 KNN算法 改進約會網站的配對效果

K-近鄰算法 優點:精度高,對異常值不敏感,無數據輸入假定 缺點:計算複雜度搞,空間複雜度高 適用範圍:數值型和標稱型 工作原理:存在一個樣本數據集合(訓練樣本集),並且樣本集中每個數據都有標籤,即我們知道樣本集中每以數據

原创 向Navicat導入本地sql文件出現錯誤解決

數據庫真是一門學問,由於做java 還有javaweb作業需要用到數據庫,所以正用正學習吧,不過遇到的問題很多,就比如把從navicat導出的sql文件再重新導入進去navicate中去,搞了好久總是不成功,總是出錯。 出現此

原创 MySQL5.6壓縮包安裝所踩的坑

相關軟件原版教程網盤鏈接 鏈接:https:// 鏈接pan .baidu.com/ s/1nvopA3Z 密碼: pcgb 要是鏈接失效的話,請留言()。 MySQL下載官方網站鏈接 https://dev.mysql.co

原创 《機器學習實戰二》K近鄰學習之手寫數字識別及檢測識別錯誤率

使用k-近鄰的手寫識別系統算法實現步驟 收集數據 準備數據 分析數據 訓練數據 測試算法 使用算法 首先還是按照書上的例子,將訓練集和測試集下載到本地, 此次只是爲了測試之前寫的識別器的錯誤率,並沒有實際對手寫字體進行識別,

原创 Myeclipse連接MySQL數據庫出現SSL問題

具體實現MyEclipse安裝JDBC驅動程序請看這位博主的博客 http://blog.csdn.net/xin917480852/article/details/52439858 在此就不一一敘說了直接說安裝完成後建立連接

原创 關於使用Pyinstaller打包生成可執行文件所遇到的問題

受老師委託,寫一個表格轉換word文檔的小程序,並打包發佈,前期業務實現倒未遇到太多問題,基本上 可以滿足需求,只是最後使用Pyinstaller打包生成exe可執行文件的時候遇到了衆多問題,下面主要把這次遇到的問題以及踩到的坑記

原创 特徵歸一化相關問題

爲什麼要對數值類型的特徵做歸一化 常用的歸一化方法 線性函數歸一化(原始數據線性變換,映射到[0,1]範圍,) Xnorm=X−XminXmax−XminX_{norm} = \frac{X-X_{min}}{X_{max} - X

原创 熵,聯合熵,條件熵,相對熵,互信息的定義

預備基礎概念 X : 隨機變量 x : 隨機變量X的具體取值 P(X) : 隨機變量X的概率分佈 P(X,Y) : 隨機變量X,Y的聯合概率分佈 P(Y|X) : 已知隨機變量X的情況下,隨機變量Y的條件概率分佈 P(X=x) =>

原创 Windows 7安裝GPU版本tensorflow(CUDA 9.0+cudnn7.4.1)GPU(NVIDIA Quarter K2000)

由於學習需要,手上有一臺圖形工作站,GPU是NVIDIA Quarter K2000的,就試着看看裝個GPU環境訓練 1 安裝前準備工作 在官網可以查到自己的GPU是否支持CUDA加速 一般算力在3.0的纔可以支持cudnn加速,如果

原创 Windows 7中爲anaconda添加python2內核

創建Python2的虛擬環境 打開anaconda prompt輸入 conda create -n py27 python=2.7 會在anaconda 的 envs目錄下創建此目錄 安裝ipykernel 在 anac