原创 機器學習(6):線性迴歸

這節主要介紹線性迴歸的相關知識,包括目標函數、最小二乘、L1、L2正則、梯度下降、AUC、logistic迴歸、softmax迴歸等。 迴歸主要是用來做擬合的,比如已知一部分房子的面積、幾居室及售價信息,來估計當前要售賣的房屋的大概價格等

原创 機器學習(2):概率論與貝葉斯先驗

概率論在機器學習中佔有一定的份量,單純的概率論是比較枯燥的,這節我們先從一個有趣的例子着手,引入生活中概率的應用,然後回顧經典的常用的概率公式、概率分佈,由基本的概率分佈引入機器學習常用的指數族分佈。其次由事件的相關、不相關、獨立,引入協

原创 tomcat設置不輸出catalina.out

在使用tomcat的過程中,日誌文件catalina經過一段時間的使用後,會變得越來越大,甚至會有幾個G的大小。對系統空間的使用造成了浪費。通過修改catalina.sh配置可以控制tomcat不生成該文件。只要將if [ -z "$CA

原创 機器學習(1):機器學習與數學分析

近期因工作需要,開始學習機器學習。學習心得體會,定期更新梳理出來,首次接觸,可能有理解和解釋不到位的地方,望批評指正,也算是自我提升。 提到機器學習,樓主第一反應是各種複雜的公式,各種搞不定的矩陣計算、積分、微分、熵等,甚至還專門爲此重新

原创 機器學習(5)、數據清洗和特徵選擇

正式進入機器學習啦,這節課還好,意外知道了莊家與賠率的計算(原來莊家真的是穩賺不賠呢,樓主表示很想設賭局去做莊);python庫好強大,Pandas包直接提供數據讀取和處理,Fuzzywuzzy支持字符串模糊查找,可用於字符串糾錯;知道了

原创 sql支持emoji表情符

由於工作需要,需要對sql表進行變更,使其支持emoji表情符號 親測下述方法有效: mysql對應的表編碼格式改成utf8mb4mysql對應的character_set_server 改成utf8mb4(show variables

原创 Python機器學習-感知機原理及代碼實現

***可任意轉載*** 博客搬家啦: 部分博客在github上,有詳細代碼。親測可執行。 具體見: https://github.com/xuena/python_machinelearning/blob/master/ pytho

原创 機器學習(4):python基礎及fft、svd、股票k線圖、分形等實踐

本節我們主要簡單介紹機器學習常用的語言–python。樓主本身是寫java的,在這之前對python並不瞭解,接觸之後發現python比java簡直要好用幾千倍。這裏主要通過常用的統計量、fft、股票k線圖及分形等樣例,介紹python的

原创 使程序在Linux下後臺運行,程序運行前後臺切換

轉自http://www.cnblogs.com/xianghang123/archive/2011/08/02/2125511.html 一、爲什麼要使程序在後臺執行 我們計算的程序都是週期很長的,通常要幾個小時甚至一個星期。我們

原创 機器學習(3):機器學習與線性代數(Linear Algebra)

這次我們來講講機器學習基礎第三部分:線性代數 其實機器學習基礎中,矩陣知識的應用很多,但是內容並不多,下面主要總結爲三個部分: 矩陣 特徵值和特徵向量 矩陣求導 我們先講一個在機器學習圖像預處理應用中典型的方法:奇異值分解(Sing