原创 吳恩達機器學習個人筆記(一)-線性迴歸

1單變量線性迴歸(Linear Regression with One Variable) 1.1 假設方程(Hypothesis)        線性迴歸屬於監督學習,大致是根據給定的數據集訓練出一個線性模型,構造成功後,輸入一個新的數

原创 java 將sql server的數據顯示在JTable上

SQL Server數據庫中的表如下圖1所示,表名爲stu_info                                                                                     

原创 吳恩達機器學習個人筆記(四)-神經網絡的學習

1 代價函數      一開始先引入神經網絡的新標記方法:   若神經網絡的樣本有m個,每個包含一組輸入和一組輸出信號,例如下列方式 其中和  都可能爲向量。表示爲神經網絡的層數,表示爲層神經網絡的神經元數,不包括該層的偏差單元 神經網絡

原创 吳恩達機器學習個人筆記(二)-邏輯迴歸

       第一部分講是線性迴歸,其大致目的是根據訓練數據得到模型,再輸入新的數據後得到預測的值,該值爲一個連續值。而邏輯迴歸於線性迴歸其實並沒有太大的區別,只不過邏輯迴歸是用於分類問題,二元分類居多,它對應訓練數據中的結果值往往爲 0

原创 吳恩達機器學習個人筆記(三)-關於神經網絡

1非線性假設(Non-linear Hypotheses)       之前學習的線性迴歸和邏輯迴歸都是線性的模型,並且它的的特徵都不會太多,這也是它們的缺點,就是如果訓練集的特徵太多的話,那麼計算效率就不好。如下面的例子        

原创 字符串分類-java

      晚上刷複試機試題,剛刷到一個題目,特此記錄。覺得題目還行,就怕到時上機會沒有時間。具體題目如下。      輸入一個字符串,要求輸出能把所有的小寫字符放前面,大寫字符放中間,數字放後面,並且中間用空格隔開,如果同種類字符間有不

原创 吳恩達機器學習個人筆記(五)-關於機器學習的誤差分析

1關於機器學習的改進         當我們使用機器學習算法解決實際問題時,可能在得到學習參數後,輸入新的數據後效果不是很理想。即運用訓練好了的模型來預測未知數據時發現了較大的誤差。那麼我們可以採用下面的方法來提高機器學習算法的性能。  

原创 Spark實戰項目2-電商分析平臺

概述 這是關於spark的一個稍微複雜的一個Demo,通過對一個電商網站模擬數據的處理,來加深spark的應用。首先產生模擬數據,模擬數據分爲本地數據和實時數據,後續的分析針對這兩種不同的數據有着不同的操作。總共有十多個小需求,通

原创 Spark streaming 與flume kafka整合

Spark streaming 與flume kafka整合創建 Kafka topic創建Flume agent創建LoggerGenerator日誌產生器Spark streaming 程序整個流程的啓動步驟 這篇博客主要記錄

原创 Spark實戰項目1-模擬網站流量分析與展示

Spark實戰項目1-模擬網站流量分析與展示1、概述2、流程2.1、數據生成2.2、啓動環境與創建Hbase表2.3、創建kafka的topic2.4、啓動Flume2.5、創建Spark Streaming 項目2.6、創建Sp

原创 共指消解(Coreference Resolution)論文解讀

1 相關概念 共指消解,也叫做共指解析,指的是在一短文本內多個表達段(術語不正確?)指向現實世界中的同一個實體。這是我的自己個人理解,具體相關官方的解釋及具體任務請查閱相關的資料,或者推薦觀看斯坦福大學的cs 224n 的課程中關

原创 VMware centos6.10設置靜態網絡,克隆虛擬機

將centos的語言設置爲中文 我安裝的爲 centos6.10 虛擬機,安裝過程的話十分簡單,網上的教程也有很多,自己可以去尋找。 爲了方便,第一步將centos的語言環境切換爲中文吧。 登錄進centos後,打開終端,切換爲r

原创 Linux 安裝jdk和hadoop

安裝jdk 在opt文件下先創建相關目錄 cd /opt sudo mkdir software #這是普通用戶需加上sudo,software用於存放安裝文件 sudo mkdir module

原创 循環神經網絡個人筆記

       循環神經網絡(RNN)是另一種比較流行的神經網絡,它對文本方面的應用表現非常敏感。一開始看的是吳恩達老師的視頻課,但是發現看了一段時間後還是非常的模糊。偶然看到臺灣大學李宏毅教授的上課視頻,感覺講的通俗易懂,豁然開朗。依據老

原创 吳恩達機器學習個人筆記(九)-異常檢測

       異常檢測也屬於無監督學習,但是看起來又有點像是監督學習,其實異常檢測依靠個人理解爲如果有一堆數據聚集在一個範圍內,這個範圍內的數據都爲正常(相比較與異常),如果新輸入一個數據,即要檢測該數據是否處於該範圍內。屬於正常的數據或