台部落XiaoQQin1

1單變量線性迴歸(Linear Regression with One Variable) 1.1 假設方程(Hypothesis) 線性迴歸屬於監督學習，大致是根據給定的數據集訓練出一個線性模型，構造成功後，輸入一個新的數

2020-06-16 12:15:03

SQL Server數據庫中的表如下圖1所示，表名爲stu_info

2020-06-16 12:15:03

1 代價函數一開始先引入神經網絡的新標記方法: 若神經網絡的樣本有m個，每個包含一組輸入和一組輸出信號,例如下列方式其中和都可能爲向量。表示爲神經網絡的層數，表示爲層神經網絡的神經元數，不包括該層的偏差單元神經網絡

2020-06-16 12:15:03

第一部分講是線性迴歸，其大致目的是根據訓練數據得到模型，再輸入新的數據後得到預測的值，該值爲一個連續值。而邏輯迴歸於線性迴歸其實並沒有太大的區別，只不過邏輯迴歸是用於分類問題，二元分類居多，它對應訓練數據中的結果值往往爲 0

2020-06-16 12:15:03

1非線性假設(Non-linear Hypotheses) 之前學習的線性迴歸和邏輯迴歸都是線性的模型，並且它的的特徵都不會太多，這也是它們的缺點,就是如果訓練集的特徵太多的話，那麼計算效率就不好。如下面的例子

2020-06-16 12:15:03

晚上刷複試機試題，剛刷到一個題目，特此記錄。覺得題目還行，就怕到時上機會沒有時間。具體題目如下。輸入一個字符串，要求輸出能把所有的小寫字符放前面，大寫字符放中間，數字放後面，並且中間用空格隔開，如果同種類字符間有不

2020-06-16 12:15:02

1關於機器學習的改進當我們使用機器學習算法解決實際問題時，可能在得到學習參數後，輸入新的數據後效果不是很理想。即運用訓練好了的模型來預測未知數據時發現了較大的誤差。那麼我們可以採用下面的方法來提高機器學習算法的性能。

2020-06-16 12:15:02

概述這是關於spark的一個稍微複雜的一個Demo,通過對一個電商網站模擬數據的處理，來加深spark的應用。首先產生模擬數據，模擬數據分爲本地數據和實時數據，後續的分析針對這兩種不同的數據有着不同的操作。總共有十多個小需求，通

2020-02-22 09:56:47

Spark streaming 與flume kafka整合創建 Kafka topic創建Flume agent創建LoggerGenerator日誌產生器Spark streaming 程序整個流程的啓動步驟這篇博客主要記錄

2020-02-21 04:40:11

Spark實戰項目1-模擬網站流量分析與展示1、概述2、流程2.1、數據生成2.2、啓動環境與創建Hbase表2.3、創建kafka的topic2.4、啓動Flume2.5、創建Spark Streaming 項目2.6、創建Sp

2020-02-21 04:40:11

1 相關概念共指消解，也叫做共指解析，指的是在一短文本內多個表達段(術語不正確？)指向現實世界中的同一個實體。這是我的自己個人理解，具體相關官方的解釋及具體任務請查閱相關的資料，或者推薦觀看斯坦福大學的cs 224n 的課程中關

2019-09-15 16:54:52

將centos的語言設置爲中文我安裝的爲 centos6.10 虛擬機，安裝過程的話十分簡單，網上的教程也有很多，自己可以去尋找。爲了方便，第一步將centos的語言環境切換爲中文吧。登錄進centos後，打開終端，切換爲r

2019-09-02 16:41:04

安裝jdk 在opt文件下先創建相關目錄 cd /opt sudo mkdir software #這是普通用戶需加上sudo,software用於存放安裝文件 sudo mkdir module

2019-09-02 16:41:04

循環神經網絡(RNN)是另一種比較流行的神經網絡，它對文本方面的應用表現非常敏感。一開始看的是吳恩達老師的視頻課，但是發現看了一段時間後還是非常的模糊。偶然看到臺灣大學李宏毅教授的上課視頻，感覺講的通俗易懂，豁然開朗。依據老

2018-11-23 06:21:03

異常檢測也屬於無監督學習,但是看起來又有點像是監督學習，其實異常檢測依靠個人理解爲如果有一堆數據聚集在一個範圍內，這個範圍內的數據都爲正常(相比較與異常)，如果新輸入一個數據，即要檢測該數據是否處於該範圍內。屬於正常的數據或

2018-11-20 06:57:50