台部落wanghailong000

使用TensorFlow 構建簡單的線性模型，模型使用以及使用tensorboard顯示直接上代碼： #coding:utf-8 import tensorflow as tf import numpy as np from p

2020-05-31 23:04:38

mahout中數據挖掘算法是運行在hadoop之上的分佈式算法，可以分佈式運行也可以在單機上運行。這篇博文是本人你學習mahout算法的開始，以下是個人對mahout中實現的canopy的理解，如果錯誤，歡迎糾正首先下載mahout

2020-05-31 23:04:38

最小二乘法：我們以最簡單的一元線性模型來解釋最小二乘法。什麼是一元線性模型呢？監督學習中，如果預測的變量是離散的，我們稱其爲分類（如決策樹，支持向量機等），如果預測的變量是連續的，我們稱其爲迴歸。迴歸分析中，如果只包括一個自

2018-08-27 19:54:43

經常把PCA和SVD搞亂了，而且理解不是特別的深，特此記錄，歡迎指正先扯點線性代數的知識：（1）設M是n階方陣，如果對任何非零向量z，都有zTMz> 0，其中zT 表示z的轉置，就稱M正定矩陣。判定：如果M的特徵值全部爲

2018-08-27 19:54:14

http://blog.csdn.net/daunxx/article/details/51725086#最大後驗估計 https://mqshen.gitbooks.io/prml/content/Chapter4/bayesian/

2018-08-27 19:54:01

參考資料： 1、http://blog.csdn.net/daunxx/article/details/51725086 2、http://blog.csdn.net/dark_scope/article/details/855824

2018-08-27 19:53:58

經常會忘記怎麼在maven項目中正確配置日誌輸出配置，然後每次還要去查下，至此記錄以備忘： 1、在pom.xml文件夾下添加日誌依賴： <dependency> <groupId>org.slf4j</groupId>

2018-08-27 19:53:58

1、在mahout中，org.apache.mahout.utils.clustering.ClusterDumper類可以將聚類結果輸出，如果是打印在控制檯，則可以使用： ClusterDumper clusterdumper=new

2018-08-27 19:53:58

之前一直沒有在setting.xml中添加鏡像地址，用的是默認中央倉庫地址，下載速度非常的慢，在添加hadoop-core-2.6.0時，還沒有。然後就添加了國內鏡像地址。 1、打開eclipse->preferences->maven-

2018-08-27 19:53:58

K-Means主要有兩個最重大的缺陷——都和初始值有關： K 是事先給定的，這個 K 值的選定是非常難以估計的。很多時候，事先並不知道給定的數據集應該分成多少個類別才最合適。（ ISODATA 算法通過類的自動合併和分裂，得到較

2018-08-27 19:53:56