台部落zhangyuming010

1、離線PCA PCA是一種最基本的降維算法，在機器學習中被廣泛使用。它是一種線性降維，其基本思想是：對大量的數據，找到其主成分，主成分的個數小於原始數據的維度，然後將原始數據投影到主成分張成的空間中，可減小數據的維度。

2020-07-07 15:50:47

這道題是leetcode上新出的題目，有興趣做了一下，輕鬆通過，具體代碼如下所示 class Solution { public: int rangeBitwiseAnd(int m, int n) { stack

2018-08-22 21:41:15

廣義線性模型的流式學習 1. 廣義線性模型的組成在這篇博客中，我們將介紹機器學習中最常用的一大類模型：廣義線性模型。廣義線性模型包含線性模型、邏輯斯特迴歸、嶺迴歸、Lasso等。這幾種模型在spark中均有實現，然而，還未有基於sp

2018-08-22 21:41:14

繼前期完成廣義線性模型的在線流式機器學習的代碼後，我們對spark的mllib中的推薦系統這一部分比較感興趣，因爲推薦系統這一部分在現實生活中也非常實用，尤其是基於地理位置的在線推薦系統目前非常火熱，很多商業軟件如大衆點評，淘點點

2018-08-22 21:41:14

推薦系統必須有快速反應能力，衆所周知，現在網絡上充滿着各種各樣的信息，而且數量相當龐大，並且還在以相當驚人的速度增長，如何在海量的信息中快速的找到我們所需要的信息並快速的反饋給用戶，是互聯網推薦系統需要考慮的一個十分重要的問題。

2018-08-22 21:41:14

在前期搭建好spark、scala平臺和學習基於python的logistic流式機器學習例程後，這一週正式基於spark做一個基於logistic的流式機器學習的實現。一、spark streaming例程首先嚐試spark st

2018-08-22 21:41:14

軟件配置：操作系統：centos 6.4（如下圖）內核版本：2.6.32（如下圖） Java版本：1.6（如下圖）一、下載並安裝scala 從

2018-08-22 21:41:14

看到最近leetcode出了shell編程訓練題，有興趣做了一下，發現還是蠻難的，提供個參考答案，希望發現更好的shell代碼的同學能回覆哈。 sed -e "s/[ ]*$//g" words.txt | sed -e "s/^[

2018-08-22 21:41:14

在完成尹老師最初給我們佈置的基於spark streaming的logistic學習後，我們與尹老師進行了一定的交流。尹老師主要對前期工作的提出了一些意見，如scala程序不規範、對廣義線性模型理解不夠透徹等問題。我們自己在編程的過程中也

2018-08-22 21:41:14

在前面搭建好scala和spark的開發環境之後，迫不及待地想基於spark運行一下scala程序，於是找到了spark官方網站的鏈接（http://spark.apache.org/docs/latest/quick-sta

2018-08-22 21:41:14

自6月底申請項目到現在9月初撰寫項目結題報告，眨眼一瞬間兩個半月很快成爲過去，在這兩個半月的時間裏，在不斷的看文章和調試代碼，首先我得感謝和我一起合作的賴百勝同學與我並肩作戰，是他給了我一次次戰勝bug的勇氣，是他讓我感覺到整個項

2018-08-22 21:41:11

在和導師第一次交流後，導師建議我們先從機器學習中最簡單的logistic迴歸開始入手，並學習流式的機器學習算法再將其應用於spark平臺上，本文先分析logistic迴歸的理論依據，再借鑑《機器學習實戰》一書中基於python的logis

2018-08-22 21:41:11

從7月初到現在已經快一個月左右了，我們的項目總體進展比較順利，本次中期檢查報告主要分爲兩部分：前期工作總結和後期展望。一、前期工作總結項目前期我們的工作主要是圍繞“基於spark的流式廣義線性模型算法實現”這個目標去做的。萬事開頭難，

2018-08-22 21:41:11

這道leetcode最新出的題，貌似也不是很難，用廣度優先搜索即可，參考代碼如下。 class Solution { public: vector<int> rightSideView(TreeNode *root) {

2018-08-22 21:41:10