原创 poj1201(貪心+樹狀數組)

網上的題解都用啥差分約束系統。。。太高端,不會玩,額。。這題把數據按b的大小進行從小到大排序。然後每次取最右邊的數據,用樹狀數組維護,真的是很方便#

原创 poj3667(線段樹區間合併)

這是典型的線段樹區間合併。知道lazy標記的同學比較好懂一點,這其中就用到了lazy標記。話不多說,上代碼#include <iostream> #

原创 hdu5400

大水題,但wa了幾次。。。 思路:用一個數組保存相鄰兩數的差,然後過一遍數組,連續的b2可以,連續的b1之後再連續的b2也可以.。這題的個數用longlong,這個注意到了,我用len表示來連續的個數,sum+=(len+1)*len/2

原创 hdu5328(不用dp)

這題咋一看會想到dp,但可以不用,可以開闢兩個數組,一個數組表示給出的數組裏面,相鄰兩數的差,另一個數組表示相鄰兩數的比值。然後只需要遍歷這兩個數組

原创 hdu3015

此題和poj1990一樣的思路,排序三次,之後的套上就行,一開始沒用long long 導致wa了7 8次不開心#include <iostream

原创 hdu3374

這題有兩個要求,一是求最大最小的位置,二是求最大最小出現的次數,次數是比較簡單的。次數需要判斷這個字符串本身是否是由重複字符串組成。這個比較好求,用kmp算法。求助next【】數組。用字符串長度了len減去next【】數組最後一個元素的長

原创 hdu1828(線段樹+掃描線求周長)

這題不錯,可以更加深入的瞭解線段樹掃面線算法,大家之前可能做過掃描線求矩形面積,但因爲求面積的某些侷限性,一些細節不用寫到就可以a,但求周長不行。 首先,介紹下求周長的思路,從左往右在每一次插入一條邊後,周長並的累加值==新增的橫邊+新增

原创 hdu3642(三維轉二維掃描線)

 比較有意思的一題,剛開始做這題的時候想到的low方法是掃描面,但這種肯定不對。。。想了一段時間,突然發現。。。枚舉每個z點,就可以轉化爲二維上的問題。 這題還有一點需要注意,不能簡單的枚舉每個z點,算每個面上的重疊面積,這點是錯的,具體

原创 hdu3308(線段樹,區間合併)

剛開始看到題目時嚇到了。。。要求上升子序列,以爲是道神題,但仔細一看原來是連續上升子序列,果斷變爲low題了。在網上看了一些大神的代碼,感覺自己的代碼簡潔了不少,以前學c的一些小知識點也回顧了一遍,繼續奮

原创 spark官方文檔

保存一下   http://www.apache.wiki/pages/viewpage.action?pageId=2883613

原创 TF-IDF算法

概率    TF-IDF是一種用於資訊檢索於諮詢勘測的常用加權技術。TF-IDF是一種統計方法,用來衡量一個詞對一個文件集的重要程度。字詞的重要性與他在文件中出現的次數成正比增加,與他在文件集中出現的次數成反比下降。 原理    TF:在

原创 數值,向量,矩陣求導

https://pan.baidu.com/s/1mhAdIek u48r

原创 scala實現Kmeans算法

  好久沒有寫博客了,雖然並沒有多少人看。kmeans的思想大家自己去查找,我就不一一敘述了。kmeans之所以不能達到全局最優,是因爲他的cost函數是一個非凸的函數,找不到最低點那個位置。kmeans的初始位置很重要,本片博客採取的就

原创 spark mlib中的隨機梯度下降算法

線性迴歸是利用被稱爲線性迴歸方程的最小平方函數對一個或多個自變量和因變量之間關係進行建模的一種迴歸分析 關於線性迴歸,邏輯迴歸的一些講解 http://blog.csdn.net/viewcode/article/details/8794

原创 scala下串行實現em算法

本人編寫的一維em算法 初學em算法時被各種公式嚇到,學的過程也不是很順利(本人數學渣渣),好不容易弄懂了大概,現在來編寫個程序來檢驗下 import scala.math object Main { val data=Array(1