原创 算法-並查集-買女裝

1.題目描述 小莊是個女裝愛好者,有一天他跑到女裝店去買女裝。商店裏有編號從1到n的n件衣物飾品,每一件都有固定的魅力加成值。 老闆告訴他,其中某些商品必須搭配購買,而且商品之間的搭配關係具有傳遞性,若A與B搭配且B與C搭配,則A與C也

原创 數字三角形問題

1. 題目  給定一個由n行數字組成的數字三角形,如下圖所示:               7             3   8           8   1   0        2   7   4   4     4   5  

原创 PageRank算法詳解

轉載自:http://www.cnblogs.com/fengfenggirl/p/pagerank-introduction.html PageRank對網頁排名的算法,曾是Google發家致富的法寶。以前雖然有實驗過,但理解還是不

原创 CSDN博客積分規則

博客積分是CSDN對用戶努力的認可和獎勵,也是衡量博客水平的重要標準。博客等級也將由博客積分唯一決定。積分規則具體如下: 1、每發佈一篇原創或者翻譯文章:可獲得10分; 2、每發佈一篇轉載文章:可獲得2分; 3、博主的文章每

原创 基於MapReduce框架的K-means算法實現

1.  K-means算法的非形式化描述 非定一個N個對象的集合,要將這些對象分組到K個簇中,k-means算法需要完成以下 步驟: 1)  將N個對象劃分到K個非空子集。 2)  計算當前分區中心的簇質心(質心是這個簇的中心點或平均點)

原创 LeetCode 402. Remove K Digits

1.題目 402. Remove K Digits Given a non-negative integer num represented as a string, remove k digits from the number so

原创 基於MapReduce的二次排序

1.需求 現給出一系列訂單數據,要求用“mapreduce自己的排序機制”將每條訂單數據中成交額最大的數據排在第一位顯示出來。 數據源: 訂單id 商品id 成交金額 Order_0000001 Pdt_01 222.8 Order_0

原创 Eclipse本地運行與遠程提交MapReduce程序的步驟詳解

1.下載eclipse插件 此插件只是方便我們在eclipse上查看hdfs集羣上的數據而已。 1.1 下載對應版本的 hadoop-eclipse-plugin-XXX.jar 並將其複製到eclipse下的plugin的目錄下,最後

原创 map端join算法實現

1.需求 現在有orders與products兩張表,路徑分別爲H:/大數據/mapreduce/mapjoin/input/ H:/大數據/mapreduce/mapjoin/   其數據內容分別是 orders id pid  mo

原创 LeetCode 410. Split Array Largest Sum

1.題目 410. Split Array Largest Sum Given an array which consists of non-negative integers and an integer m, you can sp

原创 樣本收集問題JAVA實現

1.題目 機器人Rob 從方形區域F 的左上角A點出發,向下或向右行走,直到右下角的B 點,在走過的路上,收集方格中的樣本。Rob 從A點到B 點共走2次,試找出Rob 的2條行走路徑,使其取得的樣本總價值最大。  Input

原创 Hive疑難雜症

1.Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient Logging initialized using config

原创 MapReduce實現尋找共同好友

1.需求 給出A-O個人中每個人的好友列表,求出哪些人兩兩之間有共同好友,以及他們的共同好友都有誰 原始文件: A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,

原创 Hive安裝步驟

1.官網下載HIVE的壓縮包 https://hive.apache.org/ 2.解壓 tar -zxvf apache-hive-1.2.1-bin.tar.gz -C ~/apps 3.安裝MySql (其目的是保存hive數

原创 哈夫曼樹的最長帶權路徑WPL算法

1.題目 給出一組樹節點集合(每個節點均有權值),求其最長帶權路徑 2.思路 1)首先利用給出的集合構造Huffman樹 將原節點集合按其權值從小到大排序,之後每次抽取前兩個(最小權值)的節點剔除集合,並將兩個權值想加之後賦給新的節點,