原创 線程:幾種同步方式

爲何要使用同步?      java允許多線程併發控制,當多個線程同時操作一個可共享的資源變量時(如數據的增刪改查),      將會導致數據不準確,相互之間產生衝突,因此加入同步鎖以避免在該線程沒有完成操作之前,被其他線程的調用, 

原创 Spark:Spark入門

概述 什麼是Spark Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的並行計算框架,Spark基於map reduce算法實現的分佈式計算,擁有Hadoop MapReduc

原创 Spark: Spark和Hadoop的區別--關於資源使用

Apache Spark的高性能一定程度上取決於它採用的異步併發模型(這裏指server/driver端採用的模型),這與Hadoop 2.0(包括YARN和MapReduce)是一致的。Hadoop 2.0自己實現了類似Actor的異步

原创 機器學習:PageRank算法--Scala實現

1. PageRank算法概述          PageRank,即網頁排名,又稱網頁級別、Google左側排名或佩奇排名。         是Google創始人拉里·佩奇和謝爾蓋·布林於1997年構建早期的搜索系統原型時提出的鏈

原创 機器學習算法學習一:線性迴歸

知識點: 線性迴歸概念梯度下降算法         l  批量梯度下降算法         l  隨機梯度下降算法         l  算法收斂判斷方法 1.1   線性迴歸 在統計學中,線性迴歸(Linear Regres

原创 面試:百度,阿里等--10/2015

十月百度,阿里巴巴,迅雷搜狗最新面試十一題 引言    當即早已進入10月份,十一過後,招聘,筆試,面試,求職漸趨火熱。而在這一系列過程背後浮出的各大IT公司的筆試/面試題則蘊含着諸多思想與設計,細細把玩,思考一番亦能有

原创 機器學習:實例1--推薦系統架構

推薦在電商和互聯網應用中已經應用的非常廣泛,相比於根據query進行主動的搜索,推薦是更加被動的由系統自動推出商品給用戶。搜索的意圖比較明顯,直接由query給出,而推薦需要計算猜測用戶的意圖,根據用戶歷史數據和當前行爲,基於各種模型推

原创 面試:創新工場,淘寶等面試題--09/2015

九月騰訊,創新工場,淘寶等公司最新面試三十題 引言        曾記否,去年的10月份也同此刻一樣,是找工作的高峯期,本博客便是最初由整理微軟等公司面試題而發展而來的。如今,又即將邁入求職高峯期--10月份,而本人也正在找下一份工作

原创 機器學習:算法介紹

這篇文章介紹幾個最流行的機器學習算法。現在有很多機器學習算法,困難的是進行方法歸類,這裏我們介紹兩種方法進行思考和分類這些算法。第一組算法是學習風格,第二組是在形式和功能上類似。 學習風格   一個算法基於問題建模有不同的方法,無