原创 Ubuntu 命令積累

終端字體: 放大:’Ctrl’+’shift ’+‘ + ’ 縮小:’Ctrl’+‘ - ‘ 切換賬號 到root:sudo -i 退出:exit 到普通用戶:su **

原创 梯度下降最優化算法綜述

梯度下降的變體 批梯度下降 一次更新需要計算整個數據集。速度慢,不允許在線更新模型。對於凸函數可以保證收斂到全局最小值,非凸收斂到局部最小值。 隨機梯度下降 一個樣本更新一次參數。速度快,可用於在線學習。頻繁的更新導致一個大的方差

原创 關於netlfix的學習資料收集

源碼分享: /Netflix-Prize Introduction to Restricted Boltzmann Machines Netflix prize

原创 今日頭條17研發崗筆試

頭條的2017校招開始了!爲了這次校招,我們組織了一個規模宏大的出題團隊,每個出題人都出了一些有趣的題目,而我們現在想把這些題目組合成若干場考試出來,在選題之前,我們對題目進行了盲審,並定出了每道題的難度系統。一場考試包含3道開放性題目,

原创 歡迎使用CSDN-markdown編輯器

歡迎使用Markdown編輯器寫博客 本Markdown編輯器使用StackEdit修改而來,用它寫博客,將會帶來全新的體驗哦: Markdown和擴展Markdown簡潔的語法 代碼塊高亮 圖片鏈接和圖片上傳 LaTex數學公式 UM

原创 《Wide & Deep Learning for Recommender Systems》

推薦系統: 檢索:機器學習模型+人工規則,根據Item特徵和query生成候選集。 排序:wide&deep模型對候選集中的query-Item對進行打分排名。 排序模型: 模型原理: wide:廣義線性模型: 優點:簡單、擴展

原创 Hadoop單機僞分佈式安裝

Hadoop僞分佈式:這種模式是在一臺機器上各個進程運行Hadoop的各個模塊,僞分佈式的意思就是雖然各個模塊是在各個進程上分尅運行的,但是隻是運行在一個操作系統上,並不是真正的分佈式。 關閉防火牆 su root service ipt

原创 DSSTNE

官方文檔依次建立,so easy 文檔 cudn安裝沒有給定教程,推薦參考 作者寫的很詳細,遇到的問題和我一樣,瞬間得到解決 由於個人gpu爲Pascal架構,查了一下是比費米級和開普勒更高級的新的gpu,所以在運行測試案例時遇到問題

原创 今日頭條18春招算法筆試

存在n+1個房間,每個房間依次爲房間1 2 3…i,每個房間都存在一個傳送門,i房間的傳送門可以把人傳送到房間pi(1<=pi<=i),現在路人甲從房間1開始出發(當前房間1即第一次訪問),每次移動他有兩種移動策略: A. 如果

原创 京東2016招聘 數據開發、數據研究、算法 崗位

思路:動態揹包問題 import java.util.*; class Sugar{ int cat; int x; Sugar(int cat,int x,int index){ this.ca

原创 SQL

mysql (1)控制檯單句執行 (2)sql文件執行 (3)navicat_mysql python 連接 mysql hdfs+derby+spark.sql(.enableHiveSupport()) hdfs+mysql+

原创 今日頭條18春招第二批算法筆試

作爲一個手串藝人,有金主向你訂購了一條包含n個雜色串珠的手串——每個串珠要麼無色,要麼塗了若干種顏色。爲了使手串的色彩看起來不那麼單調,金主要求,手串上的任意一種顏色(不包含無色),在任意連續的m個串珠裏至多出現一次(注意這裏手串是一個環

原创 大數據開發筆試題

系統抖動: 在請求分頁存儲管理中,從主存(DRAM)中剛剛換出(Swap Out)某一頁面後(換出到Disk),根據請求馬上又換入(Swap In)該頁,這種反覆換出換入的現象,稱爲系統顛簸,也叫系統抖動。產生該現象的主要原因是置換算

原创 今日頭條18校招第一批算法筆試

給定一個數組序列, 需要求選出一個區間, 使得該區間是所有區間中經過如下計算的值最大的一個: 區間中的最小數 * 區間所有數的和最後程序輸出經過計算後的最大值即可,不需要輸出具體的區間。如給定序列  [6 2 1]則根據上述公式

原创 Python for ML 筆記

1. 正則化 正則化是解決特徵共線性、過濾數據中噪音和防止過擬合的有效手段。正則化背後的原理是引入額外的信息(偏差)老懲罰過大的權重,起到偏差-方差平衡。 2.邏輯斯蒂迴歸 VS SVM 在解決現實的分類問題時,線性邏輯斯蒂迴歸和線性