原创 某一IT公司要求的python面試題

使用python編寫一個網站爬蟲程序,支持參數如下: spider.py -u url -d deep -f logfile -l loglevel(1-5) --testself -thread number --dbfile f

原创 SICP 讀書筆記——第 二 章 構造數據抽象

構造數據抽象 現在到了數學抽象中最關鍵的一步:讓我們忘記這些符號所表示的對象。(數學家)不應該在這裏止步,有許多操作可以應用於這些 符號,而根本不必考慮它們到底代表這什麼。 ————Hermann Weyl

原创 About Lasso 思想及算法

最近在看一些優化算法,發現這個收集的資料不錯,備份在這。是從這裏複製來的。 The Lasso Page 也有不錯的資料。 1、只有這麼幾個人在做LASSO,他們都是大牛,你可以直接GOOGLE他們的主頁,看他們在這塊發了什麼文章。

原创 【58同城招聘】資深算法工程師

鏈接在此 58同城招聘啦!找工作,就來這個神奇的網站吧! 發簡歷到我們的郵箱,我一定會耐心看的,看完給您回覆哦! 記住我的郵箱:[email protected] 崗位描述: 58同城有最大規模的生活服務廣告信息發佈

原创 SICP 讀書筆記——第 二 章 構造數據抽象——第 1 節 數據抽象導引

1. 數據抽象導引 數據抽象:將一個複合數據對象的使用 和 該數據對象怎樣由更基本的數據對象構造起來的細節隔離開。 數據抽象的基本思想就是設法構造出一些使用複合數據對象的程序,使它們就像是在“抽象數據”上操作一樣。 1.1 實例:有

原创 redis源碼閱讀[1]

主要介紹redis源碼的目錄結構。 常用數據結構 adlist.h/adlist.c:list定義,雙向鏈表 dict.h/dict.c:字典數據結構 (內存hash表) intset.h/intset.c:整數範圍內的集合set數

原创 MLib-Optimization模塊代碼閱讀[to be Continued]

常用機器學習算法最終都會需要求解一個無約束凸優化問題 minw∈ℝdf(x) 這個模塊實現了常用的優化問題求解算法,例如梯度下降法,LBFGS算法等。各種不同的線性求解算法區別在於2點: 下降方向(梯度方向、牛頓方向等) 步長(wo

原创 MLlib - Linear Methods[to be Continued]

Mathematical formulation 大多數機器學習算法的求解最終都轉化爲一個凸優化問題,例如邏輯斯特迴歸算法中採用極大似然估計權重參數 w 。一般這個優化問題可以寫作:minw∈ℝdf(w) ,而目標函數則如下: f(w

原创 configure && make && make install

原文見這裏 這裏主要介紹linux下的軟件安裝過程,包括configure、make、make install三個過程。 首先會獲取軟件安裝包,一般是tgz壓縮包。 tar xfvz game.tgz 解壓縮,接着執行configur

原创 ML相關資源蒐集整理

這裏主要蒐集推薦、搜索、計算廣告等會用到的機器學習算法相關資源。包括各個它們的背景知識以及常用算法,其中算法包含了模型算法和求解兩個方面 推薦相關 github上Flowerowl整理的 Big-Data-Resources 資源列表

原创 redis源碼閱讀[0]

工作中有用到redis,翻完《redis設計與實現》的大部分章節,對redis有一定了解了。對於我這種編程菜鳥,redis源碼是極好值得一看的,學習下代碼風格,程序設計等。看源碼瞭解細節,幫助優化程序。按照侯老師的說法:源碼面前,了無祕密

原创 記一筆

好久不來,記一筆。 光看書不寫寫也是不行。 看書的,多敲敲筆記。 寫代碼的,多寫寫思考的東西,筆記。

原创 MLlib - Classification and Regression

MLlib-Classification and Regression MLlib實現瞭解決二分類,多分類,迴歸分析問題的一些常見方法。下表具體展示了針對各個問題實現的一些方法: Problem Type Supported M

原创 LR回憶錄

廣告部門點擊率預估採用的是LR算法。以前學習算法都侷限於理論,這次是實戰。回憶總結下 LR,以後備用。 這裏結合點擊率預估整理下LR算法,爲以後實踐應用提供參考。 內容包括LR建模,L1&L2範數,LR和NB聯繫,LR求解以及實踐中遇到的

原创 redis源碼閱讀[3]

本節主要介紹RedisServer的初始化過程,即redis啓動過程中的initServer()函數(redis.c文件)。 initServer()主要初始化一些服務器信息,包括創建事件處理對象、db數據結構、socket等。 vo