原创 推薦系統挖掘長尾了嗎?

今天突然想到一個一直沒仔細思考過得問題:推薦系統是用來挖掘長尾的嗎? 在項亮的《推薦系統實戰》中有這麼一段話:從物品的角度出發,推薦系統可以更好地發掘物品的長尾(long tail)。美國《連線》雜誌主編Chris Anderson在2

原创 當爬蟲被拒絕時(Access Denied)

      由於要準備測試數據,不得不大量爬取某個網站的內容。爲了防止被封,特意將爬蟲設計爲單線程同步的爬蟲。結果在爬了大約3萬個頁面的時候,對方發回Access Denied。等一段時間後再啓動爬蟲,結果還是Access Denied。

原创 Java併發編程實戰3-可見性與volatile關鍵字

1. 緩存一致性問題 在計算機中,每條指令都是在CPU執行的,而CPU又不具備存儲數據的功能,因此數據都是存儲在主存(即內存)和外存(硬盤)中。但是,主存中數據的存取速度高於外存中數據的存取速度(這也就是爲什麼內存條的價格會高),於是計算

原创 哈希表(hash table)的基本知識

1、哈希表的定義 哈希表又叫散列表,英文全稱爲hash table,是將關鍵字(key)映射到一個固定大小的數組的數據結構。它主要是通過散列函數(hash function)實現key->hash value的映射,並將key存放到適當的

原创 Java內存模型

1.內存模型 Java內存模型,往往是指Java程序在運行時內存的模型。 Java代碼是運行在Java虛擬機之上,由Java虛擬機通過解釋執行(解釋器)或編譯執行(編譯器)來完成,故Java內存模型,也是指Java虛擬機的運行時內存模型。

原创 線性表的操作

線性表的初始化、查找、插入、刪除操作的C語言版 #include <stdio.h> #define MAXSIZE 20 //線性表的最大長度爲20 typedef int ElemType; //線性表中的元素類型設爲int型

原创 LeetCode:Climbing Stairs解法

題目:          You are climbing a stair case. It takes n steps to reach to the top.          Each time you can either cli

原创 Java併發編程實戰2-線程安全

1. 定義 一個類是線程安全的,是指在被多個線程訪問時,類可以持續進行正確的行爲。 2. WHY 我們想要的是線程安全的程序,爲什麼在線程安全的開始講線程安全的類呢? 編寫線程安全的代碼,本質上就是管理對狀態的訪問,而且通常是共享的、可變

原创 Python字符串與數值轉換

一、Python可以很方便的將字符串類型抓換成數值型:       1.直接int         使用方法:int("somestring")              2.string庫        使用方法:          

原创 Python獲取網頁狀態碼

       在網頁爬取的時候,有時候需要判斷下要爬取網頁的網頁HTTP狀態碼,然後再進行相關的工作。 1.網頁HTTP狀態碼        HTTP狀態碼錶示HTTP協議所返回的響應狀態。具體參考:http://baike.baidu.

原创 自學編程的技術大牛是如何進谷歌的

       即將於下個月上映的電影《The Internship》吸引了不少人的眼球,其中最重要的原因就是在這個落魄大叔們在Google奮鬥的勵志故事中,觀衆們可以近距離接觸Google的企業文化,而“

原创 學習編程之前你應該瞭解的5件事

1.組織性 我希望我已經意思到了應該有一個有組織性的學習編程的方法,並且知道學習編程並不是孤立的去學,而是要在技術上構建技術。 我不應該在學習web的基礎技術——HTML/CSS之前就去學習更復雜的語言,比如Python. 你應該知道

原创 Eclipse通過maven構建SpringMVC項目

使用Eclipse新建SpringMVC項目的文章不少,按照文章一步一步操作,總會發現有不一樣的地方,因此決定詳細記錄一次自己在eclipse中通過maven構建SpringMVC項目的過程。 一、前提條件 jdk的安裝與配置 ecli

原创 C++中string類的常用函數

常用的函數: 1) =,assign()     //賦以新值 2) swap()     //交換兩個字符串的內容3) +=,append(),push_back() //在尾部添加字符4) insert() //插入字符5) era

原创 Bipartite graph/network學習

Bipartite graph/network翻譯過來就是:二分圖。 維基百科中對二分圖的介紹爲:二分圖是一類圖(G,E),其中G是頂點的集合,E爲邊的集合,並且G可以分成兩個不相交的集合U和V,E中的任意一條邊的一個頂點屬於集合U,另一