原创 信息指紋及其應用

任何一段信息文字,都可以對應一個不太長的隨機數,作爲區別它和其它信息的指紋(Fingerprint)。只要算法設計的好,任何兩段信息的指紋都很難重複,就如同人類的指紋一樣。信息指紋在加密、信息壓縮和處理中有着廣泛的應用。 我們在圖論和網絡

原创 Xen 虛擬機遷移方案

Xen虛擬機兩大遷移方法詳解 一、遷移的準備工作   在進行遷移之前,有一些準備工作要做,主要是目的主機和源主機及其網絡方面。下面分別加以介紹。   首先,在源主機和目的主機方面,兩者必須都運行有Xen和xend守護進程。必須確保目的主

原创 工作總結@2010.3.16

在CUDA中,一般的數據複製到的顯卡內存的部分,稱爲global memory。這些內存時沒有cache 的,而且,存取global memory所需要的時間(即latency)是非常長的,通常是數百個cycles. 如果我們的程序只有

原创 Xen Introduction

       guest OS是指Xen能夠操控的操作系統之一,domain是指一個運行中的虛擬機,在其上有一個guest OS在執行。我們稱Xen本身爲hypervisor,因爲它運行的特權級要比它所操控的guest OS中的super

原创 Google is leaving...

今天下午才羣裏看到google 散夥飯的字樣,突感不妙,前段時間的預測居然這麼快就 come true了 打開csdn,頭條便是《谷歌官方表態考慮退出中國》字樣,看來是真的了,同時,又看到下面的所謂幾個專家的views,而尤其百度的首席

原创 學習小結@10.3.17

  GPU的基本執行過程 目前支持的CUDA的Nvidia顯示芯片,它的shader部分都是由多個multiprocessors組成的。每個multiprocessor裏包含了八個stream processrs,其組成是四個四個一組

原创 如何確定網頁和查詢的相關性

我們還是看上回的例子,查找關於“原子能的應用”的網頁。我們第一步是在索引中找到包含這三個詞的網頁(詳見關於布爾運算的系列)。現在任何一個搜索引擎都包含幾十萬甚至是上百萬個多少有點關係的網頁。那麼哪個應該排在前面呢?顯然我們應該根據網頁和查

原创 布爾代數和搜索引擎的索引

發表者: 吳軍,Google 研究員  [建立一個搜索引擎大致需要做這樣幾件事:自動下載儘可能多的網頁;建立快速有效的索引;根據相關性對網頁進行公平準確的排序。我們在介紹 Google Page Rank (網頁排名) 時已經談到了

原创 ubuntu 自動生成 makefile

文件夾emit_signal 包含文件callback.c main.c callback.h emit_signal.glade 1. 進入相應的目錄 $cd emit_signal $autoscan   如果沒有安裝autosca

原创 餘弦定理和新聞的分類

餘弦定理和新聞的分類似乎是兩件八杆子打不着的事,但是它們確有緊密的聯繫。具體說,新聞的分類很大程度上依靠餘弦定理。 Google 的新聞是自動分類和整理的。所謂新聞的分類無非是要把相似的新聞放到一類中。計算機其實讀不懂新聞,它只能快速計算

原创 怎樣度量信息

發表者:吳軍,Google 研究員 前言: Google 一直以 “整合全球信息,讓人人能獲取,使人人能受益” 爲使命。那麼究竟每一條信息應該怎樣度量呢? 信息是個很抽象的概念。我們常常說信息很多,或者信息較少,但卻很難說清楚信息到底

原创 學習小結@10.3.15

  (1) CUDA:可伸縮並行編程模型 CUDA是一種並行編程模型和軟件環境,包含3個重要的抽象概念:線程組層次結構(warp、block、grid)共享存儲器、屏蔽同步。 CUDA是Nvidia的GPGPU模型,在此架構下,一個程序分

原创 New blog New life

     明天算法考試,今天才開始複習,不知道是胸有成竹還是已經對考試很隨意了。        公曆2009年應該算是比較陰霾的一年,踏入2010的第一天,凌晨就碰到了第一個good message,終於得到了Rank A,幸運終於又開始

原创 Xen 部署

採用VMware 6.5.0平臺linux爲2.6.21版本的fedora core 7Xen的版本爲3.4.2 我的安裝步驟: 1. 平臺選定剛開始選擇Fedora Core 6,當時考慮的是找一個不Xen3.4.2所支持linux版本