原创 Bag of words模型

原文鏈接:http://blog.csdn.net/pennyliang/article/details/4325664        Bag of words,也叫做“詞袋”,在信息檢索中,Bag of words model假定

原创 新浪微博API使用之python接口的使用

新浪微博的API提供了多種語言的接口,其中python的接口由網友@廖雪峯提供。 附下載地址以及說明:http://michaelliao.github.com/sinaweibopy/ 說明文檔:https://github.com/m

原创 fedora17設置快捷鍵-快捷啓動終端

左上角Activities->Applications【應用程序】,然後最下面:System Settings【系統設置】,中間:Key board【鍵盤】,->Short cuts【快捷鍵】-->Custom Shortcuts【自定義

原创 新浪微博API使用初步介紹——解決回調地址的問題

下載下sina的API後,感覺說明的還是不夠明白……尤其是那個回調地址,蛋疼的要死啊。。 首先,下載JDK,java的。http://code.google.com/p/weibo4j/ 導入工程,不會導入的見這兒:http://blog

原创 SUSE11+python2.6離線安裝rsa模塊

離線安裝: 首先,去https://pypi.python.org/pypi/rsa/3.1.1下載安裝包rsa-3.1.1.tar.gz (md5) 採用源碼安裝的模式 解壓後,進入rsa-3.1.1文件夾,在root下執行:pytho

原创 抽取wiki內容以及簡體中文轉換爲繁體中文

抽取wiki內容 今天測試了網上分享的一個工具:WikiExtractor.py 這是一個抽取wiki內容的工具,是意大利人用 Python 寫的一個維基百科抽取器,使用非常方便。下載Wiki Dump 之後(鏈接是:http://do

原创 〖天涯頭條〗經濟的邏輯

原文地址:http://bbs.tianya.cn/post-develop-1456018-1.shtml 快年底了,也得給文盲們發點福利。特別是三中全會即將召開。外界對改革前景好象期望很大。各種牛鬼蛇神都開始出來指點江山。比如房價要

原创 Linux內存管理及其基本概念

1. 基本概念 1.1 地址 (1)邏輯地址:指由程序產生的與段相關的偏移地址部分。在C語言指針中,讀取指針變量本身值(&操作),實際上這個值就是邏輯地址,它是相對於你當前進程數據段的地址。 (2)線性地址:段中的偏移地址(邏輯地

原创 操作系統筆試題

1.基本知識點:1) 操作系統是控制和管理計算機軟硬件資源,以儘量合理有效的方法組織多個用戶共享多種資源的程序集合。2) 操作系統的基本功能: (1)處理機管理。主要功能包括進程控制、進程調度、進程同步和進程通信。 (2)存儲器管理。主要

原创 面試問題集錦二

死鎖的四個必要條件 操作系統中有若干進程併發執行,它們不斷申請、使用、釋放系統資源,雖然系統的進程協調、通信機構會對它們進行控制,但也可能出現若干進程都相互等待對方釋放資源才能繼續運行,否則就阻塞的情況。此時,若不借助外界因素,誰也不能

原创 找工作-亂七八糟資料

什麼是外部碎片,內部碎片? 外部碎片,是由於大量信息由於先後寫入、置換、刪除而形成的空間碎片。爲了便於理解,我們將信息比作貨物,將存儲空間比作倉庫來舉例子。假設,我們有編號爲1、2、3、4、5、6的6間倉庫庫房,前天送來了一大宗貨,依次裝

原创 PHP無法訪問遠程mysql的問題

首先說明,遠程服務器是可遠程訪問的。 我遇到的問題是這樣的:有A,B,C三臺服務器,C爲服務器,B可以用PHP成功連接上C機器的mysql,而A機器則不能連接! 可以說,肯定不是代碼有什麼問題,服務器上的mysql設置也是沒什麼問題的,因

原创 談談機器學習(Machine Learning)大家

閒着無事,想寫點一些我所瞭解的machine learning大家。由於學識淺薄,見識有限,並且僅侷限於某些領域,一些在NLP及最近很熱的生物信息領域活躍的學者我就淺陋無知,所以不對的地方大家僅當一笑。 Machine Learnin

原创 在php中使用mb_strlen()函數和mb_substr()函數

php默認是不支持mb_strlen()函數的,需要安裝擴展模塊。安裝方法如下: yum install php-mbstring 找到mbstring.so的位置,可以使用rpm -ql 安裝的rpm名 修改/etc/php.

原创 ctrl-c,ctrl-z,ctrl-d區別

linux下: ctrl-c 發送 SIGINT 信號給前臺進程組中的所有進程。常用於終止正在運行的程序。 ctrl-z 發送 SIGTSTP 信號給前臺進程組中的所有進程,常用於掛起一個進程。 ctrl-d 不是發送信號,而是表示