原创 獲得視頻時間總長度的另一種方法

利用Ffmpeg獲得flv視頻縮略圖和視頻時間 當時獲得視頻長度是採用網上的通用的獲得flv視頻文件長度的方法,但是這個方法只對flv視頻支持,其他格式的視頻獲取到的值就很差了, 下面在介紹一種:利用ffmpeg返回值Duration的

原创 LINUX應用技巧,序列化存儲 Python 對象

持久性 持久性的基本思想很簡單。假定有一個 Python 程序,它可能是一個管理日常待辦事項的程序,您希望在多次執行這個程序之間可以保存應用程序對象(待辦事項)。換句話說,您希望將對象存儲在磁盤上,便於 以後檢索。這就是持久性。要達到這個

原创 自主研發搜索引擎,單機500萬網頁全文索引,任意檢索不超過 20毫秒 .

舉報   搜索引擎1.0源代碼、相關說明、下載地址如下: 1、GG3M.Search.Demo   進行檢索,就是常說的搜索引擎網站。提供檢索服務。   目前實現了:按關鍵詞進行檢索,實現了動態摘要、關鍵詞高亮顯示、自動分頁、每頁顯示條

原创 全文檢索、數據挖掘、推薦引擎系列4---去除停止詞添加同義詞

Lucene對文本解析是作爲全文索引及全文檢索的預處理形式出現的,因此在一般的Lucene文檔中,這一部分都不是重點,往往一帶而過,但是對於要建立基於文本的內容推薦引擎來說,卻是相當關鍵的一步,因此有必要認真研究一下Lucene對文解析的

原创 學習豆瓣好榜樣--網站架構

作者: Fenng | 可以轉載, 轉載時務必以超鏈接形式標明文章原始出處和作者信息及版權聲明網址: http://www.dbanotes.net/arch/douban_arch.html 這次的 QCon 會議,《豆瓣網技術架

原创 提高PHP編程效率的幾點建議

用單引號代替雙引號來包含字符串,這樣做會更快一些。因爲PHP會在雙引號包圍的字符串中搜尋變量,單引 號則不會,注意:只有echo能這麼做,它是一種可以把多個字符串當作參數的“函數”(譯註:PHP手冊中說echo是語言結構,不是真正的函數,

原创 PHP學習數組

數字索引數組 如同C#中的數組類似,訪問數組中的每一項,可以使用數組的索引值,默認從0開始。 新建數組: 新建一個數組: 1 $phones = array('htc','moto','nokia'); 或: 1

原创 FirePHP介紹

FirePHP您可能不知道,但是FireBug總應該聽說過吧? FirePHP基於FireBug開發,算是FireBug的插件吧, 它可以把PHP輸出的調試信息顯示在FireBug中, 不會影響到頁面的顯示,在線上的應用中也可以使用,是不

原创 全文檢索、數據挖掘、推薦引擎系列5---文章術語向量表示法

無論是要進行全文檢索,還是對文章進行自動聚類分析,都需要將文章表示爲術語向量(Term Vector),在Lucene內部就是通過術語向量來對文章進行索引和搜索的,但是Lucene沒有向外提供合適的術語向量計算接口,所以對術語向量計算還必

原创 PHP學習文件操作

將數據寫或讀入文件,基本上分爲三個步驟: 1.         打開一個文件(如果存在) 2.         寫/讀文件 3.         關閉這個文件   l打開文件 在打開文件文件之前,我們需要知道這個文件的路徑,以及此文件是否

原创 全文檢索、數據挖掘、推薦引擎系列1---技術架構

在後web2.0時代,簡單的允許用戶產生內容,連接用戶組成社交網絡,滿足用戶個性化需求,已經變成各個網站的標配,不可能成爲網站的特色和競爭優勢了。然而,隨着用戶產生內容的增多,用戶與系統交互手段的豐富,用戶可供選擇的選項的增多,用戶迫切

原创 全文檢索、數據挖掘、推薦引擎系列3---全文內容推薦引擎之中文分詞

基於內容的推薦引擎有兩種實現途徑,一種是根據條目的元數據(可以將元數據理解爲屬性),另一種是根據條目的文本描述信息。本系列中將先描述基於條目描述信息的全文檢索實現方式,然後描述基於元數據的內容推薦引擎實現方式。 對於基於條目文本描述信息

原创 PHP判斷遠程url是否有效的幾種方法

前提 需要判斷遠程URL是否有效,遠程url包括遠程圖片,網頁,視頻等等元素 解決辦法: 使用PHP解決 使用file_get_contents函數,不過優缺點如果url無法訪問,會出現終止程序問題使用curl返回,然後判斷是否正確執

原创 Apache Solr 初級教程(介紹、安裝部署、Java接口、中文分詞)

Apache Solr 介紹 Solr 是什麼?   Solr 是一個開源的企業級搜索服務器,底層使用易於擴展和修改的Java 來實現。服務器通信使用標準的HTTP 和XML,所以如果使用Solr 瞭解Java 技術會有用卻不是必須的要求

原创 大型數據庫設計原則

陳龍兵在個人博客“將夏♂未泯‰”上曾發表過一篇博文,他依據多年來設計和使用數據庫的經驗,提出了一些大型數據庫設計原則,現轉載於此,供大家借鑑參考。全文如下: 一個好的數據庫產品不等於就有一個好的應用系統,如果不能設計一個合理的數據庫模型,