原创 搜索結果排序

利用開源做的搜索結果排序目前主要兩種計算方式:索引時做好了score計算和查詢時動態計算。各有優缺點,適合不同業務。搜索結果排序需要考慮的點比較多,比如設定不同字段不同比率來計算score,這些字段的來源是

原创 說說我眼中的php

php優缺點,隨便搜搜很多。說說我眼中的php,憑此來記錄。寫了不少php代碼,但是複用的很少。目前只有一個mysql類。用過些網上php的類,終究不是自己設計,用過就扔。也用過些框架,目前只喜歡ci和ze

原创 我是這麼理解 php 框架中的route部分

一般php的mvc框架都會有route部分,我理解的是將url解析成controller, action, params.比如 http://localhost/framework/index.php/a/

原创 一個static的問題

static可以放在class,也可以放在function。兩者有什麼差異。一般當函數do1,do2都用到 $_arr時,把它作爲類變量。class A{ static $_arr; function

原创 找工作

感興趣: 全文搜索, 網站架構, 分佈式存儲缺點: 自學的東西不繫統,比較雜,不夠深入全文檢索: 使用solr搭建過7600萬全文搜索web: 使用php+mysql寫web,600萬級pv

原创 也說倒排

大概就是關鍵詞在哪些文檔出現了,建立以關鍵詞和docid的對應關係網上鋪天蓋地就是這個。如果關鍵詞A比較常用,有1千萬個docid,不同字段,,,那麼這個索引該如何存儲?我們常規的分詞字典都是上萬的關鍵詞。

原创 2010.2.3 記下流水賬

1:我不會java2:在看Sphinx3:我也不會c++,在看4:歡迎撇開語言撇開框架聊搜索引擎的朋友,可以PM我。5:喜歡算法的朋友,也可以PM我。

原创 2010-8-3扯淡

用日期+扯淡來作題目,比較方便,而且不會重複。 :oops: 頭銜:資深PHPER,混得時間久的緣故。之所以說頭銜,因爲最近又給找搜索的獵頭抓到,很早很早以前我還有興趣聽到底要做什麼,自從去年經歷了幾次搜索

原创 啥時候盈利

想創業的人總會一廂情願的想到很多美好錢景而事實往往不如人意所以實在點對那些想創業,想忽悠別人一起做得人說啥時候盈利只有盈利了才能發工資,才能安心持久的做,空着肚子的堅持是不長久的。時間太長估計不能吸引人。目

原创 一個php算法題目我的解答

Yahoo中國面試題PHP算法(2010-03-02 22:51:13)轉載標籤:it 分類:Interview3.7 寫一個function實現數組內每個元素之間加法的遞代運算?注:數組元素全部爲自然數.

原创 某著名公司面試有感

一個職位,多個獵頭call,受不了獵頭,今天去某著名網絡公司面試。剛開始讓我筆試,題目不難,java的,很多不會,因爲我很少用java。(用lucene時寫過點,自從有了solr我就懶了)技術面試,問了些我

原创 無聊猜想:高併發,更新要求高的解決思路

一般網站(假設用 Lucene )要做更新頻率比較高的,常見的是大小索引包,大的索引包是舊數據索引,小索引包是新數據索引。更新主要集中在小索引包這裏,因爲索引小,所以完成索引到能提供搜索的時間是比較短。但是

原创 目前我感興趣的,希望有同好,一起學習

繼續跟蹤lucene,大致看新功能,而不是具體code繼續跟蹤solr,大致看新功能和應用,希望結交更多solr使用者。非專業的搜索系統上億不大現實,至少目前沒機會。千萬已經做過了,所以目前搜索我比較感興趣

原创 我爲什麼沒有用lucene的score來排序

爲什麼要用lucene的score來排序?我是google,baidu麼?不是。我做的是通用的網頁搜索麼?不是。如果做商品,一般是價格,時間,誠信,推薦,,,,,數據量多了還可以其他排序。深入了就是數據挖掘

原创 以後 不回到 京東商城 購物

會選擇一家 [b]誠信網站[/b] 購物