原创 大規模向量相似度計算(二)——hnswlib的參數含義

在此之前寫了一篇hnswlib在大規模向量近鄰檢索上的使用,本篇展開來講一下hnswlib不同參數的含義,前章詳細內容參考: 《大規模向量相似度計算(一)——hnswlib的基本使用示例》 微信搜索並關注微信公衆號:查叔筆錄,一起

原创 我寫的文章突然上了CSDN的熱榜

前段時間,我之前寫的一篇文章《如果能重來,我不會選擇北漂——初見北京》不小心上了CSDN的熱榜。 這一波操作給我的CSDN賬號吸了30多個粉,搞得我很惶恐。 哎~ 這心態看來不是做大事的料哇! 事情的發展是這個樣子的。 回憶.jp

原创 一天天神神叨叨的

最近,閒下來的時候持續在看《世界上最神奇的24堂課》。 我前兩天跟朋友開玩笑說: 科學不可達的地方,必出神棍。 可是這這兩天看着看着吧~ 就看出老莊的味道來了。 不知道是這個世界上的智慧本就相通,還是我能強行:“道可道”,一切

原创 大規模向量相似度計算(一)——hnswlib的基本使用示例

隨着推薦系統基於向量相似的召回策略越發普及和成熟。 推薦系統基於向量相似的召回更加廣泛的應用到推薦系統當中。 今天我們來聊一聊如何基於hnswlib來進行大規模的物品和物品之間的相似度計算。 1. 安裝 hnswlib pip i

原创 神奇的成功學法門

前段時間看《浮生六記》看得整個人喪喪的,然後就去換了一個口味。 今天,給大家推薦一本神奇的書。 這本書的名字就很神奇,叫做《世界上最神奇的24堂課》。 這本書的內容和出版經歷更是讓人驚歎。 《世界上最神奇的24堂課》的作者查爾斯

原创 YouTube DNN在召回上的一些實驗記錄——負樣本的選取

負樣本隨機採樣 1. 採樣細節和auc 在構建YouTube的負樣本的時候針對樣本數據,我們採用對所有正樣本覆蓋到的視頻隨機採樣的方式進行負樣本的選取。 一條輸入的樣本數據對應下一個點擊的視頻vid作爲正樣本,63個隨機挑選的vi

原创 如果不是對的人,最終的結局大概不會好吧

  斷斷續續地把《圍城》看完卻剛剛好是情人節。《圍城》是出了名的經典,但是一直沒能靜下心來去看,也沒有具體地瞭解過書中故事的內容。所以,等我開始讀到孫柔嘉要和方鴻漸結婚的時候,才慢慢開始體悟書裏面要講述的主題。   可惜的是那個

原创 在CSDN寫博客我有哪些意外的收穫

微信搜索並觀衆微信公衆號:終南樵。一起成長! 在工作兩年之後,也就是現在。我碰到了職業生涯中的第一道門檻。 這道門檻可能有很多人都會遇到,但是對於我來說可能來的有些早了一點。 我在一個二線的互聯網公司做推薦算法工程師,從事召回相關

原创 喂,那個方鴻漸

上週末,有一個朋友發朋友圈: “你不討厭,但無用”,回顧往路,再沒有自命不凡,或許方鴻漸就是我這樣的人最終的歸宿了。 我不痛不癢的來了一句: 鴻漸於阿,人趨於碌。做個方鴻漸也沒什麼不好~ 他回覆道: 沒有什麼說好與不好,

原创 無敵的Log-Likelihood Ratio(1)——LLR的計算方式

文章目錄1. LLR的計算方式2. LLR的代碼實現3 相關疑問4 參考資料   Ted  DunningTed\; DunningTedDunning在《Accurate  Methods  for  the  Statisti

原创 git commit提交信息修改

1 命令 git commit --amend 2 例子 git commit 輸入以下數據: feat: test commitlint test commitlint test commitlint of the pro

原创 交叉熵三連(3)——交叉熵及其使用

相關文章: 交叉熵三連(1)——信息熵 交叉熵三連(2)——KL散度(相對熵) 交叉熵三連(3)——交叉熵及其使用   在神經網絡中,我們經常使用交叉熵做多分類問題和二分類的損失函數,在通過前面的兩篇文章我們瞭解了信息熵和相對熵(

原创 Python 打包並上傳

1 註冊PyPi賬號 PyPi網站 2. 創建.pypirc文件 文件內容: [distutils] index-servers = pypi [pypi] repository: https://upload.pypi

原创 躺平國曆險記:兩個超平面之間距離的計算

王二麻聽說躺平國是一個非常神奇的地方。在躺平國裏,有各種神奇的東西。比如:會說話的鐵片,能夠分揀垃圾的小狗,還有會唱京劇的電線杆子。 王二麻的表哥張三李是一個糙漢子,他前幾年在國內混不下去了,一個人去了躺平國。那是一個快樂的國

原创 交叉熵三連(1)——信息熵

相關文章: 交叉熵三連(1)——信息熵 交叉熵三連(2)——KL散度(相對熵) 交叉熵三連(3)——交叉熵及其使用 1 信息熵的定義   在維基百科中信息熵的定義如下: 熵:是接受每條消息中包含的信息的平均量,又稱爲信息熵、信源