原创 小a的二月每週進展

看了眼備忘錄,二月就記了一週...(心虛) 年後從杭州出發,一路去深圳,一邊旅行一邊工作。 路線大概是:杭州 - 福州 - 莆田 - 泉州 - 廈門 - 深圳,如果不是要去線下工作,我肯定會多去幾個城市哈哈。 以後應該還會去的! 年後開始工

原创 小a的一月每週進展

每週進展放備忘錄裏佔空間,就發博客裏吧。 除了學習工作,生活上的亂七八糟也會寫進去當作“小成就”。 可能還會出現一些中二發言,希望同事們永遠不會看到。orz 從2024年的開始搬吧,中間可能有幾周是斷的。 -----------------

原创 【每週一讀】Automating Hyperparameter Tuning with LlamaIndex

原文🔗:https://levelup.gitconnected.com/automating-hyperparameter-tuning-with-llamaindex-72fdd68e3b90 原文作者:Wenqi Glantz 這篇文

原创 爬蟲:根據表格中專利號對應的超鏈接爬取網頁pdf

這個是公司同事幫我寫的,沒接觸過爬蟲,代碼存個檔學習一下。 這個文件是讀取表格單元格中的專利號和對應的超鏈接,存儲到新的csv文件中 import pandas as pd from openpyxl import load_workb

原创 【每週一讀】A Survey of Techniques for Maximizing LLM Performance

🔗:https://www.youtube.com/watch?v=ahnGLM-RC1Y 這次不是文章,是OpenAI的talk,乾貨滿滿。 直接把在飛書文檔上記的筆記當過來了。 ----------------------------

原创 創業與思考

有兩篇文章裏的想法很有幫助,記錄一下: https://jiayuan.zhubai.love/posts/2117979470253125632 https://sheracaolity.ghost.io/seven-things/ 我

原创 LLM與強化學習(一)

很早之前就想了解一下LLM到底是怎麼和強化學習結合的,今天湊巧查資料的時候看到亞馬遜的一篇文章,把知識點整理記錄一下。 1 什麼是RLHF RLHF 代表“Reinforcement Learning from Human Feedback

原创 【每週一讀】LLM Embeddings — Explained Simply

原文🔗:https://pub.aimind.so/llm-embeddings-explained-simply-f7536d3d0e4b 原文作者:Sandi Besen 今天這篇文章非常簡練,逐詞解釋了“embeddings are

原创 【每週一讀】Optimize your RAG pt.1 - Data ingestion

今天與其說是閱讀筆記更像是摘錄與翻譯...本來都用了引用塊,但格式不太好看就還是改成正文了。 以下英文部分全是原文引用。 原文🔗:https://textgeneration.substack.com/p/optimize-your-rag

原创 【踩坑記錄】ssh connection closed;git鑑權失敗

換電腦用的Clash X Pro,開着增強模式,結果終端ssh連接gituhub一直報錯: kex_exchange_identification: Connection closed by remote host Connection c

原创 【每週一讀】How to Detect Hallucinations in LLMs

準備開一個【每週一讀】欄目,分享任何有意思的文章,不定時更新。 原文🔗:https://towardsdatascience.com/real-time-llm-hallucination-detection-9a68bb292698 原文

原创 【學習筆記】BERT

BERT問答 BERT分爲哪兩種任務,各自的作用是什麼; 在計算MLM預訓練任務的損失函數的時候,參與計算的Tokens有哪些?是全部的15%的詞彙還是15%詞彙中真正被Mask的那些tokens? 在實現損失函數的時候,怎麼確保沒有被

原创 【算法】棧與隊列

1 棧與隊列理論基礎 隊列先進先出,棧先進後出;不允許有遍歷行爲,不提供迭代器 2 用棧實現隊列 題目:請你僅使用兩個棧實現先入先出隊列。隊列應當支持一般隊列支持的所有操作(push、pop、peek、empty): 實現 MyQueue

原创 【算法】哈希表

1 哈希表理論基礎 1.1 哈希表 哈希表是根據關鍵碼的值而直接進行訪問的數據結構。一般哈希表都是用來快速判斷一個元素是否出現集合裏。 1.2 哈希函數 哈希函數如下圖所示,通過hashCode把名字轉化爲數值,一般hashcode是通過

原创 【算法】算法性能分析

1 時間複雜度 1.1 知識點 時間複雜度是一個函數,它定性描述該算法的運行時間。 通常會估算算法的操作單元數量來代表程序消耗的時間。假設算法的問題規模爲n,那麼操作單元數量便用函數f(n)來表示,隨着數據規模n的增大,算法執行時間的增長率