機器學習週刊第4期：動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述

原創

jpld

2024-01-08 14:41

LLM開發者必讀論文：檢索增強（RAG）生成技術綜述！

目錄：

1、動手實戰人工智能 Hands-on Al
2、huggingface的NLP、深度強化學習、語音課
3、Awesome Jupyter
4、計算機科學熱門論文
5、LLM開發者必讀論文:檢索增強 (RAG) 生成技術綜述
6、Apple 公佈了多模態大型語言模型 Ferret
7、免費的基於ChatGPT API的安卓端語音助手
8、每日數學
9、WhisperLive:接近實時的 Whisper 實現
10、Unsloth：大模型訓練速度和效率加速工具
11、最後推薦三個AI工具

1、動手實戰人工智能 Hands-on AI

地址：https://ai.huhuhang.com/intro

這個《動手實戰人工智能 Hands-on AI》寫的相當不錯，作者用 Jupyter Notebook編寫了這個教程，參考了《機器學習方法》，《深度學習入門》，西瓜書，花花書等，剖析和推導每一個基礎算法的原理，將數學過程寫出來了，同時基於 Python 代碼對公式進行實現，做到公式和代碼的一一對應。

我把章節簡單整理成了這個思維導圖，大家可以結合自身情況，挑選感興趣的章節閱讀。

2、huggingface的NLP、深度強化學習、語音課

地址：https://huggingface.co/learn

HuggingFace開放了NLP、深度強化學習、基於transformer的語音框架三門課，看了每一課的結構，比較偏實踐，蠻不錯的。

我最近對語音比較感興趣，加上正在學點前端，所以就把語音課拿出來，做了個文檔型網頁，準備一邊學，一邊翻譯。

感興趣的同學可以一起翻譯：https://hf-audio.zhanglearning.com/

3、Awesome Jupyter

地址：https://github.com/markusschanta/awesome-jupyter

這個項目收錄了精選的Jupyter項目、庫和資源列表，已經更新了很多年，我比較喜歡可視化部分，認識了很多好玩的庫。

4、計算機科學熱門論文

地址：https://trendingpapers.com/

trendingpapers這個網站每日更新計算機科學最新、最火的論文，分門別類，查找起來非常方便。打開感興趣的論文，可以直接跳轉到arxiv查看pdf，也可以點擊Find similar找到該方向類似的論文。

5、LLM開發者必讀論文：檢索增強（RAG）生成技術綜述

論文：https://arxiv.org/abs/2312.10997

檢索增強利用外部知識庫來豐富大語言模型的上下文並生成答案，從而提升了答案的準確度。論文深入探討並梳理了檢索增強型生成（ RAG）技術，非常全面。RAG是LLM領域最火爆的方向了，我在公衆號中曾推薦過吳恩達老師最近的一個短課：吳恩達最新短課，構建和評估高級 RAG 應用程序，附中英字幕，感興趣想要學習RAG，這個短課，建議作爲首選。

6、 Apple 公佈了多模態大型語言模型 Ferret

地址：github.com/apple/ml-ferret

蘋果最新公佈的 Ferret 是一種新的多模態大型語言模型（MLLM)，能夠理解圖像中任何形狀或粒度的空間參考，並準確地理解詞彙描述。

蘋果開源了訓練、微調、模型代碼和模型權重：https://github.com/apple/ml-ferret/

可以下載、安裝後一個命令運行gradio前端

python -m ferret.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload --add_region_feature

7、免費的基於ChatGPT API的安卓端語音助手

地址：https://github.com/Skythinker616/gpt-assistant-android

這個項目是免費的、基於ChatGPT API的安卓端語音助手，可通過音量鍵喚起並進行語音交流，支持聯網、Vision拍照識圖、連續對話、提問模板、3.5/4.0接口、Markdown渲染等功能

8、每日數學

地址：https://www.theoremoftheday.org/

這個網站每天更新一個數學定理（或引理、法則、公式或恆等式），每一個都足以裝飾數學殿堂的牆壁。

每個定理都被設計得儘可能讓廣大觀衆能夠欣賞，如果某個定理的表述看起來難以理解，可以繼續查看附帶的圖形解釋、巧妙的動畫。

9、WhisperLive：接近實時的 OpenAI Whisper 實現

地址：https://github.com/collabora/WhisperLive

這個項目是一個實時轉錄應用程序，它使用 OpenAI Whisper 模型將語音輸入（來自麥克風的現場音頻輸入 or預先錄製的音頻文件）轉換爲文本輸出。

10、Unsloth

地址：https://github.com/unslothai/unsloth

訓練大語言模型往往會消耗大量算力和時間，Unsloth開源的這個項目可以加快訓練速度和效率。

支持 Llama 7b、13b、70b、CodeLlama 34b、Mistral 7b、TinyLlama 以及所有 Llama 架構！
Llama 7b Colab T4 實例在 1 T4 上比原來快 2 倍，使用的 VRAM 減少了 43%（8.4GB）LAION 數據集。Alpaca T4 實例在 1 T4 上也是快了 2 倍，使用了 6.4GB VRAM。
Mistral 7b Colab A100 實例在 1 A100 上快了 2.2 倍，使用的 VRAM 減少了 62%（12.4GB）。Colab T4 實例
CodeLlama 34b Colab 實例不會出現 OOM，速度提升了 1.9 倍，使用的 VRAM 減少了 32%（27GB）。
Kaggle 上使用 2 Tesla T4 的 Alpaca 訓練速度提高了 5.28 倍。Kaggle 實例
所有內核均使用 OpenAI 的 Triton 語言編寫。
準確率無損失 - 沒有使用近似方法 - 全部精確。
無需更換硬件。支持自 2018 年以來的 NVIDIA GPU。最低 CUDA 計算能力 7.0（V100、T4、Titan V、RTX 20、30、40x、A100、H100、L40 等）檢查您的 GPU
在 Linux 和 Windows 通過 WSL 上運行。
實驗性支持 DPO（直接偏好優化）！
支持通過 bitsandbytes 進行 4bit 和 16bit QLoRA / LoRA 微調。
開源版本的訓練速度提高了 5 倍，或者您可以查看 Unsloth Pro 和 Max 代碼路徑，以獲得高達 30 倍的訓練速度提升！

11、最後推薦三個AI工具

PIA：照片轉動漫風格工具，可線上試用

地址：https://huggingface.co/spaces/Leoxing/PIA

帶web界面的聲音克隆工具

地址：https://github.com/jianchang512/clone-voice

cloudflare-ai-web

地址：https://github.com/Jazee6/cloudflare-ai-web

支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平臺

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習週刊第4期：動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述

1、動手實戰人工智能 Hands-on AI

2、huggingface的NLP、深度強化學習、語音課

3、Awesome Jupyter

4、計算機科學熱門論文

5、LLM開發者必讀論文：檢索增強（RAG）生成技術綜述

6、 Apple 公佈了多模態大型語言模型 Ferret

7、免費的基於ChatGPT API的安卓端語音助手

8、每日數學

9、WhisperLive：接近實時的 OpenAI Whisper 實現

10、Unsloth

11、最後推薦三個AI工具

《日本蠟燭圖》讀書筆記 & 技術分析回測

《期貨-市場技術分析》讀書筆記

Python多線程編程深度探索：從入門到實戰

mongodb處理json數據很好

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

機器學習週刊第五期：一個離譜的數據可視化Python庫、可交互式動畫學概率統計、機器學習最全文檔、快速部署機器學習應用的開源項目、Redis 之父的最新文章

機器學習週刊第六期：哈佛大學機器學習課、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B

機器學習週刊第4期：動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述

機器學習週刊03:如何學習深度學習？2024 年學習生成式 AI 路線圖、如何構建高效的RAG系統、蘋果騰訊最新論文、阿里DreaMoving

玩轉Python：用Python處理文檔，5個必備的庫，特別實用，附代碼

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

機器學習週刊 第4期：動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述

1、動手實戰人工智能 Hands-on AI

2、huggingface的NLP、深度強化學習、語音課

3、Awesome Jupyter

4、計算機科學熱門論文

5、LLM開發者必讀論文：檢索增強（RAG）生成技術綜述

6、 Apple 公佈了多模態大型語言模型 Ferret

7、免費的基於ChatGPT API的安卓端語音助手

8、每日數學

9、WhisperLive：接近實時的 OpenAI Whisper 實現

10、Unsloth

11、最後推薦三個AI工具

機器學習週刊第4期：動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述