機器學習週刊 第4期:動手實戰人工智能、計算機科學熱門論文、免費的基於ChatGPT API的安卓端語音助手、每日數學、檢索增強 (RAG) 生成技術綜述

LLM開發者必讀論文:檢索增強(RAG)生成技術綜述!

目錄:

  • 1、動手實戰人工智能 Hands-on Al
  • 2、huggingface的NLP、深度強化學習、語音課
  • 3、Awesome Jupyter
  • 4、計算機科學熱門論文
  • 5、LLM開發者必讀論文:檢索增強 (RAG) 生成技術綜述
  • 6、Apple 公佈了多模態大型語言模型 Ferret
  • 7、免費的基於ChatGPT API的安卓端語音助手
  • 8、每日數學
  • 9、WhisperLive:接近實時的 Whisper 實現
  • 10、Unsloth:大模型訓練速度和效率加速工具
  • 11、最後推薦三個AI工具

1、動手實戰人工智能 Hands-on AI

地址https://ai.huhuhang.com/intro

這個《動手實戰人工智能 Hands-on AI》寫的相當不錯,作者用 Jupyter Notebook編寫了這個教程,參考了《機器學習方法》,《深度學習入門》,西瓜書,花花書等,剖析和推導每一個基礎算法的原理,將數學過程寫出來了,同時基於 Python 代碼對公式進行實現,做到公式和代碼的一一對應。

我把章節簡單整理成了這個思維導圖,大家可以結合自身情況,挑選感興趣的章節閱讀。

動手實戰人工智能 Hands-on AI

2、huggingface的NLP、深度強化學習、語音課

地址https://huggingface.co/learn

HuggingFace開放了NLP、深度強化學習、基於transformer的語音框架三門課,看了每一課的結構,比較偏實踐,蠻不錯的。

我最近對語音比較感興趣,加上正在學點前端,所以就把語音課拿出來,做了個文檔型網頁,準備一邊學,一邊翻譯。

感興趣的同學可以一起翻譯:https://hf-audio.zhanglearning.com/

3、Awesome Jupyter

地址https://github.com/markusschanta/awesome-jupyter

這個項目收錄了精選的Jupyter項目、庫和資源列表,已經更新了很多年,我比較喜歡可視化部分,認識了很多好玩的庫。

4、計算機科學熱門論文

地址https://trendingpapers.com/

trendingpapers這個網站每日更新計算機科學最新、最火的論文,分門別類,查找起來非常方便。打開感興趣的論文,可以直接跳轉到arxiv查看pdf,也可以點擊Find similar找到該方向類似的論文。

5、LLM開發者必讀論文:檢索增強(RAG)生成技術綜述

論文https://arxiv.org/abs/2312.10997

檢索增強利用外部知識庫來豐富大語言模型的上下文並生成答案,從而提升了答案的準確度。論文深入探討並梳理了檢索增強型生成( RAG)技術,非常全面。RAG是LLM領域最火爆的方向了,我在公衆號中曾推薦過吳恩達老師最近的一個短課:吳恩達最新短課,構建和評估高級 RAG 應用程序,附中英字幕,感興趣想要學習RAG,這個短課,建議作爲首選。

6、 Apple 公佈了多模態大型語言模型 Ferret

地址:github.com/apple/ml-ferret

蘋果最新公佈的 Ferret 是一種新的多模態大型語言模型(MLLM),能夠理解圖像中任何形狀或粒度的空間參考,並準確地理解詞彙描述。

蘋果開源了訓練、微調、模型代碼和模型權重:https://github.com/apple/ml-ferret/

可以下載、安裝後一個命令運行gradio前端

python -m ferret.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload --add_region_feature

7、免費的基於ChatGPT API的安卓端語音助手

地址https://github.com/Skythinker616/gpt-assistant-android

這個項目是免費的、基於ChatGPT API的安卓端語音助手,可通過音量鍵喚起並進行語音交流,支持聯網、Vision拍照識圖、連續對話、提問模板、3.5/4.0接口、Markdown渲染等功能

8、每日數學

地址https://www.theoremoftheday.org/

這個網站每天更新一個數學定理(或引理、法則、公式或恆等式),每一個都足以裝飾數學殿堂的牆壁。

每個定理都被設計得儘可能讓廣大觀衆能夠欣賞,如果某個定理的表述看起來難以理解,可以繼續查看附帶的圖形解釋、巧妙的動畫。

9、WhisperLive:接近實時的 OpenAI Whisper 實現

地址:https://github.com/collabora/WhisperLive

這個項目是一個實時轉錄應用程序,它使用 OpenAI Whisper 模型將語音輸入(來自麥克風的現場音頻輸入 or預先錄製的音頻文件 )轉換爲文本輸出。

10、Unsloth

地址https://github.com/unslothai/unsloth

訓練大語言模型往往會消耗大量算力和時間,Unsloth開源的這個項目可以加快訓練速度和效率。

  • 支持 Llama 7b、13b、70b、CodeLlama 34b、Mistral 7b、TinyLlama 以及所有 Llama 架構!
  • Llama 7b Colab T4 實例在 1 T4 上比原來快 2 倍,使用的 VRAM 減少了 43%(8.4GB)LAION 數據集。Alpaca T4 實例在 1 T4 上也是快了 2 倍,使用了 6.4GB VRAM。
  • Mistral 7b Colab A100 實例在 1 A100 上快了 2.2 倍,使用的 VRAM 減少了 62%(12.4GB)。Colab T4 實例
  • CodeLlama 34b Colab 實例不會出現 OOM,速度提升了 1.9 倍,使用的 VRAM 減少了 32%(27GB)。
  • Kaggle 上使用 2 Tesla T4 的 Alpaca 訓練速度提高了 5.28 倍。Kaggle 實例
  • 所有內核均使用 OpenAI 的 Triton 語言編寫。
  • 準確率無損失 - 沒有使用近似方法 - 全部精確。
  • 無需更換硬件。支持自 2018 年以來的 NVIDIA GPU。最低 CUDA 計算能力 7.0(V100、T4、Titan V、RTX 20、30、40x、A100、H100、L40 等)檢查您的 GPU
  • 在 Linux 和 Windows 通過 WSL 上運行。
  • 實驗性支持 DPO(直接偏好優化)!
  • 支持通過 bitsandbytes 進行 4bit 和 16bit QLoRA / LoRA 微調。
  • 開源版本的訓練速度提高了 5 倍,或者您可以查看 Unsloth Pro 和 Max 代碼路徑,以獲得高達 30 倍的訓練速度提升!

11、最後推薦三個AI工具

PIA:照片轉動漫風格工具,可線上試用

地址https://huggingface.co/spaces/Leoxing/PIA

帶web界面的聲音克隆工具

地址https://github.com/jianchang512/clone-voice

cloudflare-ai-web

地址https://github.com/Jazee6/cloudflare-ai-web

支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平臺

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章