Llama 3 開源了「GitHub 熱點速覽」

近日,Meta(原 Facebook)開源了他們公司的新一代大模型 Llama 3,雖然目前只放出了 8B 和 70B 兩個版本,但是在評估結果上已經優於 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方還表示,這些只是開胃菜,更強的 400B 參數的模型已經在訓練中了,預計幾個月後將和大家見面(開源與否尚不明確)。

說回上週的熱門開源項目,最近基於 LLM 構建知識庫的開源項目很火,但我一個都沒收錄。因爲如果是本地起大模型效果不好,請求大模型的 API 又不免費,所以我找到了一個 OpenAI API 反向代理開源項目,可用來實現免費白嫖 OpenAI API。內容也是知識庫的關鍵,Reader 能夠將網頁內容轉化成 LLM 友好的文本。對於沒有編程基礎的小夥伴,這有一個 30-Days-Of-Python 的開源教程,學它!當然,學習之餘也可以娛樂一下,比如試試‘無名殺’,這是一款類似於三國殺的開源卡牌遊戲。

  • 本文目錄
    • 1. 開源新聞
      • 1.1 Meta 開源 Llama 3 大模型
    • 2. 開源熱搜項目
      • 2.1 OpenAI API 免費反向代理:ChatGPT
      • 2.2 一門新興的系統級編程語言:Zig
      • 2.3 將網頁內容轉化成 LLM 友好的文本:Reader
      • 2.4 三國殺類型的卡牌遊戲:noname
      • 2.5 爲期 30 天的 Python 編程挑戰:30-Days-Of-Python
    • 3. HelloGitHub 熱評
      • 3.1 自定義 Windows 任務欄透明度的小工具:TranslucentTB
      • 3.2 跨平臺的手寫筆記和繪圖應用:Rnote
    • 4. 結尾

1. 開源新聞

1.1 Meta 開源 Llama 3 大模型

今年初,扎克伯格就曾公開解釋過:​Meta 爲什麼開源 Llama 模型?

  1. 改進模型:開源可以藉助社區的力量持續提升模型的質量,因爲社區的反饋和審查有助於安全性和運行效率的提升,而這對每個人都有益。
  2. 產品發展:雖然開源並不排除將模型轉化爲商業產品的可能性,開源模型的領導者可以將社區創新整合進自家產品中,提高產品競爭力。
  3. 行業標準:開源軟件有潛力成爲行業標準,從而促進技術發展和統一性。
  4. 吸引人才:由於開發者和研究人員更傾向於參與開源項目,開源策略可以幫助公司吸引和招聘到行業內的優秀人才。

最新發布的 Llama 3 相較於 Llama 2 在參數規模、訓練數據集、模型架構(GQA)、性能、多語言支持、推理和代碼生成方面都有所提升,但現在對中文支持的不是很好,而且 meta.ai 上用的還是 Llama 2。

GitHub 地址:github.com/meta-llama/llama3

2. 開源熱搜項目

2.1 OpenAI API 免費反向代理:ChatGPT

主語言:TypeScriptStar:3.7k周增長:1k

雖然現在無需登陸就可以免費使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用接口的話還要收費的。該項目就是基於免費的 ChatGPT 網站服務,將其轉化成免費的 ChatGPT API,接口返回和官方一致,支持 Docker 部署。需要注意的是部署的服務器,要在 OpenAI 服務支持的國家和地區。

GitHub 地址→github.com/PawanOsman/ChatGPT

2.2 一門新興的系統級編程語言:Zig

主語言:ZigStar:30k周增長:300

這是一種命令式、通用、靜態類型、編譯的系統編程語言,注重性能、安全和可讀性。它支持編譯時泛型與反射、交叉編譯以及手動存儲器管理,目標爲改進 C 語言,可以輕鬆地和 C 語言的代碼庫配合工作。Zig 簡潔且直接,沒有隱式控制流、沒有隱式內存分配、沒有預處理器、沒有宏,特別適合用於開發編譯器、操作系統內核、桌面應用、性能敏感的應用、嵌入式系統等。

const std = @import("std");
const parseInt = std.fmt.parseInt;

test "parse integers" {
    const input = "123 67 89,99";
    const ally = std.testing.allocator;

    var list = std.ArrayList(u32).init(ally);
    // Ensure the list is freed at scope exit.
    // Try commenting out this line!
    defer list.deinit();

    var it = std.mem.tokenizeAny(u8, input, " ,");
    while (it.next()) |num| {
        const n = try parseInt(u32, num, 10);
        try list.append(n);
    }

    const expected = [_]u32{ 123, 67, 89, 99 };

    for (expected, list.items) |exp, actual| {
        try std.testing.expectEqual(exp, actual);
    }
}

GitHub 地址→github.com/ziglang/zig

2.3 將網頁內容轉化成 LLM 友好的文本:Reader

主語言:TypeScriptStar:3k周增長:2.5k

該項目可以將指定的 URL 內容轉化爲乾淨、LLM 友好的文本,從而提高 Agent 和 RAG 系統的輸入質量,可作爲構建知識庫的一環。我試用了一下,內容提取效果不錯,但是對於需要登陸才能訪問的 URL 就不行了。

GitHub 地址→github.com/jina-ai/reader

2.4 三國殺類型的卡牌遊戲:noname

主語言:JavaScriptStar:1.9k周增長:100

「無名殺」是一款以三國爲背景的卡牌策略遊戲,它完全免費、無廣告,玩法和三國殺一樣,但自由度高很多,有海量武將可供玩家選擇,還支持自制武將和技能,提供了身份、國戰、鬥地主、塔防、單挑、聯機等遊戲模式。

GitHub 地址→github.com/libccy/noname

2.5 爲期 30 天的 Python 編程挑戰:30-Days-Of-Python

主語言:PythonStar:31k周增長:600

該項目是幫助人們在 30 天內學會 Python 編程語言,通過每天的練習和學習,逐漸掌握 Python 的基礎和進階知識,全部完成可能需要超過 100 天。該教程適合想要快速入門 Python 的初學者,或者對 Python 有一定了解,想通過實踐深入理解 Python 的開發者。

GitHub 地址→github.com/Asabeneh/30-Days-Of-Python

3. HelloGitHub 熱評

在這個章節,將會分享下本週 HelloGitHub 網站上的熱門開源項目,歡迎與我們分享你上手這些開源項目後的使用體驗。

3.1 自定義 Windows 任務欄透明度的小工具:TranslucentTB

主語言:C++

該項目是採用 C++ 開發的用於調整 Windows 任務欄透明度的工具,它體積小、免費、簡單易用,支持 5 種任務欄狀態、6 種動態模式、Windows 10/11 操作系統。

項目詳情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41

3.2 跨平臺的手寫筆記和繪圖應用:Rnote

主語言:Rust

這是一款用 Rust 和 GTK4 編寫的繪圖應用,可用於繪製草圖、手寫筆記和註釋文檔等。它支持導入/導出 PDF 和圖片文件,以及無限畫布、拖放、自動保存等功能。適用於 Windows、Linux 和 macOS 系統,需要搭配手寫板使用。

項目詳情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425

4. 結尾

在結束本週「GitHub 熱點速遞」的精彩內容後,希望這些開源項目能夠對大家有所啓發,幫助你們找到新的工具、學習資源或是娛樂項目。如果看完這些還不過癮,可以通過閱讀「往期回顧」的內容,找到更多熱門開源項目。

往期回顧

以上爲本週的「GitHub 熱點速遞」全部內容,如果你發現其他好玩、有趣的 GitHub 項目,就來 HelloGitHub 和大家一起分享吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章