大模型训练相关技术

原創

张博的博客

2024-04-18 14:19

多轮对话数据组织格式

直接构造包括多轮对话中所有机器人回复内容的标签，【充分地利用了所有机器人的回复信息】，同时【也不存在拆重复计算，非常高效】。

inputs = <user1> <assistant1> <user2> <assistant2> <user3> <assistant3>
labels = <-100> <assistant1> <-100> <assistant2> <-100> <assistant3>

为什么可以直接这样去构造多轮对话的样本呢？难道inputs中包括第二轮和第三轮的对话内容不会干扰第一轮对话的学习吗？

答案是不会。原因是LLM作为语言模型，它的注意力机制是一个单向注意力机制(通过引入 Masked Attention实现)，模型在第一轮对话的输出跟输入中存不存在第二轮和第三轮对话完全没有关系。

确实这么设计是最好的!

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

京东面试：如何进行JVM调优？

JVM 調優是一個很大的話題，在回答“如何進行 JVM 調優？”之前，首先我們要回答一個更爲關鍵的問題，那就是，我們爲什麼要進行 JVM 調優？只有知道了爲什麼要進行 JVM 調優之後，你才能準確的回答出來如何進行 JVM 調優？要進行

Java中文社羣

2024-05-21 14:43:06

WinSW——将.exe文件注册为服务的一个工具

https://github.com/winsw/winsw

2024-05-21 14:34:55

Azure Service Principals ----- Azure 上最好保守的秘密的服务

一，引言　　Azure Service Principals 是 Azure Active Directory (AAD) 中的一種標識，代表應用程序，服務，自動化流程。Service Principals 支持各種 Azure 服務和資

2024-05-21 14:34:25

程序设计思路-球连球组成的群

　　編碼設計有很多思路，都是在簡化映射實際問題時遇到的問題。　　之前和別人交流，得到一句“把它放在同一個地方好維護”，相同的功能只出現在一個地方。就會出現代碼的聚合設計，也就是一種通用的功能索引，或者說面向對象的思想。　　首先程序可以被

2024-05-21 14:32:55

Flink内存模型

之前聊Flink的slot時簡單提到過內存，Flink計算框架的內存大致分爲Flink使用的內存、Jvm使用的內存。Flink爲什麼不全使用JVM內存的原因是顯而易見的，作爲實時計算框架，JVM內存依賴GC自動回收一旦稍微慢一點，就會對

人不瘋狂枉一生

2024-05-21 14:32:45

Flink富函数

富函數是DataStream API提供的函數接口，Flink的函數都有它的Rich版本，它與其他函數不同的是，富函數可以獲取到運行環境上下文，初始化參數，擁有生命週期方法等，可通過它進行自定義複雜功能。我們常見的如RichMapFu

人不瘋狂枉一生

2024-05-21 14:32:45

YiShaAdmin：一款基于.NET Core Web + Bootstrap的企业级快速开发框架

前言今天大姚給大家分享一款基於.NET Core Web + Bootstrap的企業級快速後臺開發框架、權限管理系統，代碼簡單易懂、界面簡潔美觀（基於MIT License開源，免費可商用）：YiShaAdmin。項目官方介紹 YiS

2024-05-21 14:31:45

美团一面：项目中有 10000 个 if else 如何优化？想了半天，被问懵了！

大家好，我是R哥。最近做 Java 面試輔導，有個兄弟面試美團，遇到一個特別有意思的問題：一萬個 if else 如何優化，有好的解決方案嗎？我看到這問題都有點懵逼，現實項目中怎麼可能會有 10000 個 if else 的代碼

2024-05-21 14:31:14

一种精度更高的hopf直线检测策略, 一种高精度边缘检测方法.

#aaa是cv.read圖片. img = aaaa.copy() gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) ret, binary = cv2.threshold(gray, 0, 25

張博的博客

2024-05-21 14:29:34

深入了解安全工具Vault、Vault根令牌和解封密钥，详细整理部署Vault的详细步骤

一、深入瞭解安全工具Vault Vault是一種開源工具，用於安全地存儲、管理和控制訪問各種機密信息，如密碼、API令牌、安全配置和其他敏感數據。Vault使用強大的加密和安全管理技術來保護這些機密信息，併爲應用程序和服務提供安全的訪問

2024-05-21 14:23:34

keycloak~作为第三方登录的对接标准

當某些合作商希望把你的keycloak作爲他們的一種第三方登錄方式時，就像微信，google，github，使用你的keycloak上的賬戶資源時，你就需要考慮如何做一個開放的，標準的文檔了。一基本角色認證提供者：keycloak服

2024-05-21 14:22:24

hdu4027（线段树区间操作）

Problem - 4027 (hdu.edu.cn)許多邪惡的戰艦在戰鬥前排成一排。我們的指揮官決定使用我們的祕密武器來消滅戰列艦。每艘戰列艦都可以標記爲耐力值。對於我們祕密武器的每一次攻擊，它都可能降低連續部分戰列艦的續航能力，使它們

2024-05-21 14:20:03

Python 将PowerPoint (PPT/PPTX) 转为HTML

PPT是傳遞信息、進行彙報和推廣產品的重要工具。然而，有時我們需要將這些精心設計的PPT演示文稿發佈到網絡上，以便於更廣泛的訪問和分享。本文將介紹如何使用Python將PowerPoint文檔轉換爲網頁友好的HTML格式。包含兩個簡單示例：

2024-05-21 14:19:53

如何构建一个系统

假設有要處理的數據 A1 A2 A3 ... 你想要設計一個功能 F，這個F應該處理數據 Ai，那麼你需要編寫程序P=F，是的： O1 = F(A1) O2 = F(A2) O3 = F(A3) ... 如果寫了個F，一次就解決了，那就萬事

2024-05-21 14:18:13

172.22.56.0/22

172.22.56.0/22 56對應的二進制是00111000, 16+6=22。所以第三個byte的後面2位bit可以使用。 The IP address and subnet mask you provided, 172.22.5

2024-05-21 14:16:52

24小時熱門文章

最新文章

最新評論文章