谷歌的深度学习在AI芯片中找到了一条关键路径

原創

2021-04-08 14:48

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"一年前，ZDNet 与谷歌大脑总监 Jeff Dean"},{"type":"link","attrs":{"href":"https:\/\/www.zdnet.com\/article\/google-experiments-with-ai-to-design-its-in-house-computer-chips\/?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"谈到"}]},{"type":"text","text":"了该公司如何使用人工智能来推进定制芯片的内部开发，从而加快软件开发。Dean 指出，在有些情况下，与人类相比，人工智能的深度学习能够更好地决定如何在芯片中布置电路。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/e3\/8d\/e32d03fb6670370d6d375ebf1c5dd98d.jpg","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":"center","origin":null},"content":[{"type":"text","marks":[{"type":"size","attrs":{"size":10}}],"text":"人工智能加速器芯片的所谓搜索空间，意味着芯片的结构必须优化功能模块。很多人工智能芯片的特点是拥有用于大量简单数学运算的并行、相同的处理器单元，这里称为“PE”，用于执行大量的矢量矩阵乘法运算，而这些运算是神经网络处理的主要工作。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"上个月，谷歌在 arXiv 文件服务器上发布了一篇题为《"},{"type":"link","attrs":{"href":"https:\/\/arxiv.org\/abs\/2102.01723?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"Apollo：可迁移架构探索"}]},{"type":"text","text":"》（"},{"type":"text","marks":[{"type":"italic"}],"text":"Apollo: Transferable Architecture Exploration"},{"type":"text","text":"）的论文，并由主要作者 Amir Yazdanbakhsh 发表了一篇"},{"type":"link","attrs":{"href":"https:\/\/ai.googleblog.com\/2021\/02\/machine-learning-for-computer.html?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"博文"}]},{"type":"text","text":"，公开展示了其中一个名为 Apollo 的研究项目。Apollo 是一项很有意义的进展，它超越了 Dean 一年前在国际固态电路研讨会（International Solid State Circuits Conference）上的正式演讲以及在 ZDNet 上的发言中所暗示的含义。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"从 Dean 当时提供的例子来看，机器学习可以被用来做一些低级的设计决定，也就是所谓的“位置和路线”。芯片设计者利用软件来确定构成芯片操作的电路布局，在位置和路线上，与建筑物的平面图设计相似。相反，在 Apollo 项目中，更多的是 Yazdanbakhsh 和他的同事所谓的“架构探索”，而非建筑物的平面图设计。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"芯片的架构是设计芯片的功能元素，它们如何相互作用，以及软件程序员应该如何获取这些功能元素。例如，典型的英特尔 x86 处理器有一定数量的片内存储器、专用的算术逻辑单元和一些寄存器等等。这些部分的组合方式，赋予了所谓英特尔架构的意义。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"当被问及 Dean 的描述时，Yazdanbakhsh 通过电子邮件对 ZDNet 说：“我将看到我们的工作和位置路线项目是正交且互补的。”在谈到康奈尔大学 Christopher Batten 的演讲时，他对此解释道：“架构探索远远高于"},{"type":"link","attrs":{"href":"https:\/\/www.csl.cornell.edu\/courses\/ece5745\/handouts\/ece5745-overview.pdf?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"计算栈"}]},{"type":"text","text":"中的位置和路线。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Yazdanbakhsh 说：“我相信，在架构探索方面，还有更大的性能提升空间。”他和他的同事把 Apollo 称为“第一个可迁移的架构探索基础设施”，它是第一个可以在不同芯片上工作的程序，它对可能的芯片架构的探索能力越强，就越能把学到的东西迁移到每一个新的任务中。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Yazdanbakhsh 和团队正在开发的芯片本身就是用于人工智能的芯片，即人工智能加速器芯片。它与英伟达 A100 “Ampere” GPU、Cerebras Systems 的 WSE 芯片以及现在上市的许多其他初创公司的芯片属于同一类。所以，使用人工智能设计芯片来运行人工智能，就是一种“对称性”。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"考虑到设计人工智能芯片的任务，Apollo 项目所探索的架构适合运行神经网络。它意味着大量的线性代数，大量的简单的数学单元，执行矩阵乘法和结果的求和。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"该团队定义这一挑战是为了找出这些数学模块的适当组合，以适应给定的人工智能任务。他们选择了一项相当简单的人工智能任务，一种叫做 MobileNet 的卷积神经网络，它是一种资源高效网络，由谷歌的 Andrew G. Howard 和他的同事在"},{"type":"link","attrs":{"href":"https:\/\/arxiv.org\/abs\/1704.04861?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"2017 年推出"}]},{"type":"text","text":"。另外，他们还利用内部设计的几个网络来测试工作负载，如对象检测和语义分割等任务。这样的话，目标就变成了：芯片的架构有哪些合适的参数，使得芯片能够满足给定的神经网络任务的某些标准，比如速度？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"该搜索涉及到超过 4.52 亿个参数的排序，包括要使用多少数学单元（称为处理器元素），以及有多少参数内存和激活内存最适合给定模型。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/0f\/34\/0f2a5a645b27b71bda639cd5cf7a0634.jpg","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Apollo 的优势在于，它可以将各种已有的优化方法结合起来，并观察它们如何叠加来优化新颖的芯片设计架构。这张小提琴图展示了相对的结果。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"译注"},{"type":"text","text":"：小提琴图（Violin Plot）是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征，主要用来显示数据的分布形状。跟箱形图类似，但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Apollo 是一种框架，它可以使用文献中开发的各种方法进行所谓的黑盒优化，它可以根据特定的工作负载调整这些方法，并比较每种方法在解决目标方面的表现。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Yazdanbakhsh 和他的同事们用一些优化方法来实现另一种对称性，它实际上是为开发神经网络架构而设计的。它们包括谷歌的 QuocV. Le 及其同事在 2019 年开发的所谓"},{"type":"link","attrs":{"href":"https:\/\/arxiv.org\/abs\/1802.01548?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"进化方法"}]},{"type":"text","text":"；"},{"type":"link","attrs":{"href":"https:\/\/openreview.net\/forum?id=HklxbgBKvr&fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"基于模型的强化学习"}]},{"type":"text","text":"，以及由谷歌的 Christof Angermueller 等人开发的所谓基于群体的方法的集成，目的是“设计” DNA 序列；以及一种贝叶斯优化方法。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这样，Apollo 就包含了令人愉悦的对称性的主要层次，它把神经网络设计与生物合成设计的方法结合起来，从而设计出可反过来用于神经网络设计与生物合成的电路。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"将所有这些优化进行比较，这也是 Apollo 框架的亮点。其存在的根本原因是要有条理地运用各种不同的方法，并确定哪些方法最有效。Apollo 测试的结果详细说明了进化和基于模型的方法如何优于随机选择和其他方法。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"但是 Apollo 最显著的发现是，运行这些优化方法可以让过程比暴力搜索更加高效。举例来说，他们比较了基于群体的集合方法和他们称为体系结构方法的解决方案集的半穷举搜索。Yazdanbakhsh 和他的同事发现，基于群体的方法可以找到使用电路来折衷的解决方案，比如计算和内存，这通常需要了解特定领域的知识。因为基于群体的方法是一种学习型方法，所以它可以找到半穷尽式搜索所不能找到的解决方案："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"P3BO（基于群集的黑盒优化）实际上是在 3K 样本的搜索空间中找到一个比半穷举法稍好的设计。我们发现这个设计使用了一个很小的内存（3MB）来支持更多的计算单元。它使用了视觉工作负载的计算密集型特性，这是最初的半穷尽式搜索空间没有包含的特性。研究结果表明，半穷尽式算法需要人工搜索空间工程，而基于学习的优化算法利用了较大的搜索空间，减少了人工工作。"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"因此， Apollo 可以计算出芯片设计中各种优化方法的表现。但是，它还可以做得更多，即运行所谓的迁移学习，以展示如何反过来改进这些优化方法。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"为了改进芯片的设计点，如最大芯片尺寸（以毫米为单位），通过运行优化策略，这些实验的结果可以作为输入反馈给后续的优化方法。Apollo 团队发现，各种优化方法都是通过利用初始（或种子）优化方法的最优结果来改进它们在面积受限电路设计等任务中的性能。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这一切都要靠为 MobileNet 或任何其他网络或工作负载设计芯片这一事实来支持，因为设计过程限制了特定工作负载的适用性。事实上，作者之一 Berkin Akin 曾帮助开发过 MobileNet 的一个版本 MobileNet Edge，他曾指出，优化是芯片优化和神经网络优化的产物。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“神经网络架构必须了解目标硬件架构，从而优化整体系统性能和能效。”Akin 去年与同事 Suyog Gupta 在一篇"},{"type":"link","attrs":{"href":"https:\/\/arxiv.org\/abs\/2003.02838?fileGuid=3xgr169o12oUrbxS","title":"","type":null},"content":[{"type":"text","text":"论文"}]},{"type":"text","text":"中写道。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“问题很好，”Akin 在电子邮件中回答。“那得看情况了。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Akin 说， Apollo 也许可以满足给定的工作负载，但是芯片和神经网络之间的协同优化，将来也会带来其他好处。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Akin 的答复全文如下："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们针对给定的固定神经网络模型套件设计了硬件，当然也有一些用例。在硬件目标应用领域，这些模型可能是已经被高度优化的代表性工作负载的一部分，也可能是用户定制的加速器所需要的。本课题就是要解决这个问题，我们使用机器学习来为给定的工作负载组合寻找最佳硬件架构。当然，在某些情况下，硬件设计和神经网络体系结构可以灵活地联合优化。实际上，我们在这种联合协同优化方面已经取得了一些进展，我们希望能够做出更好的权衡……"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"最终结论是，即使芯片设计受到人工智能的新工作负载的影响，但芯片设计的新过程也可能对神经网络的设计产生可测量的影响，而且这种辩证关系可能在今后几年中以有趣的方式发展。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"作者介绍："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Tiernan Ray，毕业于普林斯顿大学，从事技术和商业报道超过 24 年。现为 Barron 技术编辑，为 Tech Trader 博客撰写每日市场报道。曾供职于彭博社、SmartMoney 和 ComputerLetter，报道科技领域的风险投资。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"原文链接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"https:\/\/www.zdnet.com\/article\/googles-deep-learning-finds-a-critical-path-in-ai-chips\/"}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

LoRA微调语言大模型的实用技巧

一、引言隨着深度學習技術的快速發展，語言大模型在自然語言處理領域取得了顯著的進展。然而，傳統的微調方法通常需要大量的計算資源和時間，對於實際應用來說並不友好。爲了解決這個問題，LoRA微調技術應運而生。LoRA（Low-Rank Adap

2024-04-28 11:30:13

京东广告研发——效率为王：广告统一检索平台实践

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

大模型区域落地再加速！百度“文心中国行”西部首站落地成都锦江

4 月 24 日，“文心中國行”西部地區首站落地成都錦江。成都市錦江區白鷺灣新經濟總部功能區、錦江區投資促進局與百度飛槳攜手合作，打造成都人工智能的新產業、新模式、新業態。來自成都政產學研各界的領導、專家、企業嘉賓，共同探討如何降低 AI

2024-04-25 11:41:53

文心中国行走进成都！4 月 24 日一起把握大模型时代的产业新机遇

4 月 24 日，文心中國行將走進成都。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，從人工智能政策解讀、大模型技術，到產業創新應用的實踐案例，讓參會者全方位瞭解大模型時期的發展與創新機遇。大會還特別

2024-04-23 11:41:07

文心大模型“你说我画”：PaddleHub与PaddleSpeech的协同实践

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

2024-04-22 11:29:20

探索时间序列大模型：TimeGPT的魅力与实践

在數據科學的各個領域中，時間序列分析一直扮演着重要角色。無論是預測股票價格、氣候變化，還是分析醫療數據，時間序列模型都發揮着不可或缺的作用。然而，傳統的時間序列分析方法在處理複雜數據時常常面臨諸多挑戰，如數據稀疏性、非線性關係等。爲了應對這

2024-04-22 11:29:17

京东广告研发——AIGC在京东广告创意的技术应用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應用還存在缺乏

2024-04-22 11:16:30

Create 2024 分论坛：百度大模型安全解决方案护航开发者一起创造未来

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

2024-04-19 21:33:25

AI大模型应用架构（ALLMA）白皮书解读

隨着人工智能技術的不斷髮展，AI大模型成爲推動生產、生活方式變革，助推產業智能化轉型升級，驅動數字經濟高質量發展等社會經濟發展方面的新引擎。爲了全面展示AI大模型的發展全貌，爲各界提供新思路，本文將對AI大模型應用架構（ALLMA）白皮書進

2024-04-19 11:29:39

文心大模型ERNIE-Tiny：轻量化技术的全面解读

隨着人工智能技術的日益成熟，大模型成爲了衆多領域的研究熱點。大模型通過龐大的數據量和複雜的網絡結構，實現了對數據的深度挖掘和高效處理。然而，大模型的龐大體積和高計算成本也限制了其在一些實際場景中的應用。爲了解決這一問題，文心大模型ERNIE

2024-04-18 11:29:53

文档图像大模型

隨着信息技術的快速發展，文檔處理已經成爲日常生活和工作中不可或缺的一部分。傳統的文檔處理方法往往需要人工參與，效率低下且易出錯。近年來，隨着深度學習技術的突破，文檔圖像大模型在智能文檔處理領域嶄露頭角，爲提升文檔處理性能提供了新的解決方案。

2024-04-18 11:29:52

王海峰：百度 500 万 AI 人才培养目标已提前达成

4 月 16 日，以“創造未來”爲主題的 Create 2024 百度 AI 開發者大會在深圳國際會展中心成功舉辦。百度首席技術官王海峯以“技術築基，星河璀璨”爲題，發表演講，解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。

2024-04-17 23:41:11

提高 RAG 应用准确度，时下流行的 Reranker 了解一下？

檢索增強生成（RAG）是一種新興的 AI 技術棧，通過爲大型語言模型（LLM）提供額外的“最新知識”來增強其能力。基本的 RAG 應用包括四個關鍵技術組成部分： Embedding 模型：用於將外部文檔和用戶查詢轉換成 Embeddi

2024-04-17 21:20:19

从零开始学习大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

24小時熱門文章

最新文章

最新評論文章