Pytorch的一些技巧

原創

2020-03-08 03:04

篩選大於閾值的值

conf_mask = (prediction[:,:,4] > confidence).float().unsqueeze(2)
prediction = prediction*conf_mask

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

什麼是LLM大模型訓練，詳解Transformer結構模型

本文分享自華爲雲社區《LLM 大模型學習必知必會系列(四)：LLM訓練理論篇以及Transformer結構模型詳解》，作者：汀丶。 1.模型/訓練/推理知識介紹深度學習領域所謂的“模型”，是一個複雜的數學公式構成的計算步驟。爲了便於理解

原創

2024-06-04 11:09:34

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

原創

2024-05-07 23:30:09

文心大模型“你說我畫”：PaddleHub與PaddleSpeech的協同實踐

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

原創

2024-04-22 11:29:20

Create 2024 分論壇：百度大模型安全解決方案護航開發者一起創造未來

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

百度安全

2024-04-19 21:33:25

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

原創

2024-04-12 21:33:07

金融領域中的大模型Lora微調：實戰應用與性能優化

隨着金融行業的快速發展，大數據和人工智能技術的應用越來越廣泛。在這個背景下，深度學習模型在金融領域的應用逐漸受到重視。然而，傳統的深度學習模型在金融場景中面臨着數據量大、模型複雜度高、計算資源有限等挑戰。爲了解決這個問題，Lora框架應運而

原創

2024-04-11 23:28:47

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

原創

2024-04-10 23:29:41

純C語言框架助力降低大模型運行成本

在人工智能領域，大模型的運行成本一直是制約其發展的瓶頸。高昂的硬件投入、複雜的算法實現以及龐大的數據訓練，使得許多企業和研究機構望而卻步。然而，最近一位名叫李明的計算機科學家，憑藉他在llama.cpp項目中的卓越成就，開始了他的創業之路，

原創

2024-03-19 12:14:20

語言大模型的浮點運算分配優化策略

隨着人工智能技術的不斷髮展，語言大模型（Large Language Models, LLMs）在自然語言處理、語音識別、機器翻譯等領域的應用越來越廣泛。這些模型通常包含數十億甚至上萬億的參數，對計算資源和浮點運算能力提出了極高的要求。如何

原創

2024-03-15 00:33:17

揭祕QQ的AI繪畫大模型技術——QQGC深度解析

隨着人工智能技術的飛速發展，AI繪畫已經成爲了一個備受矚目的領域。在這個領域中，QQGC——QQ的AI繪畫大模型技術，憑藉其卓越的性能和實用性，贏得了廣大用戶的喜愛。那麼，QQGC到底是什麼？它是如何實現的呢？本文將對這些問題進行深入解析。

原創

2024-03-08 00:41:36

【PyTorch】學習之路—簡簡單單的入門，一文看懂

PyTorch修煉手冊其實PyTorch這個框架非常簡單，沒有對比就沒有傷害，大多數的語法也非常python。如果你已瞭解numpy的一些語法，那麼上手會比較快；如果你是和我曾經一樣的小白也不要緊，跟住文章來理解他是如何處理數據

HollrayChan

2020-07-07 09:35:48

Caffe學習記錄

基礎 Caffe (Convolution Architecture For Feature Embedding (Extraction)) 網絡各層詳細解釋 http://caffe.berkeleyvision.org/tutoria

二狗diudiu

2020-07-01 15:52:08

iteration，batch ，epoch

迭代（iteration）：神經網絡在訓練數據集上跑一遍 batch size: 每次只使用數據集中的部分樣本註釋：由於batch size的提出，兩個網絡比較性能的時候，若直接比較迭代的次數，這時已經沒有什麼意義了，因爲兩個網絡的ba

二狗diudiu

2020-07-01 15:52:07

Pytorch 1.3 在Windows下的安裝

第一步：下載anaconda，地址：https://repo.anaconda.com/archive/Anaconda3-2019.10-Windows-x86_64.exe 這裏選擇window環境下的Python3.7，64位版本

yangailin12138

2020-07-01 13:23:22

Windows下安裝PyTorch1.0

更新提醒：本文已過期，PyTorch1.5正式版已在2020年4月21發佈，Windows下安裝最新的PyTorch1.5請移步本人另一篇博客：Windows下安裝PyTorch1.5。 PyTorch簡介在2017年1月18日

nudt_qxx

2020-07-01 05:15:06

24小時熱門文章

Pytorch的一些技巧

篩選大於閾值的值

argv cannot be an empty list, and must contain the program name as the first element C++調用python出錯

Pytorch搭建ResNet18識別MNIST例程

Keras搭建VGG搭建ResNet識別MNIST識別CIFAR10例程

網絡基礎（將TCP服務端程序部署在雲服務器）

筆記9-機器學習2

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結