神經網絡基礎A

原創

2020-02-25 16:09

BP神經網絡，正向傳播求損失，反向傳播求誤差。

caffe的fine-tuning：就是把現成的模型略加修改然後再作少量training，主要用於樣本數量不足的情形。

激活層點進點出，逐點計算，維度不會改變

pytorch最重要是把class完成（網絡結構、前向運算），然後定義損失函數、優化器，for循環計算loss。

content loss 歐式距離

tf.placeholder

tf.Variable

op(操作符/算子)

圖，session中跑流程

softmax就是如果某一個zj大過其他z,那這個映射的分量就逼近於1,其他就逼近於0，主要應用就是多分類，sigmoid函數只能分兩類，而softmax能分多類，softmax是sigmoid的擴展。

損失函數（hinge loss/支持向量機損失、交叉熵損失）

線性分類器的理解：模板匹配

神經元感知器

激勵層

端到端指的是輸入是原始數據，輸出是最後的結果，原來輸入端不是直接的原始數據，而是在原始數據中提取的特徵，這一點在圖像問題上尤爲突出，因爲圖像像素數太多，數據維度高，會產生維度災難，所以原來一個思路是手工提取圖像的一些關鍵特徵，這實際就是就一個降維的過程。

端到端強調中間不用手工干預

做了一些前置處理的，就不是end-to-end了。比如去噪、平滑、顯著性提取、分割、去色等等。還比如提取過特徵，將特徵作爲輸入的，也不是end-to-end，比如提取個SIFT、RGB值什麼的。

將原始圖片直接作爲輸入的，將物理系統需要的調節參數作爲輸出的，纔是端到端。（例如將車輛速度、轉角作爲輸出）

深度學習中的Batch Normalization

BN就是在神經網絡的訓練過程中對每層的輸入數據加一個標準化處理。

BN通過規範化輸入數據改變數據分佈，在前傳過程中消除梯度彌散。

比如你要研究一個新的模型，你是在前人的模型基礎上新增加了一些組件，別人也基本都是在這個模型上進行修改，那這個模型就叫做baseline model——基準模型。聽名字就能聽出來，就是你自己模型的一個基準，一個基本的框架，模型再複雜，最根本的框架是差不多的。比如序列標註任務baseline基本是BILSTM+CRF，大多數人都是在這基礎上增改，加些Char-CNN，Attention機制之類的。

神經網絡單隱層可以逼近任何連續函數單隱層交多隱層or

softmax函數

數據格式(data_format)

目前主要有兩種方式來表示張量：

a) th模式或channels_first模式，Theano和caffe使用此模式。

b）tf模式或channels_last模式，TensorFlow使用此模式。

下面舉例說明兩種模式的區別：

對於100張RGB3通道的16×32（高爲16寬爲32）彩色圖，

th表示方式：（100,3,16,32）

tf表示方式：（100,16,32,3）

唯一的區別就是表示通道個數3的位置不一樣。

張量(tensor)，可以看作是向量、矩陣的自然推廣，用來表示廣泛的數據類型。張量的階數也叫維度。

0階張量,即標量,是一個數。

1階張量,即向量,一組有序排列的數

2階張量,即矩陣,一組向量有序的排列起來

3階張量，即立方體，一組矩陣上下排列起來

4階張量......

依次類推

重點：關於維度的理解

假如有一個10長度的列表，那麼我們橫向看有10個數字，也可以叫做10維度，縱向看只能看到1個數字，那麼就叫1維度。注意這個區別有助於理解Keras或者神經網絡中計算時出現的維度問題。

Dense(500,input_shape=(784,))

a）Dense層屬於網絡層-->常用層中的一個層

b） 500表示輸出的維度，完整的輸出表示：(*,500)：即輸出任意個500維的數據流。但是在參數中只寫維度就可以了，比較具體輸出多少個是有輸入確定的。換個說法，Dense的輸出其實是個N×500的矩陣。

c）input_shape(784,) 表示輸入維度是784(28×28)，完整的輸入表示：(*,784)：即輸入N個784維度的數據

shenji

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

03-爲啥大模型LLM還沒能完全替代你？

1 不具備記憶能力的它是零狀態的，我們平常在使用一些大模型產品，尤其在使用他們的API的時候，我們會發現那你和它對話，尤其是多輪對話的時候，經過一些輪次後，這些記憶就消失了，因爲它也記不住那麼多。 2 上下文窗口的限制大模型對其inpu

2024-04-23 01:07:00

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

01-大語言模型發展

AI大模型的相關的一些基礎知識，一些背景和基礎知識。多模型強應用AI 2.0時代應用開發者的機會。 0 大綱 AI產業的拆解和常見名詞應用級開發者，在目前這樣一個大背景下的一個職業上面的一些機會實戰部分的，做這個agent，即所謂智

2024-04-22 01:12:50

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

深入解析大模型NLP LLaMa

在人工智能和自然語言處理（NLP）領域，LLaMa（Language-Model-driven Learning, aMplification and aDAptation）流程已經成爲處理大規模模型訓練的關鍵技術。它基於語言模型的學習、增

2024-04-18 11:29:54

文檔圖像大模型

隨着信息技術的快速發展，文檔處理已經成爲日常生活和工作中不可或缺的一部分。傳統的文檔處理方法往往需要人工參與，效率低下且易出錯。近年來，隨着深度學習技術的突破，文檔圖像大模型在智能文檔處理領域嶄露頭角，爲提升文檔處理性能提供了新的解決方案。

2024-04-18 11:29:52

從零開始學習大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

2024-04-12 21:33:07

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

金融領域中的大模型Lora微調：實戰應用與性能優化

隨着金融行業的快速發展，大數據和人工智能技術的應用越來越廣泛。在這個背景下，深度學習模型在金融領域的應用逐漸受到重視。然而，傳統的深度學習模型在金融場景中面臨着數據量大、模型複雜度高、計算資源有限等挑戰。爲了解決這個問題，Lora框架應運而

2024-04-11 23:28:47

RAG 修煉手冊｜一文講透 RAG 背後的技術

在之前的文章中《RAG 修煉手冊｜RAG敲響喪鐘？大模型長上下文是否意味着向量檢索不再重要》，我們已經介紹過 RAG 對於解決大模型幻覺問題的不可或缺性，也回顧瞭如何藉助向量數據庫提升 RAG 實戰效果。今天我們繼續剖析 RAG，將爲大

2024-04-10 21:20:11

一站式解讀多模態——Transformer、Embedding、主流模型與通用任務實戰（上）

本文章由飛槳星河社區開發者高宏偉貢獻。高宏偉，飛槳開發者技術專家（PPDE），飛槳領航團團長，長期在自媒體領域分享 AI 技術知識，博客粉絲 9w+，飛槳星河社區 ID 爲 GoAI 。分享分爲上下兩期，本期分享從多模態概念與意義、任務類型

2024-04-08 11:42:41

百億大規模圖在廣告場景的應用

本文通過搜索推薦項目進行外賣搜索廣告弱供給填充，提高流量變現效率。我們提出外賣多場景異構大圖、異構大圖在線建模技術演進路線，解決外賣搜索推薦業務多渠道、即時化的挑戰。相關成果發表CIKM2023會議一篇。聯合機器學習平臺搭建大規模圖訓練、

2024-03-29 21:16:38

24小時熱門文章

DAPPER 事務 TRANSACTION

最新文章

最新評論文章