人工神經網絡組成及用例

一、簡介
人工神經網絡背後的概念和科學已經存在了數十年。但是直到最近幾年,神經網絡的承諾才變爲現實,並幫助AI行業擺脫了漫長的冬季。

二、組成及其用例
組成:
人工神經網絡的核心成分是人工神經元。每個神經元接收來自其他幾個神經元的輸入,將它們乘以分配的權重,將它們相加,然後將總和傳遞給一個或多個神經元。一些人工神經元可能在將輸出傳遞給下一個變量之前將激活函數應用於輸出。
在這裏插入圖片描述
從本質上講,這聽起來像是一個非常瑣碎的數學運算。但是,當將成千上萬的神經元多層放置並堆疊在一起時,你將獲得一個人工神經網絡,可以執行非常複雜的任務,例如對圖像進行分類或識別語音。人工神經網絡由一個輸入層和一個輸出層組成,其中輸入層從外部源(數據文件,圖像,硬件傳感器,麥克風等)接收數據,一個或多個隱藏層處理數據,輸出層提供一個或多個數據點基於網絡的功能。例如,檢測人,汽車和動物的神經網絡將具有一個包含三個節點的輸出層。對銀行在安全和欺詐之間進行交易進行分類的網絡將只有一個輸出。
在這裏插入圖片描述

訓練人工神經網絡
人工神經網絡首先爲神經元之間的連接權重分配隨機值。ANN正確而準確地執行其任務的關鍵是將這些權重調整爲正確的數字。但是找到合適的權重並不是一件容易的事,特別是當您處理多層和成千上萬的神經元時。
通過對帶有註釋示例的網絡進行“培訓”來完成此校準。例如,如果您要訓練上述圖像分類器,則可以爲其提供多張照片,每張照片均標有其相應的類別(人,汽車或動物)。當您爲它提供越來越多的訓練示例時,神經網絡會逐漸調整其權重,以將每個輸入映射到正確的輸出。
基本上,訓練期間發生的事情是網絡進行自我調整以從數據中收集特定模式。同樣,對於圖像分類器網絡,當您使用質量示例訓練AI模型時,每一層都會檢測到特定的特徵類別。例如,第一層可能檢測到水平和垂直邊緣,第二層可能檢測到拐角和圓形。在網絡的更深處,更深的層次將開始挑選出更高級的功能,例如面部和物體。

神經網絡與經典AI
傳統的基於規則的AI程序基於經典軟件的原理。計算機程序旨在對存儲在存儲單元中的數據運行操作,並將結果保存在其他存儲單元中。程序的邏輯是順序的,確定性的,並基於明確定義的規則。操作由一個或多箇中央處理器運行。
但是,神經網絡既不是順序的也不是確定性的。另外,無論底層硬件如何,都沒有中央處理器來控制邏輯。相反,邏輯分佈在成千上萬個較小的人工神經元上。人工神經網絡不運行指令;相反,他們對輸入執行數學運算。開發模型行爲的是他們的集體行動。
神經網絡不是通過手動編碼的邏輯表示知識,而是在權重和激活的總體狀態下對知識進行編碼。特斯拉AI負責人安德烈·卡帕蒂(Andrej Karpathy)在一篇出色的媒體文章“ 軟件2.0 ” 中雄辯地描述了神經網絡的軟件邏輯:
我們都熟悉Software 1.0的“經典堆棧”, 它是用Python,C ++等語言編寫的。它由程序員編寫的對計算機的明確指令組成。通過編寫每一行代碼,程序員可以識別程序空間中具有某些所需行爲的特定點。
人工神經網絡只是執行機器學習的幾種算法之一,而機器學習是人工智能的分支,它根據經驗來發展行爲。還有許多其他機器學習技術,它們可以在數據中找到模式並執行諸如分類和預測之類的任務。其中一些技術包括迴歸模型,支持向量機(SVM),k最近方法和決策樹。
但是,在處理雜亂且非結構化的數據(例如圖像,音頻和文本)時,神經網絡的性能優於其他機器學習技術。
例如,如果要使用經典的機器學習算法執行圖像分類任務,則必須進行大量複雜的“功能工程”,這是一個複雜而艱鉅的過程,需要數名工程師和領域專家的共同努力。神經網絡和深度學習算法不需要特徵工程,只要訓練得當,就可以自動從圖像中提取特徵。但是,這並不意味着神經網絡可以替代其他機器學習技術。其他類型的算法需要較少的計算資源,並且較不復雜,這使得它們在嘗試解決不需要神經網絡的問題時更可取。

三、總結
在本篇文章中我們簡要的描述了人工神經網絡的組成和其在AI等方面的一些應用,下面我們將會對其運作過程作介紹。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章