四種軟件架構

四種軟件架構

一.ISP架構
在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述
二.阿里雲大數據架構

在這裏插入圖片描述

在這裏插入圖片描述
三.今日頭條推薦算法架構

推薦系統,如果用形式化的方式去描述實際上是擬合一個用戶對內容滿意度的函數,這個函數需要輸入三個維度的變量。

第一個維度是內容。頭條現在已經是一個綜合內容平臺,圖文、視頻、UGC小視頻、問答、微頭條,每種內容有很多自己的特徵,需要考慮怎樣提取不同內容類型的特徵做好推薦。

第二個維度是用戶特徵。包括各種興趣標籤,職業、年齡、性別等,還有很多模型刻劃出的隱式用戶興趣等。

第三個維度是環境特徵。這是移動互聯網時代推薦的特點,用戶隨時隨地移動,在工作場合、通勤、旅遊等不同的場景,信息偏好有所偏移。結合三方面的維度,模型會給出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。

在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述

四.AI的架構

人工智能的架構分爲三層:應用層、技術層和基礎層。

在這裏插入圖片描述

應用層聚焦在人工智能和各行業各領域的結合。技術層是算法、模型和技術開發。基礎層則是計算能力和數據資源。

各層架構再進行細分如下:

在這裏插入圖片描述

數據收集:獲取什麼類型的數據,數據可以通過那些途徑獲取。常見的數據來源是採集、購買或其他方式獲取現有數據。

比如中山大學的資深機器學習研究專家樑浩林就分享到,城市地理學領域的數據採集渠道,可以同步獲取一些社交APP,比如Yahoo Flickr、Sina
Webo的checkin數據,手機的信號數據,用戶GPS的軌跡數據等等。

數據理解:獲取到原始數據之後,分析數據裏面有什麼內容、數據準確性如何,爲下一步的預處理做準備。

比如我們拍攝的各種照片,需要從中識別出包含人臉的照片。

數據預處理:原始數據可能會有環境影響或者干擾因素,格式化也不好,所以爲了保證預測的準確性和有效性,需要進行數據的預處理。

常見的比如調整照片亮度、對比度、銳化等等。

特徵提取:將數據裏有用的,有典型特徵的抽取出來。

比如,對幾千張有效照片進行分類,特徵包括性別、頭髮眼睛皮膚顏色、輪廓、臉型等等。

模型構建:使用適當的算法,獲取預期準確的值。

常用的分類算法包括:決策樹分類法(Decision Tree),樸素貝葉斯分類算法(Native Bayesian
Classifier)、基於支持向量機(SVM)的分類器、神經網絡法(Neural Network)、k-最近鄰法(k-nearest neighbor,kNN) 語義樹、知識庫、各種視覺算法等等等。至於各種算法的區別,我還在學習中。

模型評估:通常對一個模型進行評估的標準有準確率、查全率。

查準率 =檢索出的相關信息量/檢索出的信息總量

查全率=檢索出的相關信息量/系統中的相關信息總量

狹義上的理解拿人臉識別來講,假設數據庫中存在的10個用戶的照片,我對這10個用戶進行拍照,識別出來庫中包含的人臉有7個,這7箇中識別正確的有5個,那麼查準率=5/10=50%;查全率就是7/10=70%。另外就是,假設我對1個用戶,操作十次,出來的結果是否十次均和實際匹配。我認爲也是模型評估的一個標準。

模型訓練:根據模型評估的結果,對模型進行不斷的訓練甚至是調整,以達到更好的效果。

模型應用:將模型部署、應用到實際場景中。

可以回到AI 基本概念和應用中的人臉識別開門場景,來看看如何跟我們的 AI 架構對應的。

在這裏插入圖片描述

從AI 的結構很容易可以看出來。

人工智能的核心是基礎層,即計算能力和refreshing data flow (持續的數據流)。

所以大公司願意投入人工智能和發展人工智能,因爲大公司有數據,尤其是Google、Facebook、亞馬遜、蘋果,還有國內的BAT。數據是大公司的一個優勢。

於是現在有一個聲音會認爲:大公司不具備的醫療、基金、金融等數據,可能會是小公司、人工智能初創企業突破的機會。

技術層的核心主要在於:特徵提取, 模型與算法選擇。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章