題目來源:牛客網
目錄
1.以下哪個是常見的時間序列算法模型
A.RSI
B.MACD
C.ARMA
D.KDJ
解析
時間序列是時間間隔不變的情況下收集的不同時間點數據集合,這些集合被分析用來了解長期發展趨勢及爲了預測未來。
常用的時間序列模型有
AR模型(Autoregressive model:自迴歸模型)、
MA模型(moving average model:滑動平均模型)、
ARMA模型(Auto-Regressive and Moving Average Model:自迴歸滑動平均模型)
ARIMA模型(Autoregressive Integrated Moving Average Model:自迴歸積分滑動平均模型)等
相對強弱指數 (RSI, Relative Strength Index) 是通過比較一段時期內的平均收盤漲數和平均收盤跌數來分析市場買沽盤的意向和實力 , 從而作出未來市場的走勢
移動平均聚散指標 (MACD, Moving Average Convergence Divergence), 是根據均線的構造原理 , 對股票價格的收盤價進行平滑處理 , 求出算術平均值以後再進行計算 , 是一種趨向類指標
隨機指標 (KDJ) 一般是根據統計學的原理 , 通過一個特定的週期 ( 常爲 9 日 ,9 周等 ) 內出現過的最高價 , 最低價及最後一個計算週期的收盤價及這三者之間的比例關係 , 來計算最後一個計算週期的未成熟隨機值 RSV, 然後根據平滑移動平均線的方法來計算 K 值 , D 值與 J 值 , 並繪成曲線圖來研判股票走勢
參考文獻
算法模型---時間序列模型(可以詳細閱讀一下)
題目下‘嘻嘻兔’及‘伊利殺白’的解答
2.下列不是SVM核函數的是:
A.多項式核函數
B.logistic核函數
C.徑向基核函數
D.Sigmoid核函數
解析
SVM核函數包括線性核函數、多項式核函數、徑向基核函數、高斯核函數、冪指數核函數、拉普拉斯核函數、ANOVA核函數、二次有理核函數、多元二次核函數、逆多元二次核函數以及Sigmoid核函數
參考文獻
牛客‘憶夢&....’的答案
3.統計模式分類問題中,當先驗概率未知時,可以使用()
A.最小最大損失準則
B.最小誤判概率準則
C.最小損失準則
D.N-P判決
4.以下()不屬於線性分類器最佳準則?
A.感知準則函數
B.貝葉斯分類
C.支持向量機
D.Fisher準則
解析
線性分類器:模型是參數的線性函數,分類平面是(超)平面
典型的線性分類器有:感知機、SVM支持向量機(線性核)、LDA線性判別分析(Fisher準則)
非線性分類器:模型的分界面可以是曲面或者超平面的組合
典型的非線性分類器:樸素貝葉斯(特定的某些樸素貝葉斯分類器本質上是線性分類器)、KNN、決策樹、SVM支持向量機(非線性核)
參考文獻
5.下列哪些方法可以用來對高維數據進行降維:
A.主成分分析法-PCA
B.線性判別法-LDA
C.LASSO
D.聚類分析
E.小波分析法
F.拉普拉斯特徵映射
解析
降維的目的:便於計算和可視化;有利於提取有效信息、擯棄無用信息
降維的主要方法:線性映射和非線性映射
PCA主成分分析,是一種使用最廣泛的數據壓縮算法。是一種非監督學習算法。
LDA線性判別法,將有標籤的數據點,通過投影的方法,投影到維度更低的空間中,使得投影后的點,會形成按類別區分。(高內聚,低耦合)
LASSO,一種壓縮估計,它通過構造一個罰函數得到一個較爲精煉的模型,使得它壓縮一些係數,同時設定一些係數爲零。因此保留了子集收縮的優點,是一種處理具有復共線性數據的有偏估計。Lasso的基本思想是在迴歸係數的絕對值之和小於一個常數的約束條件下,使殘差平方和最小化,從而能夠產生某些嚴格等於0的迴歸係數,得到可以解釋的模型。lasso通過參數縮減達到降維的目的
聚類分析,將個體(樣品)或者對象(變量)按相似程度(距離遠近)劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在於使類間元素的同質性最大化和類與類間元素的異質性最大化。其主要依據是聚到同一個數據集中的樣本應該彼此相似,而屬於不同組的樣本應該足夠不相似。
小波分析法
拉普拉斯特徵映射,它的直觀思想是希望相互間有關係的點(在圖中相連的點)在降維後的空間中儘可能的靠近
參考文獻
機器學習降維方法概況(可以詳細閱讀一下)
高緯數據的降維方法(圖片來源)