中國大學生計算機設計大賽國賽答辯

計算機設計大賽北京大學場–大數據組

頭天九點多下了班往北大那邊的酒店趕,到了都快11點了真是挺累了。我們是早上第三組答辯,6點30起來,差不多7點40去候場。
我們這組學長沒來,另個同學演示,我來負責答辯。老師提問特別犀利,到後面問得我啞口無言,問滿了20分鐘才放過我們/(ㄒoㄒ)/但是確實有些東西不是我做的我不瞭解,老師一看你不瞭解就瘋狂抓着那個點問QAQ相比省賽的順利,這次國賽真是慘兮兮。除去是真的知識盲區我真的答不上來,之前那段我感覺還發揮得挺好,主要是感覺自己說話還挺順的吧,氣場颱風什麼的也還可以。果然經過了各種比賽、面試、課堂分享什麼的,自己的臨場能力確實有了提升,已經不是以前那個講屁屁踢都會嚇得腿抖的小朋友啦。
依着記憶寫幾個老師提的問題:
Q1:你覺得自己的作品還有什麼缺陷
我當時答的是數據源單一讓我們系統的使用場景受限,結果老師指出我們一個很明顯的缺陷是可視化那個熱力圖做得太糙了,像一塊馬賽克直接糊上去。當時我解釋是因爲原始數據只是一個點的軌跡數據,進行分區分時段太細的話工作量太大,呃老師聽了並不咋關心。
Q2:你做這個系統給誰用的,功能似乎很雜
確實這個系統模塊有一絲絲堆功能的意圖,如果是真的做產品的話肯定是要把模塊拆分然後做得更細緻些。只是我想,我們還是在校生做的東西,要多精多巧真沒有,能把功能做多一點就不錯了(當然我沒說出來)
Q3:spark-Hadoop分別是怎麼用的
這真是被學長坑死了,根本就沒用什麼集羣什麼分佈式的,只是單純用Hadoop的工具進行了數據劃分,這個問題是糊弄過去的,從這裏就開始全線崩塌,一直追着數據問。
Q4:預測功能爲什麼要輸入那麼多值,爲什麼只能預測下一時段的值
這個當時是設計了很多接口,只是截止到我們交作品的時候製作出來輸入序列預測下一序列值的功能。預期輸入值就是一個序列,只是要通過鍵盤輸入顯得有點麻煩,不過我們沒有這樣的數據源提供輸入。後來老師提建議說可以模擬數據源輸入。
Q5:LSTM爲什麼適合長序列問題,你的預測接口是怎麼體現出它的優勢
首先是LSTM的模塊結構能對信息分態,讓信息的特徵能在時間維度上傳遞,保留信息趨勢的殘差,使得LSTM適合解決長序列問題。我們的接口就是通過輸入的序列值經過訓練好的LSTM模型進行下一時刻的預測。老師說那爲什麼只能預測下一時刻,這樣就沒有體現長序列預測的優勢,就不能預測未來時刻的嗎?我當時沒領悟到這個題意,就一直說我們的數據集限制,只能驗證數據集裏有的測試數據。但是本來就是歷史數據集,用來預測未來不是很扯嗎(我可能還是不懂老師在問什麼,還是老師不懂我做的是什麼)
Q6:原始數據集具體是什麼樣子的,怎麼處理的
不就是xx平臺xx市x年x月xx訂單軌跡數據,然後對時間、區域進行劃分。這裏又問得更細一些,但是不難答。
Q7:訓練集的observed字段是什麼意思
我真是第一次知道我們交上去的東西有這個字段,而且當時答辯的時候我們的電腦沒有這個訓練集,評委看材料真的特別細。然後我們說我們電腦上沒這個東西,本來快結束了,已經讓我們出去了,然後有個女老師偏要讓我下去看看,給她解釋,我™。我真不知道啊,我就說是另個沒來的同學做的,然後老師就說那數據給你們了,你們用了還不知道什麼意思,到底是不是你們自己做的???我???到這裏心態都崩了,我就開始說我們模型的輸入是什麼樣的,沒用到這個字段,結果自己提到特徵值,然後又被追問特徵值是什麼???我當時腦子已經一片混亂了,然後時間徹徹底底到了,然後出來之後我都是懵的😵。
我們指導老師高老師特別好,我們出來之後一直鼓勵我們說講的特別好啦,颱風特別好什麼的。我就感覺答得挺差的,啊,觸及知識盲區也是沒辦法,這已經是我能做到的最好的程度了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章