泰迪盃賽後總結

經驗教訓

  1. 不要拖到最後。
    這個比賽的時間相比於數學建模,時間真是太長了。參加了很多次數學建模,習慣了三天完成。這是我第一次參加泰迪杯,時間如此寬裕,反而不緊不慢,一直到最後幾天纔開始做,論文也寫得倉促,甚至一開始晚了幾秒鐘論文沒交上去,好在後來晚上提交通道又開放了半個小時。
  2. 抽空學一學人工智能
    這次做的比較慢的一個重要原因是我們組有兩個完全不懂神經網絡,導致問題二隻能讓其中一個人獨立解決,影響力效率。
  3. Excel是很有用的技能
    無論是處理數據還是繪製圖表,Excel的強大都遠超想象。而我現在懂的還很少,需要加強。

方法總結

相比於數學建模,泰迪杯的論文要求不是很高,格式、論文結構等各方面都沒有硬性規定,但是沒有評委能拒絕一篇行文優美乾淨、結構完整清晰、流程規範、圖表豐富的好論文。
公式可以用LaTeX編寫,不需要全篇用LaTeX編輯,因爲泰迪杯提交時除pdf格式外還需要docx格式的論文。而局部的公式用LaTeX編輯出來,絕對能增色不少。
推薦用這個網站:
https://www.codecogs.com/latex/eqneditor.php
編輯完成後,可以保存爲svg格式的矢量圖。
泰迪杯比較欣賞清晰明瞭的流程圖,不同於數學建模側重於解決問題的方法,泰迪杯數據挖掘看重的是結果,因此結果是如何得到的,也是老師們比較在意的問題。流程圖其實用PPT就可以做,或者想花裏胡哨一點,用億圖圖示也行。
既然是數據挖掘,那麼將數據、結果用可視化的方式呈現出來也很重要,可以繪製一些直方圖、餅圖、雷達圖、箱型圖等等,再加上一些表格,一定要豐富數據的呈現方式。
然後就是如何團隊協作,其實團隊最好每個人都會一點編程、會寫一點論文,我個人傾向於兩個人負責解題,同時完成自己那題的論文部分,第三個人負責幫忙編寫部分程序和提供思路,然後幫忙製圖,把關整體的論文。個人認爲,團隊競賽裏的分工不用那麼死板,有個大體的分工,確保整體工作能併發推進即可。

文本分析

頭一次參加數據挖掘比賽,感覺還挺有意思的,我們選的文本分析的題目感覺就更有意思了。
下面是我參考過的一些網頁,只記錄了幾個,許多網頁和文獻用完就關了。
熱詞提取方法探討 https://lilianlw.github.io/2016/11/06/熱詞提取方法探討/
中文文本中的關鍵字提取算法總結 https://blog.csdn.net/cdlwhm1217096231/article/details/94566936?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
使用Python做中文分詞和繪製詞雲 https://zhuanlan.zhihu.com/p/32891779
NLP自然語言處理 中文文本的分詞、去標點符號、去停用詞、詞性標註 https://blog.csdn.net/qq_42491242/article/details/105006651#_101
中文文本的分詞、去標點符號、去停用詞、詞性標註 https://www.jianshu.com/p/b74fad84634e

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章