大數據基礎及應用試題分析

第一題:30分)。編制程序爲小學生生成計算題和答案,該程序運行一次生成20道小題,每道小題是兩個兩位數的算術運算(加或減)。  

生成的題目存儲在test.txt文本文件中,每行包含1道小題,共20行。該文件中的部分行如下:

(1)11+23=

(2)21+18=

(3)18-9=

(4)28-25=

生成的答案存儲在rest.txt文本文件中,每行包含1道小題的答案,共20行。該文件的部分行如下::

(1)34

(2)39

(3)9

(4)3

 

具體要求:

    1.test.txt文件中的每個小題包含小題的序號(序號爲1~20)、兩個需要計算的兩位數、一個運算符號和一個等號;(15分,其中正確表示小題序號5分,正確存儲‘+’和‘-’號5分,正確表示兩個計算數和等號5分)

    2.rest.txt文件中的每個答案包含小題的序號(序號爲1~20)和該小題的答案;每行1個小題。(5分)

    3.出題時不能出現爲計算結果爲負數的小題。(10分)

 

提示

    1.產生隨機整數的方法:

    import random

#調用randint函數一次就產生區間[low,high]內的隨機整數。

randrom.randint(low,high)  

2.每道小題產生兩個隨機整數作爲參與計算的數字,另外產生一個隨機整數(產生範圍包含0和1的隨機整數,0表示加法,1表示減法)表示運算符。

3.計算式子轉換爲字符串

 Python中提供了str.format方式將其他數據類型的值轉化爲字符串的方法,例如下面的語句實現了將字符串name和整數age拼接爲了一個字符串,拼接時由format括號中的變量依序替換前面字符串中的‘{}’。

name="Jack"

age=18

str="The age of {} is :{}".format(name,age)

print(str)

 

題目難度:Easy

題目的題幹描述已經給出了算法,如果沒有給出算法,那麼就具有一定難度,其實Python有現成的方法,還能處理四則運算。

 

 

 

第二題:(30分。根據下面的具體要求繪製暑期票房分析圖。

  1. 根據2017.txt票房文件,繪製暑期票房前十分佈餅圖。(10分)運行結果如圖1所示:

 

要看數據格式,是否需要特殊處理,如果不需要處理,那麼很簡單,注意餅圖的中文顯示問題比較麻煩,不知道容不容易解決。

 

(2)根據2018.txt票房文件,繪製從2010-8到2018-8,每年8月的票房前十的總票房,最高票房以及最低票房的這三個數據的折線圖,橫軸標記爲:2010-8至2018-8這九個標記。(10分)

運行結果如圖2所示:

 

(3)根據2018.txt票房文件,繪製從2010-8到2018-8,每年8月的票房前十的堆疊柱狀圖,橫軸標記爲:2010-8至2018-8這九個標記。(10分)

運行結果如圖3所示,其中每一列代表一年數據的堆疊:

 

我個人比較不喜歡這題,調API函數,沒什麼意義。

 

第三題:利用Keras構建神經網絡對CIFAR100數據集進行分類。

CIFAR100數據集中的圖片大小爲32*32的彩色圖像(3通道),類別數爲100,其中訓練數據爲50000個,測試數據爲10000個。具體要求如下:

(1)正確準備訓練和測試數據。(10分)

(2)正確搭建網絡模型。(15分)。

(3)程序正確訓練.。(10分)

(4)測試集中準確率在30%以上。(5分)

   備註:

(1)該數據集已經完成下載到你的考試用機。

(2)由於DS1408機器老舊,可以考慮訓練時只用部分訓練數據。

(3)如果構建的網絡爲全連接網絡,在處理數據時需要考慮將一個圖像(32*32的3通道圖像)變形爲一個長度爲32*32*3的一維數組。

 

這道題目比較坑爹,數據量很大,沒有給出神經網絡的具體類型,根據要求調通就行。

 

總體難度低

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章