大數據基礎及應用試題分析

原創

wwxy261

2020-05-25 01:08

第一題：（30分）。編制程序爲小學生生成計算題和答案，該程序運行一次生成20道小題，每道小題是兩個兩位數的算術運算(加或減)。

生成的題目存儲在test.txt文本文件中，每行包含1道小題，共20行。該文件中的部分行如下：

(1)11+23=

(2)21+18=

(3)18-9=

(4)28-25=

生成的答案存儲在rest.txt文本文件中，每行包含1道小題的答案，共20行。該文件的部分行如下:：

(1)34

(2)39

(3)9

(4)3

具體要求：

1.test.txt文件中的每個小題包含小題的序號（序號爲1~20）、兩個需要計算的兩位數、一個運算符號和一個等號；（15分，其中正確表示小題序號5分，正確存儲‘+’和‘-’號5分，正確表示兩個計算數和等號5分）

2.rest.txt文件中的每個答案包含小題的序號（序號爲1~20）和該小題的答案；每行1個小題。（5分）

3.出題時不能出現爲計算結果爲負數的小題。（10分）

提示：

1.產生隨機整數的方法：

import random

#調用randint函數一次就產生區間[low,high]內的隨機整數。

randrom.randint(low,high)

2.每道小題產生兩個隨機整數作爲參與計算的數字，另外產生一個隨機整數（產生範圍包含0和1的隨機整數，0表示加法，1表示減法）表示運算符。

3.計算式子轉換爲字符串

Python中提供了str.format方式將其他數據類型的值轉化爲字符串的方法，例如下面的語句實現了將字符串name和整數age拼接爲了一個字符串，拼接時由format括號中的變量依序替換前面字符串中的‘{}’。

name="Jack"

age=18

str="The age of {} is :{}".format(name,age)

print(str)

題目難度：Easy

題目的題幹描述已經給出了算法，如果沒有給出算法，那麼就具有一定難度，其實Python有現成的方法，還能處理四則運算。

第二題：（30分。根據下面的具體要求繪製暑期票房分析圖。

根據2017.txt票房文件，繪製暑期票房前十分佈餅圖。（10分）運行結果如圖1所示：

要看數據格式，是否需要特殊處理，如果不需要處理，那麼很簡單，注意餅圖的中文顯示問題比較麻煩，不知道容不容易解決。

(2)根據2018.txt票房文件，繪製從2010-8到2018-8，每年8月的票房前十的總票房，最高票房以及最低票房的這三個數據的折線圖，橫軸標記爲：2010-8至2018-8這九個標記。（10分）

運行結果如圖2所示：

(3)根據2018.txt票房文件，繪製從2010-8到2018-8，每年8月的票房前十的堆疊柱狀圖，橫軸標記爲：2010-8至2018-8這九個標記。（10分）

運行結果如圖3所示，其中每一列代表一年數據的堆疊：

我個人比較不喜歡這題，調API函數，沒什麼意義。

第三題：利用Keras構建神經網絡對CIFAR100數據集進行分類。

CIFAR100數據集中的圖片大小爲32*32的彩色圖像（3通道），類別數爲100，其中訓練數據爲50000個，測試數據爲10000個。具體要求如下：

(1)正確準備訓練和測試數據。（10分）

(2)正確搭建網絡模型。(15分)。

(3)程序正確訓練.。(10分)

(4)測試集中準確率在30%以上。（5分）

備註：

(1)該數據集已經完成下載到你的考試用機。

(2)由於DS1408機器老舊，可以考慮訓練時只用部分訓練數據。

(3)如果構建的網絡爲全連接網絡，在處理數據時需要考慮將一個圖像（32*32的3通道圖像）變形爲一個長度爲32*32*3的一維數組。

這道題目比較坑爹，數據量很大，沒有給出神經網絡的具體類型，根據要求調通就行。

總體難度低

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大數據基礎及應用試題分析

Django Web項目啓動以及Model層設計基礎

Django 實戰開發後臺管理系統思路

Leetcode 遍歷模擬題目螺旋矩陣

Leetcode 42接雨水（從暴力開始優化，難度偏大）

科研進展7/3

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結