軟件工程第2次作業—效能分析

原創

羅伯特妮妮

2018-09-30 23:11

作業要求的博客鏈接：https://edu.cnblogs.com/campus/nenu/2016CS/homework/2139

git倉庫地址：https://git.coding.net/isak_even/wfAnalysis.git

第一次作業—詞頻統計v1.0:https://www.cnblogs.com/kongwy/p/9662364.html

一、項目概要：

　　本次項目實現的是詞頻統計的效能優化，v1.1主要改進功能三，目前測試《戰爭與和平》結果的最優時間爲0.385。

二、效能分析

1.以war_and_peace.txt作爲測試文件，連續三次運行，給出每次消耗時間。

原始代碼沒有使用命令行參數，經過改進後測試截圖如下：

2.猜測瓶頸

(1)第一個瓶頸應該就是讀文件，將文本處理成字符串。這次處理的是3.14MB的文本文件，讀文件一定是耗時最長的單元，這個地方應該優化一下。估計優化後時間會縮短一半。

/* ----實現讀取指定文件的功能-----*/
void readtxt(string filename)
{
    ifstream file;
    file.open(filename.c_str());//注意一定要轉化爲 char *
    string s;        //每次讀取一行txt文件返回的字符串
    while(getline(file, s))//按行讀取
    {
        str=s+' '+str;//加空格確保分割開行尾和行首的兩個單詞
    }
    transform(str.begin(), str.end(), str.begin(), ::tolower);//將大寫轉化爲小寫
    file.close();    //關閉文件
}

(2)第二個是分割字符串，並且統計合法單詞的詞頻。理由同上，測試數據過大所以耗時長，優化後時間會縮短。

for (long i=0;i<str.length();i++)
    {
        while(str[i]>='0'&&str[i]<='9'||str[i]>='a'&&str[i]<='z')
        {
            temp=true;
            b+=str[i];
            i++;
        }
        if(temp)
        {
            word=b;
            if(word[0]>'9'||word[0]<'0') //判斷第一個字符是不是數字
            {
                ++word_count[word];
                vec.push_back(word);
            }

            b="";
            word="";
            temp=false;
        }
    }

3.利用profile找出瓶頸並優化

第一次profile的截圖如下：

(1)可以看出getline(file,s)和字符串的合併是耗時最長的。分析後決定把讀文件和分割出合法字符串合在一起，讀完一行就進行處理，就可以省略str = s+' '+str。

(2)調試後發現transform函數也比較耗時，便將處理大小寫轉變爲判斷字符，確定是大寫字母再轉化爲小寫字母。

(3) 將for (long i = 0; i<str.length(); i++) 轉變爲 long a = str.length(); for (long i = 0; i<a; i++)，這樣不需要每次循環都調用length()函數。

優化後第二次profile截圖如下

(1)再次測試後此時耗時最長的是b=b+str[i]。參考博客：http://www.cnblogs.com/chuncn/archive/2009/02/13/1390176.html 我改爲：b.append(1,str[i]);

(2)++word_count[word]耗時也長。map函數是自動排序的，這樣效率會低一點，所以我換成unordered_map<string, long> word_count;

參考博客：http://www.cnblogs.com/me115/archive/2013/06/05/3117967.html

(3)最後將功能一和二共同改進一下。

4.優化後的profile截圖

5.優化後時間

三、自我評估

個人基本情況見第零次作業博客地址：https://www.cnblogs.com/kongwy/p/9611339.html

這次作業主要是優化代碼，提高效率，也是解決自己上次遺留的問題。

(1)在初步測試的時候其實不太好用，通過參考其他人的博客，發現沒有使用命令行參數，就是int main(int argc, char* argv[])，更改之後代碼也簡單了不少。

(2)用ptime測試時發現電腦配置對代碼的運行效率影響較大，所以在室友的筆記本和學院的機房都進行了多次測試。

(3)安裝VS，並且啓用性能分析，通過閱讀《構建之法》第二章基本瞭解到抽樣和代碼注入的區別。這次採用的主要還是抽樣。

(4)發現VS要求比較嚴格，代碼不能用頭文件#include<bits/stdc++.h>以及需要將 sscanf改爲sscanf_s。

(5)優化代碼之後大概減少了四十行，速度提高了十倍左右。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

C#開源的兩款功能強大的錄屏神器

ScreenToGif ScreenToGif是一款由C#語言開發且開源的操作簡單、免費的屏幕錄製和GIF動畫製作神器。它可以幫助用戶捕捉計算機屏幕上的實時動畫，並將其保存爲高質量的 GIF 圖像格式。該工具不僅適用於技術支持、軟件演示和教

2024-05-03 14:28:27

前端 Vue yarn.lock文件：詳解和使用指南

yarn.lock文件：詳解和使用指南 https://www.python100.com/html/38KF796X6BHM.html 一、什麼是yarn.lock文件 yarn.lock文件是一個產生於Yarn 0.22及以後版

2024-05-03 14:15:26

前端 Vue webpack配置之 webpack.config.js 文件配置

Webpack 在執行的時候，除了在命令行傳入參數，還可以通過指定的配置文件來執行。默認情況下，會搜索當前目錄的 webpack.config.js 文件，這個文件是一個 node.js 模塊，返回一個 json 格式的配置信息對象，或

2024-05-03 14:15:26

Vue package-lock.json的作用

package-lock.json的作用 "node_modules/@aashutoshrathi/word-wrap": { "version": "1.2.6", "resolved": "h

2024-05-03 14:15:26

前端 Vue-cli中 vue.config.js 的配置詳解

Vue-cli 3 / Vue-cli 4 目錄結構 ├── README.md # 說明 |-- dist # 打包後文件夾 ├── babel.config.js

2024-05-03 14:15:26

druid數據源 xml配置

https://blog.csdn.net/h273979586/article/details/87932220 pom依賴 <dependency> <groupId>com.alibaba</groupId>

2024-05-03 14:14:55

Windows中Redis怎麼設置密碼

Windows中Redis怎麼設置密碼

2024-05-03 14:11:15

JDK8和JDK17共存以及切換的方法

1、先安裝"jdk-8u381-windows-x64.exe"，再安裝"jdk-17_windows-x64_bin.exe" 2、"系統屬性"-"高級"-"環境變量"-"系統變量"-"Path"-"編輯"，刪除以下2條 C:\Progr

2024-05-03 14:11:15

centos7修改redis密碼

檢查Redis配置文件首先，我們需要確保Redis的配置文件中包含了設置密碼的選項。打開Redis的配置文件/etc/redis.conf，查找以下行並確保取消註釋（去掉行首的#）： requirepass your_password 啓

2024-05-03 14:11:15

基於SSM的在線外賣訂餐系統畢業設計論文【範文】

摘要隨着互聯網技術的迅猛發展和人們生活節奏的加快，在線外賣訂餐系統因其便捷性和高效率而受到廣泛歡迎。本文圍繞《基於SSM框架的在線外賣訂餐系統》這一課題展開研究，旨在設計並實現一個功能全面、操作簡便且安全可靠的在線外賣訂餐平臺。首先，文

2024-05-03 14:08:24

基於CodeMirror開發在線編輯器時遇到的問題及解決方案

需求：實現json在線編輯並支持校驗，基於此使用了 CodeMirror在線編輯，jsonlint校驗輸入數據 // package.json: "dependencies": { "codemirror": "^5.53.2"

2024-05-03 14:04:44

《軟件性能測試、分析與調優實踐之路》(第2版) PPT課件流出

掃描圖書前言中的如下圖所示的二維碼，即可進入到下載頁面。如下圖所示即爲課件的下載頁面，免費提供下載

2024-05-03 14:01:24

2024年感想

　　看了一眼之前到博客，最近的一次博客還在一年之前，時間如白駒過隙，飛快流逝。這兩年生活和工作都經歷裏很多，想想是應該在這裏好好梳理總結下。我總是感慨，自己從二十六七歲到現在三十多的年紀，好像經歷別人的半輩子，感悟衆多。　　我以前是個朋友

兜兜有糖的博客

2024-05-03 13:57:53

AWS S3 Lambda Python腳本函數實現圖片自動轉換爲webp並上傳至s3

Amazon S3 自動轉換圖片格式 Amazon S3 存儲桶新增文件自動觸發 AWS Lambda。Lambda 取 S3 文件做轉換並存回去 S3 同一個目錄下，並增加相應的後綴名。並且支持通過API Gateway的方式觸發對

2024-05-03 13:51:42

Eclipse Memory Analyzer (MAT)的安裝後提示JDK版本不對要升級到jdk_17

背景在啓動MAT分析內存時報錯：Version1.8.0 of the jvm is not suitable for this product，Version17 or greater isrequired。問題原因很明顯，我電腦的J

2024-05-03 13:51:42

24小時熱門文章

druid數據源 xml配置

最新文章

最新評論文章