C 程序性能優化

      一段c程序,功能開發完成,開始性能優化。
       當然是先用 -pg 編譯,再gprof看“熱點”在哪裏,很快找到,是計算hash值的函數,於是換了個更快的hash函數——fnv (
http://isthe.com /chongo/tech/comp/fnv/),速度提高了一些。接着把該hash函數內聯(inline),程序又快了一些。內聯函數不是解決性能問題的靈丹妙藥,因爲inline之後gprof就看不到該函數的調用情況,也就不好找真正的性能瓶頸了。

      接着把幾個常用循環中的變量聲明爲register,即優先使用寄存器,嗯,有點效果,但不是很明顯。管它的,快一點是一點。

      最後把代碼部分優化完,改編譯參數了:
      將 -O2 改爲 -O3 ,跑了單元測試,沒問題,性能好一點
      加 -march=nocona ,性能又好一點(因爲開發的程序只在服務器上跑,而公司的服務器都裝intel的CPU,而且都是新到貨,基本都是nocona平臺,所以加上沒問題)
      加 -minline-all-stringops , 據說這個選項適合含有memset、memcpy語句較多的程序,這個正合我意,加上之後性能有好了一點.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章