STM32F4xx FPU的設置(轉)

轉自:http://blog.renren.com/blog/256814551/844695191

浮點運算一直是定點CPU的難題,比如一個簡單的1.1+1.1,定點CPU必須要按照IEEE-754標準的算法來完成運算,對於8位單片機來說已經完全是噩夢,對32爲單片機來說也不會有多大改善。雖然將浮點數進行Q化處理能充分發揮32位單片機的運算性能,但是精度受到限制而不會太高。對於有FPU(浮點運算單元)的單片機或者CPU來說,浮點加法只是幾條指令的事情。

        現在又FPU或者硬件浮點運算能力的主要有高端DSP(比如TI F28335/C6000/DM6XX/OMAP等),通用CPU(X87數學協處理器)和高級的ARM+DSP處理器等。

        STM32-F4屬於Cortex-M4F構架,這和M0、M3的最大不同就是多了一個F-float,即支持浮點指令集,因此在處理數學運算時能比M0/M3高出數十倍甚至上百倍的性能,但是要充分發揮FPU的數學性能,還需要一些小小的設置:

        1.編譯控制選項:雖然STM32F4XX固件庫的例程之system_stm32f4XXX.c文件中添加了對應的代碼,但給用戶評估使用的STM32F4-Discovery例程中卻沒有,因此MDK4.23編寫浮點運算程序時,雖然編譯器正確產生了V指令來進行浮點運算,但是因爲system_stm32f4XXX.c文件沒有啓用FPU,因此CPU執行時只認爲是遇到非法指令而跳轉到HardFault_Handler()中斷中原地踏步。因此要保證這個錯誤不發生,必須要在system_init()函數裏面添加如下代碼:

/* FPU settings ------------------------------------------------------------*/ 
  #if (__FPU_PRESENT == 1) && (__FPU_USED == 1) 
    SCB->CPACR |= ((3UL << 10*2)|(3UL << 11*2));  /* set CP10 and CP11 Full Access */ 
  #endif

          因爲這個選項是有條件編譯控制的,因此需要在工程選項(Project->Options for target "XXXX")中的C/C++選項卡的Define中加入如下的語句:__FPU_PRESENT=1,__FPU_USED =1。這樣編譯時就加入了啓動FPU的代碼,CPU也就能正確高效的使用FPU進行簡單的加減乘除了。

        但這還遠遠不夠。對於複雜運算,比如三角函數,開方等運算,如果編程時還是使用math.h頭文件,那是沒法提升效率的:因爲math.h頭文件是針對所有ARM處理器的,其運算函數都是基於定點CPU和標準算法(IEEE-754),並沒有預見使用FPU的情況,需要很多指令和複雜的過程才能完成運算,也就增加了運算時間。因此要充分發揮M4F的浮點功能,就需要使用固件庫自帶的arm_math.h,這個文件根據編譯控制項(__FPU_USED == 1)來決定是使用那一種函數方法:如果沒有使用FPU,那就調用keil的標準math.h頭文件中定義的函數;如果使用了FPU,那就是用固件庫自帶的優化函數來解決問題。

        在arm_math的開頭部分是有這些編譯控制信息:

         #ifndef _ARM_MATH_H
         #define _ARM_MATH_H

         #define __CMSIS_GENERIC              /* disable NVIC and Systick functions */

         #if defined (ARM_MATH_CM4)
                    #include "core_cm4.h"
         #elif defined (ARM_MATH_CM3)
                     #include "core_cm3.h"
         #elif defined (ARM_MATH_CM0)
                     #include "core_cm0.h"
         #else
                   #include "ARMCM4.h"
                   #warning "Define either ARM_MATH_CM4 OR ARM_MATH_CM3...By Default building on ARM_MATH_CM4....."
         #endif

         #undef  __CMSIS_GENERIC              /* enable NVIC and Systick functions */
               #include "string.h"
                #include "math.h"

        就是說如果不使用CMSIS的,就會調用keil自帶的標準庫函數。否則就用CMSIS的定義。這裏因爲是用的STM32F4,所以應該要ARM_MATH_CM4控制,即加入core_cm4.h,否則就用使用ARMCM4.h——但在編譯時keil會提示找不到這文件。因此需要在工程選項之C/C++選項卡的define中繼續加入語句ARM_MATH_CM4。

        加入上述編譯控制項之後,高級數學函數的使用基本沒問題了,比如正餘弦三角函數的計算。但需要注意,如果你直接使用sin()、cos()、sqrt()這樣的函數,那結果還算調用keil的math.h,你可以在debug時看對應的代碼,其彙編指令爲BL.W __hardfp_xxx。因此這時要完成三角函數的計算就要使用arm_sin_f32()或者arm_cos_f32(),用法不變,這兩個函數的原型分別在arm_sin_f32.c和arm_cos_f32.c中。通過對256點三角函數表的查詢和插值算法得到任意角度的精確函數值,這就比“原裝”的sin()、cos()快多了。

        當然有些例外的是開發函數sqrt(),在arm_math.h中是這麼定義的:

             static __INLINE arm_status  arm_sqrt_f32(float32_t in, float32_t *pOut) 
                     { 
                        if(in > 0) 
                             { 
                                     //    #if __FPU_USED 
                                    #if (__FPU_USED == 1) && defined ( __CC_ARM   ) 
                                              *pOut = __sqrtf(in); 
                                   #else       
                                              *pOut = sqrtf(in); 
                                   #endif 
                                 return (ARM_MATH_SUCCESS); 
                            } 
                        else 
                           { 
                               *pOut = 0.0f; 
                                return (ARM_MATH_ARGUMENT_ERROR); 
                          } 
               }   

        即開方用的函數是arm_sqrt_f32(),其中首先判斷被開發的書是否大於0,只有大於0的才能進行運算,否則輸出結果爲0並返回“錯誤”標誌。如果大於0,並且實用了FPU和__CC_ARM控制項,那調用__sqrtf()來完成編譯,否則調用sqrtf()——這個sqrtf()是能在keil的math.h中找到的,即調用子函數來完成運算,而__sqrtf()呢?新出現的,相信大家都能猜到是什麼玩意兒:對,就是VSQRT指令!因此要把這點性能也要發揮出來,就需要工程選項之C/C++選項卡的define中繼續加入語句__CC_ARM纔行。大家可以比較一下是否加入__CC_ARM編譯後會彙編代碼的差別巨大差別。

       當然,對於arm_sqrt_f32()函數還是有些麻煩,如果你確認被開方的書是大於等於0的,那就直接使用__sqrtf()函數完成運算,即一條簡單的VSQRT指令。

       STM32F4固件庫還提供了其他很有用的數學函數,都位於DSP_Lib文件夾,請大家慢慢探索,Discovery!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章