__sync_fetch_and_add系列的命令

__sync_fetch_and_add系列的命令,發現這個系列命令講的最好的一篇文章,英文好的同學可以直接去看原文。Multithreaded simple data type access and atomic variables

    __sync_fetch_and_add系列一共有十二個函數,有加/減/與/或/異或/等函數的原子性操作函數,__sync_fetch_and_add,顧名思義,現fetch,然後自加,返回的是自加以前的值。以count = 4爲例,調用__sync_fetch_and_add(&count,1),之後,返回值是4,然後,count變成了5.
   有__sync_fetch_and_add,自然也就有__sync_add_and_fetch,呵呵這個的意思就很清楚了,先自加,在返回。他們哥倆的關係與i++和++i的關係是一樣的。被譚浩強他老人家收過保護費的都會清楚了。
   有了這個寶貝函數,我們就有新的解決辦法了。對於多線程對全局變量進行自加,我們就再也不用理線程鎖了。下面這行代碼,和上面被pthread_mutex保護的那行代碼作用是一樣的,而且也是線程安全的。

__sync_fetch_and_add( &global_int, 1 );
   下面是這羣函數的全家福,大家看名字就知道是這些函數是幹啥的了。

在用gcc編譯的時候要加上選項 -march=i686
type __sync_fetch_and_add (type *ptr, type value);
type __sync_fetch_and_sub (type *ptr, type value);
type __sync_fetch_and_or (type *ptr, type value);
type __sync_fetch_and_and (type *ptr, type value);
type __sync_fetch_and_xor (type *ptr, type value);
type __sync_fetch_and_nand (type *ptr, type value);
type __sync_add_and_fetch (type *ptr, type value);
type __sync_sub_and_fetch (type *ptr, type value);
type __sync_or_and_fetch (type *ptr, type value);
type __sync_and_and_fetch (type *ptr, type value);
type __sync_xor_and_fetch (type *ptr, type value);
type __sync_nand_and_fetch (type *ptr, type value);


bool __sync_bool_compare_and_swap (type *ptr, type oldval type newval, ...)
type __sync_val_compare_and_swap (type
*ptr, type oldval type newval, ...)

這兩個函數提供原子的比較和交換,如果*ptr == oldval,就將newval寫入*ptr,
第一個函數在相等並寫入的情況下返回true.
第二個函數在返回操作之前的值。

__sync_synchronize (...)
發出一個full barrier.

關於memory barrier,cpu會對我們的指令進行排序,一般說來會提高程序的效率,但有時候可能造成我們不希望得到的結果,舉一個例子,比如我們有一個硬件設備,它有4個寄存器,當你發出一個操作指令的時候,一個寄存器存的是你的操作指令(比如READ),兩個寄存器存的是參數(比如是地址和size),最後一個寄存器是控制寄存器,在所有的參數都設置好之後向其發出指令,設備開始讀取參數,執行命令,程序可能如下:

write1(dev.register_size,size);
   write1(dev.register_addr,addr);
   write1(dev.register_cmd,READ);
   write1(dev.register_control,GO);
如果最後一條write1被換到了前幾條語句之前,那麼肯定不是我們所期望的,這時候我們可以在最後一條語句之前加入一個memory barrier,強制cpu執行完前面的寫入以後再執行最後一條:
write1(dev.register_size,size);
   write1(dev.register_addr,addr);
   write1(dev.register_cmd,READ);
   __sync_synchronize();
   write1(dev.register_control,GO);

memory barrier有幾種類型:
   acquire barrier : 不允許將barrier之後的內存讀取指令移到barrier之前(linux kernel中的wmb())。
   release barrier : 不允許將barrier之前的內存讀取指令移到barrier之後 (linux kernel中的rmb())。
   full barrier    : 以上兩種barrier的合集(linux kernel中的mb())。


還有兩個函數:

type __sync_lock_test_and_set (type *ptr, type value, ...)
  將*ptr設爲value並返回*ptr操作之前的值。

void __sync_lock_release (type *ptr, ...)
    將*ptr置0


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章