Linux內核部件分析 ——原子性操作atomic_t

在任何處理器平臺下，都會有一些原子性操作，供操作系統使用，我們這裏只講x86下面的。在單處理器情況下，每條指令的執行都是原子性的，但在多處理器情況下，只有那些單獨的讀操作或寫操作纔是原子性的。爲了彌補這一缺點，x86提供了附加的lock前綴，使帶lock前綴的讀修改寫指令也能原子性執行。帶lock前綴的指令在操作時會鎖住總線，使自身的執行即使在多處理器間也是原子性執行的。xchg指令不帶lock前綴也是原子性執行，也就是說xchg執行時默認會鎖內存總線。原子性操作是線程間同步的基礎，linux專門定義了一種只進行原子操作的類型atomic_t，並提供相關的原子讀寫調用API。本節就來分析這些原子操作在x86下的實現。

typedef struct {
volatile int counter;
} atomic_t;

原子類型其實是int類型，只是禁止寄存器對其暫存。

#define ATOMIC_INIT(i) { (i) }

原子類型的初始化。32位x86平臺下atomic API在arch/x86/include/asm/atomic_32.h中實現。

static inline int atomic_read(const atomic_t *v)
{
return v->counter;
}
static inline void atomic_set(atomic_t *v, int i)
{
v->counter = i;
}

單獨的讀操作或者寫操作，在x86下都是原子性的。

static inline void atomic_add(int i, atomic_t *v)
{
asm volatile(LOCK_PREFIX "addl %1,%0"
: "+m" (v->counter)
: "ir" (i));
}
static inline void atomic_sub(int i, atomic_t *v)
{
asm volatile(LOCK_PREFIX "subl %1,%0"
: "+m" (v->counter)
: "ir" (i));
}

atomic_add和atomic_sub屬於讀修改寫操作，實現時需要加lock前綴。

static inline int atomic_sub_and_test(int i, atomic_t *v)
{
unsigned char c;
asm volatile(LOCK_PREFIX "subl %2,%0; sete %1"
: "+m" (v->counter), "=qm" (c)
: "ir" (i) : "memory");
return c;
}

atomic_sub_and_test執行完減操作後檢查結果是否爲0。

static inline void atomic_inc(atomic_t *v)
{
asm volatile(LOCK_PREFIX "incl %0"
: "+m" (v->counter));
}
static inline void atomic_dec(atomic_t *v)
{
asm volatile(LOCK_PREFIX "decl %0"
: "+m" (v->counter));
}

atomic_inc和atomic_dec是遞增遞減操作。

static inline int atomic_dec_and_test(atomic_t *v)
{
unsigned char c;
asm volatile(LOCK_PREFIX "decl %0; sete %1"
: "+m" (v->counter), "=qm" (c)
: : "memory");
return c != 0;
}

atomic_dec_and_test在遞減後檢查結果是否爲0。

static inline int atomic_inc_and_test(atomic_t *v)
{
unsigned char c;
asm volatile(LOCK_PREFIX "incl %0; sete %1"
: "+m" (v->counter), "=qm" (c)
: : "memory");
return c != 0;
}

atomic_inc_and_test在遞增後檢查結果是否爲0。

static inline int atomic_add_negative(int i, atomic_t *v)
{
unsigned char c;
asm volatile(LOCK_PREFIX "addl %2,%0; sets %1"
: "+m" (v->counter), "=qm" (c)
: "ir" (i) : "memory");
return c;
}

atomic_add_negative在加操作後檢查結果是否爲負數。

static inline int atomic_add_return(int i, atomic_t *v)
{
int __i;
#ifdef CONFIG_M386
unsigned long flags;
if (unlikely(boot_cpu_data.x86 <= 3))
goto no_xadd;
#endif
/* Modern 486+ processor */
__i = i;
asm volatile(LOCK_PREFIX "xaddl %0, %1"
: "+r" (i), "+m" (v->counter)
: : "memory");
return i + __i;
#ifdef CONFIG_M386
no_xadd: /* Legacy 386 processor */
local_irq_save(flags);
__i = atomic_read(v);
atomic_set(v, i + __i);
local_irq_restore(flags);
return i + __i;
#endif
}

atomic_add_return 不僅執行加操作，而且把相加的結果返回。它是通過xadd這一指令實現的。

static inline int atomic_sub_return(int i, atomic_t *v)
{
return atomic_add_return(-i, v);
}

atomic_sub_return 不僅執行減操作，而且把相減的結果返回。它是通過atomic_add_return實現的。

static inline int atomic_cmpxchg(atomic_t *v, int old, int new)
{
return cmpxchg(&v->counter, old, new);
}
#define cmpxchg(ptr, o, n) \
((__typeof__(*(ptr)))__cmpxchg((ptr), (unsigned long)(o), \
(unsigned long)(n), \
sizeof(*(ptr))))
static inline unsigned long __cmpxchg(volatile void *ptr, unsigned long old,
unsigned long new, int size)
{
unsigned long prev;
switch (size) {
case 1:
asm volatile(LOCK_PREFIX "cmpxchgb %b1,%2"
: "=a"(prev)
: "q"(new), "m"(*__xg(ptr)), "0"(old)
: "memory");
return prev;
case 2:
asm volatile(LOCK_PREFIX "cmpxchgw %w1,%2"
: "=a"(prev)
: "r"(new), "m"(*__xg(ptr)), "0"(old)
: "memory");
return prev;
case 4:
asm volatile(LOCK_PREFIX "cmpxchgl %k1,%2"
: "=a"(prev)
: "r"(new), "m"(*__xg(ptr)), "0"(old)
: "memory");
return prev;
case 8:
asm volatile(LOCK_PREFIX "cmpxchgq %1,%2"
: "=a"(prev)
: "r"(new), "m"(*__xg(ptr)), "0"(old)
: "memory");
return prev;
}
return old;
}

atomic_cmpxchg是由cmpxchg指令完成的。它把舊值同atomic_t類型的值相比較，如果相同，就把新值存入atomic_t類型的值中，返回atomic_t類型變量中原有的值。

static inline int atomic_xchg(atomic_t *v, int new)
{
return xchg(&v->counter, new);
}
#define xchg(ptr, v) \
((__typeof__(*(ptr)))__xchg((unsigned long)(v), (ptr), sizeof(*(ptr))))
static inline unsigned long __xchg(unsigned long x, volatile void *ptr,
int size)
{
switch (size) {
case 1:
asm volatile("xchgb %b0,%1"
: "=q" (x)
: "m" (*__xg(ptr)), "0" (x)
: "memory");
break;
case 2:
asm volatile("xchgw %w0,%1"
: "=r" (x)
: "m" (*__xg(ptr)), "0" (x)
: "memory");
break;
case 4:
asm volatile("xchgl %k0,%1"
: "=r" (x)
: "m" (*__xg(ptr)), "0" (x)
: "memory");
break;
case 8:
asm volatile("xchgq %0,%1"
: "=r" (x)
: "m" (*__xg(ptr)), "0" (x)
: "memory");
break;
}
return x;
}

atomic_xchg則是將新值存入atomic_t類型的變量，並將變量的舊值返回。它使用xchg指令實現。

/**
* atomic_add_unless - add unless the number is already a given value
* @v: pointer of type atomic_t
* @a: the amount to add to v...
* @u: ...unless v is equal to u.
*
* Atomically adds @a to @v, so long as @v was not already @u.
* Returns non-zero if @v was not @u, and zero otherwise.
*/
static inline int atomic_add_unless(atomic_t *v, int a, int u)
{
int c, old;
c = atomic_read(v);
for (;;) {
if (unlikely(c == (u)))
break;
old = atomic_cmpxchg((v), c, c + (a));
if (likely(old == c))
break;
c = old;
}
return c != (u);
}

atomic_add_unless的功能比較特殊。它檢查v是否等於u，如果不是則把v的值加上a，返回值表示相加前v是否等於u。因爲在atomic_read和atomic_cmpxchg中間可能有其它的寫操作，所以要循環檢查自己的值是否被寫進去。

#define atomic_inc_not_zero(v) atomic_add_unless((v), 1, 0)
#define atomic_inc_return(v) (atomic_add_return(1, v))
#define atomic_dec_return(v) (atomic_sub_return(1, v))

atomic_inc_not_zero在v值不是0時加1。

atomic_inc_return對v值加1，並返回相加結果。

atomic_dec_return對v值減1，並返回相減結果。

#define atomic_clear_mask(mask, addr) \
asm volatile(LOCK_PREFIX "andl %0,%1" \
: : "r" (~(mask)), "m" (*(addr)) : "memory")

atomic_clear_mask清除變量某些位。

#define atomic_set_mask(mask, addr) \
asm volatile(LOCK_PREFIX "orl %0,%1" \
: : "r" (mask), "m" (*(addr)) : "memory")

atomic_set_mask將變量的某些位置位。

/* Atomic operations are already serializing on x86 */
#define smp_mb__before_atomic_dec() barrier()
#define smp_mb__after_atomic_dec() barrier()
#define smp_mb__before_atomic_inc() barrier()
#define smp_mb__after_atomic_inc() barrier()

因爲x86的atomic操作大多使用原子指令或者帶lock前綴的指令。帶lock前綴的指令執行前會完成之前的讀寫操作，對於原子操作來說不會受之前對同一位置的讀寫操作，所以這裏只是用空操作barrier()代替。barrier()的作用相當於告訴編譯器這裏有一個內存屏障，放棄在寄存器中的暫存值，重新從內存中讀入。

本節的atomic_t類型操作是最基礎的，爲了介紹下面的內容，必須先介紹它。如果可以使用atomic_t類型代替臨界區操作，也可以加快不少速度。

Linux內核部件分析 ——原子性操作atomic_t

我真的從測試轉成了開發......

零基礎寫框架(2)：故障排查和日誌基礎

芯片產業管理和營銷指北（1）—— 產品線經理主要職能

記一次疑似JVM內存泄漏的排查過程

簡單4步，帶你用華爲雲MetaStudio製作數字人短片

【LTE基礎知識】NAS層協議之AS模型與NAS模型概述

談談生活這個詞

Win7下安裝CentOS 6.5雙系統(還沒試）

linux文件屬性和擴展名

linux sticky bit 目錄權限 rwt 權限

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結