linux下數據同步、回寫機制分析

http://blog.chinaunix.net/uid-9543173-id-3568434.html


一、前言
在linux2.6.32之前,linux下數據同步是基於pdflush線程機制來實現的,在linux2.6.32以上的版本,內核徹底刪掉了pdflush機制,改爲了基於per-bdi線程來實現數據同步,與pdflush線程相比,在per-bdi線程機制中,每個後備存儲器擁有自己唯一的回寫線程,數據同步時需要更少的線程、也不會有多個pdflush對同一個後備存儲器進行回寫的競態問題,回寫的效率更高。

二、初始化默認的後備存儲器default_backing_dev_info

  1. static int __init default_bdi_init(void)
  2. {
  3.     int err;

  4.     /*創建同步每個後備存儲器的超級塊的線程*/
  5.     sync_supers_tsk = kthread_run(bdi_sync_supers, NULL, "sync_supers");
  6.     BUG_ON(IS_ERR(sync_supers_tsk));

  7.   /*初始化一個定時器,該定時器控制同步超級塊的週期,每隔dirty_writeback_interval去喚醒一次sync_supers_tsk,從而同步超級塊。
  8.     dirty_writeback_interval可以通過修改/proc/sys/vm/下的dirty_writeback_centisecs來修改,默認值是500,單位是10ms
  9.     定時器函數sync_supers_timer_fn用於喚醒同步超級塊的線程sync_supers_tsk,並且更新定時器的到期時間,具體實現如下*/
  10.     setup_timer(&sync_supers_timer, sync_supers_timer_fn, 0);
  11.     /*用於更新定時器的到期時間,詳見下面代碼。*/
  12.     bdi_arm_supers_timer();

  13.     /*初始化default_backing_dev_info的成員變量,初始化相關的鏈表,相關的變量賦初值等操作,請讀者自行閱讀。*/
  14.     err = bdi_init(&default_backing_dev_info);
  15.     if (!err)
  16.       /*調用bdi_register註冊默認的後備存儲器default_backing_dev_infobdi_list鏈表,並創建默認的backing_dev_info管理線程,
  17.         用於管理其他的後備存儲器的數據同步線程的創建和銷燬,所有的後備存儲器在初始化時都會調用bdi_register註冊到bdi_list鏈表中。
  18.         bdi_register詳見下文分析。*/
  19.         bdi_register(&default_backing_dev_info, NULL, "default");

  20.     /*初始化空的後備存儲器,可以忽略。*/
  21.     err = bdi_init(&noop_backing_dev_info);

  22.     return err;
  23. }
sync_supers_timer_fn函數喚醒超級塊數據同步線程,然後重設定時器。
  1. static void sync_supers_timer_fn(unsigned long unused)
  2. {
  3.     wake_up_process(sync_supers_tsk);
  4.     bdi_arm_supers_timer();
  5. }
bdi_arm_supers_timer函數重設定時器
  1. void bdi_arm_supers_timer(void)
  2. {
  3.     unsigned long next;

  4.     if (!dirty_writeback_interval)
  5.         return;

  6.     next = msecs_to_jiffies(dirty_writeback_interval * 10) + jiffies;
  7.     mod_timer(&sync_supers_timer, round_jiffies_up(next));
  8. }
三、bdi_register()函數分析
bdi_register函數用於註冊後備存儲器到全局鏈表bdi_list上,並且判斷如果是默認的後備存儲器default_backing_dev_info則創建bdi-default線程,用於管理創建或銷燬所有後備存儲器相關的同步回寫線程
  1. int bdi_register(struct backing_dev_info *bdi, struct device *parent,
  2.         const char *fmt, ...)
  3. {
  4.     va_list args;
  5.     struct device *dev;

  6.     if (bdi->dev)    /* The driver needs to use separate queues per device */
  7.         return 0;

  8.     va_start(args, fmt);
  9.     dev = device_create_vargs(bdi_class, parent, MKDEV(0, 0), bdi, fmt, args);
  10.     va_end(args);
  11.     if (IS_ERR(dev))
  12.         return PTR_ERR(dev);

  13.     bdi->dev = dev;

  14.     /*
  15.      * Just start the forker thread for our default backing_dev_info,
  16.      * and add other bdi's to the list. They will get a thread created
  17.      * on-demand when they need it.
  18.      */
  19.     if (bdi_cap_flush_forker(bdi)) {
  20.         struct bdi_writeback *wb = &bdi->wb;

  21.         wb->task = kthread_run(bdi_forker_thread, wb, "bdi-%s",
  22.                         dev_name(dev));
  23.         if (IS_ERR(wb->task))
  24.             return PTR_ERR(wb->task);
  25.     }

  26.     bdi_debug_register(bdi, dev_name(dev));
  27.     set_bit(BDI_registered, &bdi->state);

  28.     spin_lock_bh(&bdi_lock);
  29.     list_add_tail_rcu(&bdi->bdi_list, &bdi_list);
  30.     spin_unlock_bh(&bdi_lock);

  31.     trace_writeback_bdi_register(bdi);
  32.     return 0;
  33. }


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章