python watchdog:监控文件系统事件的Python库和shell工具

     watchdog用来监控指定目录/文件的变化,如添加删除文件或目录、修改文件内容、重命名文件或目录等,每种变化都会产生一个事件,且有一个特定的事件类与之对应,然后再通过事件处理类来处理对应的事件,怎么样处理事件完全可以自定义,只需继承事件处理类的基类并重写对应实例方法。

    先给一个官网的例子:

  1. import sys

  2. import time

  3. import logging

  4. from watchdog.observers import Observer

  5. from watchdog.events import LoggingEventHandler

  6.  
  7. if __name__ == "__main__":

  8. logging.basicConfig(level=logging.INFO,

  9. format='%(asctime)s - %(message)s',

  10. datefmt='%Y-%m-%d %H:%M:%S')

  11. path = sys.argv[1] if len(sys.argv) > 1 else '.'

  12. event_handler = LoggingEventHandler()

  13. observer = Observer()

  14. observer.schedule(event_handler, path, recursive=True)

  15. observer.start()

  16. try:

  17. while True:

  18. time.sleep(1)

  19. except KeyboardInterrupt:

  20. observer.stop()

  21. observer.join()

    使用LoggingEventHandler()事件处理器,当指定目录发生任何变化都会打印消息到终端。

事件类(event):

  1. watchdog.events.FileSystemEvent(event_type,

  2. src_path,

  3. is_directory=False)

事件类基类,所有具体事件类的父类。当一个目录或文件变化时,就会产生一个特定事件,也就是该类的子类。

属性和方法:
event.is_directory
该事件是否由一个目录触发

event.src_path
触发该事件的文件或目录路径

event.event_type
事件类型,为moveddeletedcreatedmodified的其中之一

event.key
返回元组(event_type, src_path, is_directory)

watchdog.events.FileSystemEvent类的子类:

watchdog.events.FileDeletedEvent() 
文件被删除时触发该事件

watchdog.events.DirDeletedEvent() 
目录被删除时触发该事件

watchdog.events.FileCreatedEvent() 
文件被创建时触发该事件

watchdog.events.DirCreatedEvent() 
目录被创建时触发该事件

watchdog.events.FileModifiedEvent() 
文件被修改时触发该事件(修改文件内容、修改文件inode信息如权限和访问时间,都会触发该事件)

watchdog.events.DirModifiedEvent() 
目录被修改时触发该事件

watchdog.events.FileMovedEvent() 
文件被移动或重命名时触发该事件,因为涉及文件移动,所以除了event.src_path表示原路径,还有event.dest_path表示目的路径

watchdog.events.DirMovedEvent() 
目录被移动或重命名时触发该事件,因为涉及文件移动,所以除了event.src_path表示原路径,还有event.dest_path表示目的路径

事件处理类(event handler):

watchdog.events.FileSystemEventHandler()          

事件处理器的基类,用于处理事件,用户需继承该类,并在子类中重写对应方法。

类实例方法如下:
self.dispatch(event)
接收到一个事件后,通过该方法来决定该event由下面哪个方法处理

self.on_any_event(event)
任何事件发生都会首先执行该方法,该方法默认为空,dispatch()方法会先执行该方法,然后再把event分派给其他方法处理

self.on_moved(event)
Called when a file or a directory is moved or renamed,也就是处理DirMovedEventFileMovedEvent事件,子类需重写该方法

self.on_created(event)
Called when a file or directory is created,也就是处理DirCreatedEventFileCreatedEvent事件,子类需重写该方法

self.on_deleted(event)
Called when a file or directory is deleted,也就是处理DirDeletedEventFileDeletedEvent事件,子类需重写该方法

self.on_modified(event)
Called when a file or directory is modified,也就是处理DirModifiedEventFileModifiedEvent事件,子类需重写该方法

watchdog默认提供的一些事件处理类

  1. watchdog.events.PatternMatchingEventHandler(patterns=None,

  2. ignore_patterns=None,

  3. ignore_directories=False,

  4. case_sensitive=False)

该类会检查触发事件的src_pathdest_path(如 果有的话),是否与patterns指定的模式匹配;ignore_patterns是需要排除不处理的模式,如果路径匹配该模式则不处理;还有 ignore_directories为True则表示不处理由目录引起的事件;case_sensitive为True则表示路径不区分大小写。如果需 要按模式匹配处理事件,则可以继承该类,不过需要自己实现on_moved()on_created()on_deleted()on_modified()这四个方法。

  1. watchdog.events.RegexMatchingEventHandler(regexes=[r".*"],

  2. ignore_regexes=[],

  3. ignore_directories=False,

  4. case_sensitive=False)

基本等同于PatternMatchingEventHandler()类,除了是使用正则,而不是模式匹配。

watchdog.events.LoggingEventHandler()               

使用logging模块记录所有事件信息,见文章开头的列举的官网例子。

例子:自定义事件处理类

  1. import time

  2. from watchdog.observers import Observer

  3. from watchdog.events import FileSystemEventHandler

  4.  
  5. class MyHandler(FileSystemEventHandler):

  6. def on_modified(self, event):

  7. if event.src_path == "/home/sapser/scripts/test.log": #监控指定文件内容、权限等变化

  8. print "log file %s changed!" % event.src_path

  9.  
  10. if __name__ == "__main__":

  11. event_handler = MyHandler()

  12. observer = Observer()

  13. observer.schedule(event_handler, path='.', recursive=False)

  14. observer.start()

  15. try:

  16. while True:

  17. time.sleep(1)

  18. except KeyboardInterrupt:

  19. observer.stop()

  20. observer.join()<span style="font-weight: 700;">

  21. </span>

observer:

watchdog.observers.Observer(timeout=1)         

该类实现了监控文件变化,触发对应的事件类,然后调用关联的事件处理类来处理事件。该类其实是threading.Thread的子类,通过observer.start()使之运行在一个线程中,不会阻塞主进程运行,然后可以调用observer.stop()来停止该线程

实例属性及方法:
observer.schedule(event_handler, path, recursive=False)
监控指定路径path,该路径触发任何事件都会调用event_handler来处理,如果path是目录,则recursive=True则会递归监控该目录的所有变化。每一次调用schedule()对一个路径进行监控处理就叫做一个watch,schedule()方法会返回这个watch,接着可以对这个watch做其他操作,如为该watch增加多个event处理器等
注:内部由一个字典handlers来保存所有watch,watch的值是一个集合,包含对应此watch的所有event handler:


 
  1. handlers = {

  2. watch1: set(event_handler1, event_handler2),

  3. watch2: set(event_handler),

  4. }

observer.add_handler_for_watch(event_handler, watch)
添加一个新的事件处理器到watch中,watch是ObservedWatch()类或其子类的实例

observer.remove_handler_for_watch(event_handler, watch)
从watch中移除一个事件处理器

observer.unschedule(watch)
移除一个watch及这个watch上的所有事件处理器

observer.unschedule_all()
移除所有watch及关联的事件处理器

observer.on_thread_stop()
等同于observer.unschedule_all()

observer.stop()
调用该方法来停止observer线程

例子:为一个路径添加多个事件处理器


 
  1. import time

  2. import logging

  3. from watchdog.observers import Observer

  4. from watchdog.events import FileSystemEventHandler, LoggingEventHandler

  5. from watchdog.observers.api import ObservedWatch

  6.  
  7. class MyHandler(FileSystemEventHandler):

  8. def on_modified(self, event):

  9. if event.src_path == "/home/sapser/scripts/test.log":

  10. print "log file %s changed!" % event.src_path

  11.  
  12. if __name__ == "__main__":

  13. event_handler1 = MyHandler()

  14. observer = Observer()

  15. watch = observer.schedule(event_handler1, path='.', recursive=True)

  16.  
  17. logging.basicConfig(level=logging.INFO,

  18. format='%(asctime)s - %(message)s',

  19. datefmt='%Y-%m-%d %H:%M:%S')

  20. event_handler2 = LoggingEventHandler()

  21. observer.add_handler_for_watch(event_handler2, watch) #为watch新添加一个event handler

  22. observer.start()

  23. try:

  24. while True:

  25. time.sleep(1)

  26. except KeyboardInterrupt:

  27. observer.stop()

  28. observer.join()

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章