problem
1、衆所周知,電子書有多種格式,十分混亂,如txt,epub,mobi,azw3等等
2、txt格式是不支持目錄的,有很多看書軟件並沒有自帶生成目錄的功能,
3、所以,可以用calibre給來生成目錄,
codes
正則表達式如下:
//*[re:test(., "^\s*[第卷][0123456789一二三四五六七八九十零〇百千兩]*[章回部節集卷].*", "i")]
solutions
1、calibre是一個自由開源的電子書軟件套裝,可以用來組織、存放、以及管理電子書,支持大多數的電子書格式。同時也支持與許多流行的電子書閱讀器進行同步,並可能在DRM的限制下轉換電子書的格式。
官網下載地址:https://calibre-ebook.com/download
github源代碼地址:https://github.com/kovidgoyal/calibre
2、將電子書txt拖入calibre,找到轉換書籍
在結構檢測的xpath表達式中粘貼代碼,點擊轉換即可。
//*[re:test(., "^\s*[第卷][0123456789一二三四五六七八九十零〇百千兩]*[章回部節集卷].*", "i")]