以前下載文庫上面的內容,都是用冰點下載,因爲很多都失效了,冰點是唯一能用的。不過我們常用的文庫還是百度,雖然百度的口碑不好,但是文庫上面的資源倒是挺多,搜索到的很多資源,也放在百度文庫裏面,所以我們經常和它打交道。以前我們只要有財富值就能下載文庫的資源,後續升級了以後,還必須要下載券才能下載了,現在搞得連復多段文字都不準,實在是不爽。冰點文庫能下載互聯網幾乎所有的文檔網站,但是有一個弊端就是軟件下載的文檔是PDF不可編輯版本,因爲軟件是通過截圖合成的,所以內容都不能編輯和複製,還得自己OCR識別。
今天給大家帶來的軟件不需要那麼麻煩的操作,輸入地址就能直接下載源格式文檔!注意,是源格式,文檔是可以隨意編輯和修改的,非常方便。
軟件是使用Python開發的,不過作者並沒有美化,所以界面很醜,但我們只需要功能就行,就先不管了。
軟件會判斷文檔格式,目前支持doc文檔和PPT下載,然後你能看一大串地址,說明軟件在開始下載了。
下載速度根據你文檔頁數而定,下載完成後,會保存在你選擇的位置。
文檔格式基本上和網頁一致,並且是可以直接編輯的。如果這個文檔的字體不一樣,而你的電腦又沒有這個字體,那麼文檔的字體顯示就很奇怪,需要你自己去修改了。
懷着好奇心,我們去看看他是怎麼下載的文檔,爲什麼是可以編輯的呢?
在命令窗口複製一條軟件下載的一個地址,打開查看,可以看到一堆代碼,這一堆代碼的格式爲JSON,目前暫時看不出有什麼東西。
將內容去掉開頭的函數名,複製到解析工具裏面,進行解析。這下就比較清晰了,顯示該篇字體爲宋體,還有每行的樣式,文字大小等等。
同時每行文字內容也被解析出來了。
那麼,這個JSON數據,可以通過一個轉換器將他轉換成文檔格式,這也解釋得通爲什麼百度文庫可以在網頁顯示文檔內容,網頁上也可以複製了,原來是將文檔內容解析成了JSON數據。
那麼Python配合相關的轉換器,就能將內容轉換成文檔文件了。
至於這個地址是怎麼來的,抓取網頁的數據應該能解得到,這兒就不再和大家深入討論了。
軟件目前只支持需要下載券或者免費的文檔下載,收錢的文檔是不能下載的,這個比較遺憾,但是也還好,如果收錢的也能下載,那麼作者就離進去不遠了。這種工具還是且用且珍惜吧。
下載地址
BDWD_0.95_Single便捷版下載:
移動和彩雲 提取密碼:oVE1
微信掃描下面右側二維碼關注公衆號,發送"解壓"二字獲得解壓密碼。
原創文章,轉載請註明: 轉載自心語家園
本文鏈接地址: 居然有比冰點更好的文庫下載神器,能下載文庫源文檔?