原创 一看就懂,Python 日誌模塊詳解及應用

“ 閱讀本文大概需要 9 分鐘。”日誌概述百度百科的日誌概述:Windows網絡操作系統都設計有各種各樣的日誌文件,如應用程序日誌,安全日誌、系統日誌、Scheduler服務日誌、FTP日誌、WWW日誌、DNS服務器日誌等等,這些根據你的系

原创 你還在用 os.path?快來感受一下 pathlib 給你帶來的便捷吧!

“ 閱讀本文大概需要 5 分鐘。”概述pathlib 是Python內置庫,Python 文檔給它的定義是 Object-oriented filesystem paths(面向對象的文件系統路徑)。pathlib 提供表示文件系統路徑的類

原创 一看就懂【來自英雄聯盟蓋倫的怒吼】與 Python 詳解設計模式(二)觀察者模式

“ 閱讀本文大概需要 8 分鐘。”觀察者模式概述觀察者模式(有時又被稱爲模型-視圖(View)模式、源-收聽者(Listener)模式或從屬者模式)是軟件設計模式的一種。在此種模式中,一個目標物件管理所有相依於它的觀察者物件,並且在它本身的

原创 一看就懂!通過英雄聯盟銳雯詳解 Python 設計模式之門面模式!

“ 閱讀本文大概需要 10 分鐘。”冠軍之刃-銳雯 【網絡配圖】設計模式(Design Pattern)是一套被反覆使用、多數人知曉的、經過分類的、代碼設計經驗的總結。使用設計模式的目的:爲了代碼可重用性、讓代碼更容易被他人理解、保證代碼

原创 只會爬蟲不會反爬蟲?動圖詳解利用 User-Agent 進行反爬蟲的原理和繞過方法!

“ 閱讀本文大概需要 10 分鐘。”隨着 Python 和大數據的火熱,大量的工程師蜂擁而上,爬蟲技術由於易學、效果顯著首當其衝的成爲了大家追捧的對象,爬蟲的發展進入了高峯期,因此給服務器帶來的壓力則是成倍的增加。企業或爲了保證服務的正常運

原创 爬蟲又報錯了?用 Scrapy 來一發郵件不就好了!

“ 閱讀本文大概需要 4 分鐘。”一、需求有時候我們寫了很多爬蟲在運行,但是我們可能不會一直有時間來監控它的變化,比如報錯了,或者爬完了,如果我們能有個通知來通知我們,那該是多好啊!比如發個郵件,發個短信那是再好不過了,那麼本篇文章就介紹一

原创 從小白到大神,你可能需要這麼做!

“ 閱讀本文大概需要 6 分鐘。”七八年前,我絕對是不會相信能夠成爲現在的自己,之前的我可以說是對計算機都一無所知的小白,而現在我已經就職於頂級互聯網公司,並且已經獲得數了十個數據挖掘比賽冠軍,剛畢業年薪 60w+。但是故事還是需要從頭說起

原创 對你沒有看錯!不到 10 行代碼完成抖音熱門視頻的爬取!

“ 閱讀本文大概需要 10 分鐘。”最近研究了一下抖音的爬蟲,目前實現了熱門話題和熱門音樂下面所有相關視頻的爬取,並且我已經將該爬蟲打包成了一個 Python 庫併發布,名稱就叫做 douyin,利用該庫可以使用不到 10 行代碼完成熱門視

原创 這可能是你見過的最全的網絡爬蟲乾貨總結!

“ 閱讀本文大概需要 好多 分鐘。”昨天的時候我參加了掘金組織的一場 Python 網絡爬蟲主題的分享活動,主要以直播的形式分享了我從事網絡爬蟲相關研究以來的一些經驗總結,整個直播從昨天下午 1 點一直持續到下午 5 點,整整四個小時。整個

原创 一文詳細揭祕 Redis 持久化,瞭解一下?

“ 閱讀本文大概需要 20 分鐘。”Redis 是一個開源( BSD 許可)的,內存中的數據結構存儲系統,它可以用作數據庫、緩存和消息中間件。它支持的數據類型很豐富,如字符串、鏈表、集 合、以及散列等,並且還支持多種排序功能。 什麼叫持久化

原创 重磅福利!騰訊 AI Lab 開源大規模高質量中文詞向量數據,800 萬中文詞隨你用!

今日,騰訊 AI Lab 宣佈開源大規模、高質量的中文詞向量數據。該數據包含 800 多萬中文詞彙,相比現有的公開數據,在覆蓋率、新鮮度及準確性上大幅提高,爲對話回覆質量預測和醫療實體識別等自然語言處理方向的業務應用帶來顯著的效能提升。針對

原创 GitHub 最大更新:直接運行代碼;人工智能涼了?年度報告揭示真相

閱讀本文大概需要 5 分鐘。”GitHub 大動作來了。其一是迎來史上最大更新,其二是年度報告出爐。先說最大更新。很簡單,以後你不光能在 GitHub 上存儲和搜索代碼,而且還能直接運行部分代碼。這個期待已久的更新獲得一致好評。詳情如何,下

原创 最強 NLP 預訓練模型!谷歌 BERT 橫掃 11 項 NLP 任務記錄!

本文轉載自:機器之心作者:Jacob Devlin、Ming-Wei Chang、Kenton Lee、Kristina Toutanova 編譯:機器之心參與:路、王淑婷、張倩本文介紹了一種新的語言表徵模型 BERT——來自 Transf

原创 跟繁瑣的模型說拜拜!深度學習腳手架 ModelZoo 來襲!

摘要:我個人開發的深度學習腳手架 ModelZoo 發佈了!好多天沒有更新原創文章了,國慶前的一段時間確實比較忙,整個九月在參加各種面試,另外還有公司的項目,還有自己的畢設,另外還需要準備參加一些活動和講座,時間排的很緊,不過還在這些事情基

原创 來一家咖啡店的所見所想

中午出來辦點事,由於還有一點時間,所以來了一家咖啡店來休息一下。咖啡店叫唐恩都樂,可能大家不是特別熟悉,這家咖啡店是美國的,2008 年進入了中國大陸,但是在國內的總店似乎還不到 100 家,而星巴克 1999 年進入中國大陸,現在已經好幾