原创 應該怎樣規劃python學習規劃路線?

python現在在各行各業都有十分廣泛的應用,而且近幾年的市場需求也不斷擴大,未來的發展前景也十分廣闊,許多小夥伴想要去學習python來提高自己的職場競爭力。python學習難嗎?應該怎樣規劃學習路線?下面跟小編一起來看吧。 p

原创 電競天才Uzi宣佈退役!用數據帶你回顧他的職業生涯

【導語】:今天我們來聊聊英雄聯盟傳奇選手Uzi,Python技術部分請看第四部分。Show me data,用數據說話   最近,在被B站的「後浪」和「入海」刷屏後,一個男人也官宣了退役。他就是英雄聯盟知名選手Uzi,有許多人在感慨“神退

原创 調整超參數:決定模型是“金子”還是“垃圾”!

數據清洗以後,你也許會困惑應該從哪裏開始建模。一般情況下它的下一步應該是特徵選擇,但特徵工程和模型訓練是相互影響的。好的特徵選擇可以使模型得到好的效果,而不同的模型又對數據有不同的要求。 因此,特徵工程和模型訓練是兩個不可分割的部分。由於

原创 五月天線上演唱會:用Python解讀,分析這裏有你的青春嗎?

【導語】:今天我們來聊聊五月天這場刷屏朋友圈的線上演唱會,Python技術部分請看第四部分。 Show me data,用數據說話! 在五月的最後一天,五月天實現了他們2020年的“五月之約”。5月31日 一場席捲朋友圈的線上演唱會如約上

原创 聚類算法:Affinity Propogation算法學習指南!

Affinity Propogation最初是由Brendan Frey 和 Delbert Dueck於2007年在Science上提出的。相比其它的聚類算法,Affinity Propogation算法不需要預先指定聚類個數。

原创 二分類任務的一種簡單且可解釋的性能指標!

理論物理學家和研究科學家Mehmet Suzen曾表示,二分類任務是機器學習的基礎。但是,其性能的標準統計信息是一種數學工具,ROC-AUC很難解釋。在這裏,引入了一種性能度量,該度量僅考慮進行正確的二進制分類的可能性。 機器學習模型的核

原创 SQL面試經典50題:帶你從聚合和分組開始!

前面我們介紹了MySQL數據庫中的建表導表的步驟以及基礎的SELECT語句,本篇再基於第一篇文章的數據基礎上我們梳理下聚合和分組。 對錶進行聚合學習重點 使用聚合函數對錶中的列進行計算合計值或者平均值等的彙總操作。 通常,聚合函

原创 交叉驗證:評估模型表現

註明:本文章所有代碼均來自scikit-learn官方網站 在實際情況中,如果一個模型要上線,數據分析員需要反覆調試模型,以防止模型僅在已知數據集的表現較好,在未知數據集上的表現較差。即要確保模型的泛化能力,它指機器學習對新鮮樣本的適應能

原创 機器學習基礎之新奇和異常值檢測

異常值檢測一般要求新發現的數據是否與現有觀測數據具有相同的分佈或者不同的分佈,相同的分佈可以稱之爲內點(inlier),具有不同分佈的點可以稱之爲離羣值。離羣點和新奇點檢測是不同的,有一個重要的區分必須掌握: 離羣點檢測:訓練數據包含離羣

原创 Python知識普及:Numpy基礎操作

Numpy基礎數據結構 import numpy as np ar = np.array([[1,2,3], [3,4,6], [4,5,7]]) # 二維數組 print(ar) print(type(ar)) ar [[

原创 自我監督學習:提高深度學習數據效率的計劃

儘管深度學習在人工智能領域做出了巨大貢獻,但它還是有一個不太好的地方:它需要大量數據。這是深度學習的先驅者和批評家都同意的一件事。實際上,由於有用數據的有限可用性有限以及處理該數據的計算能力不足,深度學習直到幾年前才成爲領先的A

原创 樸素貝葉斯(Naive Bayes)和校正曲線(Calibration Curve)

算法回顧   圖片來源:https://medium.com/machine-learning-101/chapter-1-supervised-learning-and-naive-bayes-classification-part

原创 Linux系統:那些常見的硬鏈接和軟鏈接!

在Linux系統中,有些常見的硬連接和軟連接,你知道嗎?今天就帶大家來認識一下!先從Linux系統中的文件系統說起。 1. 在Linux中一切皆爲文件 在Linux中有且只有一個根目錄,它就是 / (斜槓),它的子目錄有如下這些: bin

原创 加快Python算法的四個方法:數據並行化篇!

4.jpeg CDA數據分析師 出品 相信大家在做一些算法經常會被龐大的數據量所造成的超多計算量需要的時間而折磨的痛苦不已,接下來我們圍繞四個方法來幫助大家加快一下Python的計算時間,減少大家在算法上的等待時間。以下給

原创 Linux瀏覽文件命令:cat、less、more詳解!

今天我們來詳細講解下,Linux瀏覽文件的三種命令,它們分別是:cat、less、more! cat命令: 一次性在終端中顯示文件的所有內容 cat Facebook首席運營官桑德伯格《Lean\ In》.txt cat命令顯示出多少