原创 FIFA20 對技能相近的球員分組(3):DBSCAN

瞭解 DBSCAN 基於密度的噪聲應用空間聚類。 基於密度的聚類定位高密度區域,這些高密度區域被低密度區域彼此分開。 密度:指定半徑內的點數(又名 Eps 或 ε)。 點數 核心點 :如果一個點在 Eps 中有超過指定數量的點(MinPts

原创 用機器學習分析韓國流行音樂 4 - 生產模型

注:你可以在文末找到指向整個 GitHub 倉庫的鏈接。在本教程中,我將向你展示如何將模型投入生產環境中(即模型部署)。什麼是模型部署?模型部署就是將機器學習模型集成到現有的生產環境中,以便基於數據做出實際的業務決策。我們將使用帶有 FLA

原创 在 FIFA 20 將技能相似球員進行分組(2):層次聚類

理解層次聚類 與 K-均值聚類算法(K-means)不同,不需要指定聚類的數量。 結果彙總在樹狀圖,樹狀圖可以方便地解釋數據和選擇任何數量的聚類。 基本思路 專注 :自下而上(又稱凝聚聚類(Agglomerative clustering)

原创 在 FIFA 20 將技能相似球員進行分組(1):K-均值聚類

引言足球(歐洲足球)從小就是我最喜歡的運動之一。過去無論我去哪裏,都會隨身帶着足球,這樣我就能最大限度地利用踢足球的機會。我也喜歡玩電腦遊戲《FIFA 足球世界》,我覺得,用機器學習來分析 FIFA 中的球員是一件很酷的事情。在本教程中,我

原创 用機器學習分析流行音樂(四):生產模型

本文是該教程的第四部分,我將使用 FLASK 將預測模型投入生產。如果你有興趣,可以先看本教程的第一部分、第二部分、第三部分。 什麼是模型部署?模型部署就是將機器學習模型集成到現有的生產環境中,以便基於數據做出實際的業務決策。我們將使用帶

原创 用機器學習分析流行音樂(三):構建模型

本文是本教程的第三部分,在本文中,我將構建不同的預測模型,並比較結果。 你可以先閱讀本教程的第一部分和第二部分,也可以在文末找到本文完整代碼的鏈接。 現在,讓我們來構建模型! 對數據幀進行子集化,並將分類變量轉換爲虛擬變量爲了構建模型,我

原创 用機器學習分析流行音樂(二):探索性數據分析

本文是該系列的第二部分,我從變量中發現了有趣的見解,併發布了相關視頻。 本系列第一部分的主要工作是數據收集和數據清理。本文,我們做一些探索性數據分析,這是該項目的一部分, 全部代碼 都可以在這裏找到。 完成數據清理我意識到,在之前的文章中

原创 用機器學習分析流行音樂(一):數據收集和清理

本文是本教程的第一部分,我將在本文中講述如何收集流行音樂的數據並清理。 目前,全部代碼已經放到了GitHub上。 多年來,韓國流行音樂成爲一種全球性現象,其流行程度讓我感到驚訝。 所以,我決定用機器學習來分析韓國流行音樂,探索有趣的見解。