原创 機器學習十講第八講

維度災難 什麼是維度災難 高維空間的歐式距離 由於距離在高維空間中不再有效,因此一些基於距離的機器學習模型就會收到影響 基於距離的機器學習模型:K近鄰(樣本間距離),支持向量機(樣本到決策面距離),K-Means(樣本到聚類中心距離)

原创 機器學習十講第七講

最優化 機器學習的優化目標:最小化損失函數 梯度下降 認識梯度下降 隨機梯度下降: 使用mini-batch計算出結果後再根據梯度下降法的公式去更新參數,下一步再隨機採樣子集,重複該操作。此方法稱爲隨機梯度下降(SGD) 梯度下降

原创 《一線架構師實踐指南》讀後感(一)

《一線架構師實踐指南》讀後感(一) 一、架構和設計模式區別 設計模式是一套解決類似問題的經驗的總結。採用設計模式的目的是爲了可重用代碼。而架構模式也一個通用的、可重用的解決方案。我覺得他們的區別是,設計模式跟代碼有直接關係 架構模式

原创 《一線架構師實踐指南》讀後感(五)

什麼是概念架構 概念性架構界定系統的高層組件,以及它們之間的關係。概念性架構意在對系統進行適當分解,而不陷入細節。藉此,可以與管理人員、市場人員、用戶等非技術人員交流架構。概念性架構規定了每個組件的非正式規約及架構圖,但不涉及接口細節。 實

原创 《一線架構師實踐指南》讀後感(二)

《一線架構師實踐指南》讀後感(二) 架構產生的原因 架構是人們爲了提高生活質量,進而爲了提高生產力,接着爲了提高生產效率,而做出的對目標的有機的分割。這種分割與建築的架構是一樣,對目標內部進行空間切分,又留下門窗與各部分進行連通,讓各部分

原创 《一線架構師實踐指南》讀後感(四)

《一線架構師實踐指南》讀後感(四) 什麼是Pre-architecture Pre-architecture就是架構設計的最前期階段,其工作目標包括:理解需求、建立需求大局觀、確定架構設計方向等 實際意義 需求理解的大局觀 有效處理互

原创 《一線架構師實踐指南》讀後感(三)

《一線架構師實踐指南》讀後感(三) 成爲架構師的手段 當我們所做的工作是處於社會的分工的一環,需要幫助別人解決問題,並且按時解決別人的問題成爲我們自己的問題的時候,我們就有了時間壓力,潛意識裏會自然而然的有一種對時間的恐懼。這個恐懼

原创 淘寶軟件質量屬性分析

淘寶軟件質量屬性分析 1、可用性 可用性是指系統正常運行時間的比例,系統故障發生的頻度,出現故障時會發生什麼情況,允許系統有多長時間處於非正常運行狀態等。 場景:雙十一淘寶用戶訪問量數量猛增 刺激源:用戶訪問量 刺激:很多用

原创 機器學習十講第十講

強化學習 知識回顧 機器學習方法 強化學習 馬爾可夫決策 S是離散狀態;A可能是離散,也可能是連續的;P通常用來描述模型 馬爾可夫假設:狀態不斷轉移,隨着時間可以寫成St→St+1→St+2,而在St+2這個時間段時若給定了St

原创 機器學習十講第九講

深度學習 深度學習應用領域 圖像識別:IMAGENET 機器翻譯:Google神經機器翻譯系統 玩遊戲: DeepMind團隊開發的自我學習玩遊戲的系統 語音識別 深度學習發展原因 神經元與感知機 多層感知機(MLP) 誤差函數

原创 機器學習十講第六講

降維 數學知識 特徵向量: 設A是n階方陣,如果有常數λ和n維非零列向量α的關係式Aα=λα成立,則稱λ爲方陣A的特徵值,非零向量α稱爲方陣A的對應於特徵值λ的特徵向量 特徵值分解 降維 主成分分析 模型求解 方差最大化

原创 Spark基礎之Scala

學完感受總結 Scala相比於java進行了極大的簡潔(比如函數式編程),感覺和python有些相似之處 Scala需要學習內容很多,但是經常用到的很少,在spark學習過程中比較常用的就是函數式編程和樣例類,自己之前學習Scala

原创 本地MarkDown優雅發表

本地MarkDown優雅發表 前言 身爲一名程序員,記錄筆記、發表博客首選便是MarkDown,現在網上有好多發表博客的地方:CSDN、博客園、簡書,甚至一些大佬都有自己專屬博客,但自己最喜歡的還是博客園,一來沒錢搭建服務器,二來博客園廣告

原创 機器學習十講第一講

機器學習 這個機器學習讓我感覺有點難,太費腦子了。

原创 影視分析案例

影視分析案例 學完了pandas,趁熱打鐵練習了下電影分析案例,通過練習,鞏固了這幾天的知識,不過數據分析時沒有業務邏輯,基本停留表面,數據分析的過程中也讓我感到有些枯燥。 1. 總覽數據 import pandas as pd imp