原创 RocketMQ(七)——Transaction Message(事務消息)

分佈式事務通過MQ解決分佈式事務的思路1) 業務和消息生成耦合在一起2) 業務和消息解耦RocketMQ 中的事務消息1) 目前RMQ3.2.6中事務消息的實現原理及存在的問題2) 問題解決思路 本文介紹RocketMQ提供的第

原创 機器學習(決策樹五)——案例:鳶尾花數據分類 及 據特徵屬性比較

本文實現兩個案例,分別是:鳶尾花數據分類 和 鳶尾花數據特徵屬性比較。 用到的數據集跟前面博客中KNN中的數據集是一樣: 數據鏈接:https://download.csdn.net/download/zhanglianhai55

原创 RocketMQ(八)——Pull Or Push

在前面的博客已經提到,在RocketMQ中Consumer分爲2類:Push Consumer、Pull Consumer。以前的例子都是Push Consumer,接下來,介紹下Pull Consumer。 通過MQPullCo

原创 RocketMQ——補充

以後有需要注意的小知識點,就隨時在這裏補充…… 多Master多SlaveQueue in TopicRocketMQ的核心模塊RocketMQ Filter組件介紹 多Master多Slave 由於在之前的博客(RocketM

原创 RocketMQ(六)——Order Message(順序消息)

生產者端消費者端運行效果補充 RocketMQ提供了3種模式的Producer:NormalProducer(普通)、OrderProducer(順序)、TransactionProducer(事務),對應的分別是普通消息、順序

原创 機器學習(決策樹四)——簡述 剪枝

隨着決策樹深度的增大,模型效果會變化,但增大太多就會導致過擬合的情況,對於過擬合,常見的有兩咱優化方式: 1 . 剪枝優化 決策樹過度擬合一般情況是由於節點太多導致的(也就是樹太深,這樣可不可以把某些節點給合併一下,合併之後,節點

原创 機器學習(決策樹三)——簡述 ID3 C4.5 CART

決策樹常見的算法有ID3 C4.5 CART,這裏只簡述一下,不做詳細介紹。因爲了解了決策樹的概念,再看這幾個算法,特別簡單。重點介紹三者的關係。 簡述 1) ID3 ID3算法是決策樹的一個經典的構造算法,內部使用信息熵以及信息

原创 機器學習(決策樹二)——簡述 決策樹

瞭解了信息熵,再看決策樹,會很容易的。通過上篇博客,我們知道:信息熵被認爲是一個系統有序程度的度量,一個系統越是有序,信息熵就越低,一個系統越是混亂,信息熵就越高。決策樹的構造過程就是,如何劃分,能讓系統變得更加有序。 先來直觀理

原创 機器學習(決策樹一)——最直白的話來說信息熵

接下來幾篇博客介紹決策樹,並且儘量用最直白的話來講解。本篇博客介紹決策樹中比較重要的一個概念——信息熵。 前置內容 信息熵可以說是決策樹中最基本的概念,在介紹信息熵前,補充一點兒前置內容。 假設存在一組隨機變量X,各個值出現的概率

原创 機器學習(KNN二)——案例:鳶尾花數據分類

常見API 這裏有我們上篇博客提到的DKTree,還有最基本的KNeighborsClassifier(用於分類) 和 KNeighborsRegressor(用於迴歸),這裏列出常見的參數: 參數 KNeighborsC

原创 機器學習(KNN一)——原理概述

從這篇博客開始機器學習最大的一塊——分類(有監督學習),並以KNN做爲開篇。(當然KNN也可用做迴歸) K近鄰(K-nearst neighbors, KNN)是一種基本的機器學習算法,所謂k近鄰,就是k個最近的鄰居的意思,說的是

原创 機器學習(聚類九)——密度聚類(DBSCAN)算法案例

這篇博客使用scikit的相關API創建模擬數據,然後使用DBSCAN密度聚類算法進行數據聚類操作,並比較DBSCAN算法在不同參數情況下的密度聚類效果。 API class sklearn.cluster.DBSCAN(eps

原创 機器學習(聚類八)——密度聚類

這篇博客介紹另一種類型的聚類算法——密度聚類。 密度聚類方法的指導思想:只要樣本點的密度大於某個閾值,則將該樣本添加到最近的簇中。這類算法可以克服基於距離的算法只能發現凸聚類的缺點,可以發現任意形狀的聚類,而且對噪聲數據不敏感。但

原创 機器學習(聚類七)——層次聚類的優化算法

上篇博客介紹的層次聚類,尤其是AGNES這一傳統的層次聚類算法。這篇博客介紹層次聚類的優化算法。 優化算法 BIRCH算法 BIRCH算法(平衡迭代削減聚類法):聚類特徵使用3元組進行一個簇的相關信息,通過構建滿足分枝因子和簇直徑

原创 機器學習(聚類六)——層次聚類

這篇博客開始另外一種聚類——層次聚類,層次聚類和K-Means是同一類的,屬於劃分聚類。 概述 層次聚類方法對給定的數據集進行層次的分解,直到滿足某種條件爲止,傳統的層次聚類算法主要分爲兩大類算法: 凝聚的層次聚類:AGNES算