原创 開源的DevOps開發工具箱

DevOps是一組過程、方法與系統的統稱,用於促進開發(應用程序/軟件工程)、技術運營和質量保障(QA)部門之間的溝通、協作與整合。在DevOps的整個流程中,使用一些開源工具可以促進開發與運維之間的溝通,有利於項目的管理,甚至可以達到

原创 異常行爲分析模型設計

本文針對異常訪問現狀及問題進行簡要描述,在此基礎上提出基於一元線性迴歸的最小二乘法異常訪問分析模型,通過該模型解決了異常訪問中時間與訪問間相關性問題。 異常訪問是指網絡行爲偏離正常範圍的訪問情況。異常訪問包含多種場景,如Web訪問、數

原创 阿里P8分享:關於做事方式與做事態度

阿里P8分享:關於做事方式與做事態度貼圖1:貼圖2:貼圖3:

原创 貝葉斯分類

樸素貝葉斯分類 1.1、摘要        貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉斯定理爲基礎,故統稱爲貝葉斯分類。本文作爲分類算法的第一篇,將首先介紹分類問題,對分類問題進行一個正式的定義。然後,介紹貝葉斯分類算法的基礎

原创 etcd VS zookeeper

背景 coreOS中使用了etcd作爲集羣配置服務,擁有衆多出色的特點,etcd是一個key,value的數據服務器,單實例可達每秒 1000 次寫操作,以及方便的REST接口。 zookeeper則是在Hadoop中大放光彩的分佈式

原创 研發管理總結

我的研發管理之路在騰訊、小米已有兩年,在此總結一下經驗得失   1 團隊文化 我覺得團隊建設一般由幾個過程:茫然混亂,強制規則,自覺習慣,主動創造。 茫然混亂階段,靠工程師自我素質,道德束縛,靠個人英雄完成任務,走彎路,內耗,意外事

原创 大數據驅動的雲客服

在互聯網時代,除了用戶數、營業額等,數據已經被認爲是未來的核心資源。       大數據爲雲客服可以在以下幾方面發揮作用:   1、近期:智能客服機器人 客服機器人可分四代 第一代:基於關鍵詞精確匹配,簡單有效。例如,在微信公衆號

原创 codis評測

一. 壓測環境 1臺3u8機器(PHP-C3)、1臺lg 3u8機器(PHP-LG):運行PHP腳本,發起codis讀寫請求 3臺3u8機器(CODIS-C3):codis集羣,運行1個proxy實例、2組redis(每組1主2從),pr

原创 深入分析Parquet列式存儲格式

Parquet是面向分析型業務的列式存儲格式,由Twitter和Cloudera合作開發,2015年5月從Apache的孵化器裏畢業成爲Apache頂級項目,最新的版本是1.8.0。 列式存儲 列式存儲和行式存儲相比有哪些優勢呢?

原创 58到家通用實時消息平臺架構細節

一、解決什麼問題 + 難點 解決什麼業務問題 (1)端到雲的實時上報需求:58速運司機端GPS實時上報 (2)雲到端的實時推送需求:58速運司機訂單實時推送 (3)端到端的聊天消息需求:用戶、商戶、客服之間的聊天溝通 難點:

原创 RabbitMq、ActiveMq、ZeroMq、kafka之間的比較

MQ框架非常之多,比較流行的有RabbitMq、ActiveMq、ZeroMq、kafka。這幾種MQ到底應該選擇哪個?要根據自己項目的業務場景和需求。下面我列出這些MQ之間的對比數據和資料。 第一部分:RabbitMQ,Acti

原创 文本聚類算法分析

1. 傳統的文本聚類算法   傳統的文本聚類算法分爲以下幾種 1.1 分割方法(partitioning methods) 1.1.1 K-MEANS算法: 工作原理: 首先從n個數據對象任意選擇 k 個對象作爲初始聚類中心;而對

原创 主題提取

隨着因特網在全球範圍內的飛速發展,網絡媒體已被公認爲是繼報紙、廣播、電視之後的“第四媒體”,網絡成爲反映社會輿情的主要載體之一。網絡環境下的輿情信息的主要來源有:新聞評論、BBS、聊天室、博客、聚合新聞(RSS)。網絡輿情表達快捷、信息

原创 VR、AR、MR、CR到底如何區分

VR的概念想必大家都比較清楚了,這裏一帶而過,重點講述AR、MR和CR的區別。 VR Vitual Reality,虛擬現實,是利用計算設備模擬產生

原创 對線性迴歸,logistic迴歸和一般迴歸的認識

1 摘要       本報告是在學習斯坦福大學機器學習課程前四節加上配套的講義後的總結與認識。前四節主要講述了迴歸問題,回歸屬於有監督學習中的一種方法。該方法的核心思想是從連續型統計數據中得到數學模型,然後將該數學模型用於預測或者分類