原创 Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate學習筆記
1.論文要點 1.1 英文 Conversion rate (CVR) prediction is an essential task for ranking system in industrial applications,
原创 基於電信行業的AIOps應用與實踐
1.摘要: 在大型互聯網架構中,爲提升平臺的計算能力及資源利用率,普遍採用分佈式技術。然而使用分佈式技術也會帶來一些潛在問題,若主機的資源需求與資源分配不匹配、部分主機長時間負載過重,容易導致服務失效,造成服務中斷或數據丟失;同時
原创 機器學習常用算法整理
1.XGBoost算法 1.1 算法特性 用於解決二分類問題,同時通過使用許多策略能夠防止過擬合現象發生,模型準確率比普通算法要高。XGBoost支持並行化計算,使得算法在模型訓練及模型計算時運行速度快,效率高。XGBoost考慮
原创 Causal ML學習筆記
項目名稱:Causal ML: A Python Package for Uplift Modeling and Causal Inference with ML 項目名稱:Causal ML:使用機器學習進行提升建模和因果推理的Pyth
原创 Windows的eclipse下開發Hadoop
Windows的eclipse下開發Hadoop 1. 使用與服務器對應版本的Hadoop的jar包 2. 下載hadoop-common-2.2.0-bin-master文件 修改環境變量->
原创 java編寫求集合的全體子集
若求解集合中的全部子集,只需從頭開始遍歷即可,比如:我們想求集合{A,B,C,D}的全部子集,我們發現它的全部子集可以從頭開始遍歷{, A, AB, ABC, ABCD, AC, ACD, AD, B, BC, BCD, BD, C, C
原创 Elasticsearch權威指南-學習筆記
Elasticsearch權威指南-學習筆記 一.索引 索引只是一個用來指向一個或多個分片(shards)的“邏輯命名空間(logical namespace)”。 一個分片(shard)是一個最小級別“工作單元(worker unit
原创 Redis集羣架構及對比
1. Redis3.0 · 優點 a. 無中心節點 b. 數據按照 slot 存儲分佈在多個 Redis 實例上 c. 平滑的進行擴容/縮容節點 d. 自動故障轉移(節點之間通過 Gossip 協議交換狀態信息,進
原创 網頁/網站/博客等刷點擊率(流量)方法
網頁/網站/博客等刷點擊率(流量)方法前言: 首先,在這裏不鼓勵大家對網頁/網站/博客等進行刷點擊率的作法,畢竟此行爲是一種作弊現象,但作爲一名技術人員本着分享技術的想法也要給大家分享一下。方法: 通過Linux中的curl命
原创 redis集羣(離線版)安裝手冊
1. 依賴包: apr-1.3.9-5.el6_2.src.rpm apr-util-1.3.9-3.el6_0.1.src.rpm curl-7.19.7-52.el6.src.rpm httpd-2.2.15-59.el6
原创 中國聯通大數據應用
中國聯通大數據應用 隨着web4.0時代的到來,數據將成爲企業的最大資產。運營商所含有的數據是不可限量的,同時其帶來的價值也是無法估量的。充分利用運營商的數據以及互聯網大數據技術,能夠爲企業帶來意想不到的效果。 1.應用 對內
原创 Zabbix server(離線版)安裝手冊
由於zabbix server需要依賴MySQL及PHP的相關依賴,因此需要先安裝好MySQL及PHP的相關依賴後方可安裝zabbixserver。 安裝MySQL 目錄mysql下的rpm 1.新建mysql用戶 useradd my
原创 自動化安裝zookeeper腳本
1.自動化安裝zookeeper 1.run.sh: #參數1:zk的壓縮包地址(後綴爲.tar.gz) #參數2:zk解壓後目錄 #參數3:zk存儲data的目錄 #參數4:zk運行log的目錄 #參數5:集羣中每個集羣的ip(','分
原创 協同過濾推薦算法(java原生JDK實現-附源碼地址)
協同過濾推薦算法(java原生JDK實現-附源碼地址) 一、項目需求 1. 需求鏈接 https://tianchi.aliyun.com/getStart/information.htm?raceId=231522 2.
原创 ElasticSearch javaAPI demo示例
一.數據實體: ID:自增主鍵 ID:ID值 VALUE_DAY:該機器當天的值 GROUPNAME:組名 TYPE_MACHINE:機器類型 DATE:日期 TYPE:類型 二.Java代碼: 1.創建客戶端: package el