原创 LR+GBDT的工作原理

簡介 因爲梯度提升樹訓練過於複雜,而邏輯迴歸過於簡單,只能發現線性簡單,而對於交互項和非線性關係沒有辨識度。 於是用梯度提升樹訓練模型,基於樹模型,就有了交叉和非線性,然後把葉子節點放到邏輯迴歸模型裏,解決了邏輯迴歸算法的缺點。

原创 GAN綜述

GAN GAN的優化是一個極小極大博弈問題; minGmaxDV(D,G)=Ex∼pdata(x)[log⁡D(x)]+Ez∼pz(z)[log⁡(1−D(G(z)))]\mathop{min}\limits_{G}\matho

原创 編程範式

編程範式 事件驅動是一種編程範式,這裏程序的執行流由外部事件來決定。它的特點是包含一個事件循環,當外部事件發生時使用回調機制來觸發相應的處理。 另外兩種常見的編程範式是(單線程)同步以及多線程編程。 異步編程風格: 事件驅動+回

原创 Hadoop集羣中的自定義Python環境

新建純淨版的虛擬環境 virtualenv --no-site-packages venv 修改虛擬環境爲可遷移狀態 virtualenv --relocatable venv 激活虛擬環境 source venv/bin/acti

原创 使用Prometheus實現監控

介紹 Prometheus 是一套開源的系統監控報警框架。它啓發於 Google 的 borgmon 監控系統,由工作在 SoundCloud 的 google 前員工在 2012 年創建,作爲社區開源項目進行開發,並於 2015 年

原创 字符串模式匹配

模式匹配 單模匹配:KMP 多模匹配:AC自動機 AC自動機 # -*- encoding:utf-8 -* __all__ = ['Ahocorasick', ] class Node(object): def _

原创 歸併排序

def merge_sort(num): import math if(len(num) < 2): return num middle = int(math.floor(len(num)/2)

原创 插入排序

#include <iostream> using namespace std; void Swap(int &a, int &b) { a = a + b; b = a - b; a = a - b;

原创 選擇排序

#include <iostream> using namespace std; void Swap(int &a, int &b) { a = a + b; b = a - b; a = a - b;

原创 基於鄰域的推薦算法

User-Based 用戶相似度: wuv=∣N(u)∩N(v)∣∣N(u)∪N(v)∣w_{uv} = \frac{|N(u) \cap N(v)|}{|N(u) \cup N(v)|}wuv​=∣N(u)∪N(v)∣∣N(u)∩

原创 冒泡排序

#include <iostream> using namespace std; void Swap(int &a, int &b) { a = a + b; b = a - b; a = a - b;

原创 利用C++調用Pytorch的模型

背景 PyTorch的主要接口是Python語言。雖然Python是許多需要動態和易於迭代的場景的首選語言,但同樣有很多情況下,Python的這些屬性恰好是不利的。在生產環境中,需要保證低延遲和其它嚴格的要求,而對於生產場景,C++

原创 基於PyTorch的GAN

from __future__ import print_function import os import torch import torchvision import torch.nn as nn from torchvisi

原创 風格遷移

from __future__ import print_function from __future__ import division from torchvision import models from torchvisio

原创 基於PyTorch的卷積神經網絡

from __future__ import print_function import torch import torch.nn as nn import torchvision import torchvision.tran