原创 平衡三進制的轉換問題

給定一個數,如何用平衡三進製表示,就像5= 9-3-1? 有時候,覺得平衡三進制很有用處,既有加法,也有減法。 #include <iostream> using namespace std; void transform_tern

原创 餘額支付風控--整體篇

餘額支付風控 整體篇 by dylanfan at 2015-2-9 一  概述 什麼是風控?在支付行業的的風控是通過一定手段來對平臺的業務風險進行控制,偏業務安全領域。風控和技術安全還是不太一樣,技術安全更多關注系統漏洞,是否被攻擊

原创 LDA gibbs

今天看了幾個不錯的博客和文檔說的是lda topic model。 其實最早接觸這個是我在百分點實習的那會,那會還按照文章和國外的一個java實現代碼,寫了個python版本的,代碼很簡單。當時用的數據集有點大,發現單機lda有點慢,並且

原创 給定兩個有序的n長度的數組,如何找出這兩個數組合並後的中位數?

給定兩個有序的n長度的數組,如何找出這兩個數組合並後的中位數? (1) o(n)的時間複雜度。這個就像兩個有序鏈表合併一樣,設定一個變量,記錄合併數的索引,一旦等於n,即停止,當前值衛中位數。 (2)log(n)時間複雜度。通過比較兩個數

原创 LDA工程化之快速採樣算法

範濤 發表於2017-04-14  LDA 是一種topic model,相信對大多數工業界研發人員來說,LDA是一種讓人望而卻步的東西。LDA背後的數學理論是相對複雜的,但是LDA的最終計算公式卻很簡單,物理意義也很好理解。在互聯網

原创 突發事件檢測: kleinberg 狀態機模型

範濤 發表於2017-04-08 1  背景       現實中,我們接觸到各種文本信息,大多是以相應的事件來組織的。針對每個特定事件,涉及的相關文檔都會有相應的時間信息,我們稱這種時間信息爲文檔的到達時間。 那針對某個特定事件,

原创 圖模型在欺詐檢測應用一點看法

在三十而立的日子,把很久之前寫的東西發出來,以紀念這個特殊的日子。 因爲研究生研究經歷,以及工作經歷中前前後後涉及過這塊,之前也和很多人私下探討過這個領域問題,現在把裏面一些關鍵點寫出來,算拋磚引玉吧。 範濤 發表於2017/12/07

原创 Google Smart Reply筆記: Automated Response Suggestion for Email

1 背景 Google mail 自動爲郵件生成回覆內容。 2 總體架構 3: Response selection (LSTM 和beam search) LSTM 爲編解碼的Seq2Seq生成模型,產生response。但

原创 深度學習之圖像目標檢測(Object Detection)

這裏分享下之前關於深度學習在圖像目標識別檢測上一些主流技術以及在家裝類別上識別效果demo。

原创 海量數據相似查找系列2 -- Annoy算法

範濤 發表於2017-04-19 上面一章說了下高維稀疏數據如何通過learning to hash的方法來進行相似查找,這種主要想說下另外一種情況,稠密向量如何進行快速相似查找呢?還是以文本爲例吧。之前提到過文本的paragra

原创 EM-Tree + Paragraph2vector 實現大規模文檔聚類

範濤 發表於2017-04-08 主要分享下《Parallel Streaming Signature EM-tree: A Clustering Algorithm for Web Scale Applications》這篇文章

原创 《Credit Risk Scorecard》 第六章: Scorecard Development

範濤 發表於2017-03-31 第六章:Scorecard Development Process, Stage 4: Scorecard Development 開發流程: 對於申請評分卡(A 卡)來說,下面是整個開發流程。對

原创 Facebook:FastText 理解和在query意圖識別的應用

範濤 發表於2017-04-06 FastText github路徑: https://github.com/facebookresearch/fastText 參考文獻: https://heleifz.github.io

原创 Spark Graphx 進行團伙的識別(community detection)

最近在使用Spark Graphx,拿Graphx做了點實驗。對大規模圖常見的分析方法有連通圖挖掘,團伙挖掘等。在金融科技領域,尤其風控領域,會有各種重要的關聯網絡,並且這種網絡圖十分龐大。 所以,Spark Graphx這種分佈式計算框

原创 深度學習之《社交網絡問答系統-問題重複檢測任務》實現

範濤 發表於2017-04-05 quora duplicate questions:Semantic Question Matching with Deep Learning  本文參考了quora duplicate que