原创 大話數據結構 - 數據結構概論

1. 數據結構的邏輯結構數據元素之間的相互關係1.1 集合結構集合結構之間的元素除了屬於同一個集合之外, 他們之間沒有任何其他關係, 各個元素的關係是平等的;        1.2 線性結構元素之間存在一對一的關係, 比如數組, 鏈表;

原创 大話數據結構 - 串

1. 串的定義 串是由0個或多個字符組成的有限序列,也叫做字符串。串中 字符數目n稱爲串的長度。 子串:串中任意個數的連續字符組成的子序列稱爲該字符串的子串,包含該子串的串稱爲主串。子串中的位置就是該子串第一個字符在主串中的序號。 2.

原创 RTB廣告技術修煉之-流量漫遊

1.  背景及目標        本文是Real Time Bidding技術系列文章的第一篇,旨在通過一個廣告請求漫遊RTB系統的各個模塊,從而揭示各模塊需要解決的問題、面臨的挑戰。 作爲系列文章的第一篇,本文的目的是從整體介紹RTB系

原创 文本挖掘 - 目錄

開一個文本挖掘的專題,主要內容來自北京大學楊建武老師《文本挖掘》課程PPT。 點贊 1 收藏 分享 文章舉報 KeeJee 發佈了139 篇原創文章 · 獲贊 141 ·

原创 驗證集與測試集

驗證集沒有算法自動學習的過程,但存在人工調參過擬合的成份。在有監督的機器學習中,經常會說到訓練集(train)、驗證集(validation)和測試集(test),這三個集合的區分可能會讓人糊塗,特別是,有些讀者搞不清楚驗證集和測試集有什

原创 hash trick

https://en.wikipedia.org/wiki/Feature_hashing function hashing_vectorizer(features : array of string, N : integer):

原创 DeepFM

fm與dnn的並行式融合論文: https://arxiv.org/pdf/1606.07792.pdfdeepfm在kaggle競賽中的應用: https://github.com/ChenglongChen/tensorflow-De

原创 一文看懂mapreduce

http://blog.csdn.net/universe_ant/article/details/52624867

原创 matplotlib中文亂碼解決

下列程序在Python3.6下運行通過。 # -*- coding=utf-8 -*- from matplotlib import font_manager import matplotlib.pyplot as plt; if _

原创 Python利用dict實現switch

Python3還是沒有switch,可以利用if-else來實現,但是非常不方便。使用dict來實現會比較簡潔優雅。 # -*- coding: utf-8 -*- """ Python利用dict實現switch """ def ad

原创 FTRL

FTRL是一種優化LR的算法。FTRL實現

原创 準確率與召回率

1、兩個最常見的衡量指標是“準確率(precision)”(你給出的結果有多少是正確的)和“召回率(recall)”(正確的結果有多少被你給出了) 這兩個通常是此消彼長的(trade off),很難兼得。很多時候用參數來控制,通過修改參

原创 GBDT

GBDT詳解https://www.jianshu.com/p/005a4e6ac775https://www.cnblogs.com/ModifyRong/p/7744987.htmlhttp://blog.csdn.net/suran

原创 LSTM - 通過keras上實踐理解LSTM

https://blog.csdn.net/ma416539432/article/details/53509607

原创 改進卷積神經網絡,你需要這14種設計模式

作者:Mariya Yao機器之心編譯參與:馬亞雄、吳攀深度學習領域近來已經發展出大量的新架構,而如何選擇使用這些新架構提升卷積神經網絡的性能就顯得越發重要了。機器之心之前報道過提交 ICLR 2017 的論文:也正是關注於此。而本文在描