原创 使用JSON進行數據傳輸

使用JSON進行數據傳輸 一、選擇的意義 在異步應用程序中發送和接收信息時,可以選擇以純文本和 XML 作爲數據格式。爲了更好的使用ajax,我們將學習一種有用的數據格式 JavaScript Object Notation(JSON),

原创 K-means算法的java實現,聚類分析681個三國武將

一,k-means算法介紹:   k-means算法接受輸入量 k ;然後將n個數據對象劃分爲 k個聚類以便使得所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個“中心

原创 折半查找-java實現

二分查找又稱折半查找,它是一種效率較高的查找方法。   【二分查找要求】:1.必須採用順序存儲結構 2.必須按關鍵字大小有序排列。 /** * 二分查找又稱折半查找,它是一種效率較高的

原创 Bayesain Networks

2.2、重新考慮上一篇的例子       上一篇文章我們使用樸素貝葉斯分類實現了SNS社區中不真實賬號的檢測。在那個解決方案中,我做了如下假設:       i、真實賬號比非真實賬號平均具有更大的日誌密度、各大的好友密度以及更多的使用真實

原创 Porter Algorithm ---------詞幹提取算法

在英語中,一個單詞常常是另一個單詞的“變種”,如:happy=>happiness,這裏happy叫做happiness的詞幹(stem)。在信息檢索系統中,我們常常做的一件事,就是在Term規範化過程中,提取詞幹(stemming),即

原创 網絡廣告購買方式,RTB, DSP, AdExchange掃盲知識點彙總

         1、90%的在線廣告庫存尚未銷售出去; 2、谷歌廣告交易平臺(AdEx)推出也就一年多而已,卻成爲該市場中最重要的一個平臺,雖然並不是最大的平臺……但“他們目前真的包含了很多信息”。 3、(廣告)機構都非常願意與客戶交

原创 MinHash

1.概述     跟SimHash一樣,MinHash也是LSH的一種,可以用來快速估算兩個集合的相似度。MinHash由Andrei Broder提出,最初用於在搜索引擎中檢測重複網頁。它也可以應用於大規模聚類問題。 2.

原创 redis-cli 命令總結

Redis提供了豐富的命令(command)對數據庫和各種數據類型進行操作,這些command可以在Linux終端使用。在編程時,比如使用Redis 的Java語言包,這些命令都有對應的方法。下面將Redis提供的命令做一總結。 官網命令

原创 Naive Bayesian classification

1.1、摘要       貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉斯定理爲基礎,故統稱爲貝葉斯分類。本文作爲分類算法的第一篇,將首先介紹分類問題,對分類問題進行一個正式的定義。然後,介紹貝葉斯分類算法的基礎——貝葉斯定理。最後,通

原创 Redis.conf 配置

#是否以後臺進程運行,默認爲no,如果需要以後臺進程運行則改爲yes daemonize no     #如果以後臺進程運行的話,就需要指定pid,你可以在此自定義redis.pid文件的位置。 pidfile /var/run/redi

原创 JAVA設計模式五大原則

JAVA設計模式五大原則 1、單一職責 不論是在設計類,接口還是方法,單一職責都會處處體現,單一職責的定義:我們把職責定義爲系統變化的原因。所有在定義類,接口,方法的時候。定義完以後再去想一想是不能多於一個的動機去改變這個類,接口,方法。

原创 JVM內存管理和GC

JVM內存組成結構 JVM內存結構由堆、棧、本地方法棧、方法區等部分組成,結構圖如下所示:  1)堆 所有通過new創建的對象的內存都在堆中分配,其大小可以通過-Xmx和-Xms來控制。堆被劃分爲新生代和舊生代,新生代又被進一步

原创 23種設計模式總結

創建型模式(CreationalPatters):一共有五種,常用的有三種。 工廠方法(FactoryMethod):定義一個用於創建對象的接口,讓子類決定實例化哪一個類。工廠方法是一個列的實例化延遲到其子類。工廠方法用一個vir

原创 Bloom Filter-大規模數據處理利器

一 BloomFilter簡介 Bloom Filter是一種空間效率很高的隨機數據結構,它利用位數組很簡潔地表示一個集合,並能判斷一個元素是否屬於這個集合。Bloom Filter的這種高效是有一定代價的:在判斷一個元素是否屬於某個集合

原创 R樹

R樹在數據庫等領域做出的功績是非常顯著的。它很好的解決了在高維空間搜索等問題。舉個R樹在現實領域中能夠解決的例子吧:查找20英里以內所有的餐廳。如果沒有R樹你會怎麼解決?一般情況下我們會把餐廳的座標(x,y)分爲兩個字段存放在數據庫中,一