原创 Windows 7和Windows 8下安裝SAS

本文講解Windows 7和Windows 8下安裝SAS 9.1.3的步驟。 打開控制面板,選擇程序: 在程序和功能項下選擇“運行爲以前版本的Windows編寫的程序” 選擇程序位置: 選擇“嘗試建議的位置” 點擊“測試

原创 一個實例理解Java Reference

Java Reference即Java的引用機制。當用類創建一個對象時,類中的成員變量被分配內存空間,這些內存空間稱爲該對象的實體,而對象中存放着引用,以確保實體由該對象操作使用。 Java的所有對象都是引用,類似於C和C++中的指針。J

原创 天平稱重謎題

  前段時間抽空看了《說謊者悖論和漢諾塔遊戲》([加拿大]馬塞爾·丹尼斯著,程雲琦譯)一書,作者在第一個謎題“斯芬克斯之謎”中介紹了法國耶穌會詩人 Claude Gaspard Bachet de Méziriac(1581-163

原创 有趣的String

String類也許是Java Coders最早接觸的類之一。我不算資深程序員,但也有好幾年的Java Coding史了,至今還不得不常常感慨於String類帶給我的神奇之旅。我認爲這是一個非常有趣的類。說String有趣,是因爲它構造的

原创 Swarm安裝與開發環境配置

如果你正在研究多智能體系統(Multi-Agent Systems,MAS),如果恰巧你有一點Java程序設計基礎,如果更巧的是你對用Swarm for Java開發MAS抱有濃厚的興趣,那麼請跟隨我一起來搭建一個JDK+JCreator

原创 191億的含義

    2012年11月12日零點一過,所有關注雙11的人都屏住了呼吸等待着最終數據的公佈,等待着一個奇蹟的誕生。191億!其中天貓132億,淘寶59億。雖然沒有過200億,但這依然是一個讓人瘋狂而又絕望的數字。天貓的132億是2011年

原创 Hive join操作小結

本篇對Hive QL中join、left outer join、left semi join和full outer join等表連結操作作一簡要總結。 測試表準備 首先準備三張測試表,內容分別爲: hql_jointest_a idn

原创 UltraEdit個性化定製-Hive QL代碼摺疊、函數列表及自動補全

UltraEdit是程序員的完美情人,我就不贅述其強大易用了,一句話,誰玩誰知道。本文旨在幫助你個性化配置UE,以便在寫Hive QL代碼時能夠更高效舒暢。具體而言,實現以下目的: * 對Hive QL代碼實現摺疊,效果如圖1。 圖

原创 分類器的相關概念

昨天,@人民網 發了一條八卦微博,盤點“雨神”(@蕭敬騰)是如何煉成的。微博稱,網友統計發現,在@蕭敬騰 近年12次主要行程中,有10次他的“現身”讓當地下起了雨,下雨的概率爲83.3%。 圖1 這裏,網友相當於是做了一個人工

原创 Mahout Spectral聚類

譜聚類(Spectral Clustering)這名字看着就比Canopy、K-means來得高端大氣上檔次,事實上它確實是一種比較現代化的聚類方法,並且極具工程應用價值。譜聚類算法聲稱對樣本空間的形狀無限制,並能收斂於全局最優解。

原创 SAS主成分分析

同事講主成分分析,舉了這麼個例子:就像你選女人,有身材、相貌兩個指標,如果身材、相貌都很突出,那當然很好選擇;但如果兩個女人,一個身材突出,一個相貌出衆,看着都很喜歡,那可如何是好!這個時候通過主成分分析,彙總出一個指標,這個指標可以一定

原创 使用MapReduce實現遺傳算法

摘要:遺傳算法在大規模問題的求解中得到越來越多的應用。傳統的基於MPI的並行遺傳算法需要知道機器架構的細節。另一方面,由Google提出的MapReduce可用於開發具有擴展性和容錯能力的應用,是一個強大的抽象模型。本文演示瞭如何使用M

原创 Mahout 0.5部署

Mahout下載與安裝 1、下載Mahout。到地址[1]可以找到鏡像地址。我們下載Mahout 0.5。請將mahout-distribution-0.5.tar.gz和mahout-distribution-0.5-src.zip都

原创 SAS隨機抽樣

    在統計研究中,針對容量無限或者容量很大以至於無法直接對其進行研究的總體,都是通過從中抽取一部分個體作爲研究對象,以考察總體的特徵。被抽取的部分個體稱爲該總體的一個樣本。從總體中抽取樣本的過程,稱爲抽樣。     抽樣包括隨機抽樣和

原创 Mahout Canopy聚類

讀過孟巖的《理解矩陣》系列博文[1]~[3],其中的一段論述讓我很受用:學習一門學問,最重要的是把握主幹內容,迅速建立對於這門學問的整體概念,不必一開始就考慮所有的細枝末節和特殊情況,自亂陣腳[2]。 本着這樣的學習思路,我們按以下步驟