原创 寶石比較重量

寶石比較重量 標籤(空格分隔): 算法 題目描述: 小明陪小紅去看鑽石,他們從一堆鑽石中隨機抽取兩顆並比較她們的重量。這些鑽石的重量各不相同。在他們們比較了一段時間後,它們看中了兩顆鑽石g1和g2。現在請你根據之前比較的信息判斷

原创 錯題集錦(二) -- Java專項

錯題集錦(二) – Java專項 標籤(空格分隔): 找工作 JVM的內存模型 線程共享: 堆(Heap):主要存放一些對象實例 方法區(Method Area / Non-Heap):用於存儲已被JVM加載的類的信息、常量、

原创 樸素貝葉斯與貝葉斯網絡

樸素貝葉斯與貝葉斯網絡 標籤(空格分隔): 機器學習 樸素貝葉斯 樸素貝葉斯樸素在哪裏呢? —— 兩個假設 * 一個特徵出現的概率與其他特徵(條件)獨立; * 每個特徵同等重要。 樸素貝葉斯分類器 P(c|x)=P(c)

原创 XML學習筆記(二)-- DTD格式規範

標籤(空格分隔): 學習筆記 XML的一個主要目的是允許應用程序之間自由交換結構化的數據,因此要求XML文檔具有一致的結構、業務邏輯和規則。可以定義一種模式來定義XML文檔的結構,並藉此驗證XML文檔的有效性。 定義XM

原创 MATLAB模擬布豐投針實驗

MATLAB模擬布豐投針實驗 標籤(空格分隔): 算法 Buffon’s Needle 桌面上有距離爲a的若干平行線,將長度爲L的針隨機丟在桌面上,則這根針與平行線相交的概率是多少?假定L < a. 思路:從針據橫線的距離與夾角

原创 增長xx%帶來什麼信息?

增長xx%帶來什麼信息? 標籤(空格分隔): 概率論 在與概率論有關的題目中,我們經常會遇到:某公司增長xx%,帶來哪些信息? 看下面這道題目: 某公司在華東和華南兩大區域開展業務,年底彙總業績的時候發現,兩大區域的月度轉化

原创 Spark學習(一)--RDD操作

標籤(空格分隔): 學習筆記 Spark編程模型的兩種抽象:RDD(Resilient Distributed Dataset)和兩種共享變量(支持並行計算的廣播變量和累加器)。 RDD RDD是一種具有容錯性的基於內存的集羣計

原创 聚類算法彙總

聚類算法彙總 標籤(空格分隔): 機器學習 作爲無監督領域(unsupervised)一個太過famous的算法了,聚類(clustering)就是對大量未知標註的數據集,按照數據的內在相似性將數據集劃分爲多個類別,使類別內的數

原创 集成學習(Ensemble Learning)

集成學習(Ensemble Learning) 標籤(空格分隔): 機器學習 Adabost 對於一些弱分類器來說,如何通過組合方法構成一個強分類器。一般的思路是:改變訓練數據的概率分佈(權值分佈),針對不同的訓練數據分佈調用弱

原创 GMM及EM算法

GMM及EM算法 標籤(空格分隔): 機器學習 前言: * EM(Exception Maximizition) – 期望最大化算法,用於含有隱變量的概率模型參數的極大似然估計; * GMM(Gaussian M

原创 最大似然估計(MLE)與最小二乘估計(LSE)的區別

最大似然估計與最小二乘估計的區別 標籤(空格分隔): 概率論與數理統計 最小二乘估計 對於最小二乘估計來說,最合理的參數估計量應該使得模型能最好地擬合樣本數據,也就是估計值與觀測值之差的平方和最小。 設Q表示平方誤差,Yi

原创 Lucky String

Lucky String – 微軟筆試 標籤(空格分隔): 算法 A string s is LUCKY if and only if the number of different characters in s is a f

原创 L0/L1/L2範數的聯繫與區別

標籤(空格分隔): 機器學習 最近快被各大公司的筆試題淹沒了,其中有一道題是從貝葉斯先驗,優化等各個方面比較L0、L1、L2範數的聯繫與區別。 L0範數 L0範數表示向量中非零元素的個數: ||x||0=#(i) with  

原创 錯題集錦(一)

錯題集錦(一) 標籤(空格分隔): 找工作 靜態動態鏈接庫 靜態鏈接庫的優點 代碼裝載速度快,執行速度比動態鏈接庫略快; 只需保證在開發者的計算機中有正確的.lib文件,在意位二進制形式發佈程序時不需要考慮在用戶的計算機上是否

原创 堆排序

堆排序 標籤(空格分隔): 算法 堆實際上是一種滿二叉樹,所以我們可以直接利用父母節點與孩子節點之間在數組中的位置關係來操縱,而不需要真的建立一棵二叉樹。 堆分爲大頂堆(父節點比所有左右子孩子的排序碼都要大)和小頂堆(父節點比