原创 概率圖模型之:貝葉斯網絡

1、貝葉斯定理P(A∣B)=P(A)P(B∣A)P(B)P(A∣B)=P(A)P(B∣A)P(B)P(A|B)是已知B發生後A的條件概率,也由於得自B的取值而被稱作A的後驗概率。 P(B|A)是已知A發生後B的條件概率,也由於得自A的取值

原创 【Spark系列2】reduceByKey和groupByKey區別與用法

在spark中,我們知道一切的操作都是基於RDD的。在使用中,RDD有一種非常特殊也是非常實用的format——pair RDD,即RDD的每一行是(key, value)的格式。這種格式很像Python的字典類型,便於針對key進行一些

原创 Hadoop開啓關閉調試信息

修改$HADOOP_CONF_DIR/log4j.properties文件 hadoop.root.logger=ALL,consoleor:開啓:export HADOOP_ROOT_LOGGER=DEBUG,console關閉:exp

原创 從貝葉斯方法談到貝葉斯網絡

轉自:http://blog.csdn.net/v_july_v/article/details/409846990 引言    事實上,介紹貝葉斯定理、貝葉斯方法、貝葉斯推斷的資料、書籍不少,比如《數理統計學簡史》,以及《統計決策論及貝