三硬幣問題的EM算法實現

原創

2018-10-10 08:06

代碼:

def three_coins(pi,p,q,y,steps):
    e = 0.00001
    # E-step
    for _ in range(steps):
        miu = []
        for yi in y:
            miu.append((pi*(p**yi)*((1-p)**(1-yi)))/(pi*(p**yi)*((1-p)**(1-yi))+(1-pi)*(q**yi)*((1-q)**(1-yi))))
    # M-step
        temp = list(map(lambda x:1-x,miu))
        new_pi = sum(miu)/len(miu)
        new_p = sum(map(lambda t:t[0]*t[1],list(zip(miu,y))))/sum(miu)
        new_q = sum(map(lambda t:t[0]*t[1],list(zip(temp,y))))/sum(temp)
        print(new_pi, new_p, new_q)
    # check if converge
        if abs(pi-new_pi) < e and abs(p-new_p) < e and abs(q-new_q) < e:
            print("Done")
            break
        pi, p, q = new_pi, new_p, new_q

運行:

# sample input
input_y = [1,1,0,1,0,0,1,0,1,1]
# initial parameters
init_pi, init_p, init_q, iter_num = 0.5, 0.5, 0.5, 100
# run
three_coins(init_pi, init_p, init_q, iter_num)

輸出:

0.5 0.6 0.6
0.5 0.6 0.6

更換不同的初始值, EM算法收斂的值會有所不同.

# initial parameters
init_pi, init_p, init_q, iter_num = 0.4, 0.6, 0.7, 100
# run
three_coins(init_pi, init_p, init_q, iter_num)

0.40641711229946526 0.5368421052631579 0.6432432432432431
0.40641711229946537 0.5368421052631579 0.6432432432432431

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

python學習——生成cdkey小程序

本小程序用來生成形如acf3-ssh3-22sh-jjis-hsha-yysh的cdkey #!/usr/bin/env python # coding=utf-8 import string import random #源字

2020-07-07 23:06:44

Python之線程的GIL問題

1.GIL是什麼 GIL(Global Interpreter Lock)並不是python的特性，而是Python解釋器Cpython引入的一個概念。而python的解釋器不僅僅只有Cpython，若解釋器爲Jpython，

2020-07-07 19:05:39

Python之線程編程（Thread）

線程基本概念 1. 什麼是線程【1】線程被稱爲輕量級的進程【2】線程也可以使用計算機多核資源，是多任務編程方式【3】線程是系統分配內核的最小單元

2020-07-07 19:05:39

Python之數據結構基本概念

什麼是數據結構？ 1. 數據數據即信息的載體，是能夠輸入到計算機中並且能被計算機識別、存儲和處理的符號總稱。 2. 數據元素數據元素是數據的基本單位，又稱之爲記錄

2020-07-07 17:40:19

Python之數據結構--線性表

線性表線性表的定義是描述其邏輯結構，而通常會在線性表上進行的查找、插入、刪除等操作。線性表作爲一種基本的數據結構類型，在計算機存儲器中的存儲一般有兩種形式，一種是順序存儲，一種是鏈式存儲。線性表的順序存

2020-07-07 17:40:19

Python之數據結構--棧和隊列

棧和隊列棧 1. 定義棧是限制在一端進行插入操作和刪除操作的線性表（俗稱堆棧），允許進行操作的一端稱爲“棧頂”，另一固定端稱爲“棧底”，當棧中沒有元素時稱

2020-07-07 17:40:19

Python之線程的同步互斥與死鎖

線程間通信方法 1. 通信方法線程間使用全局變量進行通信 2. 共享資源爭奪共享資源：多個進程或者線程都可以操作的資源稱爲共享資源。對共享資源的操作代碼段稱爲臨界區。影響：對共享資源的無序操作可能會

2020-07-07 17:40:19

Python之基於fork的多進程編程

fork使用 pid = os.fork() 功能：創建新的進程返回值：整數，如果創建進程失敗返回一個負數，如果成功則在原有進程中返回新進程的PID，在新進程中返回0 import os from ti

2020-07-07 17:40:18

Python之排序與查找

排序排序(Sort)是將無序的記錄序列（或稱文件）調整成有序的序列。排序方法有很多種，下面舉例說明：冒泡排序冒泡排序是一種簡單的排序算法。它重複地走訪過要排序的數列，一次比較兩個元素，如

2020-07-07 17:40:18

Python之multiprocessing模塊及進程池

進程創建方法 1. 流程特點【1】將需要子進程執行的事件封裝爲函數【2】通過模塊的Process類創建進程對象，關聯函數【3】可以通過進程對象設置進程信息及屬

2020-07-07 17:40:18

Python之IO併發（多路複用）

IO 分類 IO分類：阻塞IO ，非阻塞IO，IO多路複用，異步IO等。阻塞IO 1.定義：在執行IO操作時如果執行條件不滿足則阻塞。阻塞IO是IO的默認形態。 2.效率：阻塞IO是

2020-07-07 17:40:17

Python之進程理論基礎

進程（process）進程理論基礎 1. 定義：程序在計算機中的一次運行。【程序】是一個可執行的文件，是靜態的佔有磁盤。

2020-07-07 17:40:17

Python之正則表達式介紹

動機【1】文本處理已經成爲計算機常見工作之一【2】對文本內容的搜索，定位，提取是邏輯比較複雜的工作【3】爲了快速方便的解決上述問題，產生了正則表達式技術簡介 1. 定義即文本的高級匹配模

2020-07-07 17:40:17

Python之數據結構--樹形結構

樹形結構基礎概念 1. 定義樹（Tree）是n（n≥0）個節點的有限集合T，它滿足兩個條件：有且僅有一個特定的稱爲根（Root）的節點；其餘的節點可以分爲m（m≥0）個

2020-07-07 17:40:17

Python之RE模塊的使用

RE 模塊是Python的標準庫模塊，直接引入就可以直接使用，具體的功能包含如下： regex = compile(pattern,flags = 0) 功能: 生產正則表達式對象參數: pattern 正則表達式

2020-07-07 17:40:17

24小時熱門文章

最新文章

最新評論文章