原创 你認真思考過自己的商業模式嗎

李笑來《把時間當做朋友》《財富自由之路》 1,三種個人商業模式 你認真考慮過自己的商業模式嗎? 大多數人認爲“商業模式”這個概念和自己沒有太大的關係,因爲商業模式是企業纔有的東西。 企業靠商業模式賺錢 個人靠能力和運氣賺錢 事實上

原创 集羣高性能

集羣高性能的本質很簡單,通過增加更多的服務器來提升系統整體的計算能力。計算本身存在一個特點,同樣的輸入數據和邏輯,無論在哪臺服務器上執行都應該得到相同的輸出。因此高性能集羣設計的複雜度,主要體現任務分配這部分,需要設計合理的任務分配策略,

原创 你真的瞭解列式數據庫嗎

傳統的關係型數據庫是行式數據庫,因爲關係數據庫是按照行來存儲數據的,而列式數據庫就是按照列來存儲數據的數據庫。 行式數據庫的主要優勢有以下兩點。第一點是業務同時讀取多列的時候,效率比較高,因爲這些列都是按行存儲在一起的,一次磁盤操作就能夠

原创 存儲高可用

存儲高可用方案的本質都是通過將數據複製到多個存儲設備,通過數據冗餘的方式來實現高可用,其複雜性主要體現在如何應對複製延遲和中斷導致的數據不一致問題。因此對任何一個高可用存儲方案,我們需要從以下幾方面去進行思考和分析,第一數據如何複

原创 業務高可用

10.1 異地多活 判斷一個系統是否符合異地多活需要滿足如下兩個標準,第一,正常情況下,用戶無論訪問哪一個地點的業務系統,都能得到正確的業務服務,第二,某地系統異常情況下,用戶訪問到其他地方,正常的業務系統也能得到正確的業務服務。   異

原创 計算高可用架構

計算高可用的本質是通過冗餘來規避部分硬件故障的風險,所以計算高可用的設計思想很簡單,通過增加更多的服務器來達到計算高可用。 計算高可用架構設計的複雜度主要體現在任務管理方面,計算高可用架構設計的關鍵點有如下兩點,第一哪些服務器可以

原创 可擴展模式

可擴展模式的基本思想。可擴展性架構的設計方法有很多,但萬變不離其宗,所有的可擴展性架構設計背後的基本思想都可以總結爲一個字,拆。拆,就是將原來大一統的系統拆分爲多個規模小的部分,擴展時只修改其中一部分即可,無需整個系統到處都改,通

原创 互聯網數據平臺架構

互聯網數據平臺架構圖如下。

原创 互聯網標準技術架構

技術架構圖如下。    

原创 Java源碼解析CopyOnWriteArrayList

本文基於jdk1.8進行分析。 ArrayList和HashMap是我們經常使用的集合,它們不是線程安全的。我們一般都知道HashMap的線程安全版本爲ConcurrentHashMap,那麼ArrayList有沒有類似的線程安全的版本呢

原创 Java源碼解析ArrayList及ConcurrentModificationException

本文基於jdk1.8來分析ArrayList的源碼 首先是主要的成員變量。 /** * Default initial capacity. */ private static final int DE

原创 《數學之美》第4章 談談分詞 學習筆記

中文分詞方法,最早是北京航空航天大學樑元南教授提出的字典分詞方法,也就是,從左到右掃描句子,然後查字典,按照優先匹配最長詞語的規則進行分詞。 但是,這種方法有一些侷限性。 後來,發展出了基於統計的分詞方法。這種方法的思路是,對於一個句子的

原创 《數學之美》第3章 統計語言模型 學習筆記

基於語法分析的語言模型遇到瓶頸後,科學家逐步將語言模型的實現思路轉變到基於數學統計的方法。 賈里尼克的出發點很簡單:一個句子是否合理,就看它的可能性大小如何。假設S表示一個有意義的句子,它是由w1w2w3w4w5……wn這n個詞語組成,n

原创 《數學之美》第二章自然語言處理 從規則到統計 學習筆記

1,機器智能 關於什麼是機器智能,圖靈給出過一個定義,叫做“圖靈測試”。讓用戶跟一個機器交流,如果人無法判斷交流對象是人還是機器,則可以說這個機器具有了機器智能,也叫通過了圖靈測試。   自然語言發展60多年的過程,基本上可以分爲兩個階段

原创 《數學之美》第一章 文字和語言數字和信息-學習筆記

本文是《數學之美》第一章 文字和語言數字和信息的學習筆記 信息的傳遞過程是信息源首先將信息編碼形成能夠在信道中傳播的信息,然後信息經過信道進行傳遞,最後,接收者需要解碼才能獲取到信息源需要傳遞的信息。   翻譯這件事之所以能成,僅僅是因爲