原创 13.2 pickle模塊

Pickle模塊 Pickle.dumps方法 # -*-coding:utf-8 -*- __author__ = 'xiaojiaxin' __file_name__ = 'pickle_test' #pickle支持多種語言,但是不

原创 12.3目錄結構

目錄結構 設計好目錄結構 可讀性高 可維護性高 比如一個Foo項目Foo/ --- bin/ --- foo --- foo/ --- tests/ --- _init__.py --- test_

原创 13.1JSON模塊

Json模塊 序列化?把對象從內存中變成可存儲或傳輸的過程稱之爲序列化。在Python中叫picking.在其他語言中也被稱之爲serialization,flattening等,都是一個意思序列化之後,就可以把序列化後的內容寫入磁盤,或者

原创 Flume-Hbase-Sink針對不同版本flume與HBase的適配研究與經驗總結

導語:本文細緻而全面地講解使用flume輸出數據到HBase的三種不同 Flume-Hbase-Sink 之間的差異性,以及技術細節。並且透徹而全面地總結了不同版本flume和HBase之間的兼容性問題。 爲了更加詳細說明三種不同hbase

原创 HBase 優化,columnFamily和qualifierColumn的設計原則

一、把一個傳統的關係型數據庫中的數據映射到hbase,從性能的角度如何優化ColumnFamily和qualifierColumn. 二、兩個比較極端的情況,(1)關係型數據庫中的每一列對應一個columnFamily,(2)關係型數據庫中

原创 簡單理解viterbi算法

簡介:viterbi算法其實就是多步驟每步多選擇模型的最優選擇問題,其在每一步的所有選擇都保存了前續所有步驟到當前步驟當前選擇的最小總代價(或者最大價值)以及當前代價的情況下前繼步驟的選擇。依次計算完所有步驟後,通過回溯的方法找到最優選擇路

原创 線性代數基礎

【轉載】線性代數基礎知識原文地址:http://blog.csdn.net/longxinchen_ml/article/details/51629328 作者:Zico Kolter (補充: Chuong Do) 時間:2

原创 Python實現鏈表

單鏈表: # -*- coding:utf-8 -*- class Node(object): """節點""" def __init__(self,elem): self.elem = elem

原创 Python實現二分查找

搜索常見算法:順序查找,二分法查找,哈希查找,下面是二分查找的實現方式 # coding:utf-8 # 二分查找的前提:只能對有序列進行查找 def binary_search(alist,item): """二分查找---遞歸實

原创 Python實現棧和隊列

棧: # -*- coding:utf-8 -*- class Stack(object): def __init__(self): self.__list = [] def push(self,item):

原创 Python實現二叉樹

二叉樹算法python實現:1.添加節點2.廣度優先遍歷3.深度優先遍歷:先序遍歷,中序遍歷,後序遍歷 # -*- codding:utf-8 -*- class Node(object): """節點""" def __

原创 Python實現排序算法2

4.希爾排序 # -*- coding:utf-8 -*- def shell_sort(alist): """希爾排序""" n = len(alist) gap = n // 2 while gap >

原创 Python實現排序算法1

排序算法有很多種,下面列舉幾種:1.冒泡排序2.選擇排序3.插入排序4.希爾排序5.快速排序6.歸併排序1.冒泡排序 # -*- coding:utf-8 -*- def bubble_sort(alist): """冒泡排序"""

原创 idea和pycharm激活一直報key is invalid問題,終於找到答案!!!

今天裝了pycharm最新版本也就是2018.3.4版本,以往裝的時候激活都很順利,按照網上的教程一遍成功,但是今天在填寫active code的時候一直顯示key is invalid,找了很多不同的激活碼,但都是一樣的報這個錯誤,最後才

原创 Kafka offset

引言Kafka中的Message是以topic爲基本單位組織的,不同的topic之間是相互獨立的。每個topic又可以分成幾個不同的partition(每個topic有幾個partition是在創建topic時指定的),每個partitio