原创 OpenStack與Docker對比與描述

Openstack與Docker兩者之間是互補關係: (1)Docker主要針對PaaS平臺,以應用爲中心,能夠讓IaaS層的計算資源更加充分的被利用,因爲Docker相對虛擬機來說,更輕量,對資源的利用率會更加充分; (2)OpenSt

原创 Hadoop圖像壓縮

Hadoop圖像解壓縮        Hadoop雲平臺可以完成 對海量圖像數據的處理,其主要考慮到壓縮速度和壓縮圖像的可分割性。        壓縮算法主要從時間和速度上進行權衡,更快的壓縮和解壓縮速度會佔用更多的存儲空間。Hadoop

原创 OpenStack存儲相關組件描述

OpenStack存儲技術  Swift 對象存儲技術,類似Amazon S3服務,但是提供很強的擴展性,冗餘和持久化技術,也兼容S3 API。 對象存儲支持多種應用,比如複製和存檔數據,圖像或視頻服務,存儲次級靜態數據,開發存儲整合的新

原创 Citrix VDI 跨平臺桌面虛擬化架構的研究

三大虛擬化技術: 1.VMware的VMware ESX 2.Citrix的XenServer 3.微軟的Hyper-V的虛擬化技術 雲計算虛擬化的解決方案:

原创 開源分佈式計算系統框架比較

開源分佈式計算系統框架(Storm,Spark,MapReduce)        目前流行的分佈式計算框架主要有 Hadoop MapReduce, Spark Streaming, Storm; 這三個框架各有優勢,現在都屬於 Ap

原创 Source Insight基本使用和快捷鍵

Source Insight基本使用和快捷鍵     爲什麼要用Source Insight呢?貌似是因爲比完整的IDE要更快一些,比較利於查看大量的代碼。   軟件的安裝很簡單,設置好安裝目錄。   配置好文檔路徑,當然這個也

原创 有1千萬條重複的短信,以文本的形式保存,一行一條,也有重複,請用5分鐘時間找出重複最多的前10條短信

採用內存映射辦法。 首先,1千萬條短信按現在的短息長度將不會超過1GB空間,使用內存映射文件比較合適,可以一次映射 (如果有更大的數據量,可以採用分段映射),由於不需要頻繁使用文件I/O和頻繁分配小內存,這將大大提高了數據的加載速度。 其

原创 歡迎使用CSDN-markdown編輯器

歡迎使用Markdown編輯器寫博客 本Markdown編輯器使用StackEdit修改而來,用它寫博客,將會帶來全新的體驗哦: Markdown和擴展Markdown簡潔的語法 代碼塊高亮 圖片鏈接和圖片上傳 LaTex數學公式 UM

原创 Python學習二

Python 不使用set函數,刪除list中重複的數據 常用方法: 1.使用列表綜合   代碼如下:          lista=['a','r','b','f','f','b']          listb=[]        

原创 python中__init__()作用

Python中__init__函數的作用         python中__init__()函數即表示構造函數,通常在Python中創建類中見到。          代碼如下:          class Student(object

原创 Hadoop之Zookeeper學習(一)

  Zookeeper簡介          Zookeeper 的官方描述爲“Zookeeper是一個高性能,分佈式的,開源分佈式應用協調服務。它提供了簡單原始的功能,分佈式應用可以基於它實現更高級 的服務,比如同步,配置管理,集羣管理

原创 學習第一天

新年新氣象,潛心學習,此刻開始!

原创 HBase深入學習筆記