原创 Ubuntu 15.10安裝elementary desktop

elementaryOS的風格類似於macos,基於Ubuntu改造,個人比較喜歡其界面理念,簡單清晰。因此下載了elementaryOS Freya使用,使用過程中,各個軟件版本的升級比較落後,比如gcc等,因此嘗試使用ubuntuOS安

原创 通過JDBC連接hive

       hive是大數據技術簇中進行數據倉庫應用的基礎組件,是其它類似數據倉庫應用的對比基準。基礎的數據操作我們可以通過腳本方式以hive-client進行處理。若需要開發應用程序,則需要使用hive的jdbc驅動進行連接。本文以hi

原创 影響Java EE性能的十大問題

本文總結了影響Java EE性能的十大問題 (1)缺乏正確的容量規劃;(2)中間件環境規範不足;(3)虛擬機垃圾回收過度;(4)與外部系統集成過多或過少;(5)缺乏適當的數據庫SQL調優和容量規劃;(6)特定應用程序性能問題;(7)中間件調

原创 我的友情鏈接

51CTO博客開發

原创 大數據技術Hadoop入門理論系列之一----hadoop生態圈介紹

   Technorati 標記: hadoop,生態圈,ecosystem,yarn,spark,入門 1. hadoop 生態概況Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。用戶可以在不瞭解分佈式底層細節的情況下

原创 大數據技術hadoop入門理論系列之二—HDFS架構簡介

HDFS簡單介紹 HDFS全稱是Hadoop Distribute File System,是一個能運行在普通商用硬件上的分佈式文件系統。 與其他分佈式文件系統顯著不同的特點是: HDFS是一個高容錯系統且能運行在各種低成本硬件上;

原创 轉:值得推薦的C/C++框架和庫 (真的很強大)

目錄(?)[+] 值得學習的C語言開源項目 - 1 Webbench - 2 Tinyhttpd - 3 cJSON - 4 CMockery - 5 Libev - 6 Memcached - 7 Lua - 8 SQL

原创 海量數據處理之Bloom Filter詳解

前言     本博客內曾已經整理過十道海量數據處理面試題與十個方法大總結。接下來,本博客內會重點分析那些海量數據處理的方法,並重寫十道海量數據處理的面試題。如果有任何問題,歡迎不吝指正。謝謝。 一、什麼是Bloom Filter     B

原创 在 Java EE 容器中擴展雲特性

用於擴展 JEE 容器/應用程序的並行性、靈活性、多租戶和安全性的策略和模式 在本文中,作者概述了雲應用程序和 Java? 企業版應用程序的基本特徵,比較了他們的相同點和不同點,然後定義了一組策略並提供了一些模式來擴展 Java EE 容器

原创 從hadoop框架與MapReduce模式中談海量數據處理

前言     幾周前,當我最初聽到,以致後來初次接觸Hadoop與MapReduce這兩個東西,我便稍顯興奮,覺得它們很是神祕,而神祕的東西常能勾起我的興趣,在看過介紹它們的文章或論文之後,覺得Hadoop是一項富有趣味和挑戰性的技術,且它

原创 lightning mdb 源代碼分析系列(3)

     本系列前兩章已經描述了系統架構以及系統構建的基礎內存映射,本章將詳細描述lmdb的核心,外存B+Tree的操作。本文將從基本原理、內存操作方式、外存操作方式以及LMDB中的相關函數等幾方面描述LMDB中關於B+Tree的使用方式。

原创 教你如何迅速秒殺掉:99%的海量數據處理面試題

前言    一般而言,標題含有“秒殺”,“99%”,“史上最全/最強”等詞彙的往往都脫不了譁衆取寵之嫌,但進一步來講,如果讀者讀罷此文,卻無任何收穫,那麼,我也甘願揹負這樣的罪名,:-),同時,此文可以看做是對這篇文章:十道海量數據處理面試

原创 lightning mdb 源代碼分析(4)—MVCC/COW

本博文將描述MVCC和cow技術以及LMDB中如何使用以及實現這兩種技術。 COW(Copy On Write): COW技術背後的思想是拖延技術,基本方法是假如有多個調用者需要訪問的資源,在其初始化的時候是不能區分的,即對於多個調用者來說

原创 通過JDBC連接hive

       hive是大數據技術簇中進行數據倉庫應用的基礎組件,是其它類似數據倉庫應用的對比基準。基礎的數據操作我們可以通過腳本方式以hive-client進行處理。若需要開發應用程序,則需要使用hive的jdbc驅動進行連接。本文以hi

原创 我的友情鏈接

51CTO博客開發