原创 虛擬機中 hadoop 的集羣的搭建 以及 中途可能出現的問題

搭建集羣的提前準備: 機器名                  機器IP                                用  途                                              

原创 面試筆試問題:大數據量,海量數據 處理方法總結

Hashing  適用範圍:快速查找,刪除的基本數據結構,通常需要總數據量可以放入內存 基本原理及要點: hash函數選擇,針對字符串,整數,排列,具體相應的hash方法。 碰撞處理,一種是open hashing,也稱爲拉鍊法;另一種就

原创 針對 hadoop 中MapReduce 測試過程中的內存溢出的問題

上面   java.lang.OutOfMemoryError: Java heap space  這個錯誤並不是程序自身的邏輯有問題,而是產生了大量內存而導致的,那麼下面我就來解決一下這個問題 如果你用的工具是 MyEclipse

原创 Oracle undo我們需要掌握什麼

引言:undo 是Oracle數據庫的重要組件,剛入門的朋友建議要把undo的原理和機制理解明白,尤其是和redo組件的區別和聯繫。瞭解undo就相當於對oracle恢復有了一半的理解。下面我們開始學習Oracle undo需要掌握什麼

原创 輕鬆帶你走進Oracle數據庫的世界

1.使用sqlplus 啓動和關閉數據庫。 2.創建用戶test,密碼test.

原创 hive調優

優化時,把hive sql當做map reduce程序來讀,會有意想不到的驚喜。(當然我們可以在寫hive語句的時候,可以看看hive是怎麼把sql語句編程mapreduce的) 理解hadoop的核心能力,是hive優化的根本。這是這一

原创 ZooKeeper典型應用場景一覽

數據發佈與訂閱(配置中心)                                                          發佈與訂閱模型,即所謂的配置中心,顧名思義就是發佈者將數據發佈到ZK節點上,供訂閱者動態獲取

原创 ORACLE分區表、分區索引詳解

ORACLE分區表、分區索引ORACLE對於分區表方式其實就是將表分段存儲,一般普通表格是一個段存儲,而分區表會分成多個段,所以查找數據過程都是先定位根據查詢條件定位分區範圍,即數據在那個分區或那幾個內部,然後在分區內部去查找數據,一個分

原创 Resource is out of sync with the file system解決辦法

在eclipse或mycelipse中,啓動run on server時或查看項目文件時報錯: Resource is out of sync with the file system: '/Test_1_Struts_Spring_H

原创 用SQL寫的18位身份證校驗代碼

身份證校驗碼的計算方法  1、將前面的身份證號碼17位數分別乘以不同的係數。第i位對應的數爲[2^(18-i)]mod11。從第一位到第十七位的係數分別爲:7 9 10 5 8 4 2 1 6 3 7 9 10 5 8 4 2 ;   

原创 投資者看好hadoop的六大理由

1)投資者看好Hadoop 目前,投資者十分看好Hadoop,並開始紛紛投資相關技術。從分佈式層面上來說,Hadoop開源軟件整體方案供應商Cloudera已獲得7600萬美元投資,分佈式架構新成員MapR和Hortonworks分別融資

原创 hadoop 的 框架 ZooKeeper 入門

首先先了解一下 ZooKeeper 是什麼?  Zookeeper 是 Google 的 Chubby一個開源的實現,是 Hadoop 的分佈式協調服務;它包含一個簡單的原語集,分佈式應用程序可以基於它實現同步服務,配置維護和命名服務等那

原创 Server Tomcat v6.0 Server at localhost was unable to start within 45 seconds 的解決方法

錯誤 : Server Tomcat v6.0 Server at localhost was unable to start within 45 seconds. If the server requires more time, tr

原创 這種SQL怎麼調整?

只有20幾行的表,笛卡兒積要很久,邏輯讀很大,改爲物理表就沒事了,改爲其他寫法也沒事 SQL> set lines 132 pages 50000 SQL> set autot on SQL> with

原创 Linux版 對sys用戶進行審計的示例

我們在操作數據庫的時候,知道SYS用戶的權限是最大的幹什麼事很方便,同時帶來的問題就是非常危險,沒有人可以束縛住。因此我們有時需要對SYS用戶進行審計 SYS@LEO1>show parameter audit NAME