原创 Oracle基本操作1

目錄1.查詢當前用戶下所有表名2.行轉列3.時間截取4.數據合併5.遞歸 1.查詢當前用戶下所有表名 select table_name from user_tables; 2.行轉列 統計每個部門下的人數 行轉列 語

原创 Hadoop-HDFS的核心總結

目錄什麼是Hadoop?什麼是HDFS?HDFS的核心思想HDFS的優缺點HDFS的架構HDFS的核心設計1. 心跳機制2. 安全模式3. 副本存放策略4. 負載均衡 什麼是Hadoop? Hadoop是apache旗下的一款開

原创 pandas-DataFrame行列訪問

目錄1.DataFrame概念2.DataFrame行列訪問2.1 訪問一列,多列2.2 訪問一行,多行2.3 訪問某幾行中的某幾列2.4 訪問某幾列中的某幾行2.5 如何獲取單元格的值2.6 小結 1.DataFrame概念

原创 Oracle基本操作2-PL/SQL

目錄1.PL/SQL語法結構2.%type和%rowtype3.循環3.1 loop循環3.2 while loop循環3.3 for loop循環 1.PL/SQL語法結構 declare 變量、常量、遊標 begin s

原创 漏斗轉化率統計實戰 &(hive嚴格模式,本地模式)

目錄1. 求每一步相對於第一步的轉化率2. 求每一步相對於上一步的轉化率3. 求每一步相對於上一步的轉化率(方法2) 轉化率統計 表名order.txt 字段id, name, pv 1,廣告,10000 2,菜單,3000 3

原创 數據庫和數據倉庫的區別(個人理解)

一、從定義來看 數據庫,用來存儲結構化的數據,數據庫由多張表組成,每張表都有行列,是二維的。數據都是一行一行的插入到表中。 數據倉庫,其實也是存儲數據的,相對於數據庫來說存儲的數據量要更龐大。而且數據倉庫多是用於決策分析的

原创 hive外部表和內部表的區別

目錄關於庫的操作關於外部表和內部表的操作1. 創建外部表【一般HDFS上先有公用數據,再創建外部表進行連接】external2. 創建內部表【一般先創建表,不指定路徑,再導入數據】總結 關於庫的操作 創建庫 create d

原创 numpy-軸axis理解

目錄1.例子(二維數組)2.例子(三維數組) 1.例子(二維數組) 2.例子(三維數組)

原创 三分鐘入門hive的7個概念

1. hive是由Facebook實現並開源的 解決mapreduce編寫複雜和學習程度高的問題。 2. hive是hadoop的數據倉庫工具 hive是將存儲在HDFS上的結構化數據映射爲一張二維表格,編寫sql語句來統計分析。

原创 Oracle基本操作3-遊標

1.遊標 # 將sql返回的結果集用遊標進行標註,以後通過對遊標的操作來獲取結果集的數據 # 定義遊標 cursor 遊標名 is select語句; #打開遊標 open 遊標名; #提取遊標 fetch 遊標名 into

原创 numpy索引和切片,重點理解x[0,1]和x[[0,1]]區別

目錄1.例子2.索引3.切片 1.例子 2.索引 重點區分: 1、基本的索引 x[0] x[0,1] # 第0行,第1列 2、整數數組的索引 x[[0,1]] # 第0行,第1行 3、布爾數組的索引 x[[True, Fal

原创 hive數據導入的6種方式

目錄1.hadoop fs -put的方式2.load的方式3.insert...values的方式4.insert...select的方式5.CTAS的方式(比第4種方式更加簡便)6.create views視圖的方式(比第5種

原创 hive分區表和分桶表

目錄1.分區表1.1靜態分區小結1.2動態分區1.2.1單字段動態分區1.2.2多字段半自動分區1.2.3多字段全動態分區全動態分區相關參數調優小結2.分桶表小結 先創建一個數據庫myhive2019 create databa

原创 Oracle數據遷移備份、授權和創建表空間、用戶

目錄1.Oracle數據遷移備份(cmd方式)2.Oracle用戶授權3.創建表空間和用戶 1.Oracle數據遷移備份(cmd方式) 從Oracle導出數據到本地電腦 C:\Users\bobo>exp scott/tig

原创 hive元數據庫理解和初級實操

1. hive元數據庫 hive創建一張表,關聯HDFS上存儲的結構化數據,那麼這張表存儲在哪裏? 其實hive會把用戶創建的數據庫表等抽象的信息專門存儲在一個數據庫中,這個數據庫就是-------元數據庫。 HDFS存儲的數據