原创 跟蹤併發請求

-- 跟蹤併發請求 select request_id, argument_text, v.REQUESTED_BY, v.REQUESTOR, v.*   from apps.fnd_conc_req_summary_v v  whe

原创 Hive sql優化

hive sql 運行太慢,如何優化? 經驗不豐富的數據分析或者BI工程師往往上來就看sql,調整sql內容,其實不然。 一.業務層面 first of all, 優先了解sql反應的業務,先把業務梳理清晰,去除掉不必要的表,關聯。 這個

原创 hive,spark sql優化

一.hive sql優化 1.發生數據傾斜,如何解決? 什麼是數據傾斜?  由於數據分佈不均勻,造成數據大量的集中到一點,造成數據熱點 1.1 原因 1)、key分佈不均勻 2)、業務數據本身的特性 3)、建表時考慮不周 4)、某些SQL

原创 dbeaver常用快捷鍵

hot key ctrl + enter 執行sql ctrl + \  執行sql,保留之前窗口結果 ctrl + shift + ↑ 向上複製一行 ctrl + shift + ↓ 向下複製一行 ctrl + alt + F 對sql

原创 查看form中LOV對應的後臺代碼

--幫助->關於oracle應用產品獲得sid值 --如果你在這個界面沒有看到會話sid值,去檢查下你的FND:診斷這個配置文件的值是否爲是. DECLARE   CURSOR cur_lov_sql(p_pre_sql_addr VA

原创 PLSQL中獲取堆棧消息的方法

FUNCTION get_error_message RETURN VARCHAR2 IS     l_msg_index     NUMBER;     l_msg_data      VARCHAR2(2000);     l_er

原创 數據分析師的幾層境界

一.業務方滿意 最基本的要求,讓所有業務方滿意   二.業務方覺得你很吊 第二層境界,業務方覺得你很吊   三.業務方按着你的思維套路提需求 第三層,通過不斷的合作和賦能業務方,讓業務方瞭解數據結構和數據分析的模式,可以站在系統化的角度提

原创 重啓EBS應用服務器和數據庫

1) 先停掉應用服務 [appltest@ol6-ap scripts]$ cd $ADMIN_SCRIPTS_HOME [appltest@ol6-ap scripts]$ adstpall.sh 2)停數據庫 FTP到數據庫服務器

原创 使用spark.createDataFrame報錯

spark_df = spark.createDataFrame(df) pandas df轉換爲spark df時報錯 Can not merge type <class 'pyspark.sql.types.LongType'> a

原创 獲取銷售訂單行對應的總成本

--獲取銷售訂單行對應的總成本 FUNCTION get_line_item_cost(p_inventory_item_id IN NUMBER, p_organization_id   IN NUMBER) RETURN VARCH

原创 replace into和insert on duplicate key比較

mysql有兩種 插入新數據的方法replace into  和insert on duplicate key replace into: replace into 跟 insert 功能類似,不同點在於:replace into 首先嚐

原创 presto 提取json數組中的json對象

使用json_array_get函數,可以提取json數組中的指定位置,默認第一位的索引是0   json_array_get(json對象, 0)

原创 Hive sql優化方式總覽

hive sql 運行太慢,如何優化? 經驗不豐富的數據分析或者BI工程師往往上來就看sql,調整sql內容,其實不然。 一.業務層面 first of all, 優先了解sql反應的業務,先把業務梳理清晰,去除掉不必要的表,關聯。 這個

原创 presto函數大全 中文版

Functions and Operators 基於Presto 0.215版本的中文註釋 函數大全,參考官方文檔:https://prestodb.github.io/docs/0.215/functions.html   6.1. 邏

原创 hive sql執行方式對比(tez,mapreduce,spark,storm)

執行方式 簡介 優點 缺點 MapReduce 是一種離線計算框架,將一個算法抽象成Map和Reduce兩個階段進行處理,非常適合數據密集型計算 大數據量下優勢明顯 讀寫hdfs次數多;數據量不大時多性能一般