原创 olap數據測試

===== 只要是彙總和level對不上,彙總少,level多.就是維度表主鍵有重複. ===== 事實表有需要丟棄的數據,必須在建模的時候做個屏蔽,否則彙總和level對不上,彙總多,level少 解決方案1: default memb

原创 infobright 小節

===== Infobright有兩個版本ICE和IEE,目前ICE的版本是3.3.1,支持64位Linux和32位windows。ICE不支持DML,也就是不支持insert、update等操作 Infobright是開源的MySQL數

原创 olap的幾個細節

===== 關於維度表和事實表join不到的哪些記錄是直接不分析的. 也就是所有的結果是維度表left join的結果.如果維度表中出現可空值,就會顯示出來(#null). 查詢分2次進行,第一次是查詢出所有的維度,第二次是用內連查詢 =

原创 學會推動事情的進展

感覺有時候有些人的思路好混亂,下次不能忍了. 但是也要好好聽別人的意見,搞明白以後再溫和的提建議 有些人說的分分鐘的事情,自己沒做過也是要很長時間的.也許本來估計就是有錯的. 點贊 收藏 分享 文章舉

原创 Mysql日期和時間函數大全

原文 對於每個類型擁有的值範圍以及並且指定日期何時間值的有效格式的描述見7.3.6 日期和時間類型。  這裏是一個使用日期函數的例子。下面的查詢選擇了所有記錄,其date_col的值是在最後30天以內: mysql> SELECT som

原创 Java日期時間使用總結

原文地址 Java日期時間使用總結   一、Java中的日期概述   日期在Java中是一塊非常複雜的內容,對於一個日期在不同的語言國別環境中,日期的國際化,日期和時間之間的轉換,日期的加減運算,日期的展示格式都是非常複雜的問題。  

原创 java正則

 衆所周知,在程序開發中,難免會遇到需要匹配、查找、替換、判斷字符串的情況發生,而這些情況有時又比較複雜,如果用純編碼方式解決,往往會浪費程序員的時間及精力。因此,學習及使用正則表達式,便成了解決這一矛盾的主要手段。 大 家都知道,正則表

原创 關於本週,上週,本月,上月的實現

週會涉及到跨年,但是月不會跨年. 每週的天數的固定的,但是月的天數是不固定的.

原创 hive udaf 返回複雜類型

方式1: package com.hive.customertag; import java.util.ArrayList; import java.util.regex.Matcher; import java.util.regex

原创 Mysql group by top N的問題

http://sqlfiddle.com/#!2/4c0a5/32 >>>>> 建表 create table mytable (   person varchar(10),   `group` int,   age int ); ins

原创 python 時間

import datetime now = datetime.datetime.now() print print "Current date and time using str method of datetime object:

原创 hive 細節測試

count distinct NULL值計算嗎  re:不計算 hive> select * from test_1;                          OK 1 1 NULL 2hive> select count(d

原创 御膳房交流

產品的各環節打通是很重要的,離線在線要結合,買了還買如果無法轉化爲生產力,就沒什麼意思了。 精準營銷 數據可視化也許比分析更重要 推薦系統獨立於數據挖掘 數據源不在一起不好解決 集團方面:成功案例、uv

原创 計算廣告-百度沙龍

打通線上線下 acookies記錄上網行 廣告支撐互聯網的存在 正確的事情就是做對用戶和網站都有用的事 廣告:廣、快、準 GSP拍賣 基尼係數:穩定性(大小廣告組博弈) 從經濟學的模型定理  點擊作弊 競價系統 點擊率(CTR)預

原创 novicat

導出時選擇xls格式就會很慢,要選擇txt或者csv