原创 一張圖讓你詳細理解Group By的分組聚合過程
原文鏈接:http://www.datastudy.cc/to/59 Group By分組聚合是我們在使用過程中使用最多的SQL之一(另外一個使用最多的估計就是JOIN了吧),爲了讓大家詳細瞭解Group By的計算執行過程,我們
原创 Python如何將百分號的字符轉成數字
原文鏈接:http://www.datastudy.cc/to/65 很多時候,我們拿到的報表數據,裏面的小數都是帶百分號的字符串,不能進行直接的計算,需要對其進行轉換,然後再輸出。 解決方法: fro
原创 如何高效地學習數據結構——Python篇
原文鏈接:http://www.datastudy.cc/to/44 我們來看看如何高效地學習一門語言的數據結構,今天我們先看Python篇。 所謂數據結構,是指相互之間存在一種或多種特定關係
原创 陳老師撕B志玲姐姐的熱門微博數據分析
原文鏈接:http://www.tbk.ren/article/256.html?source=csdn 昨晚陳老師不知因何事忽然在微博上罵女神志玲姐姐,引起來網友們的熱鬧圍觀,導致前幾天風風火火的汪峯的前妻吸毒的事件,頓時落下帷幕
原创 用Python讀紅樓夢之——一、詞雲繪製
原文連接 Python在數據分析中越來越受歡迎,已經達到了統計學家對R的喜愛程度,Python的擁護者們當然不會落後於R,開發了一個個好玩的數據分析工具,下面我們來看看如何使用Python,來讀紅樓夢,本文是《用Python讀紅樓
原创 通過Mysql語句得到mysql安裝路徑
通過Mysql語句得到mysql安裝路徑:select @@basedir as basePath from dual
原创 在MySQL中,如何實現Row Number OVER Partiton或者是Rank OVER Partiton呢?
原文鏈接:http://www.tbk.ren/article/255.html?source=csdn 有的同學在處理自己的業務邏輯的時候,需要用到Row Number OVER Partition的方法,那麼,什麼是Row Numb
原创 用Python讀紅樓夢之——二、詞雲美化
原文連接 咱們書接上回,講到我們使用Python把紅樓夢中的核心詞彙給繪畫出來了,但是,紅樓夢這麼唯美的書,給我們烏漆麻黑的搞了一張詞雲,寶寶們肯定接受不了。 我們先來找照片,這張照片不錯,不過還是要處理一下,把背景
原创 在R中,如何計算Row Number呢?或者說是partition rank呢?
原文鏈接:http://www.tbk.ren/article/254.html?source=csdn 有的同學在處理自己的業務邏輯的時候,需要用到Row Number的方法,那麼,什麼是Row Number呢? 例如我
原创 開機時間排名——一個正態分佈的應用的案例
原文鏈接:http://www.datastudy.cc/to/37 覺得很有用,但是用不上。 這個肯定是很多人對《統計學》這一門課程的直觀感覺,如果這貨一點用處都沒有,那是不可能的,大學的老師又不傻,沒
原创 wget 使用技巧
wget 是一個命令行的下載工具。對於我們這些 Linux 用戶來說,幾乎每天都在使用它。下面爲大家介紹幾個有用的 wget 小技巧,可以讓你更加高效而靈活的使用 wget。 $ wget -r -np -nd http://examp
原创 linux壓縮和解壓縮命令大全
.tar 解包:tar zxvf FileName.tar 打包:tar czvf FileName.tar DirName --------------------------------------------- .gz
原创 表結構設計之拉鍊表
一、概念 拉鍊表是針對數據倉庫設計中表存儲數據的方式而定義的,顧名思義,所謂拉鍊,就是記錄歷史。記錄一個事物從開始,一直到當前狀態的所有變化的信息。 在歷史表中對客戶的一生的記錄可能就這樣幾條記錄,避免了按每一
原创 Shell比較兩個日期的大小
在Shell中我們可以利用date命令比較兩個日期的大小,方法是先把日期轉換成時間戳格式,再進行比較。 date 的+%s可以將日期轉換成時間戳格式,看下面的例子: #!/bin/bash date1="2008-4-09 12:0
原创 [Java]讀取文件方法大全
1、按字節讀取文件內容 2、按字符讀取文件內容 3、按行讀取文件內容 4、隨機讀取文件內容 public class ReadFromFile { /** * 以字節爲單位讀取文件,常用於讀二進制文件,如圖片、