Pig

運算符描述
FILTER基於某個條件從關係中選擇一組元組。
FOREACH對某個關係的元組進行迭代,生成一個數據轉換。
GROUP將數據分組爲一個或多個關係。
JOIN聯接兩個或兩個以上的關係(內部或外部聯接)。
LOAD從文件系統加載數據。
ORDER根據一個或多個字段對關係進行排序。
SPLIT將一個關係劃分爲兩個或兩個以上的關係。
STORE在文件系統中存儲數據。


Simple Data Types

Description

Example

Scalars



int

Signed 32-bit integer

10

long

Signed 64-bit integer

Data: 10L or 10l

Display: 10L

float

32-bit floating point

Data: 10.5F or 10.5f or 10.5e2f or 10.5E2F

Display: 10.5F or 1050.0F

double

64-bit floating point

Data: 10.5 or 10.5e2 or 10.5E2

Display: 10.5 or 1050.0

Arrays



chararray

Character array (string) in Unicode UTF-8 format

hello world

bytearray

Byte array (blob)


Complex Data Types



tuple

An ordered set of fields.

(19,2)

bag

An collection of tuples.

{(19,2), (18,1)}

map

A set of key value pairs.

[open#apache]


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章