行轉(zhuǎn)列和列轉(zhuǎn)行(重點(diǎn))
行轉(zhuǎn)列(split + explode + laterview)
列轉(zhuǎn)行 ( concat_ws + collect_list/set )
Hive排名函數(shù)
row_number不并列不跳過: 1 2 3 4
dense_rank并列不跳過: 1 1 2 3
rank并列跳過: 1 1 3 4
Hive分析函數(shù):Ntile
效果:
排序并分桶 ntile(3) over(partition by A order by B) => {1,2,3}->1,{4,5,6}->2,{7,8,9}->3 可用于取前50%數(shù)據(jù)統(tǒng)計(jì)、取中間三分之一統(tǒng)計(jì)等需求。