order by
會對輸入做全局排序
,因此只有1個reducer(多個reducer無法保證全局有序),會導致當輸入規(guī)模較大時,需要較長的計算時間。
sort by
不是全局排序,其在數(shù)據(jù)進入 reducer 前完成排序。
因此,如果用 sort by 進行排序,并且設置 mapred.reduce.tasks>1
, 則 sort by 只保證每個 reducer 的輸出有序,不保證全局有序
。文章來源:http://www.zghlxwxcb.cn/news/detail-599974.html
我們下期見,拜拜!文章來源地址http://www.zghlxwxcb.cn/news/detail-599974.html
到了這里,關于Hive 中 sort by 和 order by 的區(qū)別的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!