国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

使用hive查看orc文件 orcfiledump命令詳解 異常處理(Failed to read ORC file)

這篇具有很好參考價值的文章主要介紹了使用hive查看orc文件 orcfiledump命令詳解 異常處理(Failed to read ORC file)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

列式存儲以orc和parquet文件居多,現(xiàn)階段hive數(shù)據(jù)存儲的主流格式是orc,然后結合presto(目前對orc的支持好于parquet)做一些即席查詢。hive數(shù)據(jù)文件是直接存儲在hdfs上,但是hadoop貌似沒有提供直接查看文本的命令,好在hive提供了支持。


一、ORC文件查看

1. 命令幫助: hive --service orcfiledump --help

$ hive --service orcfiledump --help
usage ./hive orcfiledump [-h] [-j] [-p] [-t] [-d] [-r <col_ids>] [--recover] [--skip-dump] [--backup-path <new-path>] <path_to_orc_file_or_directory>

  --json (-j)                 Print metadata in JSON format
  --pretty (-p)               Pretty print json metadata output
  --timezone (-t)             Print writer's time zone
  --data (-d)                 Should the data be printed
  --rowindex (-r) <col_ids> Comma separated list of column ids for which row index should be printed
  --recover                   Recover corrupted orc files generated by streaming
  --skip-dump                 Used along with --recover to directly recover files without dumping
  --backup-path <new_path>  Specify a backup path to store the corrupted files (default: /tmp)
  --help (-h)                 Print help message
# (-[a-z])里的內容為縮寫,與前面的--xx等價,使用起來更加方便
# --json --pretty都用于metadata信息的展示,后者對輸出的json進行了格式化
# --data 可用于數(shù)據(jù)預覽

2. 數(shù)據(jù)預覽演示

hive --service orcfiledump -d /warehouse/tablespace/managed/hive/ads.db/xxx/dw=2021-07-05 | tail

查看orc文件,hive,hadoop,小技巧,hive,大數(shù)據(jù),hadoop
① 建議挑選較小的文件進行測試
②文件實在很大建議使用tail,使用head在輸出指定的行數(shù)后會報一堆的異常信息
查看orc文件,hive,hadoop,小技巧,hive,大數(shù)據(jù),hadoop

二、ORC文件修復

今天使用presto查hive數(shù)據(jù)的時候報了如下異常
Query 20230313_083619_19104_9jvmr failed: Failed to read ORC file: hdfs://DATALAKE/warehouse/tablespace/managed/hive/dim.db/xxx/dw=2023-03-06/000065_0

但是從hdfs上看文件是存在的,也有大小,然后嘗試了下修復命令

hive --service orcfiledump  --recover /warehouse/tablespace/managed/hive/dim.db/xxx/dw=2023-03-06/000065_0

修復成功
查看orc文件,hive,hadoop,小技巧,hive,大數(shù)據(jù),hadoop

(建議先備份文件)
暫未發(fā)現(xiàn)異常,大家如有遇到orc fail這種情況可以嘗試下文章來源地址http://www.zghlxwxcb.cn/news/detail-567007.html

到了這里,關于使用hive查看orc文件 orcfiledump命令詳解 異常處理(Failed to read ORC file)的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 安卓adb命令查看系統(tǒng)文件大小及磁盤使用情況

    安卓adb命令查看系統(tǒng)文件大小及磁盤使用情況

    現(xiàn)象 今天測試端提出一個問題,桌面無法進入,點HOME鍵做什么都沒用,就是不能進去桌面,但是其他功能比如語音之類的可用。 分析 分析日志發(fā)現(xiàn)如下報錯: 提示設備存儲空間已滿,應用在寫入日志和做一些文件存儲相關的操作異常,導致桌面無法進入。 處理 需要先排查

    2024年02月05日
    瀏覽(30)
  • 在windows系統(tǒng)環(huán)境下使用 tail 命令實時查看文件

    在windows系統(tǒng)環(huán)境下使用 tail 命令實時查看文件

    文章目錄 前言 一、使用tail for Windows工具 二、使用Git Bash Linux系統(tǒng)下我們可以使用tail -f 命令實時查看文件,下面提供兩種在windows系統(tǒng)環(huán)境下使用tail 命令的方法 。 tail for Windows 是便攜式軟件不需要安裝,它可用于顯示文件的最后一行并跟蹤/監(jiān)視文件的更改。 下載地址: 點

    2024年02月16日
    瀏覽(17)
  • 在Hive/Spark上運行執(zhí)行TPC-DS基準測試 (ORC和TEXT格式)

    《大數(shù)據(jù)平臺架構與原型實現(xiàn):數(shù)據(jù)中臺建設實戰(zhàn)》一書由博主歷時三年精心創(chuàng)作,現(xiàn)已通過知名IT圖書品牌電子工業(yè)出版社博文視點出版發(fā)行,點擊《重磅推薦:建大數(shù)據(jù)平臺太難了!給我發(fā)個工程原型吧!》了解圖書詳情,京東購書鏈接:https://item.jd.com/12677623.html,掃描

    2024年02月12日
    瀏覽(38)
  • 如何查看聲卡、pcm設備以及tinyplay、tinymix、tinycap的使用 Android tinyAlsa命令詳解:

    1、查看當前的聲卡: cat /proc/asound/cards 2、查看pcm設備列表: cat /proc/asound/pcm 3、查看當前有哪些進程占用了pcm設備節(jié)點 lsof |grep pcm?? ? 4、查看有哪些音頻設備節(jié)點 ls /dev/snd/ 音頻設備的命名規(guī)則為 [device type] C [card index] D [device index][capture/playback] ,即名字中含有4部分的信息

    2024年02月02日
    瀏覽(16)
  • 1、通過億級數(shù)據(jù)量在hive和impala中查詢比較text、orc和parquet性能表現(xiàn)(二)

    1、通過億級數(shù)據(jù)量在hive和impala中查詢比較text、orc和parquet性能表現(xiàn)(二)

    本文通過在hdfs中三種不同數(shù)據(jù)格式文件存儲相同數(shù)量的數(shù)據(jù),通過hive和impala兩種客戶端查詢進行比較。 本文前提:熟悉hadoop、hive和impala、kafka、flink等,并且其環(huán)境都可正常使用。(在后續(xù)的專欄中都會將對應的內容補全,目前已經完成了zookeeper和hadoop的部分。) 本文分為

    2024年02月12日
    瀏覽(24)
  • Hive SchemaTool 命令詳解

    Hive schematool 是 hive 自帶的管理 schema 的相關工具。 直接輸入 schematool 或者 schematool -help 輸出結果如下: -dbType 數(shù)據(jù)庫類型,只支持以下幾種。 如列出當前 schema 的信息 結果如下: -driver 連接后臺數(shù)據(jù)庫的驅動類名稱。 -dryRun 僅僅列出要執(zhí)行的SQL,不執(zhí)行。 -passWord 覆蓋 hive

    2024年04月12日
    瀏覽(23)
  • 查看磁盤信息命令和查看目錄以及文件占用空間大小命令

    查看磁盤信息命令和查看目錄以及文件占用空間大小命令

    記錄 :313 場景 :在CentOS 7.9操作系統(tǒng),查看磁盤信息命令、查看目錄以及文件占用空間大小命令。主要是df、du、lsblk、fdisk、parted、pvdisplay、vgdisplay、lvdisplay、free等命令。 版本: 操作系統(tǒng):CentOS 7.9 1.df命令 查看文件系統(tǒng)占用磁盤空間大小。df,disk free簡稱。 (1)查看幫助 命

    2024年02月07日
    瀏覽(98)
  • Linux 系統(tǒng) history(查看執(zhí)行命令歷史) 命令詳解

    history 命令是Linux/Unix系統(tǒng)中的一個常用命令,用于查看當前用戶在命令行中執(zhí)行過的命令歷史記錄。該命令允許用戶查看、搜索、編輯和執(zhí)行之前執(zhí)行過的命令,為用戶提供了方便、快捷的操作方式。本文將全面詳細地講解 history 命令的各種用法和注意事項,并提供一些實用

    2024年02月16日
    瀏覽(397)
  • 三、Docker:Compose安裝、使用、文件結構、配置參數(shù)與命令詳解

    三、Docker:Compose安裝、使用、文件結構、配置參數(shù)與命令詳解

    注意:后續(xù)技術分享,第一時間更新,以及更多更及時的技術資訊和學習技術資料 ,將在公眾號 CTO Plus 發(fā)布,請關注公眾號: CTO Plus ? ? Docker-compose 是用于定義和運行多容器 Docker 應用程序的編排工具。使用 docker-compose 后不再需要逐一創(chuàng)建和啟動容器。可以使用YML文件來配

    2024年02月10日
    瀏覽(17)
  • Linux 文件查看命令

    Linux 文件查看命令

    一、cat命令 1. cat+文件名 ,查看文件內容: 例如,查看main.c文件的內容: 2. cat 文件名 ,往文件中寫入數(shù)據(jù), Ctrl+d是結束輸入 例如,向文件a.txt中寫入數(shù)據(jù): 查看剛剛寫入a.txt的內容: 3. cat 文件名1 文件名2 新文件名 ,合并文件,將文件1和文件2 的內容合并放到新文件中

    2024年02月13日
    瀏覽(29)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包