国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<dd id="ykmcq"><var id="ykmcq"></var></dd>

^{<tbody id="ykmcq"></tbody>}

<dd id="ykmcq"></dd>

<th id="ykmcq"><abbr id="ykmcq"></abbr></th>

使用hive查看orc文件 orcfiledump命令詳解異常處理(Failed to read ORC file)

2年前作者：ykn_2233分類：Toy博客閱讀(25)違法舉報

這篇具有很好參考價值的文章主要介紹了使用hive查看orc文件 orcfiledump命令詳解異常處理(Failed to read ORC file)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

列式存儲以orc和parquet文件居多，現(xiàn)階段hive數(shù)據(jù)存儲的主流格式是orc，然后結合presto(目前對orc的支持好于parquet)做一些即席查詢。hive數(shù)據(jù)文件是直接存儲在hdfs上，但是hadoop貌似沒有提供直接查看文本的命令，好在hive提供了支持。

一、ORC文件查看

1. 命令幫助： hive --service orcfiledump --help

$ hive --service orcfiledump --help
usage ./hive orcfiledump [-h] [-j] [-p] [-t] [-d] [-r <col_ids>] [--recover] [--skip-dump] [--backup-path <new-path>] <path_to_orc_file_or_directory>

  --json (-j)                 Print metadata in JSON format
  --pretty (-p)               Pretty print json metadata output
  --timezone (-t)             Print writer's time zone
  --data (-d)                 Should the data be printed
  --rowindex (-r) <col_ids> Comma separated list of column ids for which row index should be printed
  --recover                   Recover corrupted orc files generated by streaming
  --skip-dump                 Used along with --recover to directly recover files without dumping
  --backup-path <new_path>  Specify a backup path to store the corrupted files (default: /tmp)
  --help (-h)                 Print help message
# (-[a-z])里的內容為縮寫，與前面的--xx等價，使用起來更加方便
# --json --pretty都用于metadata信息的展示，后者對輸出的json進行了格式化
# --data 可用于數(shù)據(jù)預覽

2. 數(shù)據(jù)預覽演示

hive --service orcfiledump -d /warehouse/tablespace/managed/hive/ads.db/xxx/dw=2021-07-05 | tail

查看orc文件,hive,hadoop,小技巧,hive,大數(shù)據(jù),hadoop
① 建議挑選較小的文件進行測試
②文件實在很大建議使用tail，使用head在輸出指定的行數(shù)后會報一堆的異常信息

二、ORC文件修復

今天使用presto查hive數(shù)據(jù)的時候報了如下異常
Query 20230313_083619_19104_9jvmr failed: Failed to read ORC file: hdfs://DATALAKE/warehouse/tablespace/managed/hive/dim.db/xxx/dw=2023-03-06/000065_0

但是從hdfs上看文件是存在的，也有大小，然后嘗試了下修復命令

hive --service orcfiledump  --recover /warehouse/tablespace/managed/hive/dim.db/xxx/dw=2023-03-06/000065_0

修復成功
查看orc文件,hive,hadoop,小技巧,hive,大數(shù)據(jù),hadoop

(建議先備份文件)
暫未發(fā)現(xiàn)異常，大家如有遇到orc fail這種情況可以嘗試下文章來源地址http://www.zghlxwxcb.cn/news/detail-567007.html

到了這里，關于使用hive查看orc文件 orcfiledump命令詳解異常處理(Failed to read ORC file)的文章就介紹完了。如果您還想了解更多內容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

安卓adb命令查看系統(tǒng)文件大小及磁盤使用情況
現(xiàn)象今天測試端提出一個問題，桌面無法進入，點HOME鍵做什么都沒用，就是不能進去桌面，但是其他功能比如語音之類的可用。分析分析日志發(fā)現(xiàn)如下報錯：提示設備存儲空間已滿，應用在寫入日志和做一些文件存儲相關的操作異常，導致桌面無法進入。處理需要先排查
2024年02月05日
瀏覽(30)
在windows系統(tǒng)環(huán)境下使用 tail 命令實時查看文件
文章目錄前言一、使用tail for Windows工具二、使用Git Bash Linux系統(tǒng)下我們可以使用tail -f 命令實時查看文件，下面提供兩種在windows系統(tǒng)環(huán)境下使用tail 命令的方法。 tail for Windows 是便攜式軟件不需要安裝，它可用于顯示文件的最后一行并跟蹤/監(jiān)視文件的更改。下載地址：點
2024年02月16日
瀏覽(17)
在Hive/Spark上運行執(zhí)行TPC-DS基準測試 (ORC和TEXT格式）
《大數(shù)據(jù)平臺架構與原型實現(xiàn)：數(shù)據(jù)中臺建設實戰(zhàn)》一書由博主歷時三年精心創(chuàng)作，現(xiàn)已通過知名IT圖書品牌電子工業(yè)出版社博文視點出版發(fā)行，點擊《重磅推薦：建大數(shù)據(jù)平臺太難了！給我發(fā)個工程原型吧！》了解圖書詳情，京東購書鏈接：https://item.jd.com/12677623.html，掃描
2024年02月12日
瀏覽(38)
如何查看聲卡、pcm設備以及tinyplay、tinymix、tinycap的使用 Android tinyAlsa命令詳解：
1、查看當前的聲卡： cat /proc/asound/cards 2、查看pcm設備列表： cat /proc/asound/pcm 3、查看當前有哪些進程占用了pcm設備節(jié)點 lsof |grep pcm?? ? 4、查看有哪些音頻設備節(jié)點 ls /dev/snd/ 音頻設備的命名規(guī)則為 [device type] C [card index] D [device index][capture/playback] ，即名字中含有4部分的信息
2024年02月02日
瀏覽(16)
1、通過億級數(shù)據(jù)量在hive和impala中查詢比較text、orc和parquet性能表現(xiàn)（二）
本文通過在hdfs中三種不同數(shù)據(jù)格式文件存儲相同數(shù)量的數(shù)據(jù)，通過hive和impala兩種客戶端查詢進行比較。本文前提：熟悉hadoop、hive和impala、kafka、flink等，并且其環(huán)境都可正常使用。（在后續(xù)的專欄中都會將對應的內容補全，目前已經完成了zookeeper和hadoop的部分。）本文分為
2024年02月12日
瀏覽(24)
Hive SchemaTool 命令詳解
Hive schematool 是 hive 自帶的管理 schema 的相關工具。直接輸入 schematool 或者 schematool -help 輸出結果如下： -dbType 數(shù)據(jù)庫類型，只支持以下幾種。如列出當前 schema 的信息結果如下： -driver 連接后臺數(shù)據(jù)庫的驅動類名稱。 -dryRun 僅僅列出要執(zhí)行的SQL，不執(zhí)行。 -passWord 覆蓋 hive
2024年04月12日
瀏覽(23)
查看磁盤信息命令和查看目錄以及文件占用空間大小命令
記錄：313 場景：在CentOS 7.9操作系統(tǒng)，查看磁盤信息命令、查看目錄以及文件占用空間大小命令。主要是df、du、lsblk、fdisk、parted、pvdisplay、vgdisplay、lvdisplay、free等命令。版本：操作系統(tǒng)：CentOS 7.9 1.df命令查看文件系統(tǒng)占用磁盤空間大小。df，disk free簡稱。 (1)查看幫助命
2024年02月07日
瀏覽(98)
Linux 系統(tǒng) history（查看執(zhí)行命令歷史）命令詳解
history 命令是Linux/Unix系統(tǒng)中的一個常用命令，用于查看當前用戶在命令行中執(zhí)行過的命令歷史記錄。該命令允許用戶查看、搜索、編輯和執(zhí)行之前執(zhí)行過的命令，為用戶提供了方便、快捷的操作方式。本文將全面詳細地講解 history 命令的各種用法和注意事項，并提供一些實用
2024年02月16日
瀏覽(397)
三、Docker：Compose安裝、使用、文件結構、配置參數(shù)與命令詳解
注意：后續(xù)技術分享，第一時間更新，以及更多更及時的技術資訊和學習技術資料，將在公眾號 CTO Plus 發(fā)布，請關注公眾號： CTO Plus ? ? Docker-compose 是用于定義和運行多容器 Docker 應用程序的編排工具。使用 docker-compose 后不再需要逐一創(chuàng)建和啟動容器。可以使用YML文件來配
2024年02月10日
瀏覽(17)
Linux 文件查看命令
一、cat命令 1. cat+文件名，查看文件內容：例如，查看main.c文件的內容： 2. cat 文件名，往文件中寫入數(shù)據(jù)， Ctrl+d是結束輸入例如，向文件a.txt中寫入數(shù)據(jù)：查看剛剛寫入a.txt的內容： 3. cat 文件名1 文件名2 新文件名，合并文件，將文件1和文件2 的內容合并放到新文件中
2024年02月13日
瀏覽(29)

<tr id="hcv7s"><input id="hcv7s"></input></tr>