国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程

這篇具有很好參考價(jià)值的文章主要介紹了【大數(shù)據(jù)精講】HBase基本概念與讀寫流程。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

目錄

基本概念

概念

數(shù)據(jù)模型

Name Space命名空間

Table

Row

Column

Time Stamp

Cell

邏輯結(jié)構(gòu)

json

物理存儲(chǔ)結(jié)構(gòu)

基礎(chǔ)架構(gòu)

Meta表架構(gòu)

RegionServer架構(gòu)

??寫流程

??讀流程


基本概念

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

Apache HBase – Apache HBase? Home

" This project's goal is the hosting of very large tables -- billions of rows X millions of columns --"

概念

  • 海量數(shù)據(jù):10億行、100萬列
  • 非關(guān)系型數(shù)據(jù)庫:kv結(jié)構(gòu)
  • 稀疏的:不像關(guān)系型數(shù)據(jù)庫表,即使沒有數(shù)據(jù)也要留空
  • 分布式的
  • 持久的
  • 多維的:hashmap是單維度的
  • 排序的:排序后可以使用比如二分查找
  • map映射:k:v
    • key:行鍵、列鍵和時(shí)間戳索引作為key
    • value:未解釋的字節(jié)數(shù)組,未解釋指即經(jīng)過序列化的

HBase使用與BigTable非常相似的數(shù)據(jù)模型,用戶將數(shù)據(jù)行存儲(chǔ)在帶標(biāo)簽的表中。數(shù)據(jù)行具有可排序的鍵和任意數(shù)量的列。該表存儲(chǔ)稀疏,因此如果用戶喜歡,同一表中的行可以具有瘋狂變化的列。

數(shù)據(jù)模型

Name Space命名空間

類似數(shù)據(jù)庫概念,其下有多個(gè)表,自帶兩個(gè):hbase和default

  • hbase:系統(tǒng)使用,存放內(nèi)置表,不要操作
  • default:用戶默認(rèn)使用的

Table

hbase在定義表時(shí)只需要聲明列族即可,不需要聲明具體的列。數(shù)據(jù)存儲(chǔ)是稀疏的,可以動(dòng)態(tài)、按需指定,可以輕松應(yīng)對(duì)字段變更

Row

行由RowKey和多個(gè)Column組成的,數(shù)據(jù)是按照RowKey字典順序存儲(chǔ)的,查詢時(shí)只能按照RowKey進(jìn)行檢索,所以RowKey的設(shè)計(jì)十分重要。

hbase不能寫sql,比如where name=xx不行,沒這個(gè)功能,只能按rowkey讀取,這也是hbase不太好用的原因。

Column

ColumnFamily列族+ColumnQualifier列名組成。

如info:name,info:age

建表時(shí)只需要指明列族,而列名無需預(yù)先定義。

Time Stamp

用來標(biāo)記版本

Cell

即k:v模型,key由{rowkey,column family: column qualifier, timestamp}組成來,唯一確定的單元。cell中的數(shù)據(jù)全部是字節(jié)碼形式存儲(chǔ)。

cell針對(duì)的是底層存儲(chǔ)StoreFile而言的,指的是底層存儲(chǔ)的一行數(shù)據(jù),其他是針對(duì)表而言的

邏輯結(jié)構(gòu)

json

  • 列族:column family
  • 列:column
  • row key:行號(hào),用來排序和整理數(shù)據(jù),特點(diǎn):一定是按照字典序排序好的,字典序:row_key11在row_key2前面

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

橫向拆分:按行拆分region

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

豎向拆分:按列族拆分為store

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

物理存儲(chǔ)結(jié)構(gòu)

物理存儲(chǔ)結(jié)構(gòu)即為數(shù)據(jù)映射關(guān)系,而在概念視圖的空單元格,底層實(shí)際根本不存儲(chǔ)。

  • Timestamp
    • 時(shí)間戳用于標(biāo)記版本
    • 不同版本version的數(shù)據(jù)根據(jù)timestamp進(jìn)行區(qū)分,讀取數(shù)據(jù)默認(rèn)讀取最新的版本
    • HDFS存儲(chǔ)有一個(gè)標(biāo)志性的特點(diǎn):不能夠修改數(shù)據(jù)
    • 在不能改數(shù)據(jù)的基礎(chǔ)上怎么實(shí)現(xiàn)改,以時(shí)間戳作為版本
  • Type:標(biāo)記,寫入Put 刪除Delete
    • 對(duì)于刪除操作,其類型為DeleteColumn

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

基礎(chǔ)架構(gòu)

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

Meta表架構(gòu)

警告:不要修改

System Table:hbase:meta

表名:[table],[region start key],[region id]

第一列:info:regioninfo 為region信息,存儲(chǔ)一個(gè)HRegionInfo對(duì)象

第二列:info:server 當(dāng)前region所處的RegionServer信息,包含端口號(hào)

第三列:info:serverstartcode 當(dāng)前region被分到RegionServer的起始時(shí)間

如果一個(gè)表處于切分的過程中,即region切分,還會(huì)多出兩列info:splitA和info:splitB,存儲(chǔ)值也是HRegionInfo對(duì)象,拆分結(jié)束后,刪除這兩列

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

RegionServer架構(gòu)

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

??寫流程

master只負(fù)責(zé)修改和寫hbase/meta表,讀找zk就可以了,zk會(huì)告訴你表在哪

僅能保證單文件HFile/storeFile有序

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

??讀流程

hash有個(gè)特點(diǎn):說沒有一定沒有,說有不一定有

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試

【大數(shù)據(jù)精講】HBase基本概念與讀寫流程,大數(shù)據(jù),面試,大數(shù)據(jù),面試文章來源地址http://www.zghlxwxcb.cn/news/detail-821217.html

到了這里,關(guān)于【大數(shù)據(jù)精講】HBase基本概念與讀寫流程的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • HBase詳解(對(duì)hbase集群搭建、讀寫流程、hbase的javaApi等細(xì)致入微的講解與保姆級(jí)的圖解)

    HBase詳解(對(duì)hbase集群搭建、讀寫流程、hbase的javaApi等細(xì)致入微的講解與保姆級(jí)的圖解)

    我本想用MySQL來與HBase作比較,但發(fā)現(xiàn)他們兩者毫無可比性,因?yàn)閮烧哌\(yùn)用領(lǐng)域不同,各自有各自的優(yōu)點(diǎn),就好比爬山穿登山鞋,潛水穿腳蹼一般。 一門技術(shù)的興起,一個(gè)優(yōu)秀的開源項(xiàng)目的存在肯定是有它所存在的意義,正如大數(shù)據(jù)一樣,正是因?yàn)殡S著時(shí)間的發(fā)展,隨著技術(shù)

    2024年02月11日
    瀏覽(20)
  • Hbase基本概念

    Hbase基本概念

    一、Hbase介紹 1) Hbase一個(gè)分布式的基于列式存儲(chǔ)的數(shù)據(jù)庫,基于Hadoop的hdfs存儲(chǔ),zookeeper進(jìn)行管理。 (2) Hbase適合存儲(chǔ)半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),對(duì)于數(shù)據(jù)結(jié)構(gòu)字段不夠確定或者雜亂無章很難按一個(gè)概念去抽取的數(shù)據(jù)。 (3) Hbase為null的記錄不會(huì)被存儲(chǔ). (4)基于的表包含rowkey,時(shí)間戳

    2024年02月09日
    瀏覽(14)
  • HBase--技術(shù)文檔--基本概念--《快速掃盲》

    HBase--技術(shù)文檔--基本概念--《快速掃盲》

    Apache HBase – Apache HBase? Home 阿里云hbase 云數(shù)據(jù)庫HBase_大數(shù)據(jù)存儲(chǔ)_訂單風(fēng)控_數(shù)據(jù)庫-阿里云 云數(shù)據(jù)庫 HBase-阿里云幫助中心 ????????HBase是一種分布式、可擴(kuò)展、支持海量數(shù)據(jù)存儲(chǔ)的NoSQL數(shù)據(jù)庫。它基于 Hadoop ,采用列式存儲(chǔ)方式,可以提供實(shí)時(shí)計(jì)算和分布式訪問。HBase的數(shù)

    2024年02月11日
    瀏覽(33)
  • kotlin學(xué)習(xí)(一)基本概念、數(shù)據(jù)對(duì)象類型、控制流程、空值檢驗(yàn)、類與接口

    kotlin學(xué)習(xí)(一)基本概念、數(shù)據(jù)對(duì)象類型、控制流程、空值檢驗(yàn)、類與接口

    kotlin與java語言一樣,編譯成字節(jié)碼后,在JVM虛擬機(jī)中運(yùn)行。kotlin語言的特性依賴于kotlin的語法編譯器。與kotlin類似的語言還有: Scala:大數(shù)據(jù)領(lǐng)域開發(fā)語言 Groovy:基于 JVM 平臺(tái)的動(dòng)態(tài)腳本語言, 在安卓開發(fā)中用來編寫依賴關(guān)系、插件等 2019年谷歌宣布Kotlin成為安卓第一開發(fā)語

    2024年02月09日
    瀏覽(38)
  • 【Hadoop面試】HDFS讀寫流程

    【Hadoop面試】HDFS讀寫流程

    HDFS(Hadoop Distributed File System)是GFS的開源實(shí)現(xiàn)。 HDFS是一個(gè)典型的主/備(Master/Slave)架構(gòu)的分布式系統(tǒng),由一個(gè)名字節(jié)點(diǎn)Namenode(Master) +多個(gè)數(shù)據(jù)節(jié)點(diǎn)Datanode(Slave)組成。其中Namenode提供元數(shù)據(jù)服務(wù),Datanode提供數(shù)據(jù)流服務(wù),用戶通過HDFS客戶端與Namenode和Datanode交互訪問文件系統(tǒng)。

    2024年02月04日
    瀏覽(16)
  • 客戶端讀寫HBase數(shù)據(jù)庫的運(yùn)行原理

    客戶端讀寫HBase數(shù)據(jù)庫的運(yùn)行原理

    1.HBase的特點(diǎn) HBase是一個(gè)數(shù)據(jù)庫,與RDMS相比,有以下特點(diǎn): ① 它不支持SQL ② 不支持事務(wù) ③ 沒有表關(guān)系,不支持JOIN ④ 有列族,列族下可以有上百個(gè)列 ⑤ 單元格,即列值,可以存儲(chǔ)多個(gè)版本的值,每個(gè)版本都有對(duì)應(yīng)時(shí)間戳 ⑥ 行鍵按照字典序升序排列 ⑦ 元數(shù)據(jù) 和 數(shù)據(jù) 分

    2024年02月10日
    瀏覽(25)
  • MATLAB算法實(shí)戰(zhàn)應(yīng)用案例精講-【概念篇】構(gòu)建數(shù)據(jù)指標(biāo)方法(補(bǔ)充篇)

    目錄 前言 幾個(gè)高頻面試題目 指標(biāo)與標(biāo)簽的區(qū)別 幾個(gè)相關(guān)概念 數(shù)據(jù)域

    2024年02月10日
    瀏覽(33)
  • MATLAB算法實(shí)戰(zhàn)應(yīng)用案例精講-【概念篇】構(gòu)建數(shù)據(jù)指標(biāo)方法(最終篇)

    目錄 前言 算法原理 指標(biāo)體系的意義 1. 更好進(jìn)行管理 2. 更優(yōu)打造業(yè)務(wù) 3. 更早構(gòu)造壁壘/

    2024年02月11日
    瀏覽(29)
  • Redis面試題一(基本概念)

    目錄 1.redis 為何這么快 基于內(nèi)存的操作 單線程模型 C語言實(shí)現(xiàn) 高效的數(shù)據(jù)結(jié)構(gòu) 避免磁盤I/O 網(wǎng)絡(luò)模型優(yōu)化 2.redis為什么使用單線程 3.緩存三大問題以及解決方案 4.先刪后寫還是先寫后刪 先刪緩存后寫 DB 先寫 DB 再刪緩存 5.如何保證 Redis 的高并發(fā) 6.redis 如何保證原子性 7.redis的

    2024年04月25日
    瀏覽(18)
  • HTTP協(xié)議詳解:基本概念與工作流程

    HTTP(Hypertext Transfer Protocol,超文本傳輸協(xié)議)是一種用于在計(jì)算機(jī)網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)交換的通信協(xié)議。它是互聯(lián)網(wǎng)上最常用的協(xié)議之一,被廣泛應(yīng)用于Web瀏覽器和服務(wù)器之間的通信。本文將深入探討HTTP協(xié)議的基本概念和工作流程,幫助讀者更好地理解這個(gè)重要的通信協(xié)議。

    2024年02月10日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包