国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

HDFS組織架構及相關介紹

2年前作者：daladalabao分類：Toy博客閱讀(21)違法舉報

這篇具有很好參考價值的文章主要介紹了HDFS組織架構及相關介紹。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

HDFS組織架構

HDFS(Hadoop Distributed File System)是Hadoop生態(tài)系統(tǒng)中一個高可靠性、高吞吐量、高容錯性的分布式文件系統(tǒng)。它最初是Google發(fā)明的GFS(Google File System)的實現(xiàn)，根據(jù)Apache Hadoop Project組織架構，HDFS的組織架構如下：

Client

Client是與用戶交互的第一層，它處理和提供文件系統(tǒng)或者存儲集群的IO請求。Client可以是運行在Hadoop框架上面的應用程序，比如MapReduce作業(yè)，也可以使用命令行來操作HDFS文件系統(tǒng)。
NameNode

NameNode是HDFS的主節(jié)點，是整個分布式文件系統(tǒng)的管理核心。它存儲了關于每一個文件和目錄的元數(shù)據(jù)信息，包括文件名、文件屬性、文件塊的位置信息等。此外，NameNode還負責處理客戶端讀寫請求，并將數(shù)據(jù)塊分配給相應的DataNode。
Secondary NameNode

Secondary NameNode不是NameNode的替代品，它是在備份NameNode的文件系統(tǒng)狀態(tài)信息方面起著幫助NameNode的作用。它定期從NameNode獲取最新的文件元數(shù)據(jù)信息并將其合并到fsimage(文件系統(tǒng)鏡像)中，同時再結(jié)合edits(編輯日志)來生成新的fsimage，在某些情況下可以減輕NameNode壓力。
DataNode

DataNode是存儲HDFS中實際數(shù)據(jù)塊的節(jié)點。它們負責接收客戶端讀寫請求來讀取或者寫入數(shù)據(jù)，并向其他DataNode傳輸數(shù)據(jù)塊進行備份和復制，以保證數(shù)據(jù)副本數(shù)量在分布式集群中的存儲以及高可用性。

NameNode

NameNode 在啟動的時候會做哪些操作

在Hadoop集群中，NameNode是一個重要的組件，它負責管理文件系統(tǒng)命名空間和訪問控制等操作。當啟動NameNode時，它會執(zhí)行以下操作：

讀取配置文件：NameNode需要讀取相關的配置文件，例如core-site.xml、hdfs-site.xml等，以獲取必要參數(shù)。
校驗文件系統(tǒng)元數(shù)據(jù)：NameNode會檢查文件系統(tǒng)元數(shù)據(jù)，包括命名空間、權限和塊信息等是否存在損壞。如果文件系統(tǒng)損壞，則會嘗試從備份恢復。
連接到ZooKeeper：如果ZooKeeper作為HA環(huán)境下的主節(jié)點，那么NameNode會連接到ZooKeeper，否則它將自己指定為主節(jié)點。
啟動RPC服務：NameNode作為HDFS的核心組件之一，它需要提供RPC服務用于遠程客戶端操作文件系統(tǒng)。因此，在啟動時，NameNode會啟動RPC服務，并綁定到默認端口9000。
初始化內(nèi)存數(shù)據(jù)結(jié)構：NameNode會初始化內(nèi)存數(shù)據(jù)結(jié)構來存儲文件系統(tǒng)的映像，包括命名空間樹、所有數(shù)據(jù)塊的ID列表和塊到Datanode的映射等。
注冊Datanode：在NameNode啟動后，Datanode需要向它注冊以便被識別。NameNode會監(jiān)聽其管理端口50010，接收來自Datanode的注冊請求。
初始化SafeMode：如果在上一次停機時文件系統(tǒng)處于SafeMode模式下，那么在啟動NameNode時它會重現(xiàn)該狀態(tài)。此時，進入安全模式的原因和狀態(tài)信息會被記錄在命名空間映像中。
啟動后臺線程：NameNode還需要啟動許多后臺線程，用于監(jiān)控數(shù)據(jù)節(jié)點的健康狀況、處理客戶端請求以及清理

Namenode在首次啟動時的工作流程

格式化文件系統(tǒng)：為了啟動Hadoop文件系統(tǒng)，我們需要首先進行格式化以生成文件系統(tǒng)元數(shù)據(jù)。這一步會創(chuàng)建默認配置和目錄結(jié)構并生成一個名為 fsimage 的映像文件。
啟動NameNode：一旦文件系統(tǒng)格式被初始化，就可以啟動NameNode進程。NameNode會從fsimage文件中加載文件系統(tǒng)元數(shù)據(jù)到內(nèi)存中，同時它需要等待DataNode注冊并發(fā)送塊報告。
啟動DataNode：一旦DataNode節(jié)點開始運行，它會向NameNode注冊，并將塊報告與NameNode交互。之后，NameNode將比較fsimage中記錄的塊數(shù)是否與block report中的總塊數(shù)相同。
對文件系統(tǒng)進行操作：最后，對文件系統(tǒng)進行操作，例如創(chuàng)建新目錄、上傳文件、刪除文件等更改文件系統(tǒng)狀態(tài)的操作。每次文件系統(tǒng)上發(fā)生更改，都需要將其更新到內(nèi)存中的元數(shù)據(jù)信息中，并在edits日志文件中記錄更改的信息以實現(xiàn)持久性，以保證元數(shù)據(jù)信息的可靠性。因此，以上所述工作流程說明namenode在啟動時做的事情。

Namenode非首次啟動時的工作流程

在非首次啟動時，Namenode的工作流程與首次啟動時類似。然而，由于此時已經(jīng)存在edits日志和fsimage文件，因此有些步驟會有所不同，并且Namenode需要執(zhí)行一些額外的操作來恢復前一次運行期間未完成處理的編輯日志。

啟動NameNode：
- Namdenode讀取fsimage文件并將其加載到內(nèi)存中。
- 然后Namenode讀取上次運行期間未完成的編輯日志（即edits文件）并將其合并到內(nèi)存中的元數(shù)據(jù)樹。
等待DataNode的注冊：一旦Namenode完成第1步，則等待DataNode節(jié)點注冊并發(fā)送塊報告流程開始。
版本和命名空間檢查：接下來，Namenode會進行版本和命名空間檢查以確保文件系統(tǒng)的有效性和完整性。
運行BlockReport：一旦版本檢查成功，Namendoe將運行BlockReport過程，該過程涉及向所有DataNode節(jié)點請求它們管理的block列表，并標記可能失效的block。
對文件系統(tǒng)進行操作：最后，可以對文件系統(tǒng)進行任何更改。每次發(fā)生更改時，隨著內(nèi)存中元數(shù)據(jù)信息的更新，Namenode會記錄更改的信息到edits日志文件中，以實現(xiàn)持久性并保證元數(shù)據(jù)信息的可靠性。

總之，當Namenode在非首次啟動時，它會從fsimage文件中恢復文件系統(tǒng)狀態(tài)，然后將編輯日志與其合并。此后，進行命名空間和版本檢查，接著進行塊報告處理，并等待對文件系統(tǒng)做出更改。

Secondary NameNode

Secondary NameNode是什么

Secondary NameNode是Apache Hadoop分布式計算框架中的一個組件，它的主要作用是協(xié)助NameNode元數(shù)據(jù)操作。

在Hadoop集群中，NameNode是至關重要的組件，它負責管理整個分布式文件系統(tǒng)(HDFS)的命名空間和訪問控制。但是，由于NameNode必須承擔大量任務，例如客戶端讀寫請求、數(shù)據(jù)塊定位以及心跳檢查等，這將導致其負載劇增并影響其性能。

為了解決這個問題，Hadoop引入了Secondary NameNode，在內(nèi)存中定期備份和合并NameNode的元數(shù)據(jù)，并將其寫入本地磁盤中，而不會對NameNode的進程進行任何干擾或負擔。

如果發(fā)生NameNode某些故障，Secondary NameNode可以與本地磁盤中存儲的元數(shù)據(jù)一起，幫助恢復NameNode。雖然它不能完全代替NameNode，但是它提供了一種低成本高效的方式來實現(xiàn)NameNode元數(shù)據(jù)的冗余和快速恢復，從而提高整個集群的可靠性和穩(wěn)定性。

Secondary NameNode工作機制

Secondary NameNode是HDFS（Hadoop分布式文件系統(tǒng)）中的一個組件，主要負責幫助NameNode完成某些管理操作，以提高HDFS的可靠性和效率。

工作機制

Secondary NameNode會定期從NameNode獲取checkpoint數(shù)據(jù)。Checkpoint是NameNode關于文件系統(tǒng)狀態(tài)的一個快照，包括了所有塊的元數(shù)據(jù)信息，例如塊大小、位置等。這些信息存放在fsimage和edits兩個文件中。 fsimage文件包含了當前文件系統(tǒng)的元數(shù)據(jù)信息，而edits文件則包含了自上一個checkpoint之后的命名空間操作（例如：創(chuàng)建文件、刪除文件等）。
Secondary NameNode將這些文件合并成一個新的fsimage文件，并將edits日志清空。這個新的fsimage文件被稱為“checkpoint”。
Secondary NameNode通過HTTP將新生成的checkpoint發(fā)送給NameNode。
當NameNode接收到這個checkpoint時，它會加載這個新的fsimage文件，然后對其中的edits日志進行重放，以恢復從上次checkpoint以來所有的修改。這樣，NameNode的內(nèi)部數(shù)據(jù)結(jié)構就能夠與Secondary NameNode保持同步。

通過這種機制，Secondary NameNode維護了一個較小的fsimage和edits日志來加速HDFS集群的恢復速度和故障恢復能力，在NameNode崩潰時提供備份數(shù)據(jù)，同時減少NameNode服務器的壓力，在大規(guī)模HDFS集群中發(fā)揮著重要作用。

Secondary NameNode 不能恢復 NameNode 的全部數(shù)據(jù)，那如何保證NameNode 數(shù)據(jù)存儲安全

NameNode 數(shù)據(jù)存儲的安全主要依賴于兩個方面：備份和故障轉(zhuǎn)移。

一方面，在 Hadoop 集群中，通常會設置多個 NameNode 實例以提高數(shù)據(jù)存儲的可靠性和可用性。這些不同的 NameNode 可能是通過“活動”和“備用”角色輪番交替來發(fā)揮作用。在適當配置了 ZooKeeper 或者其他類似的工具時，如果某一個 NameNode 發(fā)生故障或宕機，則可以自動地將所有的讀寫請求轉(zhuǎn)移到另一個健康的 NameNode 上，從而保證整個集群的正常運行。同時，對于數(shù)據(jù)存儲本身也可以進行備份操作。例如，通過使用 HDFS 的快照（Snapshot）功能，可以及時地創(chuàng)建和管理文件系統(tǒng)狀態(tài)的備份。這些備份可以存儲在不同的位置或者不同的媒介上，以實現(xiàn)更加穩(wěn)定的數(shù)據(jù)存儲。

另一方面，HDFS 還支持異地備份，通過在遠程地帶備份數(shù)據(jù)，即使本地數(shù)據(jù)丟失，也可以恢復數(shù)據(jù)。如果有公有云或私有云的存儲服務商合作，你也可以把HDFS的數(shù)據(jù)異地備份到公有云或私有云的對象存儲上，保證本地故障的數(shù)據(jù)恢復速度更加迅速和更長遠地存儲的安全性。文章來源地址http://www.zghlxwxcb.cn/news/detail-507919.html

到了這里，關于HDFS組織架構及相關介紹的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

[架構之路-243]：目標系統(tǒng) - 縱向分層 - 架構是表面輪廓、內(nèi)部骨架、未來藍圖，企業(yè)組織架構、信息系統(tǒng)架構、軟件架構、應用程序就架構
目錄一、什么是架構 1.1 架構是表面輪廓 1.2 架構是內(nèi)部骨架 1.3 架構是藍圖，是愿景 1.4 架構是數(shù)據(jù)流、控制流、管理流、同步流 1.5 數(shù)據(jù)、控制、同步、管理的比較二、架構的層級 2.1 企業(yè)組織架構 2.2 企業(yè)系統(tǒng)架構 2.2 信息系統(tǒng)架構 2.3 軟件架構 2.4 應用程序的架構三、軟
2024年02月08日
瀏覽(29)
怎樣優(yōu)雅地增刪查改（五）：按組織架構查詢
之前我們實現(xiàn)了Employee，Alarm管理模塊以及通用查詢應用層。 Employee的集合查詢業(yè)務，是通過重寫CreateFilteredQueryAsync方法，來實現(xiàn)按組織架構查詢的過濾條件。我們將這段邏輯代碼提取到通用查詢應用層中，便可實現(xiàn)在任何業(yè)務的按組織架構查詢。查詢依據(jù) 在Abp中，組織架構
2024年02月16日
瀏覽(33)
如何在Microsoft Word中制作組織架構圖
如果要說明公司或組織中的報告關系，可以創(chuàng)建一個使用組織結(jié)構圖布局的 SmartArt?圖形，如組織結(jié)構圖。注意：繪制組織結(jié)構圖的另一種方法是使用?Microsoft?繪圖應用程序 Visio。使用 SmartArt?圖形在?Excel、Outlook、PowerPoint 或?Word?中創(chuàng)建組織結(jié)構圖，以顯示組織中的報告關
2024年02月12日
瀏覽(16)
軟件測試基礎（五）之了解測試團隊的組織架構
今天來了解一下軟件測試團隊的組織架構模式到底是什么樣子。 ??一個公司軟件測試的組織架構，可能會決定你未來的成長空間，同時也決定了我們的工作模式到底是什么樣子。 ??現(xiàn)在測試行業(yè)內(nèi)通常測試團隊的組織架構主要分成兩種，一種叫做金字塔式管理模式，一
2024年02月07日
瀏覽(28)
阿里組織架構迎來巨變！拆分為六大業(yè)務，或可分別獨立上市
“1+6+N”組織調(diào)整是阿里巴巴“24年來最重要的一次組織變革”，六大業(yè)務集團及業(yè)務公司可以獨立融資或獨立上市，意味著阿里的整體估值將得到大幅提升。馬云回國、阿里巴巴宣布啟動“1+6+N”組織調(diào)整、具備條件的業(yè)務集團和公司將獨立上市……一系列有關阿里的消息在
2024年02月06日
瀏覽(29)
釘釘企業(yè)內(nèi)部機器人開發(fā)——同步組織架構人員信息到數(shù)據(jù)庫
開發(fā)釘釘機器人的過程中，我們不僅需要直接把組織架構用戶信息導入數(shù)據(jù)庫，還要不定時的進行同步，因為釘釘里面的人員總是在變動，部門也是不斷在調(diào)整。下面是使用遞歸的方式，調(diào)用釘釘接口，同步部門和人員信息，沒有的創(chuàng)建，多余的刪除
2024年02月11日
瀏覽(19)
PMP組織架構分類（強矩陣弱矩陣等）及項目經(jīng)理權力與職能經(jīng)理對比，一看必懂
PMP組織架構中一般分類：職能型，項目型，矩陣型（包括弱矩陣型、強矩陣型、平衡型矩陣）。先重點來說說弱/強矩陣型: 矩陣型劃分強弱矩陣（事務急迫與難度）：弱矩陣：一般為較簡單或不緊急的項目強矩陣：一般為較復雜或較緊急的項目平衡矩陣：各方面都相對
2024年02月06日
瀏覽(21)
Go-Ldap-Admin | openLDAP 同步釘釘、企業(yè)微信、飛書組織架構實踐和部分小坑
目錄一、Docker-compose快速拉起demo測試環(huán)境二、原生部署流程安裝MySQL：5.7數(shù)據(jù)庫安裝openLDAP 修改域名，新增con.ldif 創(chuàng)建一個組織安裝OpenResty 下載后端下載前端部署后端部署前端三、管理動態(tài)字段釘釘企業(yè)微信飛書四、部分報錯 Go-Ldap-Admin官網(wǎng)：Go-Ldap-Admin 本文用于記
2024年02月07日
瀏覽(31)
【數(shù)據(jù)庫】樹形數(shù)據(jù)組織架構下的封鎖并發(fā)控制，B樹索引并發(fā)訪問控制，樹協(xié)議原理及案例分析
? 專欄內(nèi)容：手寫數(shù)據(jù)庫toadb 本專欄主要介紹如何從零開發(fā)，開發(fā)的步驟，以及開發(fā)過程中的涉及的原理，遇到的問題等，讓大家能跟上并且可以一起開發(fā)，讓每個需要的人成為參與者。本專欄會定期更新，對應的代碼也會定期更新，每個階段的代碼會打上tag，方便階段學
2024年02月04日
瀏覽(27)
postgresql 使用之存儲架構觸摸真實數(shù)據(jù)的存儲結(jié)構以及組織形式，存入數(shù)據(jù)庫的數(shù)據(jù)原來在這里
? 專欄內(nèi)容： postgresql內(nèi)核源碼分析手寫數(shù)據(jù)庫toadb 并發(fā)編程個人主頁：我的主頁座右銘：天行健，君子以自強不息；地勢坤，君子以厚德載物. postgresql 數(shù)據(jù)庫服務運行時，數(shù)據(jù)在磁盤上是如何存儲的呢？這就涉及到了存儲架構。在文件系統(tǒng)中，我們可以看到以目錄和文
2024年02月14日
瀏覽(19)