作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)
1.簡(jiǎn)介
Apache Hadoop 是一款開(kāi)源的、分布式文件系統(tǒng)和計(jì)算平臺(tái)。它由 Apache 基金會(huì)開(kāi)發(fā),并于 2011 年成為 Apache 頂級(jí)項(xiàng)目之一。Hadoop 的主要特性包括:
-
分布式存儲(chǔ): Hadoop 允許將數(shù)據(jù)存儲(chǔ)在多個(gè)服務(wù)器上,在同一個(gè)集群中,并提供高容錯(cuò)性和可靠性。
-
分布式處理: Hadoop 提供了 MapReduce 編程模型,用于并行地處理海量的數(shù)據(jù)集。
-
可擴(kuò)展性: Hadoop 可以通過(guò)添加節(jié)點(diǎn)來(lái)擴(kuò)充集群,而不影響其運(yùn)行。
-
HDFS(Hadoop Distributed File System): Hadoop 中的 HDFS 是一種分布式的文件系統(tǒng),用于存儲(chǔ)大量的數(shù)據(jù)。
-
YARN(Yet Another Resource Negotiator): YARN 是 Hadoop 2.0 中引入的資源調(diào)度框架。
本系列教程共分為5個(gè)小節(jié),分別對(duì)應(yīng) Hadoop 集群的安裝、配置、管理和使用等五大功能模塊。每節(jié)的內(nèi)容將圍繞這幾個(gè)方面進(jìn)行詳細(xì)講解。
1. 背景介紹
1.1 Hadoop 是什么?
Apache Hadoop 是一個(gè)開(kāi)源的分布式文件系統(tǒng)和計(jì)算平臺(tái),它支持對(duì)超大型數(shù)據(jù)集的存儲(chǔ)、分布式處理、和超算資源的管理。其基于以下優(yōu)點(diǎn)而聲名大噪:
-
可靠性: Hadoop 通過(guò)冗余機(jī)制保證數(shù)據(jù)安全和可用性。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-718650.html
擴(kuò)展性: Hadoop 支持動(dòng)態(tài)添加或者刪除節(jié)點(diǎn)文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-718650.html
到了這里,關(guān)于Hadoop生態(tài)圈實(shí)戰(zhàn)系列:第一篇 Hadoop 集群安裝及使用詳解的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!