国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<meter id="fz9ev"></meter>

<cite id="fz9ev"></cite>

<menu id="fz9ev"><var id="fz9ev"><dfn id="fz9ev"></dfn></var></menu>

【運維】hadoop 集群安裝（三）hdfs、yarn集群配置、nodemanager健康管理講解

2年前作者：roman_日積跬步-終至千里分類：Toy博客閱讀(18)違法舉報

這篇具有很好參考價值的文章主要介紹了【運維】hadoop 集群安裝（三）hdfs、yarn集群配置、nodemanager健康管理講解。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

上篇簡單說明了多節(jié)點的hadoop節(jié)點怎么安裝，但是沒有細致的分析hadoop相關配置，具體怎么根據(jù)環(huán)境進行配置，接下來我們對這些配置進行講解

一. 配置說明

1. hadoop各進程環(huán)境配置

Daemon	Environment Variable
NameNode	HDFS_NAMENODE_OPTS
DataNode	HDFS_DATANODE_OPTS
Secondary NameNode	HDFS_SECONDARYNAMENODE_OPTS
ResourceManager	YARN_RESOURCEMANAGER_OPTS
NodeManager	YARN_NODEMANAGER_OPTS
WebAppProxy	YARN_PROXYSERVER_OPTS
Job History Server	MAPRED_HISTORYSERVER_OPTS

舉個例子：

配置Namenode使用parallelGC和4GB的Java堆，應該在hadoop-env.sh中添加以下語句:

export HDFS_NAMENODE_OPTS="-XX:+UseParallelGC -Xmx4g"

?
其他有用的配置

HADOOP_PID_DIR : 各進程pid存儲目錄

HADOOP_LOG_DIR ：各進程日志目錄。日志文件會自動創(chuàng)建

HADOOP_HEAPSIZE_MAX：hadoop使用的最大java堆內(nèi)存。默認的，hadoop讓JVM決定使用多少。這個值可以被每個進程所設置的值所覆蓋。例如，設置HADOOP_HEAPSIZE_MAX=1g和hadoop_namende_opts ="-Xmx5g"將為NameNode配置5GB的堆。

注意：

In most cases, you should specify the HADOOP_PID_DIR and HADOOP_LOG_DIR directories such that they can only be written to by the users that are going to run the hadoop daemons. Otherwise there is the potential for a symlink attack.

對于大多數(shù)情況，你需要設置HADOOP_PID_DIR和HADOOP_LOG_DIR，因為他們只允許啟動用戶去操作，這就避免了潛在的symlink attack。

?
ing
在系統(tǒng)級的shell環(huán)境中配置HADOOP_HOME也是傳統(tǒng)的做法。例如，/etc/profile.d中的一個簡單腳本:

  HADOOP_HOME=/path/to/hadoop
  export HADOOP_HOME

?

2. hadoop各進程配置

2.1. etc/hadoop/core-site.xml

參數(shù)	值	備注
fs.defaultFS	NameNode URI：hdfs://host:port/	用于指定Hadoop客戶端應用程序連接和操作HDFS時使用的默認文件系統(tǒng)的URI或URL
io.file.buffer.size	131072	讀寫 SequenceFiles 緩存大小

?

fs.defaultFS
例如，如果將fs.defaultFS配置為hdfs://namenode:9000，則Hadoop客戶端應用程序?qū)⒛J連接到名為namenode的HDFS名稱節(jié)點，并使用9000端口進行通信。
它簡化了應用程序代碼、支持多集群環(huán)境和方便切換文件系統(tǒng)等功能。

?

2.2. etc/hadoop/hdfs-site.xml

2.2.1. NameNode

參數(shù)	值	備注
dfs.namenode.name.dir	xxx/namenode,xxx/namenode	用于保存Namenode的namespace和事務日志的路徑
dfs.blocksize	134217728	對于大型文件系統(tǒng),使用256MB作為一個塊的大小. 這里是128MB。
dfs.namenode.handler.count	4096	更多的NameNode服務器線程來處理來自大量 DataNode 的 RPC請求。
dfs.hosts.exclude	xxx/decommission	不允許加入的datanode，動態(tài)刪除datanode節(jié)點時使用
dfs.webhdfs.enabled	true	用于啟用或禁用WebHDFS服務。

?

2.2.2. datanode

參數(shù)	值	備注
dfs.datanode.data.dir	xxx/data,xxx/data	用于保存用戶上傳的數(shù)據(jù)目錄
dfs.datanode.data.dir.perm	750	定義了dfs.datanode.data.dir 數(shù)據(jù)目錄的權限
dfs.block.local-path-access.user	user1、user2	哪些用戶可以直接訪問數(shù)據(jù)節(jié)點的本地塊文件路徑。Hadoop可以允許附近數(shù)據(jù)節(jié)點的本地塊文件通過本地文件系統(tǒng)直接進行讀取，而無需通過網(wǎng)絡傳輸。這可以提高數(shù)據(jù)訪問的性能。則默認情況下，所有用戶都可以直接訪問數(shù)據(jù)節(jié)點的本地塊文件路徑。

?

2.3. etc/hadoop/yarn-site.xml

2.3.1. ResourceManager and NodeManager

參數(shù)	值	備注
yarn.acl.enable	true / false	true，則啟用訪問控制列表（ACL）功能，意味著訪問控制將應用于YARN操作。false，則禁用ACL功能，允許所有用戶執(zhí)行YARN操作。
yarn.admin.acl	Admin ACL	未設置yarn.admin.acl，則默認情況下沒有用戶或用戶組被授予管理員權限。配置為一個或多個用戶名或用戶組，那么這些用戶或用戶組將被授予管理員權限。
yarn.log-aggregation-enable	true/false	啟用或禁用日志聚合功能。true:將應用程序的日志從各個節(jié)點收集到中央位置。啟用日志聚合功能可以方便地管理和檢索應用程序的日志，特別是在集群規(guī)模較大、應用程序數(shù)量眾多或需要定位故障時。聚合的日志可以存儲在HDFS中，供后續(xù)的日志分析、監(jiān)控或?qū)徲嬍褂谩?/td>

?

2.3.2. ResourceManager

參數(shù)	值	備注
yarn.resourcemanager.address	默認值：0.0.0.0:8032	ResourceManager 對客戶端暴露的地址?？蛻舳送ㄟ^該地址向RM提交應用程序，殺死應用程序等。
yarn.resourcemanager.scheduler.address	默認值：${yarn.resourcemanager.hostname}:8030	ResourceManager 對ApplicationMaster暴露的訪問地址。ApplicationMaster通過該地址向RM申請資源、釋放資源等。
yarn.resourcemanager.resource-tracker.address	默認值：${yarn.resourcemanager.hostname}:8031	ResourceManager 對NodeManager暴露的地址.。NodeManager通過該地址向RM匯報心跳，領取任務等。
yarn.resourcemanager.admin.address	默認值：${yarn.resourcemanager.hostname}:8033	ResourceManager 對管理員暴露的訪問地址。管理員通過該地址向RM發(fā)送管理命令等。
yarn.resourcemanager.webapp.address	默認值：${yarn.resourcemanager.hostname}:8088	ResourceManager對外web ui地址。用戶可通過該地址在瀏覽器中查看集群各類信息。
yarn.resourcemanager.scheduler.class	org.apache.hadoop.yarn.server. resourcemanager.scheduler.capacity.CapacityScheduler	啟用的資源調(diào)度器主類。目前可用的有FIFO、Capacity Scheduler和Fair Scheduler。
yarn.scheduler.minimum-allocation-mb yarn.scheduler.maximum-allocation-mb	默認值：1024/8192	單個可申請的最小/最大內(nèi)存資源量。比如設置為1024和3072，則運行MapRedce作業(yè)時，每個Task最少可申請1024MB內(nèi)存，最多可申請3072MB內(nèi)存。
yarn.resourcemanager.nodes.include-path yarn.resourcemanager.nodes.exclude-path	默認值：“”	NodeManager黑白名單。如果發(fā)現(xiàn)若干個NodeManager存在問題，比如故障率很高，任務運行失敗率高，則可以將之加入黑名單中。
yarn.resourcemanager.hostname	hostname	可以設置所有resourcemanager*address相關配置，這些配置使用默認端口
yarn.scheduler.maximum-allocation-vcores yarn.scheduler.minimum-allocation-vcores	8/1	啟動container最大和最小的核心數(shù)

?

2.3.3. NodeManager

參數(shù)	值	備注
yarn.nodemanager.resource.memory-mb	nodemanager進程內(nèi)存，通過free -h 查看機器具體內(nèi)存設定	NodeManager總的可用物理內(nèi)存。注意，該參數(shù)是不可修改的，一旦設置，整個運行過程中不可動態(tài)修改。另外，該參數(shù)的默認值是8192MB，即使你的機器內(nèi)存不夠8192MB，YARN也會按照這些內(nèi)存來使用
yarn.nodemanager.vmem-pmem-ratio	2.1	任務每使用1MB物理內(nèi)存，最多可使用虛擬內(nèi)存量，默認是2.1。
yarn.nodemanager.local-dirs	默認值：${hadoop.tmp.dir}/nm-local-dir	中間結(jié)果存放位置。注意，這個參數(shù)通常會配置多個目錄，用來分攤磁盤IO負載。
yarn.nodemanager.log-dirs	/logs	日志目錄。多個目錄也可以分攤IO負載
yarn.nodemanager.log.retain-seconds	10800（3小時）	NodeManager上日志最多存放時間（不啟用日志聚集功能時有效）
yarn.nodemanager.remote-app-log-dir	/log	當任務完成時會將日志存在hdfs上。需要設置權限，且只有當日志聚合開啟時可用
yarn.nodemanager.remote-app-log-dir-suffix		日志目錄的后綴
yarn.nodemanager.aux-services	mapreduce_shuffle,spark_shuffle	NodeManager上運行的附屬服務。比如配置成mapreduce_shuffle，才可運行MapReduce程序
yarn.nodemanager.aux-services.spark_shuffle.class	org.apache.spark. network.yarn.YarnShuffleService	spark shuffle類，需指定才能運行spark任務
yarn.nodemanager.env-whitelist	默認值：JAVA_HOME, HADOOP_COMMON_HOME, HADOOP_HDFS_HOME, HADOOP_CONF_DIR, HADOOP_YARN_HOME	用于指定允許傳遞給應用程序容器的環(huán)境變量白名單。白名單中列出的環(huán)境變量將會被允許傳遞給應用程序容器，而不在白名單中的環(huán)境變量將被過濾掉。配置后，需要在YARN集群中重新啟動NodeManager，以使配置更改生效。

2.3.4. History Server

參數(shù)	值	備注
yarn.log-aggregation.retain-seconds	2592000(30天)	日志聚合后保留的時間長度，以秒為單位
yarn.log-aggregation.retain-check-interval-seconds	3600（1小時）	檢查聚合日志保留時間間隔的時間間隔

2.4. etc/hadoop/mapred-site.xml

2.4.1. MapReduce Applications

參數(shù)	值	備注
mapreduce.framework.name	默認值：yarn	使用的MapReduce框架的名稱或標識。 - 默認情況下，值設置為yarn，表示使用YARN作為MapReduce的框架。當將其設置為yarn時，MapReduce任務將由YARN ResourceManager進行管理，并在YARN集群中的NodeManager上執(zhí)行。 - 當將其設置為local時，MapReduce任務將在單個本地節(jié)點上以本地模式運行，不涉及集群資源管理。 - 當將其設置為classic時，MapReduce任務將在Hadoop 1.x中使用舊的經(jīng)典模式。
mapreduce.map.memory.mb	默認：1GB	指定每個Map任務可用的內(nèi)存量。內(nèi)存設置旨在控制每個Map任務可以使用的物理內(nèi)存量，包括執(zhí)行過程中的數(shù)據(jù)緩存、堆空間等。
mapreduce.map.java.opts	-Xmx2048m	指定每個Map任務的Java虛擬機（JVM）選項
mapreduce.task.io.sort.mb	512	Map任務的中間排序階段使用的內(nèi)存量。在Map任務的中間排序階段，數(shù)據(jù)將被排序并寫入磁盤以供Reduce任務使用。默認情況下，每個Map任務被分配100MB的內(nèi)存用于中間數(shù)據(jù)的排序。內(nèi)存設置旨在控制排序操作期間數(shù)據(jù)可以保留的內(nèi)存量。較大的值可以提高排序性能，但可能占用更多的內(nèi)存資源。
mapreduce.task.io.sort.factor	100	指定在Map任務的排序階段執(zhí)行歸并操作時同時合并的文件數(shù) 在Map任務的排序階段，中間數(shù)據(jù)會被分為多個數(shù)據(jù)塊，每個數(shù)據(jù)塊會被寫入磁盤的臨時文件。而在歸并操作中，這些臨時文件會被合并以生成最終的排序結(jié)果。較高的值可以加快排序操作的速度，但會使用更多的內(nèi)存資源。
mapreduce.reduce.shuffle.parallelcopies	50	指定Reduce任務的shuffle階段并行拷貝（并行復制）數(shù)據(jù)的數(shù)量。在Map階段結(jié)束后，Map任務會將中間結(jié)果數(shù)據(jù)拷貝到Reduce任務進行進一步處理。在這個過程中，Reduce任務從各個Map任務并行復制數(shù)據(jù)以提高整體性能。增加并行拷貝的數(shù)量可以加快數(shù)據(jù)傳輸速度，提高整體性能，但會占用更多的網(wǎng)絡帶寬和系統(tǒng)資源。

2.4.2. MapReduce JobHistory Server

參數(shù)	值	備注
mapreduce.jobhistory.address	{historynode}:10020	historynode server 地址
mapreduce.jobhistory.webapp.address	{historynode}:19888	Historynode server web UI
mapreduce.jobhistory.intermediate-done-dir	/mr-history/tmp	這個配置屬性主要用于管理作業(yè)歷史事件記錄的中間完成文件的存儲位置。此值不會直接影響作業(yè)執(zhí)行或性能。
mapreduce.jobhistory.done-dir	/mr-history/done	值不會直接影響作業(yè)執(zhí)行或性能。這個配置屬性主要用于管理作業(yè)歷史事件記錄文件的存儲位置。

?

3. Monitoring Health of NodeManagers

Hadoop provides a mechanism by which administrators can configure the NodeManager to run an administrator supplied script periodically to determine if a node is healthy or not.

管理員可以提供一個腳本，周期性的檢查nodemanager是否健康。
?

基本邏輯：

Administrators can determine if the node is in a healthy state by performing any checks of their choice in the script. If the script detects the node to be in an unhealthy state, it must print a line to standard output beginning with the string ERROR. The NodeManager spawns the script periodically and checks its output. If the script’s output contains the string ERROR, as described above, the node’s status is reported as unhealthy and the node is black-listed by the ResourceManager. No further tasks will be assigned to this node. However, the NodeManager continues to run the script, so that if the node becomes healthy again, it will be removed from the blacklisted nodes on the ResourceManager automatically. The node’s health along with the output of the script, if it is unhealthy, is available to the administrator in the ResourceManager web interface. The time since the node was healthy is also displayed on the web interface.

管理員通過腳本可以決定節(jié)點是否處于健康狀態(tài)。如果腳本檢測到node處于不健康狀態(tài)時，它需要打印出ERROR為首的日志。
nodemanager周期性的產(chǎn)生腳本，并檢查其輸出。如果腳本輸出ERROR，則node狀態(tài)為不健康狀態(tài)，resourcemanager將其加入黑名單，之后將不會有任務分配到這個節(jié)點。但nodemanager會繼續(xù)運行此腳本，以便當其再次健康時，resourcemanager會將其移出黑名單。
管理員可以在yarn的web觀察到node的健康狀態(tài)。

?

參數(shù)	值	備注
yarn.nodemanager.health-checker.script.path	/path/to/health-check-script.sh	腳本路徑
yarn.nodemanager.health-checker.script.opts	-option1 value1 -option2 value2	腳本接收的參數(shù)
yarn.nodemanager.health-checker.interval-ms	ms	多長時間執(zhí)行一次腳本
yarn.nodemanager.health-checker.script.timeout-ms	ms	腳本執(zhí)行超時時間

?

The health checker script is not supposed to give ERROR if only some of the local disks become bad. NodeManager has the ability to periodically check the health of the local disks (specifically checks nodemanager-local-dirs and nodemanager-log-dirs) and after reaching the threshold of number of bad directories based on the value set for the config property yarn.nodemanager.disk-health-checker.min-healthy-disks, the whole node is marked unhealthy and this info is sent to resource manager also. The boot disk is either raided or a failure in the boot disk is identified by the health checker script.

當本地磁盤損壞時，不支持health checker輸出ERROR，即不能判定為node壞掉，nodemanager有能力周期性的檢查本地磁盤的好壞，具體的，是nodemanager-local-dirs、nodemanager-log-dirs這兩個目錄。當?shù)竭_yarn.nodemanager.disk-health-checker.min-healthy-disks 的上限時，整個node將被標記為不健康狀態(tài)，并將信息發(fā)送給resourcemanager。

當磁盤被突襲或者啟動失敗時，health checker script將會識別。

?
?

二. 配置示例

1. core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://namenodeip:9000</value>
    </property>

    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>


</configuration>

?

2. hdfs-site.xml

<configuration>
    <!-- ===========namenode===========   -->

    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/opt/data/hdfs/namenode,/opt/data02/hdfs/namenode</value>
        <description>If this is a comma-delimited list of directories then the name table is replicated in all of the
            directories, for redundancy.
            Path on the local filesystem where the NameNode stores the namespace and transactions logs persistently.
            用于保存Namenode的namespace和事務日志的路徑
        </description>

    </property>

    <property>
        <name>dfs.blocksize</name>
        <value>134217728</value>
        <description>HDFS blocksize of 256MB for large file-systems.
            對于大型文件系統(tǒng),使用256MB作為一個塊的大小. 這里是128MB。
        </description>
    </property>

    <property>
        <name>dfs.namenode.handler.count</name>
        <value>4096</value>
        <description>
            More NameNode server threads to handle RPCs from large number of DataNodes.
            更多 NameNode 服務器線程來處理來自大量 DataNode 的 RPC請求。
        </description>
    </property>

    <property>
        <name>dfs.hosts.exclude</name>
        <value>/home/${user.name}/software/hadoop/etc/hadoop/decommission</value>
        <description>If necessary, use these files to control the list of allowable datanodes.
            不允許加入的datanode
        </description>
    </property>

    <!-- ===========namenode===========   -->


    <!-- ===========datanode===========   -->
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/data/hdfs/data,/opt/data02/hdfs/data</value>
        <description>If necessary, use these files to control the list of allowable datanodes.
            不允許加入的datanode
        </description>
    </property>


    <!-- ===========datanode===========   -->


    <property>
        <name>dfs.datanode.data.dir.perm</name>
        <value>750</value>
    </property>

    <property>
        <name>dfs.block.local-path-access.user</name>
        <value>taiyi,hbase</value>
    </property>

    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>

?

3. yarn-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>


<configuration>

    <!-- ResourceManager and NodeManager    -->
    <property>
        <name>yarn.acl.enable</name>
        <value>false</value>
        <description>
            Enable ACLs? Defaults to false.
        </description>
    </property>

    <property>
        <name>yarn.admin.acl</name>
        <value>yarn</value>
        <description>
            ACL to set admins on the cluster.
            ACLs are of for comma-separated-usersspacecomma-separated-groups.
            Defaults to special value of * which means anyone.
            Special value of just space means no one has access.
            設置集群的acl權限 ing
        </description>
    </property>


    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
        <description>
            Configuration to enable or disable log aggregation
            日志聚合
        </description>
    </property>


    <!-- ResourceManager and NodeManager    -->


    <!--  Configurations for ResourceManager:   -->
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>resourcemanagerIp:8832</value>
        <description>
            ResourceManager host:port for clients to submit jobs.
            host:port If set, overrides the hostname set in yarn.resourcemanager.hostname.
            用于客戶端提交任務
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>resourcemanagerIp:8830</value>
        <description>
            ResourceManager host:port for ApplicationMasters to talk to Scheduler to obtain resources.
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>resourcemanagerIp:8831</value>
        <description>
            ResourceManager host:port for NodeManagers.
            host:port If set, overrides the hostname set in yarn.resourcemanager.hostname.
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>resourcemanagerIp:8833</value>
        <description>
            ResourceManager host:port for administrative commands.
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>resourcemanagerIp:8888</value>
        <description>
            ResourceManager web-ui host:port.
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>resourcemanagerHostname</value>
        <description>
            ResourceManager host.
            host Single hostname that can be set in place of setting all yarn.
            resourcemanager*address resources.
            Results in default ports for ResourceManager components.
        </description>
    </property>


    <property>
        <name>yarn.resourcemanager.scheduler.class</name>
        <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
        <description>
            ResourceManager Scheduler class.
            CapacityScheduler (recommended), FairScheduler (also recommended), or FifoScheduler.
            Use a fully qualified class name, e.g.,
            org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler.
        </description>
    </property>


    <property>
        <name>yarn.scheduler.minimum-allocation-mb</name>
        <value>2048</value>
        <description>
            Minimum limit of memory to allocate to each container request at the Resource Manager.
            In MBs
            每個container最小啟動資源
        </description>
    </property>
    <property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>8192</value>
        <description>
            Maximum limit of memory to allocate to each container request at the Resource Manager.
        </description>
    </property>
    <property>
        <name>yarn.scheduler.maximum-allocation-vcores</name>
        <value>8</value>
    </property>
    <property>
        <name>yarn.scheduler.minimum-allocation-vcores</name>
        <value>1</value>
    </property>


    <!--  Configurations for ResourceManager:   -->


    <!--  Configurations for NodeManager:  -->

    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>61440</value>
        <description>
            Resource i.e. available physical memory, in MB, for given NodeManager
            Defines total available resources on the NodeManager to be made available to running containers
        </description>
    </property>


    <property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>4</value>
        <description>
            Maximum ratio by which virtual memory usage of tasks may exceed physical memory
            The virtual memory usage of each task may exceed its physical memory limit by this ratio.
            The total amount of virtual memory used by tasks on the NodeManager may exceed its physical memory usage by
            this ratio.
            任務的虛擬內(nèi)存使用可能超過物理內(nèi)存的最大比例
        </description>
    </property>


    <property>
        <name>yarn.nodemanager.local-dirs</name>
        <value>/data/yarn/nm-local-dir,/data02/yarn/nm-local-dir</value>
    </property>


    <property>
        <name>yarn.nodemanager.log-dirs</name>
        <value>/home/taiyi/hadoop/yarn/userlogs</value>
    </property>

    <property>
        <name>yarn.nodemanager.log.retain-seconds</name>
        <value>10800</value>
        <description>
            Default time (in seconds) to retain log files on the NodeManager
            Only applicable if log-aggregation is disabled.
        </description>
    </property>


    <property>
        <name>yarn.nodemanager.remote-app-log-dir</name>
        <value>/home/taiyi/hadoop/yarn/containerlogs</value>
        <description>
            HDFS directory where the application logs are moved on application completion.
            Need to set appropriate permissions. Only applicable if log-aggregation is enabled.
        </description>
    </property>

    <property>
        <name>yarn.nodemanager.remote-app-log-dir-suffix</name>
        <value>logs</value>
        <description>
            Suffix appended to the remote log dir.
            Logs will be aggregated to ${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}
            Only applicable if log-aggregation is enabled.
        </description>
    </property>


    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle,spark_shuffle</value>
        <description>
            Shuffle service that needs to be set for Map Reduce applications.
        </description>
    </property>

    <property>
        <name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
        <value>org.apache.spark.network.yarn.YarnShuffleService</value>
    </property>


    <!--  Configurations for NodeManager:  -->


    <!--Configurations for History Server (Needs to be moved elsewhere): -->
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>2592000</value>
        <description>
            How long to keep aggregation logs before deleting them. -1 disables.
            Be careful, set this too small and you will spam the name node.
        </description>
    </property>


    <property>
        <name>yarn.log-aggregation.retain-check-interval-seconds</name>
        <value>3600</value>
        <description>
            Time between checks for aggregated log retention.
            If set to 0 or a negative value then the value is computed
            as one-tenth of the aggregated log retention time.
            Be careful, set this too small and you will spam the name node.
        </description>
    </property>


</configuration>

?

4. mapred-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>

    <!-- Configurations for MapReduce Applications:   -->

    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        <description>
            Execution framework set to Hadoop YARN.
        </description>
    </property>


    <property>
        <name>mapreduce.map.memory.mb</name>
        <value>2048</value>
        <description>
            Larger resource limit for maps.
        </description>
    </property>


    <property>
        <name>mapreduce.map.java.opts</name>
        <value>-Xmx2048m</value>
        <description>
            Larger heap-size for child jvms of maps.
        </description>
    </property>


    <property>
        <name>mapreduce.task.io.sort.mb</name>
        <value>512</value>
        <description>
            Higher memory-limit while sorting data for efficiency.
        </description>
    </property>


    <property>
        <name>mapreduce.task.io.sort.factor</name>
        <value>100</value>
        <description>More streams merged at once while sorting files.
        </description>
    </property>


    <property>
        <name>mapreduce.reduce.shuffle.parallelcopies</name>
        <value>50</value>
        <description>Higher number of parallel copies run
            by reduces to fetch outputs from very large number of maps.
        </description>
    </property>

    <!-- Configurations for MapReduce Applications:   -->

    <!--Configurations for MapReduce JobHistory Server:-->
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>joghistorynodeIp:10020</value>
    </property>


    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>joghistorynodeIp:19888</value>
    </property>


<!--    <property>-->
<!--        <name>mapreduce.jobhistory.intermediate-done-dir</name>-->
<!--        <value>/home/taiyi/yarn/mrhistory/tmp</value>-->
<!--        <description>-->
<!--            Directory where history files are written by MapReduce jobs-->
<!--        </description>-->
<!--    </property>-->


<!--    <property>-->
<!--        <name>mapreduce.jobhistory.done-dir</name>-->
<!--        <value>/home/taiyi/yarn/mrhistory/done</value>-->
<!--        <description>-->
<!--            Directory where history files are managed by the MR JobHistory Server.-->
<!--        </description>-->
<!--    </property>-->

    <!--Configurations for MapReduce JobHistory Server:-->


        <!--  用于執(zhí)行任務時尋找hadoop環(huán)境變量  -->
    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
    <property>
        <name>mapreduce.map.env</name>
        <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
    <property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
</configuration>

參考：
https://hadoop.apache.org/docs/r3.0.3/hadoop-project-dist/hadoop-common/ClusterSetup.html#Monitoring_Health_of_NodeManagers
https://www.jianshu.com/p/01b51bd1c77a

https://blog.csdn.net/oaimm/article/details/25298691文章來源地址http://www.zghlxwxcb.cn/news/detail-692602.html

到了這里，關于【運維】hadoop 集群安裝（三）hdfs、yarn集群配置、nodemanager健康管理講解的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

頭歌Hadoop 開發(fā)環(huán)境搭建及HDFS初體驗（第2關：配置開發(fā)環(huán)境 - Hadoop安裝與偽分布式集群搭建）
注： 1 頭歌《Hadoop 開發(fā)環(huán)境搭建及HDFS初體驗》三關在一個實驗環(huán)境下，需要三關從前往后按順序評測，跳關或者實驗環(huán)境結(jié)束后重新打開不能單獨評測通過 2 復制粘貼請用右鍵粘貼，CTRL+C/V不管用哦~ 第1關：配置開發(fā)環(huán)境 - JavaJDK的配置：解壓：配置環(huán)境變量：細節(jié)： vi
2024年02月08日
瀏覽(352)
【hadoop運維】running beyond physical memory limits：正確配置yarn中的mapreduce內(nèi)存
在hadoop3.0.3集群上執(zhí)行hive3.1.2的任務，任務提交時報如下錯誤： Application application_1409135750325_48141 failed 2 times due to AM Container for appattempt_1409135750325_48141_000002 exited with exitCode: 143 due to: Container [pid=4733,containerID=container_1409135750325_48141_02_000001] is running beyond physical memory limits. Curren
2024年02月09日
瀏覽(21)
Hadoop YARN HA 集群安裝部署詳細圖文教程
目錄一、YARN 集群角色、部署規(guī)劃 1.1?集群角色--概述 1.2?集群角色--ResourceManager（RM）? 1.3?集群角色--NodeManager（NM）? 1.4 HA?集群部署規(guī)劃二、YARN RM?重啟機制 2.1 概述? 2.2 演示? 2.2.1?不開啟?RM?重啟機制現(xiàn)象? 2.3 兩種實現(xiàn)方案與區(qū)別? 2.3.1?Non-work-preserving RM restart 2.3.2?
2024年02月04日
瀏覽(53)
部署HDFS集群（完全分布式模式、hadoop用戶控制集群、hadoop-3.3.4+安裝包）
目錄前置一、上傳解壓（一）上傳（二）解壓二、修改配置文件（一）配置workers文件（二）配置hadoop-env.sh文件（三）配置core-site.xml文件（四）配置hdfs-site.xml文件三、分發(fā)到hp2、hp3, 并設置環(huán)境變量（一）準備數(shù)據(jù)目錄? ? （二）配置環(huán)境變量四、創(chuàng)建數(shù)據(jù)目錄，并
2024年04月14日
瀏覽(28)
大數(shù)據(jù)技術之Hadoop：HDFS集群安裝篇（三）
目錄分布式文件系統(tǒng)HDFS安裝篇一、為什么海量數(shù)據(jù)需要分布式存儲二、分布式的基礎架構(gòu)分析三、 HDFS的基礎架構(gòu) 四?HDFS集群環(huán)境部署 4.1 下載安裝包 4.2 集群規(guī)劃 4.3 上傳解壓 4.4 配置HDFS集群 4.5 準備數(shù)據(jù)目錄 4.6 分發(fā)hadoop到其他服務器 4.7 配置環(huán)境變量 4.8 為普通用戶授
2024年02月14日
瀏覽(24)
hadoop集群中增加新節(jié)點服務器（DataNode + NodeManager）方案及驗證
現(xiàn)根據(jù)業(yè)務需要，需要在原有的3臺完全分布式的集群（hadoop1、hadoop2、hadoop3仨節(jié)點）增設一臺新的服務器節(jié)點（hadoop4），以下是在原有的完全分布式hadoop集群中增設新節(jié)點（ DataNode + NodeManager ）的部署步驟。基礎服務配置 hadoop4上依次執(zhí)行以下步驟: 1）用戶：重置root用戶密
2024年01月19日
瀏覽(37)
啟動Hadoop集群，出現(xiàn)Cannot set priority of nodemanager(resourcemanager) process xxx問題
（不感興趣可以跳過背景介紹）配置在安裝hive的過程中，初始化數(shù)據(jù)庫成功后（mysql），輸入命令: ./bin/hive 啟動hive時出錯（忘記截圖了）。后發(fā)現(xiàn)原因是hive3.x僅支持JDK 1.8，并不支持openJDK 11，盡管hadoop3.3.x是支持JDK 1.8和openJDK 11的。當降低JDK版本后啟動集群，便出現(xiàn)啟動
2024年02月01日
瀏覽(22)
Hadoop生態(tài) | HDFS | Yarn | Hive | Hbase
? 簡單說兩句 ? 作者：后端小知識， CSDN后端領域新星創(chuàng)作者|阿里云專家博主 CSDN 個人主頁：后端小知識 ?? GZH ：后端小知識 ?? 歡迎關注 ?? 點贊 ?? 收藏 ?? 留言 ?? 進入大數(shù)據(jù)階段就意味著進入NoSQL階段，更多的是面向OLAP場景，即數(shù)據(jù)倉庫、BI應用等。大數(shù)據(jù)技
2024年04月08日
瀏覽(25)
Middleware ? Hadoop功能與使用詳解（HDFS+YARN）
Hadoop是一個開源的分布式計算和存儲框架，由Apache基金會開發(fā)和維護。Hadoop 為龐大的計算機集群提供可靠的、可伸縮的應用層計算和存儲支持，它允許使用簡單的編程模型跨計算機群集分布式處理大型數(shù)據(jù)集，并且支持在單臺計算機到幾千臺計算機之間進行擴展。 Hadoop使用
2024年02月07日
瀏覽(26)
單機搭建hadoop環(huán)境（包括hdfs、yarn、hive）
單機可以搭建偽分布式hadoop環(huán)境，用來測試和開發(fā)使用，hadoop包括： hdfs服務器， yarn服務器，yarn的前提是hdfs服務器，在前面兩個的基礎上，課可以搭建hive服務器，不過hive不屬于hadoop的必須部分。過程不要想的太復雜，其實挺簡單，這里用最糙最快最直接的方法，在我的單
2024年02月20日
瀏覽(25)

<address id="zkj7y"></address>