国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

這篇具有很好參考價值的文章主要介紹了【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

1 Spark 簡介

初步了解一項技術(shù),最好的方式就是去它的官網(wǎng)首頁,一般首頁都會有十分官方且準確的介紹,學習 Spark 也不例外,官方介紹:Apache Spark ?是一種多語言引擎,用于在單節(jié)點機器或集群上執(zhí)行數(shù)據(jù)工程、數(shù)據(jù)科學和機器學習。 我們可以得知,Spark 可以單節(jié)點運行,也可以搭建集群來保證可靠性和負載均衡等等,同時,除了我們熟知的可以處理大數(shù)據(jù)場景業(yè)務(wù)外,Spark 還可以進行數(shù)據(jù)科學和機器學習(如 Spark MLlib 就是 Spark 提供的一個機器學習算法庫)。

【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

Spark 也擁有十分龐大的生態(tài)系統(tǒng),支持多種框架的集成,有助于將它們擴展到數(shù)千臺機器。
【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

2 Spark 的核心組成(5大模塊)

【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

1、Spark Core:包含了 Spark 最核心與基礎(chǔ)的功能,為其他 Spark 功能模塊提供了核心層的支撐,可類比 Spring 框架中的 Spring Core。

2、Spark SQL:官方文檔的介紹如下圖,Spark SQL 適用于結(jié)構(gòu)化表和非結(jié)構(gòu)化數(shù)據(jù)的查詢,并且可以在運行時自適配執(zhí)行計劃,支持 ANSI SQL(即標準的結(jié)構(gòu)化查詢語言)。
【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce
3、Spark Streaming:是 Spark 平臺上針對實時數(shù)據(jù)進行流式計算的組件,而流式數(shù)據(jù)指的是實時或接近實時的時效性處理的大數(shù)據(jù)流,常見的流式數(shù)據(jù)處理使用Spark、Storm和Samza等框架。

4、Spark MLlib:是 Spark 提供的一個機器學習算法庫。MLlib 不僅提供了模型評估、數(shù)據(jù)導入等額外的功能,還提供了一些更底層的機器學習原語。

5、Spark GraphX:是 Spark 面向圖計算提供的框架與算法庫。

3 Spark 的主要特征(4大特征)

為了準確,也是按官方文檔學習就可以,總結(jié)了一下,主要有 4 個特點:

  • 適合批處理、實時流式數(shù)據(jù)的計算處理
  • 能夠快速執(zhí)行分布式的 SQL 查詢
  • 支持 PB 級大數(shù)據(jù)的科學計算
  • 可用于機器學習,且支持集群訓練機器學習算法
    【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

4 Spark 對比 MapReduce

與其說是 Spark 對比 Hadoop,不如說得準確一點,Spark 對比 Hadoop 中的 MapReduce。

MapReduce 對比 Spark:

  • 在適用場景上:MapReduce 不適合循環(huán)迭代式數(shù)據(jù)流處理以及可復用的多并行運行的數(shù)據(jù),而 Spark 與之相反,Spark 的出現(xiàn)晚于 MapReduce,Spark 適合循環(huán)迭代式數(shù)據(jù)流處理以及可復用的多并行運行的數(shù)據(jù),這也就是為什么在上一篇文章中提到,Spark 的核心模塊中有機器學習和圖算法的模塊,Spark 的這種特性使得它可以處理機器學習、圖挖掘算法等問題,效率遠遠高于 MapReduce。

  • 開發(fā)語言:雖然有時說語言不是問題,但不同語言也是有不同特性的,MapReduce 是用 Java 語言開發(fā)的,而 Spark 是用 Scala 語言開發(fā)的,Scala 十分擅長函數(shù)的處理。

  • 根本差別:Spark 和Hadoop 的根本差異是多個作業(yè)任務(wù)之間的數(shù)據(jù)通信問題,Spark 多個作業(yè)之間數(shù)據(jù)通信是基于內(nèi)存,而 Hadoop 是基于磁盤,這也是為什么 Spark 更加適合循環(huán)迭代式數(shù)據(jù)流處理的原因,因為省去了多余的磁盤調(diào)度開銷。
    【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce

  • 執(zhí)行任務(wù):Spark 執(zhí)行新任務(wù)采用 fork 線程的方式,而 Hadoop 采用創(chuàng)建新的進程的方式。文章來源地址http://www.zghlxwxcb.cn/news/detail-447069.html

到了這里,關(guān)于【大數(shù)據(jù)開發(fā) Spark】第一篇:Spark 簡介、Spark 的核心組成(5大模塊)、Spark 的主要特征(4大特征)、Spark 對比 MapReduce的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 【第一篇:簡介關(guān)于OpenAI的使用】

    其實以上都不是我寫的,都是chat-GPT自己寫的,真的很神奇!

    2024年02月04日
    瀏覽(21)
  • 明德?lián)PFPGA至簡設(shè)計原理與應(yīng)用 第一篇 FPGA基礎(chǔ)知識 第一章 FPGA簡介

    FPGA 的全稱為 Field-Programmable Gate Array, 即現(xiàn)場可編程門陣列。FPGA 就是一個可以“改變”內(nèi)部結(jié)構(gòu)的芯片,而讓這個芯片來實現(xiàn)怎樣的功能,就需要通過編程即設(shè)計HDL,經(jīng)過 EDA工具編譯、綜合、布局布線成后轉(zhuǎn)換為可燒錄的文件,最終加載到 FPGA 器件中去,改變 FPGA 內(nèi)部的連

    2024年01月16日
    瀏覽(221)
  • c++的類開發(fā)第一篇

    類就是一種公共接口,公眾(public)是使用類的程序,交互系統(tǒng)由類對象組成,而接口由編寫類的人提供的方法組成。接口讓程序員能夠編寫與類對象交互的代碼,從而讓程序能夠使用類對象。例如,要計算 string 對象中包含多少個字符,您無需打開對象,而只需使用string類提供

    2024年02月19日
    瀏覽(24)
  • [Docker] DevContainer高效開發(fā)(第一篇):基于remote container開發(fā)

    [Docker] DevContainer高效開發(fā)(第一篇):基于remote container開發(fā)

    docker和容器化技術(shù)讓運維有了質(zhì)的飛躍,從此,部署軟件再也無需擔心軟件運行所需的繁雜環(huán)境,只要拉取鏡像然后運行就可以將應(yīng)用連帶其部署的環(huán)境一步到位。 但是回想起我們的開發(fā)過程,誰還不是依然需要先安裝一堆環(huán)境(編譯器、庫等等),然后才能進行開發(fā)。如果

    2024年02月19日
    瀏覽(17)
  • 【Spring進階系列丨第一篇】初識Spring開發(fā)

    【Spring進階系列丨第一篇】初識Spring開發(fā)

    小伙伴們大家好,我是陳橘又青,今天起 《Spring進階系列》 開始更新。本專欄將涵蓋Spring框架的核心概念、配置管理、Web開發(fā)、AOP、Boot、Security、Data、Integration和Batch等多個主題。通過理論講解和實際案例的剖析,幫助讀者深入理解Spring框架的原理和應(yīng)用技巧,提升開發(fā)人員

    2024年02月05日
    瀏覽(18)
  • 數(shù)據(jù)結(jié)構(gòu)入門篇:第一篇

    數(shù)據(jù)結(jié)構(gòu)入門篇:第一篇

    ??首先,為什么要學數(shù)據(jù)結(jié)構(gòu)? 數(shù)據(jù)結(jié)構(gòu)的 概念 :在內(nèi)存中對數(shù)據(jù)進行管理; 數(shù)據(jù)結(jié)構(gòu)的學習能讓我們在處理大量數(shù)據(jù)時提高處理效率,即讓我們在不同的場景下更快的處理大量數(shù)據(jù); ??算法和數(shù)據(jù)結(jié)構(gòu)有什么關(guān)系? 算法 就是處理數(shù)據(jù)的一種方法; 數(shù)據(jù)結(jié)構(gòu)是為算法服

    2023年04月18日
    瀏覽(26)
  • 記錄第一篇被”華為開發(fā)者聯(lián)盟鴻蒙專區(qū) “收錄的文章

    記錄第一篇被”華為開發(fā)者聯(lián)盟鴻蒙專區(qū) “收錄的文章

    記錄第一篇被”華為開發(fā)者聯(lián)盟鴻蒙專區(qū)?“社區(qū)收錄的文章。 堅持寫作的動力是什么? 是記錄、分享,以及更好的思考?。 ?

    2024年02月14日
    瀏覽(24)
  • 第一篇【傳奇開心果系列】beeware開發(fā)移動應(yīng)用:輪盤抽獎移動應(yīng)用

    第一篇【傳奇開心果系列】beeware開發(fā)移動應(yīng)用:輪盤抽獎移動應(yīng)用

    一、項目目標 使用beeware的toga寫傳奇開心果輪盤抽獎安卓手機應(yīng)用和蘋果手機應(yīng)用 二、開發(fā)傳奇開心果輪盤抽獎安卓應(yīng)用編程思路 要使用Beeware的Toga庫來編寫一個傳奇開心果輪盤抽獎安卓應(yīng)用,你需要按照以下步驟進行操作: 安裝Beeware:首先,你需要安裝Beeware的開發(fā)工具包

    2024年01月20日
    瀏覽(99)
  • 第一篇 香橙派刷機和開發(fā)環(huán)境準備(ubuntu20.04版)

    第一篇 香橙派刷機和開發(fā)環(huán)境準備(ubuntu20.04版)

    目錄 一、香橙派刷ubuntu系統(tǒng)和SSH登錄 1.Ubuntu有趣的Codename 2.刷機步驟(ubuntu20.04) ??格式化TF卡 ??燒寫系統(tǒng)到TF卡 ??調(diào)試串口登陸系統(tǒng) ??SSH登陸系統(tǒng) ?二、開發(fā)環(huán)境準備 1.香橙派ubuntu20.04換源 2.VNC遠程連接香橙派 (1)安裝VNC服務(wù) (2)VNC連接香橙派 3.安裝wiringPi (1)安裝

    2023年04月21日
    瀏覽(83)
  • 手把手教你區(qū)塊鏈java開發(fā)智能合約nft-第一篇

    手把手教你區(qū)塊鏈java開發(fā)智能合約nft-第一篇

    剛接觸區(qū)塊鏈開發(fā),使用java開發(fā),真的是太難了,自己一步步摸索,從新手小白一路碰壁,動不動就報錯,去網(wǎng)上搜索對應(yīng)錯誤,還真什么都搜索不到,摸索了三四個月,今天終于有了一些進展,今天開始分享出來,希望能幫助到需要的朋友 我作為一個java后端的程序員,不

    2024年01月23日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包