教程簡(jiǎn)介Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。Spark是UC Berkeley AMP lab (加州大學(xué)伯克利分校的AMP實(shí)驗(yàn)室)所開(kāi)源的類Hadoop MapReduce的通用并行框架,Spark,擁有Hadoop MapReduce所具有的優(yōu)點(diǎn);但不同于MapReduce的是——Job中間輸出結(jié)果可以保存在內(nèi)存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法。Spark 是一種與 Hadoop 相似的開(kāi)源集群計(jì)算環(huán)境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負(fù)載方面表現(xiàn)得更加優(yōu)越,換句話說(shuō),Spark 啟用了內(nèi)存分布數(shù)據(jù)集,除了能夠提供交互式查詢外,它還可以優(yōu)化迭代工作負(fù)載。Apache Spark入門教程 - 從基本到高級(jí)概念的簡(jiǎn)單步驟了解Apache Spark,其中包括簡(jiǎn)介,RDD,安裝,核心編程,部署,高級(jí)Spark編程等示例。教程目錄
- Apache Spark教程
- Apache Spark - 簡(jiǎn)介
- Apache Spark - RDD
- Apache Spark - 安裝
- Apache Spark - 核心編程
- Apache Spark - 部署
- 高級(jí)Spark編程
- Apache Spark - 有用的資源
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-486210.html
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-486210.html
到了這里,關(guān)于Apache Spark教程_編程入門自學(xué)教程_菜鳥(niǎo)教程-免費(fèi)教程分享的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!