摘要:本文整理自阿里云高級技術(shù)專家/數(shù)據(jù)湖存儲負責人鄭鍇(鐵杰);阿里云高級技術(shù)專家/開源大數(shù)據(jù)OLAP負責人范振(辰繁)在 阿里云EMR2.0線上發(fā)布會 的分享。
本篇內(nèi)容主要介紹了阿里云云原生數(shù)據(jù)湖分析解決方案的三個核心要素:
1.全托管,湖存儲;
2.一站式,湖管理;
3.多模態(tài),湖計算
阿里云云原生數(shù)據(jù)湖分析解決方案全面重磅升級,經(jīng)中國信通院評測,它是目前國內(nèi)唯一滿分的數(shù)據(jù)湖方案。它有三個核心要素構(gòu)成:
- 全托管,湖存儲:全面兼容支持 HDFS/POSIX 協(xié)議,無縫對接大數(shù)據(jù)和AI一體化生態(tài);
- 一站式,湖管理:提供全面的數(shù)據(jù)庫存儲管理能力;
- 多模態(tài),湖計算:基于一湖多架構(gòu),能夠同時實現(xiàn)離線湖、實時湖、湖倉分析。
一、全托管 - 湖存儲(OSS-HDFS)
1、第三代數(shù)據(jù)湖存儲 OSS-HDFS
- 第一代數(shù)據(jù)湖存儲是開源的 HDFS;
- 標準對象存儲如阿里云OSS,被認為是第二代數(shù)據(jù)庫存儲;
- 阿里云融合前兩代數(shù)據(jù)湖存儲上的優(yōu)勢,推出第三代數(shù)據(jù)湖存儲:OSS-HDFS。
2、OSS-HDFS 生態(tài)支持
新的數(shù)據(jù)湖存儲解決方案 OSS-HDFS,通過 HDFS API 和 POSIX API,實現(xiàn)對數(shù)據(jù)湖存儲之上豐富的大數(shù)據(jù)和AI計算場景的完整支持,這是第三代數(shù)據(jù)湖存儲的核心命題。文章來源:http://www.zghlxwxcb.cn/news/detail-452087.html
- 通過提供充分的、完全的 HDFS 接口兼容,充分對接 Hadoop、Spark 這類大數(shù)據(jù)生態(tài);
- 同時,對新興的湖倉分析計算場景也提供了充分的支持;
- 對于蓬勃發(fā)展的AI生態(tài),通過 POSIX 提供兼容支持。
3、性能優(yōu)勢
在存儲服務(wù)的核心能力方面,如性能、規(guī)模和成本上,阿里云云原生數(shù)據(jù)湖分析解決方案具備顯著的優(yōu)勢。文章來源地址http://www.zghlxwxcb.cn/news/detail-452087.html
-
性能:高
- 原子性和毫秒級目錄操作 rename、delete
- 超大目錄 du/count 毫秒級返回
-
規(guī)模:大
- 熱文件(10 億)+ 溫冷(40億)vs 4億
- OSS 帶寬水平擴展
-
成本:低
- 標準?
到了這里,關(guān)于阿里云EMR 2.0:定義下一代云原生智能數(shù)據(jù)湖的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!