国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<object id="h4d5y"><progress id="h4d5y"></progress></object>

GIS大數(shù)據(jù)處理框架sedona(塞多納)編程入門指導(dǎo)

2年前作者：松果仁分類：Toy博客閱讀(27)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了GIS大數(shù)據(jù)處理框架sedona(塞多納)編程入門指導(dǎo)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

GIS大數(shù)據(jù)處理框架sedona(塞多納)編程入門指導(dǎo)

簡(jiǎn)介

Apache Sedona?是一個(gè)用于處理大規(guī)?？臻g數(shù)據(jù)的集群計(jì)算系統(tǒng)。Sedona擴(kuò)展了現(xiàn)有的集群計(jì)算系統(tǒng)，如Apache Spark和Apache Flink，使用一組開箱即用的分布式空間數(shù)據(jù)集和空間SQL，可以有效地加載、處理和分析跨機(jī)器的大規(guī)?？臻g數(shù)據(jù)。碼云鏡像碼云sedona文檔持續(xù)更新中

代碼結(jié)構(gòu)

GIS大數(shù)據(jù)處理框架sedona(塞多納)編程入門指導(dǎo)

common java核心包,對(duì)底層JTS、geotools坐標(biāo)系轉(zhuǎn)換等操作方法的接口包裝,并提供了circle(擴(kuò)展JTS功能),距離計(jì)算方法:Haversine方式,Spheroid橢球;WKT,GeoJSON等格式轉(zhuǎn)換;索引支持QUADTREE,RTREE;geohash計(jì)算;供spark、flink等上層應(yīng)用調(diào)用使用
core 與spark適配核心包,封裝提供基礎(chǔ)對(duì)象SpatialRDD,PointRDD,LineStingRDD,CircleRDD,PolygonRDD;幾何鏈接操作joinJudgement(通過幾何拓?fù)潢P(guān)系),knnJudgement(幾何距離),rangeJudgement(treeIndex索引范圍查詢);數(shù)據(jù)讀取轉(zhuǎn)換formatMapper:cvs,wkt,geoJson,shapefile,netcdf;spatialPartitioning分區(qū)器:QuadtreePartitioning,KDBTreePartitioner等
flink flink適配,調(diào)用common下的functions里面提供的函數(shù)方法
python-adapter python適配,調(diào)用common下的functions里面提供的函數(shù)方法
sql spark-sql適配,調(diào)用common下的functions里面提供的函數(shù)方法

使用說明

在spark下面的使用說明

1.安裝

具體參看

<dependency>
  <groupId>org.apache.sedona</groupId>
  <artifactId>sedona-spark-shaded-3.0_2.12</artifactId>
  <version>1.4.0</version>
</dependency>
<dependency>
  <groupId>org.apache.sedona</groupId>
  <artifactId>sedona-viz-3.0_2.12</artifactId>
  <version>1.4.0</version>
</dependency>
<!-- Optional: https://mvnrepository.com/artifact/org.datasyslab/geotools-wrapper -->
<dependency>
    <groupId>org.datasyslab</groupId>
    <artifactId>geotools-wrapper</artifactId>
    <version>1.4.0-28.2</version>
</dependency>

2.初始化SparkSession

SparkSession sparkSession = SparkSession.builder()
.master("local[*]") // Delete this if run in cluster mode
.appName("readTestScala") // Change this to a proper name
// Enable Sedona custom Kryo serializer
.config("spark.serializer", KryoSerializer.class.getName) // org.apache.spark.serializer.KryoSerializer
.config("spark.kryo.registrator", SedonaKryoRegistrator.class.getName)
.getOrCreate() // org.apache.sedona.core.serde.SedonaKryoRegistrator

3.安裝函數(shù)

SedonaSQLRegistrator.registerAll(sparkSession)

4.使用例子

4.1 dataFrame方式加載數(shù)據(jù)

4.1.1 從文件加載數(shù)據(jù)

假設(shè)有一個(gè)WKT數(shù)據(jù)格式的tsv文件,存儲(chǔ)位置/Download/usa-county.tsv

POLYGON (..., ...)  Cuming County   
POLYGON (..., ...)  Wahkiakum County
POLYGON (..., ...)  De Baca County
POLYGON (..., ...)  Lancaster County

加載

Dataset<Row> rawDf = sparkSession.read.format("csv").option("delimiter", "\t").option("header", "false").load("/Download/usa-county.tsv")
rawDf.createOrReplaceTempView("rawdf")
rawDf.show()

結(jié)果展示

|                 _c0|_c1|_c2|     _c3|  _c4|        _c5|                 _c6|_c7|_c8|  _c9|_c10| _c11|_c12|_c13|      _c14|    _c15|       _c16|        _c17|
+--------------------+---+---+--------+-----+-----------+--------------------+---+---+-----+----+-----+----+----+----------+--------+-----------+------------+
|POLYGON ((-97.019...| 31|039|00835841|31039|     Cuming|       Cuming County| 06| H1|G4020|null| null|null|   A|1477895811|10447360|+41.9158651|-096.7885168|
|POLYGON ((-123.43...| 53|069|01513275|53069|  Wahkiakum|    Wahkiakum County| 06| H1|G4020|null| null|null|   A| 682138871|61658258|+46.2946377|-123.4244583|
|POLYGON ((-104.56...| 35|011|00933054|35011|    De Baca|      De Baca County| 06| H1|G4020|null| null|null|   A|6015539696|29159492|+34.3592729|-104.3686961|
|POLYGON ((-96.910...| 31|109|00835876|31109|  Lancaster|    Lancaster County| 06| H1|G4020| 339|30700|null|   A|2169240202|22877180|+40.7835474|-096.6886584|

4.1.1 通過ST_函數(shù)

SELECT ST_GeomFromWKT(_c0) AS countyshape, _c1, _c2

4.1.3 從GeoJSON文件讀取

String schema = "type string, crs string, totalFeatures long, features array<struct<type string, geometry string, properties map<string, string>>>";
sparkSession.read.schema(schema).json(geojson_path)
    .selectExpr("explode(features) as features") // Explode the envelope to get one feature per row.
    .select("features.*") // Unpack the features struct.
    .withColumn("geometry", expr("ST_GeomFromGeoJSON(geometry)")) // Convert the geometry string.
    .printSchema();

4.1.4 從數(shù)據(jù)庫讀取

// For any JDBC data source, inluding Postgis.
Dataset<Row> df = sparkSession.read().format("jdbc")
    // Other options.
    .option("query", "SELECT id, ST_AsBinary(geom) as geom FROM my_table")
    .load()
    .withColumn("geom", expr("ST_GeomFromWKB(geom)"))

// This is a simplified version that works for Postgis.
Dataset<Row> df = sparkSession.read().format("jdbc")
    // Other options.
    .option("dbtable", "my_table")
    .load()
    .withColumn("geom", expr("ST_GeomFromWKB(geom)"))

4.2 CRS（坐標(biāo)系）轉(zhuǎn)換

SELECT ST_Transform(countyshape, "epsg:4326", "epsg:3857") AS newcountyshape, _c1, _c2, _c3, _c4, _c5, _c6, _c7
FROM spatialdf

4.3 地理空間查詢

4.3.1 范圍查詢

ST_Contains, ST_Intersects, ST_Within

SELECT *
FROM spatialdf
WHERE ST_Contains (ST_PolygonFromEnvelope(1.0,100.0,1000.0,1100.0), newcountyshape)

4.3.2 距離查詢

ST_Distance

SELECT countyname, ST_Distance(ST_PolygonFromEnvelope(1.0,100.0,1000.0,1100.0), newcountyshape) AS distance
FROM spatialdf
ORDER BY distance DESC
LIMIT 5

4.3.3 關(guān)聯(lián)查詢

SELECT *
FROM polygondf, pointdf
WHERE ST_Contains(polygondf.polygonshape,pointdf.pointshape)

SELECT *
FROM polygondf, pointdf
WHERE ST_Intersects(polygondf.polygonshape,pointdf.pointshape)

SELECT *
FROM pointdf, polygondf
WHERE ST_Within(pointdf.pointshape, polygondf.polygonshape)

SELECT *
FROM pointdf1, pointdf2
WHERE ST_Distance(pointdf1.pointshape1,pointdf2.pointshape2) < 2

5 存儲(chǔ)

已入postgis為例文章來源地址http://www.zghlxwxcb.cn/news/detail-492492.html

my_postgis_db# create table my_table (id int8, geom geometry);

df.withColumn("geom", expr("ST_AsEWKB(geom)")
    .write.format("jdbc")
    .option("truncate","true") // Don't let Spark recreate the table.
    // Other options.
    .save()

// If you didn't create the table before writing you can change the type afterward.
my_postgis_db# alter table my_table alter column geom type geometry;

6 SpatialRDD與DataFrame相好轉(zhuǎn)換

6.1 SpatialRDD轉(zhuǎn)DataFrame

Dataset<Row> spatialDf = Adapter.toDf(spatialRDD, sparkSession)

6.2 DataFrame轉(zhuǎn)SpatialRDD

val schema = StructType(Array(
  StructField("county", GeometryUDT, nullable = true),
  StructField("name", StringType, nullable = true),
  StructField("price", DoubleType, nullable = true),
  StructField("age", IntegerType, nullable = true)
))
val spatialDf = Adapter.toDf(spatialRDD, schema, sparkSession)

到了這里，關(guān)于GIS大數(shù)據(jù)處理框架sedona(塞多納)編程入門指導(dǎo)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Python編程：高效數(shù)據(jù)處理與自動(dòng)化任務(wù)實(shí)踐
一、引言 Python，作為一種解釋型、交互式、面向?qū)ο蟮木幊陶Z言，憑借其簡(jiǎn)潔易懂的語法和強(qiáng)大的功能庫，已經(jīng)成為數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、Web開發(fā)等多個(gè)領(lǐng)域的首選工具。本文將探討Python在數(shù)據(jù)處理和自動(dòng)化任務(wù)方面的應(yīng)用，通過具體的代碼案例展示Python的強(qiáng)大功能。二、
2024年04月26日
瀏覽(68)
Hadoop與Spark：大數(shù)據(jù)處理框架的比較與選擇
Hadoop與Spark：大數(shù)據(jù)處理框架的比較與選擇在大數(shù)據(jù)的時(shí)代背景下，數(shù)據(jù)處理和分析的需求日益增長。為了滿足這些需求，開發(fā)者們創(chuàng)造了許多大數(shù)據(jù)處理框架，其中最為人們熟知的可能就是Hadoop和Spark了。這兩者各有其優(yōu)勢(shì)，選擇哪一個(gè)取決于你的具體需求。下面我們將對(duì)
2024年01月25日
瀏覽(28)
大數(shù)據(jù)處理領(lǐng)域的經(jīng)典框架：MapReduce詳解與應(yīng)用【上進(jìn)小菜豬大數(shù)據(jù)】
上進(jìn)小菜豬，沈工大軟件工程專業(yè)，愛好敲代碼，持續(xù)輸出干貨。 MapReduce是一個(gè)經(jīng)典的大數(shù)據(jù)處理框架，可以幫助我們高效地處理龐大的數(shù)據(jù)集。本文將介紹MapReduce的基本原理和實(shí)現(xiàn)方法，并給出一個(gè)簡(jiǎn)單的示例。 MapReduce的基本原理包括兩個(gè)階段：Map和Reduce。 1、Map階段 M
2024年02月07日
瀏覽(22)
Python 框架學(xué)習(xí) Django篇 (八) 代碼優(yōu)化、數(shù)據(jù)庫冗余處理
我們開發(fā)軟件系統(tǒng)的時(shí)候，需要不斷的反思我們代碼里面是否有可以優(yōu)化的地方。而優(yōu)化的重點(diǎn)之一，就是把冗余的代碼優(yōu)化為可以復(fù)用的庫。我們?cè)谇懊婢帉懥艘恍┕δ?，但是其中存在很多冗余的方?打開這3個(gè)文件我們可以看到他們的入口函數(shù)dispatcher? 實(shí)際的代碼相似度
2024年02月06日
瀏覽(24)
基于C#編程建立泛型Matrix數(shù)據(jù)類型及對(duì)應(yīng)處理方法
????????上一篇文檔中描述了如何寫一個(gè)VectorT類，本次在上一篇文檔基礎(chǔ)上，撰寫本文，介紹如何書寫一個(gè)泛型Matrix，可以應(yīng)用于int、double、float等C#數(shù)值型的matrix。 ????????本文所描述的MatrixT是一個(gè)泛型，具有不同數(shù)值類型Matrix矩陣構(gòu)造、新增、刪除、查詢、更改、
2024年02月02日
瀏覽(32)
GPT-4科研實(shí)踐：數(shù)據(jù)可視化、統(tǒng)計(jì)分析、編程、機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘、數(shù)據(jù)預(yù)處理、代碼優(yōu)化、科研方法論
查看原文GPT4科研實(shí)踐技術(shù)與AI繪圖 GPT對(duì)于每個(gè)科研人員已經(jīng)成為不可或缺的輔助工具，不同的研究領(lǐng)域和項(xiàng)目具有不同的需求。例如在科研編程、繪圖領(lǐng)域： 1、編程建議和示例代碼: ?無論你使用的編程語言是Python、R、MATLAB還是其他語言，都可以為你提供相關(guān)的代碼示例。
2024年02月07日
瀏覽(106)
使用Python編程語言處理數(shù)據(jù) (Processing data using Python programm
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) Python作為一種高級(jí)、開源、跨平臺(tái)的編程語言，已經(jīng)成為當(dāng)今最流行的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工具。本文介紹了使用Python編程語言處理數(shù)據(jù)的一些基礎(chǔ)知識(shí)，如列表、字典、集合、迭代器等，并對(duì)pandas、numpy、matplotlib、seaborn等數(shù)據(jù)分析庫進(jìn)行了
2024年02月07日
瀏覽(27)
【ARMv8 SIMD和浮點(diǎn)指令編程】NEON 通用數(shù)據(jù)處理指令——復(fù)制、反轉(zhuǎn)、提取、轉(zhuǎn)置...
NEON 通用數(shù)據(jù)處理指令包括以下指令（不限于）： ? DUP 將標(biāo)量復(fù)制到向量的所有向量線。 ? EXT 提取。 ? REV16、REV32、REV64 反轉(zhuǎn)向量中的元素。 ? TBL、TBX 向量表查找。 ? TRN 向量轉(zhuǎn)置。 ? UZP、ZIP 向量交叉存取和反向交叉存取。 1 DUP (element) 將向量元素復(fù)制為向量或標(biāo)量。
2024年02月07日
瀏覽(23)
Java 學(xué)習(xí)路線：基礎(chǔ)知識(shí)、數(shù)據(jù)類型、條件語句、函數(shù)、循環(huán)、異常處理、數(shù)據(jù)結(jié)構(gòu)、面向?qū)ο缶幊?、包、文件?API
Java 是一種由 Sun Microsystems 于 1995 年首次發(fā)布的編程語言和計(jì)算平臺(tái)。Java 是一種通用的、基于類的、面向?qū)ο蟮木幊陶Z言，旨在減少實(shí)現(xiàn)依賴性。它是一個(gè)應(yīng)用程序開發(fā)的計(jì)算平臺(tái)。Java 快速、安全、可靠，因此在筆記本電腦、數(shù)據(jù)中心、游戲機(jī)、科學(xué)超級(jí)計(jì)算機(jī)、手機(jī)等領(lǐng)
2024年03月24日
瀏覽(39)
BIC-2022-BDT:區(qū)塊鏈和基于數(shù)字雙胞胎的智能制造高效數(shù)據(jù)處理安全框架
摘要工業(yè)物聯(lián)網(wǎng)具有智能連接、數(shù)據(jù)實(shí)時(shí)處理、協(xié)同監(jiān)測(cè)、信息自動(dòng)處理等特點(diǎn)，是物聯(lián)網(wǎng)時(shí)代的重要組成部分之一。異構(gòu)工業(yè)物聯(lián)網(wǎng)設(shè)備對(duì)高數(shù)據(jù)速率、高可靠性、高覆蓋、低延遲的要求，已成為信息安全領(lǐng)域的一大挑戰(zhàn)。工業(yè)物聯(lián)網(wǎng)中的智能制造產(chǎn)業(yè)需要多方協(xié)同的信息
2024年02月06日
瀏覽(31)

^{<tr id="3oivo"></tr>}