国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

企業(yè)spark案例 —— 出租車軌跡分析(Python)

這篇具有很好參考價(jià)值的文章主要介紹了企業(yè)spark案例 —— 出租車軌跡分析(Python)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

頭歌的大數(shù)據(jù)作業(yè),答案沒找著,遂自己整了一份

第1關(guān):SparkSql 數(shù)據(jù)清洗

任務(wù)描述

本關(guān)任務(wù):將出租車軌跡數(shù)據(jù)規(guī)整化,清洗掉多余的字符串。

相關(guān)知識(shí)

為了完成本關(guān)任務(wù),你需要掌握:1. 如何使用 SparkSQL 讀取 CSV 文件,2. 如何使用正則表達(dá)式清洗掉多余字符串。

編程要求

在右側(cè)編輯器補(bǔ)充代碼,將出租車軌跡數(shù)據(jù)規(guī)整化,清洗掉多余的字符串,并使用 DataFrame.show() 打印輸出。

# -*- coding: UTF-8 -*-
from pyspark.sql import SparkSession
if __name__ =='__main__':
    spark = SparkSession.builder.master("local").appName("demo").getOrCreate()
    #**********begin**********#
    df = spark.read.option("header",True).option("delimiter","\t").csv("/root/data.csv")
    df.createTempView("data")
    spark.sql("""
    select regexp_replace(TRIP_ID,'\\\W+','') as TRIP_ID ,
        regexp_replace(CALL_TYPE,'\\\W+','') as CALL_TYPE ,
        regexp_replace(ORIGIN_CALL,'\\\W+','') as ORIGIN_CALL ,
        regexp_replace(TAXI_ID,'\\\W+','') as TAXI_ID ,
        regexp_replace(ORIGIN_STAND,'\\\W+','') as ORIGIN_STAND ,
        regexp_replace(TIMESTAMP,'\\\W+','') as TIMESTAMP ,
        regexp_replace(POLYLINE,'\\\W+','') as POLYLINE
    from data
    """).show()
    #**********end**********#
    spark.stop()

第2關(guān):SparkSql數(shù)據(jù)分析

任務(wù)描述

本關(guān)任務(wù):使用 SparkSQL 完成數(shù)據(jù)分析。

相關(guān)知識(shí)

為了完成本關(guān)任務(wù),你需要掌握:如何使用 SparkSQL 進(jìn)行數(shù)據(jù)分析文章來源地址http://www.zghlxwxcb.cn/news/detail-770451.html

# -*- coding: UTF-8 -*-
from pyspark.sql import SparkSession
import json

if __name__ == '__main__' :
    spark = SparkSession.builder.master("local").appName("demo").getOrCreate()
    #**********begin**********#
    df = spark.read.option("header",True).option("delimiter","\t").csv("/root/data2.csv")
    df.createTempView("data")
    spark.sql("select TRIP_ID,CALL_TYPE,ORIGIN_CALL, TAXI_ID, ORIGIN_STAND, from_unixtime(TIMESTAMP,'yyyy-MM-dd') as TIME ,POLYLINE from data").show()
    spark.udf.register("timeLen", lambda x: {
        (len(json.loads(x)) - 1) * 15 if len(json.loads(x)) > 0 else 8
    })
    spark.udf.register("startLocation", lambda x: {
        str(json.loads(x)[0]) if len(json.loads(x)) > 0 else ""
    })
    spark.udf.register( "endLocation", lambda x: {
        str(json.loads(x)[len(json.loads(x)) - 1]) if len(json.loads(x)) > 0 else ""
    })
    df.createTempView("data2")
    res=spark.sql("select TRIP_ID,CALL_TYPE,ORIGIN_CALL,TAXI_ID,ORIGIN_STAND,from_unixtime(TIMESTAMP,'yyyy-MM-dd') as TIME, POLYLINE, timeLen(POLYLINE) as TIMELEN, startLocation(POLYLINE) as STARTLOCATION, endLocation(POLYLINE) as ENDLOCATION from data2")
    res.createTempView("data3")
    res.show()
    spark.sql("select CALL_TYPE,TIME,count(1) as NUM from data3 group by TIME,CALL_TYPE order by CALL_TYPE,TIME").show()
    #**********end**********#

到了這里,關(guān)于企業(yè)spark案例 —— 出租車軌跡分析(Python)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Transbigdata——交通出租車大數(shù)據(jù)可視化分析,以成都市為例

    Transbigdata——交通出租車大數(shù)據(jù)可視化分析,以成都市為例

    提示:文章寫完后,目錄可以自動(dòng)生成,如何生成可參考右邊的幫助文檔 分享一個(gè)交通大數(shù)據(jù)可視化的案例,本案例來自于transbigdata包的出租車數(shù)據(jù)分析案例的復(fù)現(xiàn),數(shù)據(jù)集采用的是成都市的出租車(網(wǎng)約車和傳統(tǒng)的出租車數(shù)據(jù)),文件內(nèi)容比較大,這里我會(huì)附帶數(shù)據(jù)集的下

    2024年02月01日
    瀏覽(28)
  • 【華為OD統(tǒng)一考試B卷 | 100分】出租車計(jì)費(fèi) 、靠譜的車(C++ Java JavaScript Python)

    華為OD在線OJ:出租車計(jì)費(fèi) 、靠譜的車 已購買本專欄用戶,請(qǐng)私信博主開通賬號(hào),在線刷題?。?! 在線OJ:立即刷題 題庫專欄:2023華為OD機(jī)試(A卷+B卷)(C++JavaJSPy) 題目描述:出租車計(jì)費(fèi) 、靠譜的車 程序員小明打了一輛出租車去上班。出于職業(yè)敏感,他注意到這輛出租車的計(jì)

    2024年02月08日
    瀏覽(28)
  • 出租車計(jì)價(jià)c語言

    本關(guān)任務(wù):根據(jù)某城市普通出租車收費(fèi)標(biāo)準(zhǔn)編寫程序?qū)囐M(fèi)進(jìn)行計(jì)算。具體標(biāo)準(zhǔn)如下: 起步里程為3km,起步費(fèi)為10元;10km以內(nèi)超起步里程部分,每千米2元,超過10km以上的部分加收50%的回空補(bǔ)貼費(fèi),即每千米3元。營運(yùn)過程中,因堵車及乘客要求臨時(shí)停車的,按每5分鐘2元計(jì)收

    2024年02月07日
    瀏覽(28)
  • Java語言怎么編寫一個(gè)程序計(jì)算出租車的運(yùn)輸費(fèi)用:出租車起步15公里以內(nèi)20塊錢,需要支付調(diào)頭費(fèi)用

    下面是一個(gè)Java語言編寫的計(jì)算出租車運(yùn)輸費(fèi)用的程序: ? ```java import java.util.Scanner; ? public class TaxiFareCalculator { ? ? public static void main(String[] args) { ? ? ? ? Scanner input = new Scanner(System.in); ? ? ? ? ? System.out.print(\\\"請(qǐng)輸入出租車行駛的里程(公里):\\\"); ? ? ? ? double distance

    2024年02月12日
    瀏覽(28)
  • FPGA出租車計(jì)費(fèi)系統(tǒng)設(shè)計(jì)

    FPGA出租車計(jì)費(fèi)系統(tǒng)設(shè)計(jì)

    ? ? ? ? 設(shè)計(jì)一個(gè)簡易的出租車計(jì)費(fèi)系統(tǒng),實(shí)現(xiàn)計(jì)價(jià)功能,計(jì)費(fèi)標(biāo)準(zhǔn)為按里程收費(fèi), 起步價(jià)為6.00 元,當(dāng)里程小于3公里時(shí),按起步價(jià)收費(fèi), 超過3公里后按1.2元 /公里收費(fèi)。 ? ? ? ? 實(shí)現(xiàn)車輛行駛的模擬:能模擬汽車的 啟動(dòng),暫停,停止 等狀態(tài)。 ? ? ? ? 計(jì)費(fèi)顯示部分設(shè)計(jì)

    2024年02月04日
    瀏覽(28)
  • 基于單片機(jī)出租車計(jì)價(jià)器設(shè)計(jì)

    基于單片機(jī)出租車計(jì)價(jià)器設(shè)計(jì)

    ?功能介紹 以51單片機(jī)作為主控系統(tǒng); 1602液晶屏顯示最初的起步價(jià),里程收費(fèi),等待時(shí)間收費(fèi); 按鍵調(diào)整起步價(jià),里程收費(fèi),等待時(shí)間收費(fèi); 電機(jī)旋轉(zhuǎn),通過霍爾傳感器檢測轉(zhuǎn)速,來模擬出租車行駛; 電路圖 仿真圖 元器件清單 B1 5V直流電機(jī)+托盤(粘好磁鐵) BT1 2032紐扣電

    2024年02月11日
    瀏覽(30)
  • 【Vivado】基于FPGA的出租車計(jì)價(jià)表設(shè)計(jì)

    【Vivado】基于FPGA的出租車計(jì)價(jià)表設(shè)計(jì)

    學(xué)校FPGA設(shè)計(jì)結(jié)課課設(shè) 主要做了出租車計(jì)價(jià)表,一個(gè)比較舊的課題,代碼如下: 分模塊編程,按照價(jià)目表寫代碼,具體注釋見代碼。 在module里新加一個(gè) input 變量 key_stage ,用 key_stage 表示不同車流量段,用以計(jì)數(shù) 在module里新增一個(gè)變量 state 來限定是在白天還是夜間

    2024年02月04日
    瀏覽(35)
  • LeetCode 2008. 出租車的最大盈利:動(dòng)態(tài)規(guī)劃 + 哈希表

    力扣題目鏈接:https://leetcode.cn/problems/maximum-earnings-from-taxi/ 你駕駛出租車行駛在一條有 n ?個(gè)地點(diǎn)的路上。這 n ?個(gè)地點(diǎn)從近到遠(yuǎn)編號(hào)為? 1 ?到? n ?,你想要從 1 ?開到 n ?,通過接乘客訂單盈利。你只能沿著編號(hào)遞增的方向前進(jìn),不能改變方向。 乘客信息用一個(gè)下標(biāo)從 0 ?開

    2024年02月04日
    瀏覽(29)
  • 仿滴滴打車百度地圖定位查找附近出租車或門店信息

    仿滴滴打車百度地圖定位查找附近出租車或門店信息

    隨著技術(shù)的發(fā)展,開發(fā)的復(fù)雜度也越來越高,傳統(tǒng)開發(fā)方式將一個(gè)系統(tǒng)做成了整塊應(yīng)用,經(jīng)常出現(xiàn)的情況就是一個(gè)小小的改動(dòng)或者一個(gè)小功能的增加可能會(huì)引起整體邏輯的修改,造成牽一發(fā)而動(dòng)全身。通過組件化開發(fā),可以有效實(shí)現(xiàn)單獨(dú)開發(fā),單獨(dú)維護(hù),而且他們之間可以隨

    2024年02月09日
    瀏覽(23)
  • 【Cocos 3d】從零開始自制3d出租車小游戲

    【Cocos 3d】從零開始自制3d出租車小游戲

    本文很長,建議收藏食用。 課程來源: 游戲開發(fā)教程 | 零基礎(chǔ)也可以用18堂課自制一款3D小游戲 | Cocos Creator 3D 中文教程(合集)p1~p6 簡介: 資源下載:https://github.com/cocos-creator/tutorial-taxi-game 適合學(xué)習(xí)人群:本教程假定你對(duì)編程有一定的了解,ts,js 學(xué)習(xí)過其中之一。 如果不

    2024年02月02日
    瀏覽(54)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包