如下為MathorCup 高校數(shù)學(xué)建模挑戰(zhàn)賽D題思路解析:
D 題 航空安全風(fēng)險分析和飛行技術(shù)評估問題
飛行安全是民航運(yùn)輸業(yè)賴以生存和發(fā)展的基礎(chǔ)。隨著我國民航業(yè)的快速發(fā)展,針對飛行安全問題的研究顯得越來越重要。2022 年 3 月 21 日,“3.21”空難的發(fā)生終結(jié)了中國民航安全飛行 1 億零 59 萬飛行小時的歷史最好安全記錄。嚴(yán)重飛行事故的發(fā)生,不僅會給航空公司帶來巨大的經(jīng)濟(jì)損失,更會對乘客造成極大的生命威脅。因而需要聚焦飛行安全問題,強(qiáng)化航空安全研究,綜合利用現(xiàn)有數(shù)據(jù)強(qiáng)化科學(xué)管理,通過有針對性、系統(tǒng)性的管控手段有效提升從業(yè)人員的素質(zhì),監(jiān)測和預(yù)警風(fēng)險,進(jìn)而降低飛行事故的發(fā)生幾率。
航空安全大數(shù)據(jù)主要包括快速存取記錄器(Quick Access Recorder, QAR)數(shù)據(jù),該數(shù)據(jù)主要記錄飛機(jī)在飛行過程中的各項飛行參數(shù);在飛行品質(zhì)監(jiān)控(Flight Operational Quality Assurance,F(xiàn)OQA)中,QAR 中超出人為設(shè)定限制值的數(shù)據(jù)記為超限數(shù)據(jù)。除此之外,在實際研究過程中,還會涉及到飛行中的艙音數(shù)據(jù)等。本問題主要涉及的是 QAR 數(shù)據(jù),QAR 數(shù)據(jù)相對比較規(guī)范。
背景分析:這一部分點明了本題的主體,說明了QAR數(shù)據(jù)是什么,即附件內(nèi)容,后面會寫數(shù)據(jù)集的分析與處理。
在飛行品質(zhì)監(jiān)控具體研究和應(yīng)用方面,目前我國民航業(yè)內(nèi)的研究主要分為兩個方面,一是針對超限事件的研究、分析和應(yīng)用;二是對非超限數(shù)據(jù)的統(tǒng)計分析和應(yīng)用。對于超限事件的研究,一般是通過規(guī)定飛行參數(shù)的集中區(qū)域設(shè)置超限閾值,將超出閾值部分的飛行記錄找出來,進(jìn)行重點分析,防范潛在隱患造成嚴(yán)重飛行事故。
目前此類分析是飛行品質(zhì)監(jiān)控工作的主體,較好地保證了現(xiàn)階段的安全工作,其不足之處在于缺少對超限原因的分析。由于超限并非全部是人為因素引發(fā),例如許多是由于特殊環(huán)境條件造成的,甚至有可能是飛機(jī)本身的設(shè)計、制造因素所致,因此僅通過單純的超限分析很難識別出來;如果僅基于超限事件對飛行機(jī)組進(jìn)行管理,很容易誤入歧途。QAR 超限可用于航空安全管理和飛行訓(xùn)練的數(shù)據(jù)支持。目前并不傾向于僅以少量的 QAR 超限數(shù)據(jù)為依據(jù)開展飛行訓(xùn)練工作,因此飛行品質(zhì)監(jiān)控工作逐漸衍生出另外一種傾向性,即通過挖掘 QAR 全航段數(shù)據(jù)開展分析,形成特定人員的飛行品質(zhì)記錄?;诓煌w行機(jī)組、飛行航線、機(jī)場、特定飛行條件下的飛行記錄,通過對數(shù)據(jù)進(jìn)行建模、分析,計算評估風(fēng)險傾向性,開展有針對性的安全管理,排查安全隱患,改進(jìn)安全績效。目前類似研究主要是大規(guī)模讀取飛行數(shù)據(jù),并進(jìn)行存儲和分析,形成飛行品質(zhì)服務(wù)平臺,為風(fēng)險評估和趨勢分析提供數(shù)據(jù)基礎(chǔ)。G 值是飛機(jī)飛行過程中過載情況的直接反應(yīng),在著陸安全分析中,G 值通常是描述落地瞬間安全性的重要指標(biāo)。著陸瞬間 G 值指的是飛機(jī)接地瞬間前 2 秒和后5 秒數(shù)據(jù)的最大 G 值。
背景分析:這一部分主要就是給出了通過對QAR數(shù)據(jù)挖掘,可以改善飛行品質(zhì)監(jiān)控工作,從而改進(jìn)進(jìn)安全績效。
基于以上背景,請你們團(tuán)隊解決以下問題:
問題 1:有些 QAR 數(shù)據(jù)存在錯誤,需要對數(shù)據(jù)進(jìn)行預(yù)處理,去偽存真, 以減少錯誤數(shù)據(jù)對研究分析帶來的影響。請你們的隊伍對附件 1 的數(shù)據(jù)質(zhì)量開展可靠性研究,提取與飛行安全相關(guān)的部分關(guān)鍵數(shù)據(jù)項,并對其重要程度進(jìn)行分析。
問題一分析:問題一可以分為兩小問,首先需要進(jìn)行數(shù)據(jù)預(yù)處理,其中特別的要針對錯誤數(shù)據(jù)進(jìn)行分析,剔除,這個過程也就是提到的可靠性研究。
常見的剔除數(shù)據(jù)的方法就是使用箱型圖剔除異常值,如下是一個簡單的箱形圖:
將一組數(shù)據(jù)從大到小排列,分別計算出,
上四分位數(shù) 3: 75%分位點所對應(yīng)的值
中位數(shù) 2: 50%分位點對應(yīng)的值
下四分位數(shù) 1: 25%分位點所對應(yīng)的值
上邊緣(須): Q3+1.5(Q3-Q1)
下邊緣(須): Q1-1.5(Q3-Q1)
數(shù)據(jù) 的合理范圍為:
和使用3σ準(zhǔn)則剔除異常值相比,箱形圖不需要數(shù)據(jù)服從正態(tài)分布,能真實直觀的表現(xiàn)數(shù)據(jù)形狀;箱線圖以四分位數(shù)和四分位距作為判斷異常值的標(biāo)準(zhǔn),四分位數(shù)具有一定的耐抗性,多達(dá) 25%的數(shù)據(jù)可以變得任意遠(yuǎn)而不會很大地擾動四分位數(shù),使得異常值無法對數(shù)據(jù)形狀造成巨大影響,因此箱形圖識別異常值的結(jié)果比較客觀。
通過此方法剔除附件1的異常數(shù)據(jù),然后題目需要對數(shù)據(jù)質(zhì)量進(jìn)行可靠性研究,這里就分析哪幾個指標(biāo)的數(shù)據(jù)異常值多,更加分散即可。另外,對于一些離散型數(shù)據(jù),比如二值數(shù)據(jù)等,如果想要檢測異常值,只能以其他指標(biāo)作為輸入,當(dāng)前指標(biāo)為輸出進(jìn)行預(yù)測。查看預(yù)測值與真實值的差異來判斷,不建議這么做。
針對第一問的第二小問,即提取與飛行安全相關(guān)的部分關(guān)鍵數(shù)據(jù)項,并對其重要程度進(jìn)行分析,這部分可以使用相關(guān)性分析來提取重要程度,這一部分可以使用相關(guān)性的熱力圖進(jìn)行可視化,即下圖這種。根據(jù)目標(biāo)指標(biāo)的相關(guān)性系數(shù)排序,來確定重要程度。同樣的,這里也可以使用一些其他的評價類算法,比如灰色綜合評價法、模糊綜合評價法等方式進(jìn)行重要程度的排序與建模。
在第一問開始前,最好對數(shù)據(jù)集做一個初步的EDA(探索性數(shù)據(jù)分析),包括一些數(shù)據(jù)可視化。包含但不限于:
- 數(shù)據(jù)量、特征數(shù)量、數(shù)據(jù)類型
- 數(shù)據(jù)分布情況(標(biāo)準(zhǔn)差、分位數(shù)、最大最小值)
- 重復(fù)值處理(保留、刪除):假如你想發(fā)現(xiàn)某個用戶的行為模式,該用戶在不同的時間點進(jìn)行相同的操作,那這個重復(fù)值是不是能幫助你獲取該用戶的行為偏好(你的問題),那可以保留
- 異常值處理(保留、刪除):假如你正在做異常檢測的任務(wù),那這個信息能幫助你進(jìn)行有效的數(shù)據(jù)標(biāo)注(你的需要)
- 缺失值處理(刪除、填充)
這里推薦的數(shù)據(jù)可視化方法有:
單變量可視化:查看數(shù)據(jù)分布-直方圖、箱線圖
兩個變量的可視化:相關(guān)性分析-線圖、散點圖、熱力圖,比如:
問題 2:飛機(jī)在從起飛到著陸的整個飛行過程中,通過一系列的飛行操縱確保飛行安全,這些操縱主要包括橫滾操縱、俯仰操縱等。目前,國內(nèi)航空公司通過超限監(jiān)控飛行操縱動作,這種監(jiān)控方法雖然能夠快速分辨 出飛機(jī)的狀態(tài)偏差,但是只能告訴安全管理人員發(fā)生了什么,而不能立刻 得出發(fā)生這種偏差的原因。為此,可以通過操縱桿的過程變化情況來分析 產(chǎn)生這種偏差的原因。根據(jù)附件 1,請你們對飛行操縱進(jìn)行合理量化描述。下圖為 3 次著陸過程中的桿位變化曲線,其中紅色曲線描述了一次重著陸(著陸 G 值超過給定限制值)過程,該重著陸主要是由于飛行機(jī)組在低空有一次不當(dāng)松桿操縱所致,紅色曲線中的接地前 5 秒有一個明顯下凸,這就是需要進(jìn)行量化描述的一次松桿操縱。
問題二(小部分)分析:量化描述可以通過變化率、閾值等進(jìn)行描述,在判斷時同樣根據(jù)這些指標(biāo)來分辨,可以在這里設(shè)置置信區(qū)間等方式。這里可能需要進(jìn)行算法準(zhǔn)確率的分析。有時間,可以使用時間序列分析(比如arima)
這里可以做置信度、置信區(qū)間分析。還可以劃分訓(xùn)練集、測試集來直接計算精確率。這里還可以可視化ROC曲線等。
1.精確率(precision)
就precision而言有很多版本,各種說法不一,有精確率也有正確率更有甚者把準(zhǔn)確率也搞出來了實在受不了,反正咱們看英文precision。
precision是表示預(yù)測為正樣本中,被實際為正樣本的比例??梢钥闯鰌recision是考慮的正樣本被預(yù)測正確的比例.根據(jù)圖1-1可得其計算公式為:P = TP / (TP + FP)
2. 召回率(recall)
召回率是表示實際為正樣本中,預(yù)測為正樣本的比例。可以看出,召回率考慮的是正樣本的召回的比例.根據(jù)圖1-1可得其計算公式為:P = TP / (TP + FN)
3.準(zhǔn)確率(accuracy)
準(zhǔn)確率表示所有的預(yù)測樣本中,預(yù)測正確的比例.其計算公式為:A = (TP + TN) / (TP + FN + FP + TN)
總結(jié):精確率(accuracy)和召回率(recall)計算公式的分子都是TP也就是正樣本被預(yù)測為正樣本的數(shù)量,可知其為正樣本的精確率和正樣本的召回率.而準(zhǔn)確率(accuracy)主要表征的是整體預(yù)測正確的比例.
以上僅為第一、二問部分思路(后續(xù)完善),剩余部分思路、數(shù)據(jù)集和其他具體配套代碼、參考論文,以及其他題目思路,可以看文末群名片獲取
問題 3:導(dǎo)致不同超限發(fā)生的原因各不相同,有時是特定機(jī)場容易出現(xiàn)特定的超限,有時是特定的天氣容易出現(xiàn)特定的超限,有時是特定的飛 行員容易出現(xiàn)特定的超限。請研究附件 2 的數(shù)據(jù),對超限的不同情況進(jìn)行分析,研究不同超限的基本特征,如分析飛機(jī)在哪些航線或者在哪些機(jī)場 容易出現(xiàn)何種超限等。
問題 4:飛機(jī)運(yùn)行數(shù)據(jù)的研究一般分為兩大類,一類是通過航線運(yùn)行安全檢查(Line Operations Safety Audit,LOSA)獲取的飛行員的運(yùn)行表現(xiàn), 另外一類是根據(jù)相關(guān)學(xué)者建議,基于飛行參數(shù)開展飛行技術(shù)評估。根據(jù)附
件 3,請你們建立數(shù)學(xué)模型,探討一種基于飛行參數(shù)的飛行技術(shù)評估方法, 分析飛行員的飛行技術(shù),數(shù)據(jù)表中的“不同資質(zhì)”代表飛行員的不同技術(shù)級 別。
問題 5:隨著技術(shù)的進(jìn)步,未來在民航客機(jī)上安裝實時傳輸?shù)?QAR 數(shù)
據(jù)記錄系統(tǒng)已成為可能,這種“實時飛行數(shù)據(jù)”技術(shù),可以在接近實時的情 況下把航班飛行數(shù)據(jù)傳輸?shù)降孛娣治鱿到y(tǒng),極大地提高風(fēng)險識別能力和預(yù) 防水平。假設(shè)飛行數(shù)據(jù)已能實現(xiàn)陸空實時傳輸,如果你是該航空公司的安 全管理人員,請建立航空公司實時自動化預(yù)警機(jī)制,預(yù)防可能的安全事故 發(fā)生,結(jié)合附件 1 的數(shù)據(jù),給出仿真結(jié)果。
以上僅為第一、二問部分思路(后續(xù)完善),剩余部分思路、數(shù)據(jù)集和其他具體配套代碼、參考論文,以及其他題目思路,可以看文末群名片獲取文章來源:http://www.zghlxwxcb.cn/news/detail-415436.html
選題建議如下:2023Mathorcup高校數(shù)學(xué)建模挑戰(zhàn)賽ABCD選題建議_DS C君的博客-CSDN博客文章來源地址http://www.zghlxwxcb.cn/news/detail-415436.html
到了這里,關(guān)于2023MathorCup 高校數(shù)學(xué)建模挑戰(zhàn)賽D題思路解析的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!