国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)分析之Logistic回歸分析(二元邏輯回歸、多元有序邏輯回歸、多元無序邏輯回歸)

這篇具有很好參考價(jià)值的文章主要介紹了數(shù)據(jù)分析之Logistic回歸分析(二元邏輯回歸、多元有序邏輯回歸、多元無序邏輯回歸)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、Logistic回歸分類

在研究X對(duì)于Y的影響時(shí):

  • 如果Y為定量數(shù)據(jù),那么使用多元線性回歸分析;
  • 如果Y為定類數(shù)據(jù),那么使用Logistic回歸分析。

結(jié)合實(shí)際情況,可以將Logistic回歸分析分為3類:

  1. 二元Logistic回歸分析
  2. 多元有序Logistic回歸分析
  3. 多元無序Logistic回歸分析
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

Logistic回歸分析用于研究X對(duì)Y的影響,并且對(duì)X的數(shù)據(jù)類型沒有要求,X可以為定類數(shù)據(jù),也可以為定量數(shù)據(jù),但要求Y必須為定類數(shù)據(jù),并且根據(jù)Y的選項(xiàng)數(shù),使用相應(yīng)的數(shù)據(jù)分析方法。

  1. 如果Y有兩個(gè)選項(xiàng),如有和無、是和否,那么應(yīng)該使用二元Logistic回歸分析;
  2. 如果Y有多個(gè)選項(xiàng),并且各個(gè)選項(xiàng)之間可以對(duì)比大小,例如,1代表“輕度”,2代表“中度”,3代表“重度”,這3個(gè)選項(xiàng)具有對(duì)比意義,數(shù)值越高,代表樣本的嚴(yán)重程度越高,那么應(yīng)該使用多元有序Logistic回歸分析;
  3. 如果Y有多個(gè)選項(xiàng),并且各個(gè)選項(xiàng)之間不具有對(duì)比意義,例如,1代表“唱”,2代表“跳”,3代表“Rap”,4代表“籃球”,數(shù)值僅代表不同類別,數(shù)值大小不具有對(duì)比意義,那么應(yīng)該使用多元無序Logistic回歸分析。

2、二元邏輯回歸

因變量為二分類變量,自變量可以為連續(xù)型變量也可以為分類變量,預(yù)測(cè)自變量和因變量之間的顯著關(guān)系。

使用二元Logistic回歸模型前,需判斷是否滿足以下七個(gè)研究假設(shè):

  1. 假設(shè)1:因變量即結(jié)局是二分類變量。
  2. 假設(shè)2:有至少1個(gè)自變量,自變量可以是連續(xù)變量,也可以是分類變量。
  3. 假設(shè)3:每條觀測(cè)間相互獨(dú)立。分類變量(包括因變量和自變量)的分類必須全面且每一個(gè)分類間互斥。
  4. 假設(shè)4:最小樣本量要求為自變量數(shù)目的15倍,也有一些研究者認(rèn)為樣本量應(yīng)達(dá)到自變量數(shù)目的50倍
  5. 假設(shè)5:連續(xù)的自變量與因變量的logit轉(zhuǎn)換值之間存在線性關(guān)系。
  6. 假設(shè)6:自變量間不存在共線性。
  7. 假設(shè)7:沒有明顯的離群點(diǎn)、杠桿點(diǎn)和強(qiáng)影響點(diǎn)。

參考鏈接:https://www.zhihu.com/question/34502688/answer/329779658

2.1 二元邏輯回歸分析步驟

在進(jìn)行二元logistic回歸分析之前,需要進(jìn)行一些準(zhǔn)備工作,來提高分析結(jié)果的準(zhǔn)確性。準(zhǔn)備工作包括進(jìn)行分析項(xiàng)即自變量的確定、多重共線性判斷、以及變量處理三方面。
多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

2.1.1 確定分析項(xiàng)(自變量的確定)

因?yàn)橛绊懸蛩乇容^多,并不能確定單個(gè)影響因素是否會(huì)對(duì)因變量產(chǎn)生影響,為了篩選確實(shí)對(duì)因變量有影響的自變量進(jìn)行分析,可以在進(jìn)行二元logistic回歸分析之前就單個(gè)因素的影響情況進(jìn)行分析(非必要步驟)。根據(jù)影響因素類型不同,可以分別進(jìn)行方差分析(t檢驗(yàn))、卡方檢驗(yàn)進(jìn)行分析。

  • 連續(xù)變量使用方差分析
  • 分類變量使用卡方檢驗(yàn)

從方差分析和卡方檢驗(yàn)的結(jié)果來看,如果顯著性差異P<0.05,則對(duì)此變量予以保留,但并不是P>0.05的變量都要摒棄,一般我們可以將顯著性水平P值放寬至0.1、0.2都可以,這是為了以防遺漏重要因素,當(dāng)然也可以在不滿足顯著性水平的自變量中挑選現(xiàn)實(shí)中或臨床上覺得有意義的指標(biāo),但是納入模型的自變量不是越多越好,原因如下:

  • 當(dāng)自變量過多的時(shí)候,為了避免回歸模型過擬合,因此我們會(huì)基于P值差異性檢驗(yàn)選擇變量,這種方法通過設(shè)定一個(gè)P值閾值(如0.1、0.2)來篩選變量,只有那些P值小于閾值的變量才會(huì)被包括在模型中。這種方法可以幫助簡化模型,減少不必要的變量,但也可能排除一些實(shí)際上對(duì)模型預(yù)測(cè)有貢獻(xiàn)的變量。
  • 如果將所有自變量放入模型,這種方法可能會(huì)包括所有可能影響因變量的變量,但這也可能導(dǎo)致模型過擬合,即模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但在新的、未見過的數(shù)據(jù)上表現(xiàn)不佳。此外,過多的自變量可能導(dǎo)致模型解釋性差,因?yàn)楹茈y確定哪些變量真正對(duì)結(jié)果有顯著影響。
  • 有效納入分析的數(shù)據(jù)量不能過少,一般我們認(rèn)為數(shù)據(jù)量至少是自變量數(shù)目的5~10倍。

2.1.2 多重共線性判斷

在模型納入模型時(shí),納入的變量也要考慮到變量之間的多重共線性,如果模型中的變量之間存在高度相關(guān)性,可能需要考慮移除一些相關(guān)性高的變量,以減少模型的復(fù)雜性,原因如下:

  1. 影響模型穩(wěn)定性:多重共線性意味著模型中的兩個(gè)或多個(gè)自變量高度相關(guān)。這會(huì)導(dǎo)致模型的參數(shù)估計(jì)不穩(wěn)定,小的數(shù)據(jù)變化可能導(dǎo)致估計(jì)系數(shù)的大幅度波動(dòng)。
  2. 降低模型解釋能力:當(dāng)存在多重共線性時(shí),很難確定是哪一個(gè)自變量對(duì)因變量有顯著影響,因?yàn)樗鼈冎g的影響可能會(huì)相互掩蓋。這降低了模型的解釋能力,使得研究者難以解釋模型結(jié)果。
  3. 影響模型預(yù)測(cè)能力:由于參數(shù)估計(jì)的不穩(wěn)定性,多重共線性可能會(huì)降低模型的預(yù)測(cè)準(zhǔn)確性。模型可能在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但在新的、未見過的數(shù)據(jù)上表現(xiàn)不佳。
  4. 統(tǒng)計(jì)顯著性問題:多重共線性可能導(dǎo)致統(tǒng)計(jì)檢驗(yàn)的P值不準(zhǔn)確,使得原本不顯著的變量被錯(cuò)誤地認(rèn)為顯著,或者相反,顯著的變量被錯(cuò)誤地忽略。
  5. 模型復(fù)雜性:多重共線性可能導(dǎo)致模型過于復(fù)雜,包含不必要的變量,這不僅增加了模型的計(jì)算成本,也可能使得模型難以理解和應(yīng)用。

為了判斷多重共線性,常用的統(tǒng)計(jì)量包括方差膨脹因子(Variance Inflation Factor, VIF)和容忍度(Tolerance)。VIF值大于10通常被認(rèn)為是嚴(yán)重的多重共線性。如果發(fā)現(xiàn)模型中存在多重共線性,可以采取以下措施:

  • 移除相關(guān)性高的變量:從模型中移除一些高度相關(guān)的自變量。
  • 合并變量:如果兩個(gè)變量高度相關(guān),可以考慮將它們合并為一個(gè)新的變量。
  • 增加樣本量:有時(shí)候,增加樣本量可以減輕共線性問題。
  • 使用主成分分析(PCA)或因子分析:這些方法可以減少變量的數(shù)量,同時(shí)保留大部分信息。

在進(jìn)行二元邏輯回歸之前,確保模型中沒有嚴(yán)重的多重共線性,可以幫助提高模型的穩(wěn)定性、解釋能力和預(yù)測(cè)能力。

共線性診斷SPSS流程:

  • 1、分析–>回歸–>線性
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
  • 2、填入因變量 --> 填入自變量 --> 統(tǒng)計(jì)量 --> 勾選共線性診斷
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
  • 3、結(jié)果展示
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
    從上表可以看出,VIF值均小于10,說明模型并不存在共線性問題。如果存在共線性問題可使用嶺回歸或者逐步回歸進(jìn)行解決。

2.1.3 數(shù)據(jù)預(yù)處理

在進(jìn)行二元邏輯回歸之前,進(jìn)行數(shù)據(jù)預(yù)處理是一個(gè)關(guān)鍵步驟,原因包括:

  1. 提高模型準(zhǔn)確性:通過預(yù)處理,可以確保數(shù)據(jù)的質(zhì)量,減少噪聲和異常值的影響,從而提高模型的預(yù)測(cè)準(zhǔn)確性。
  2. 處理缺失值:數(shù)據(jù)集中的缺失值會(huì)影響模型的訓(xùn)練。預(yù)處理可以幫助決定如何處理這些缺失值,例如通過刪除、填充或使用模型預(yù)測(cè)缺失值。
  3. 變量轉(zhuǎn)換:某些變量可能需要轉(zhuǎn)換(如對(duì)數(shù)轉(zhuǎn)換、標(biāo)準(zhǔn)化、歸一化等)以滿足線性回歸模型的假設(shè),或者改善變量與因變量之間的關(guān)系。
  4. 處理異常值:異常值可能會(huì)扭曲模型的參數(shù)估計(jì)。通過識(shí)別和處理異常值,可以避免這些極端值對(duì)模型的影響。
  5. 變量選擇:通過預(yù)處理,可以進(jìn)行變量選擇,移除不相關(guān)或冗余的變量,從而簡化模型并減少多重共線性的風(fēng)險(xiǎn)。
  6. 編碼分類變量:邏輯回歸模型通常需要數(shù)值輸入,因此需要將分類變量(如性別、種族等)轉(zhuǎn)換為數(shù)值形式,如使用啞變量編碼。
  7. 平衡數(shù)據(jù)集:在二元邏輯回歸中,如果數(shù)據(jù)集中的兩個(gè)類別(如0和1)分布極不平衡,可能需要進(jìn)行過采樣或欠采樣來平衡數(shù)據(jù)集,以避免模型偏向于多數(shù)類。
  8. 理解數(shù)據(jù)結(jié)構(gòu):預(yù)處理過程中的數(shù)據(jù)探索可以幫助研究者更好地理解數(shù)據(jù)的結(jié)構(gòu)和潛在問題,為模型的建立提供指導(dǎo)。
  9. 提高計(jì)算效率:清洗和預(yù)處理數(shù)據(jù)可以減少不必要的計(jì)算,提高模型訓(xùn)練的效率。
  10. 確保模型假設(shè):邏輯回歸模型有一些基本假設(shè),如線性關(guān)系、獨(dú)立性等。預(yù)處理可以幫助確保數(shù)據(jù)滿足這些假設(shè),從而使得模型結(jié)果更可靠。

數(shù)據(jù)啞變量處理:

  1. 因變量0-1編碼:二元logistic回歸分析要求因變量必須用數(shù)字0、1進(jìn)行編碼,即“是”用1表示,“否”用0表示。
  2. 2 分類自變量啞變量處理:二元logistic回歸分析中自變量既可以是定量數(shù)據(jù)也可以是分類數(shù)據(jù),如果是分類數(shù)據(jù)需要進(jìn)行啞變量處理,在分析時(shí)將生成的啞變量少放一項(xiàng),作為參考項(xiàng)。在進(jìn)行分析時(shí),對(duì)于嚴(yán)重程度【正常、輕、中、重度】4個(gè)啞變量,需要保留一項(xiàng)作為對(duì)照項(xiàng),不放進(jìn)分析框中。比如將“正?!弊鳛閷?duì)照項(xiàng),則不將該啞變量放入分析框中,將剩下的3類程度放進(jìn)分析框中。

2.2 SPSS二元邏輯回歸流程

  • 1、分析–>回歸–>二元Logistic
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
  • 2、填入因變量–>填入自變量
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
  • 3、選項(xiàng)–>勾選【Hosmer-Lemeshow擬合度】–>勾選【exp(B)的CI(X)】–>勾選【在最后一個(gè)步驟中】
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

2.3 模型擬合評(píng)價(jià)

二元logistic回歸分析的模型擬合情況判斷可以分為兩類,分別是:

  • 模型系數(shù)的綜合檢驗(yàn)
  • Hosmer-Lemeshow擬合度檢驗(yàn)

2.2.1 模型系數(shù)的綜合檢驗(yàn)

  • 模型系數(shù)的綜合檢驗(yàn)用于對(duì)整體模型的有效性進(jìn)行檢驗(yàn);
  • 模型系數(shù)的綜合檢驗(yàn)通常是指對(duì)模型中所有自變量系數(shù)的聯(lián)合顯著性進(jìn)行檢驗(yàn)。在二元邏輯回歸中,這通常涉及到檢驗(yàn)所有自變量系數(shù)是否同時(shí)等于零。如果檢驗(yàn)結(jié)果表明這些系數(shù)顯著不為零,那么我們可以認(rèn)為模型中的自變量集合對(duì)因變量有顯著影響。

多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

從上圖可以看出,模型系數(shù)的綜合檢驗(yàn)的p值小于0.05,說明模型是有效的,反之說明模型無效。

在二元邏輯回歸分析中,Cox & Snell R方和Nagelkerke R方都是用來衡量模型擬合優(yōu)度的指標(biāo),它們提供了模型解釋變量對(duì)響應(yīng)變量變異性的量化度量。由于邏輯回歸模型的輸出是概率,而不是線性回歸中的直接響應(yīng)變量,因此不能直接使用傳統(tǒng)的R方來衡量模型的擬合優(yōu)度。Cox& Snell R方和Nagelkerke R方作為偽R方,提供了一種替代的方法。

  1. Cox & Snell R方:

    • Cox & Snell R方衡量的是模型相對(duì)于一個(gè)只有截距的模型(即沒有自變量的模型)的改進(jìn)程度。
      多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

    • Cox & Snell R方的值范圍在0到1之間,值越大表示模型的擬合越好。但是,它的最大值通常小于1,這意味著它不能完全反映模型的解釋能力。

  2. Nagelkerke R方:

    • Nagelkerke R方是對(duì)Cox & Snell R方的調(diào)整,使其最大值可以達(dá)到1,從而提供了一個(gè)更直觀的衡量模型擬合優(yōu)度的指標(biāo)。
      多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
    • Nagelkerke R方的值范圍也是0到1,它考慮了模型中自變量的數(shù)量,因此在比較包含不同數(shù)量自變量的模型時(shí)更為公平。

在實(shí)際應(yīng)用中,Cox & Snell R方和Nagelkerke
R方通常都會(huì)被報(bào)告,因?yàn)樗鼈兲峁┝藦牟煌嵌仍u(píng)估模型擬合優(yōu)度的方法。然而,需要注意的是,這些偽R方值并不像線性回歸中的R方那樣直接反映模型解釋的方差比例,它們的值通常較小,且在比較不同模型時(shí)需要謹(jǐn)慎。此外,這些指標(biāo)的值不應(yīng)該被用來跨數(shù)據(jù)集比較模型的擬合優(yōu)度,而應(yīng)該在同一數(shù)據(jù)集內(nèi)比較不同模型的擬合程度。在解釋這些指標(biāo)時(shí),應(yīng)該結(jié)合模型的其他方面,如預(yù)測(cè)準(zhǔn)確性、變量的顯著性以及模型的實(shí)際應(yīng)用價(jià)值。

2.2.2 Hosmer-Lemeshow擬合度檢驗(yàn)

Hosmer-Lemeshow擬合度檢驗(yàn)是用于評(píng)估二元邏輯回歸模型擬合優(yōu)度的一種統(tǒng)計(jì)方法。這種檢驗(yàn)的目的是檢查模型預(yù)測(cè)的概率與實(shí)際觀測(cè)到的概率之間是否存在顯著差異。如果模型預(yù)測(cè)的概率與實(shí)際概率非常接近,那么我們可以認(rèn)為模型擬合得較好;如果存在顯著差異,則表明模型可能沒有很好地捕捉到數(shù)據(jù)中的信息。

Hosmer-Lemeshow檢驗(yàn)的步驟如下:

  1. 計(jì)算預(yù)測(cè)概率:對(duì)于模型中的每個(gè)觀測(cè)值,使用邏輯回歸模型計(jì)算出因變量發(fā)生的概率。

  2. 分組:將所有觀測(cè)值根據(jù)預(yù)測(cè)概率分成若干組(通常為10組),每組包含大約10%的觀測(cè)值。分組的目的是將預(yù)測(cè)概率相近的觀測(cè)值放在一起。

  3. 計(jì)算觀察頻率和預(yù)期頻率:對(duì)于每組,計(jì)算實(shí)際發(fā)生因變量的觀測(cè)頻率(即實(shí)際發(fā)生的事件數(shù)除以該組的總觀測(cè)數(shù))和預(yù)期頻率(即根據(jù)模型預(yù)測(cè)概率計(jì)算的預(yù)期事件數(shù))。

  4. 計(jì)算卡方統(tǒng)計(jì)量:使用觀察頻率和預(yù)期頻率計(jì)算卡方統(tǒng)計(jì)量。這個(gè)統(tǒng)計(jì)量衡量了觀察到的事件數(shù)與預(yù)期事件數(shù)之間的差異。

  5. 確定P值:將計(jì)算出的卡方統(tǒng)計(jì)量與相應(yīng)的卡方分布進(jìn)行比較,以確定P值。P值表示在模型正確的情況下,觀察到當(dāng)前或更極端的卡方統(tǒng)計(jì)量的概率。

  6. 做出決策:如果P值大于預(yù)先設(shè)定的顯著性水平(通常為0.05),則沒有足夠的證據(jù)拒絕模型擬合良好的假設(shè),即模型擬合度可接受。如果P值小于顯著性水平,則拒絕模型擬合良好的假設(shè),表明模型可能不適合數(shù)據(jù)。

Hosmer-Lemeshow檢驗(yàn)的一個(gè)關(guān)鍵點(diǎn)是選擇分組的數(shù)量。分組數(shù)量的選擇可能會(huì)影響檢驗(yàn)的結(jié)果,因此在實(shí)際應(yīng)用中需要謹(jǐn)慎選擇。此外,這種檢驗(yàn)假設(shè)模型中的預(yù)測(cè)變量與因變量之間存在線性關(guān)系,如果這種假設(shè)不成立,檢驗(yàn)結(jié)果可能不準(zhǔn)確。

多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

Hosmer-Lemeshow擬合度檢驗(yàn)(簡寫為HL檢驗(yàn))用于判斷模型擬合優(yōu)度。p值大于0.05則說明通過HL檢驗(yàn),反之則說明模型沒有通過HL檢驗(yàn),模型擬合優(yōu)度差。從上表可知:檢驗(yàn)對(duì)應(yīng)的 p值大于0.05,說明本次模型通過HL檢驗(yàn),模型擬合優(yōu)度較好。

2.3 回歸分析結(jié)果解讀

多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)

2.3.1 sig.(全稱是significance)

  • 在統(tǒng)計(jì)學(xué)中,“sig” 是 "significance"的縮寫,它通常用來表示統(tǒng)計(jì)顯著性。統(tǒng)計(jì)顯著性是指在進(jìn)行假設(shè)檢驗(yàn)時(shí),觀察到的數(shù)據(jù)與原假設(shè)(null hypothesis)之間的差異是否足夠大,以至于不太可能僅僅是由于隨機(jī)變異造成的。換句話說,它衡量的是拒絕原假設(shè)的證據(jù)強(qiáng)度。
  • 在實(shí)際應(yīng)用中,研究者會(huì)設(shè)定一個(gè)顯著性水平(α),這個(gè)水平通常設(shè)定為0.05、0.01或其他閾值,取決于研究的具體情況和領(lǐng)域標(biāo)準(zhǔn)。如果計(jì)算出的P值(概率值)小于這個(gè)顯著性水平,那么結(jié)果被認(rèn)為是統(tǒng)計(jì)顯著的(sig.),這意味著有足夠的證據(jù)拒絕原假設(shè),認(rèn)為觀察到的效應(yīng)或差異是真實(shí)的。
  • 例如,如果一個(gè)研究的顯著性水平設(shè)定為0.05,而計(jì)算出的P值為0.03,那么這個(gè)結(jié)果就是統(tǒng)計(jì)顯著的(sig.),因?yàn)镻值小于0.05。這表明觀察到的數(shù)據(jù)不太可能僅僅是由于隨機(jī)因素產(chǎn)生的,從而支持了備擇假設(shè)(alternative hypothesis)。
  • 在二元邏輯回歸結(jié)果中,如果sig.小于研究者設(shè)定的顯著性水平(一般為0.05),那么研究者會(huì)拒絕原假設(shè),認(rèn)為該自變量對(duì)因變量(響應(yīng)變量)有顯著的影響。在這種情況下,我們說該自變量在統(tǒng)計(jì)上是顯著的。
  • 只有在自變量P值小于設(shè)定的顯著性水平值時(shí),此自變量才納入模型中。

2.3.2 B(回歸系數(shù))

  1. 在二元邏輯回歸結(jié)果中,“B” 通常指的是回歸系數(shù),也就是偏回歸系數(shù)。在邏輯回歸模型中,這些系數(shù)表示的是自變量(解釋變量)對(duì)因變量(通常是二分類的響應(yīng)變量)的對(duì)數(shù)幾率(log odds)的影響。每個(gè)回歸系數(shù)代表了在其他自變量保持不變的情況下,相應(yīng)自變量每增加一個(gè)單位,對(duì)數(shù)幾率的變化量。

  2. 偏回歸系數(shù)是在控制了模型中所有其他自變量的影響后,單個(gè)自變量對(duì)因變量的影響。在邏輯回歸中,由于模型的性質(zhì),回歸系數(shù)和偏回歸系數(shù)是相同的。這意味著,當(dāng)我們談?wù)?“B” 值時(shí),我們實(shí)際上是在討論在給定其他自變量的情況下,每個(gè)自變量對(duì)因變量對(duì)數(shù)幾率的邊際影響。

  3. 在輸出結(jié)果中,每個(gè)自變量的回歸系數(shù)(B)旁邊通常會(huì)有一個(gè)標(biāo)準(zhǔn)誤差(SE)和P值,用于評(píng)估該系數(shù)的統(tǒng)計(jì)顯著性。如果P值小于顯著性水平(如0.05),則認(rèn)為該自變量在統(tǒng)計(jì)上顯著,即它對(duì)因變量有顯著的影響。

B(或稱為回歸系數(shù))的大小和符號(hào)代表了自變量(解釋變量)對(duì)因變量(響應(yīng)變量)的影響程度和方向。具體來說:

B的大?。?/p>

  • B的絕對(duì)值越大,表示自變量每變化一個(gè)單位,因變量發(fā)生的概率變化越大。
  • 換句話說,自變量對(duì)因變量的影響越強(qiáng)。 在邏輯回歸中,B的值通常被解釋為對(duì)數(shù)幾率(log odds)的變化。
  • 例如,如果B的值為0.5,那么自變量每增加一個(gè)單位,因變量發(fā)生的概率大約會(huì)增加到原來的1.65倍(因?yàn)?/li>

B的符號(hào):

  • B的符號(hào)表示自變量對(duì)因變量影響的方向。
  • 如果B為正,表示自變量與因變量呈正相關(guān),即自變量的增加會(huì)導(dǎo)致因變量發(fā)生的概率增加。
  • 如果B為負(fù),表示自變量與因變量呈負(fù)相關(guān),即自變量的增加會(huì)導(dǎo)致因變量發(fā)生的概率減少。

在解釋邏輯回歸模型的系數(shù)時(shí),還需要注意以下幾點(diǎn):

  • 解釋系數(shù)時(shí)要考慮模型的整體:單個(gè)系數(shù)的解釋需要在模型的整體背景下進(jìn)行,因?yàn)槟P椭械钠渌兞靠赡軙?huì)影響特定系數(shù)的解釋。
  • 考慮系數(shù)的顯著性:通常,我們會(huì)計(jì)算每個(gè)系數(shù)的標(biāo)準(zhǔn)誤差和對(duì)應(yīng)的P值,以判斷該系數(shù)是否在統(tǒng)計(jì)上顯著。如果P值小于顯著性水平(如0.05),則認(rèn)為該系數(shù)顯著,即自變量對(duì)因變量的影響是統(tǒng)計(jì)上顯著的。
  • 考慮模型的其他統(tǒng)計(jì)指標(biāo):除了單個(gè)系數(shù),還需要考慮模型的整體擬合優(yōu)度(如偽R方)、模型的預(yù)測(cè)能力以及模型中可能存在的多重共線性等問題。

總之,B的大小和符號(hào)在二元邏輯回歸中提供了自變量對(duì)因變量影響程度和方向的重要信息,但這些信息需要結(jié)合模型的其他統(tǒng)計(jì)指標(biāo)和背景來綜合解釋。

2.3.3 Wald

  1. 在二元邏輯回歸分析中,"Wald"通常指的是Wald統(tǒng)計(jì)量,這是一種用于檢驗(yàn)?zāi)P椭袉蝹€(gè)自變量系數(shù)顯著性的統(tǒng)計(jì)方法。Wald統(tǒng)計(jì)量是基于最大似然估計(jì)(MLE)的,它衡量的是模型中某個(gè)特定參數(shù)的估計(jì)值與零的差異程度。

  2. 在二元邏輯回歸模型中,Wald統(tǒng)計(jì)量用于檢驗(yàn)每個(gè)自變量的系數(shù)是否顯著不為零。如果一個(gè)自變量的Wald統(tǒng)計(jì)量顯著(即對(duì)應(yīng)的P值小于預(yù)先設(shè)定的顯著性水平,如0.05),則認(rèn)為該自變量對(duì)因變量有顯著影響。換句話說,這個(gè)自變量在模型中是重要的,不應(yīng)該被移除。

  3. Wald統(tǒng)計(jì)量的計(jì)算公式通常如下:
    多元回歸logistic分析有四個(gè)組,數(shù)據(jù)分析,邏輯回歸,統(tǒng)計(jì)學(xué)
    其中:

    • β^是自變量系數(shù)的估計(jì)值。
    • SE( β^) 是估計(jì)值的標(biāo)準(zhǔn)誤差。
  4. Wald統(tǒng)計(jì)量遵循卡方分布,其自由度等于自變量的系數(shù)個(gè)數(shù)。在實(shí)際應(yīng)用中,Wald統(tǒng)計(jì)量的結(jié)果通常與P值一起報(bào)告,P值提供了在零假設(shè)(自變量系數(shù)為零)下觀察到當(dāng)前統(tǒng)計(jì)量或更極端情況的概率。如果P值小于顯著性水平,我們拒絕零假設(shè),認(rèn)為自變量對(duì)因變量有顯著影響。

  5. Wald統(tǒng)計(jì)量的大小代表了自變量系數(shù)估計(jì)值相對(duì)于其標(biāo)準(zhǔn)誤差的大小。具體來說,Wald統(tǒng)計(jì)量是一個(gè)比值,它衡量的是估計(jì)的系數(shù)(β)與零(即沒有影響)之間的差異程度,相對(duì)于估計(jì)系數(shù)的標(biāo)準(zhǔn)誤差(SE( β^))。

  6. Wald統(tǒng)計(jì)量的大小可以解釋如下:

    • 如果Wald統(tǒng)計(jì)量較大,意味著估計(jì)的系數(shù)與零的差異較大,這通常表明自變量對(duì)因變量有較強(qiáng)的影響,且這種影響在統(tǒng)計(jì)上不太可能是偶然發(fā)生的。在這種情況下,對(duì)應(yīng)的P值通常較小,表明自變量在統(tǒng)計(jì)上是顯著的。

    • 如果Wald統(tǒng)計(jì)量較小,意味著估計(jì)的系數(shù)與零的差異不大,這可能表明自變量對(duì)因變量的影響較弱或不顯著。在這種情況下,對(duì)應(yīng)的P值較大,可能不會(huì)拒絕零假設(shè),即認(rèn)為自變量對(duì)因變量沒有顯著影響。

在實(shí)際應(yīng)用中,Wald統(tǒng)計(jì)量的大小可以幫助研究者理解每個(gè)自變量在模型中的重要性。然而,需要注意的是,Wald統(tǒng)計(jì)量的大小并不直接反映影響的大小或方向,它只是用來檢驗(yàn)系數(shù)是否顯著不為零。影響的大小和方向通常通過系數(shù)的估計(jì)值(β^)和其解釋(如比值比(Odds Ratio))來解釋。

2.3.4 EXP(B)及EXP(B)的95%C.I.上下限

在二元邏輯回歸結(jié)果中,EXP(B) 通常指的是回歸系數(shù)(B)的指數(shù)化,也就是比值比(Odds Ratio,簡稱OR)。這個(gè)值用于解釋自變量對(duì)因變量的影響強(qiáng)度和方向。EXP(B) 的95%置信區(qū)間(C.I.)提供了一個(gè)范圍,用于估計(jì)這個(gè)比值比的真實(shí)值在多大程度上是可信的。

  1. EXP(B):
    EXP(B) 表示的是自變量每變化一個(gè)單位,因變量發(fā)生的幾率比(odds ratio)的變化。如果 EXP(B) 大于1,表示自變量的增加與因變量發(fā)生幾率的增加相關(guān);如果 EXP(B) 小于1,表示自變量的增加與因變量發(fā)生幾率的減少相關(guān);如果 EXP(B) 等于1,表示自變量的變化與因變量發(fā)生幾率無關(guān)。

    在邏輯回歸中,OR值(Odds Ratio)用于衡量自變量與因變量之間關(guān)聯(lián)的強(qiáng)度和方向。OR值的解釋依賴于其數(shù)值大?。ㄈ绻蜃兞看淼氖且粋€(gè)不希望發(fā)生的結(jié)果時(shí)):

    • 如果OR值大于1,通常表示自變量與因變量之間存在正相關(guān),即自變量的增加與因變量的發(fā)生風(fēng)險(xiǎn)增加相關(guān),此時(shí)自變量被視為危險(xiǎn)因素。
    • 如果OR值小于1,表示自變量與因變量之間存在負(fù)相關(guān),即自變量的增加與因變量的發(fā)生風(fēng)險(xiǎn)減少相關(guān),此時(shí)自變量被視為保護(hù)因素。
    • 如果OR值等于1,表示自變量與因變量之間沒有顯著的關(guān)聯(lián)。

    在二元邏輯回歸中,當(dāng)OR值(Odds Ratio,幾率比)大于1時(shí),確實(shí)表示自變量與因變量之間存在正向關(guān)聯(lián)。這意味著自變量的增加與因變量發(fā)生的幾率增加相關(guān)。然而,是否將這種正向關(guān)聯(lián)解釋為“危險(xiǎn)性因素”取決于因變量的性質(zhì):

    • 如果因變量代表的是一個(gè)不希望發(fā)生的結(jié)果(例如疾病、事故等),那么自變量的正向關(guān)聯(lián)(OR > 1)通常被視為危險(xiǎn)性因素,因?yàn)樗黾恿瞬幌MY(jié)果發(fā)生的風(fēng)險(xiǎn)。
    • 相反,如果因變量代表的是一個(gè)積極的結(jié)果(例如康復(fù)、成功等),那么自變量的正向關(guān)聯(lián)(OR >1)可能被視為保護(hù)性因素,因?yàn)樗黾恿朔e極結(jié)果發(fā)生的可能性。
  2. 95% C.I. 上下限:
    95%置信區(qū)間的上下限提供了一個(gè)范圍,表示我們可以有95%的把握認(rèn)為真實(shí)的比值比落在這個(gè)區(qū)間內(nèi)。如果這個(gè)區(qū)間不包含1,那么我們可以認(rèn)為自變量對(duì)因變量的影響在統(tǒng)計(jì)上是顯著的。

  3. 大小和符號(hào)的解釋:

    • EXP(B) 的大小表示自變量對(duì)因變量影響的強(qiáng)度。值越大,表示影響越強(qiáng);值越小,表示影響越弱。
    • EXP(B) 的符號(hào)表示影響的方向。大于1表示正向影響,小于1表示負(fù)向影響。

    例如:文章來源地址http://www.zghlxwxcb.cn/news/detail-839285.html

    • 如果一個(gè)自變量的 EXP(B) 為2.5,95% C.I.上下限分別為1.5和4.0,這意味著我們可以有95%的把握認(rèn)為該自變量每增加一個(gè)單位,因變量發(fā)生的幾率比真實(shí)值在1.5到4.0之間。由于這個(gè)區(qū)間不包含1,我們可以認(rèn)為這個(gè)自變量對(duì)因變量有顯著的正向影響。
    • 當(dāng)一個(gè)自變量的EXP(B)的95%置信區(qū)間(C.I.)跨越了1(例如,上下限分別為0.5和4.0),這意味著我們不能確定該自變量對(duì)因變量的影響是正向的還是負(fù)向的,或者是否有顯著影響。
      • 由于在這種情況下,置信區(qū)間包含了1,表明真實(shí)的幾率比(Odds Ratio)可能大于1(正向影響),也可能小于1(負(fù)向影響),或者恰好等于1(沒有影響)。
      • 由于95% C.I.的下限為0.5,這表明如果自變量增加一個(gè)單位,因變量發(fā)生的幾率可能會(huì)減少(因?yàn)?.5小于1)。
      • 由于同時(shí),由于上限為4.0,這也表明因變量發(fā)生的幾率可能會(huì)增加。因此,我們不能得出關(guān)于自變量影響方向的明確結(jié)論,只能說在當(dāng)前的數(shù)據(jù)和模型下,自變量對(duì)因變量的影響是不確定的。
      • 在實(shí)際研究中,遇到這種情況時(shí),研究者通常會(huì)謹(jǐn)慎地解釋結(jié)果,指出自變量的影響方向和顯著性是不確定的,并可能需要更多的數(shù)據(jù)或進(jìn)一步的研究來探索這一關(guān)系。同時(shí),研究者也可能會(huì)考慮模型的假設(shè)、數(shù)據(jù)的質(zhì)量和可能的混雜因素,以確保分析的準(zhǔn)確性。

3、多元有序邏輯回歸

4、多元無序邏輯回歸

待續(xù)。。。。。。

到了這里,關(guān)于數(shù)據(jù)分析之Logistic回歸分析(二元邏輯回歸、多元有序邏輯回歸、多元無序邏輯回歸)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包