国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

第四章 數(shù)據(jù)關聯(lián)分析方法

這篇具有很好參考價值的文章主要介紹了第四章 數(shù)據(jù)關聯(lián)分析方法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

基本概念和方法

關聯(lián)規(guī)則和算法應用

基本概念和術語

關聯(lián)規(guī)則算法應用:

一個關聯(lián)規(guī)則分析的例子—————超市購物籃分析

第四章 數(shù)據(jù)關聯(lián)分析方法

?第四章 數(shù)據(jù)關聯(lián)分析方法

第四章 數(shù)據(jù)關聯(lián)分析方法

?第四章 數(shù)據(jù)關聯(lián)分析方法不要看

后面數(shù)字看不懂

?第四章 數(shù)據(jù)關聯(lián)分析方法

第四章 數(shù)據(jù)關聯(lián)分析方法

?第四章 數(shù)據(jù)關聯(lián)分析方法

?項集:是指項的集合。包含k個項的項集稱為k-項集

支持度:若A是一個項集,則A的支持度表示在所有事務T中同時出現(xiàn)A項集的概率

置信度:A出現(xiàn)的次數(shù)除以A和B同時出現(xiàn)的次數(shù)。

第四章 數(shù)據(jù)關聯(lián)分析方法

?頻繁項集:支持度滿足最小支持度閾值的項集稱為頻繁項集。通常k-項集如果滿足最小支持度閾值,稱為頻繁集,記作Lk。

關聯(lián)規(guī)則(Association Rule):可以表示為一個蘊含式。

如:X=>Y,X和Y分別稱為關聯(lián)規(guī)則的前件和后件。

關聯(lián)規(guī)則是否可用,需要考察他的支持度和置信度(可信度)兩個指標。

第四章 數(shù)據(jù)關聯(lián)分析方法

?可以通過以下實例來理解:

第四章 數(shù)據(jù)關聯(lián)分析方法

?置信度等于兩者出現(xiàn)的支持度和前者出現(xiàn)的支持度之比。

第四章 數(shù)據(jù)關聯(lián)分析方法

??第四章 數(shù)據(jù)關聯(lián)分析方法

?第四章 數(shù)據(jù)關聯(lián)分析方法

?第四章 數(shù)據(jù)關聯(lián)分析方法

第四章 數(shù)據(jù)關聯(lián)分析方法

?經典的Apriori關聯(lián)規(guī)則算法

第四章 數(shù)據(jù)關聯(lián)分析方法

?Apriori關聯(lián)規(guī)則算法基本思想

Apriori的基本思想:頻繁項集的任何非空子集也一定是頻繁的。

核心思想:掃描數(shù)據(jù)獲得所有的頻繁1項集L1,利用L1查找頻繁2項集,如此循環(huán)直到不再有新的頻繁集被找到為止。而獲取不同長度的頻繁項集之前,都需要先查找到候選集(支持度滿足最小支持度閾值的項集)。

?如何生成候選集呢?
第四章 數(shù)據(jù)關聯(lián)分析方法

?先自連接再進行修剪。

這個例子非常重要,比較容易理解。

第四章 數(shù)據(jù)關聯(lián)分析方法

支持度(sup)就是數(shù)出在數(shù)據(jù)集D中itemset出現(xiàn)的次數(shù)

{1,2,3}.{1,2,3,5},{1,3,5},{2,3,5}再進行修剪,他們的子集都必須在L2里面。

去除{1,2,3},{1,2,3,5},{1,3,5}

得到C3{2,3,5}

Apriori算法的缺點:

多次掃描數(shù)據(jù)庫,產生巨大數(shù)量的候選集,繁瑣的支持度計算。

下面我們來講解FP-Growth算法

FP-Growth算法不產生候選項集,而是采用分而治之的策略。

(1)構建FP樹:壓縮數(shù)據(jù)庫,并將頻繁項放入頻繁模式樹(FP樹),他仍然保留項集的關聯(lián)信息。

(2)從FP樹中挖掘頻繁項集:
1.從FP中獲得條件模式基

2.利用條件模式基,構建一個條件FP樹

3.根據(jù)條件FP樹,進行排列組合,挖掘出頻繁項。

以下示例較為簡單:重點理解

第四章 數(shù)據(jù)關聯(lián)分析方法

?設定最小支持度為2,得到頻繁集,并按照大小重新排列。

第四章 數(shù)據(jù)關聯(lián)分析方法

?第二次掃描排序后的數(shù)據(jù)庫。并且構建FP樹。

開始從FP樹中進行挖掘——頻繁項集

第四章 數(shù)據(jù)關聯(lián)分析方法

?那什么是條件模式基呢?

第四章 數(shù)據(jù)關聯(lián)分析方法

?為什么每個條件模式基的計數(shù)為1呢?
由于i5的計數(shù)為1,最終到達i5的重復次數(shù)也只能為1,所以條件模式基的計數(shù)是根據(jù)路徑中的結點的最小計數(shù)來決定的。文章來源地址http://www.zghlxwxcb.cn/news/detail-431691.html

到了這里,關于第四章 數(shù)據(jù)關聯(lián)分析方法的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!

本文來自互聯(lián)網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • RuoYi模塊功能分析:第四章 redis

    位于 package com.ruoyi.framework.config; 包下,主要用于自定義序列化解決亂碼問題和寫入lua限流腳本 位于 package com.ruoyi.framework.config; 包下,Redis使用FastJson序列化 位于 package com.ruoyi.common.core.redis; 包下,對redis內置的 基本 方法進行了二次封裝 位于 package com.ruoyi.web.controller.monitor;

    2024年02月20日
    瀏覽(25)
  • Qt5開發(fā)及實例V2.0-第四章Qt基本對話框

    Qt5開發(fā)及實例V2.0-第四章Qt基本對話框

    首先介紹標準文件對話框(QFileDialog)、標準顏色對話框(QColorDialog)、標準字體對話框(QFontDialog)、標準輸入對話框(QInputDialog)及標準消息對話框(QMessageBox),運行效果如圖4.1所示。 按如圖4.1所示依次執(zhí)行如下操作。 (1)單擊“文件標準對話框實例”按鈕,彈出“文

    2024年02月07日
    瀏覽(96)
  • 【云計算與虛擬化】第四章 實驗二 vCenter Server網絡部署及基本操作

    【云計算與虛擬化】第四章 實驗二 vCenter Server網絡部署及基本操作

    實驗二 ???vCenter Server網絡部署及基本操作 一、實驗內容 通過vSphere client 客戶端登陸vCenter服務器,為新建的虛擬機Windows7 激活,并修改計算機名為姓名拼音的首字母-學號 通過vSphere client 客戶端登陸vCenter服務器,將虛擬機windows7的cpu和內存設置為可以熱插拔 通過vSphere clie

    2024年04月22日
    瀏覽(25)
  • 數(shù)據(jù)結構 第四章:串

    數(shù)據(jù)結構 第四章:串

    所謂串其實就是字符串,該小節(jié)我們會先學習串的定義和相關基本操作。也就是要探討它的邏輯結構和基本運算(數(shù)據(jù)結構三要素:邏輯結構、存儲結構、數(shù)據(jù)的運算) 1.1.1串的定義 串 ,即字符串(String)是由零個或多個 字符 組成的有序序列。 一般記為S=‘a1a2…an’(n=0)

    2024年02月06日
    瀏覽(27)
  • 408數(shù)據(jù)結構第四章

    408數(shù)據(jù)結構第四章

    小題形式考,比較簡單,拿兩個題來練手就會了 字符串簡稱串 由零個或多個字符組成的有限序列 S是串名n稱為串的長度,n=0稱為空串 串中多個連續(xù)的字符組成的子序列稱為該串的子串 串的邏輯結構和線性表極為相似,區(qū)別僅在于串的數(shù)據(jù)結構對象限定為字符集 線性表的基

    2024年02月11日
    瀏覽(25)
  • 數(shù)據(jù)結構 第四章 棧

    數(shù)據(jù)結構 第四章 棧

    ?? 寫在最前 :這篇文章將學習棧這種結構,以及該結構的一些基本操作的實現(xiàn),包括順序存儲棧和鏈式存儲棧的基本操作的實現(xiàn)。 ??:點求個關注,讓我們一起探索計算機的奧秘! 所謂的 棧就是一種特殊的線性表 ,對于棧這種邏輯結構來說他和線性表最大的區(qū)別就是 棧

    2024年04月15日
    瀏覽(31)
  • 第四章 基于概率論的分類方法:樸素貝葉斯

    樸素貝葉斯 優(yōu)點:在數(shù)據(jù)較少的情況下仍然有效,可以處理多類別問題。 缺點:對于輸?數(shù)據(jù)的準備?式較為敏感。 適?數(shù)據(jù)類型:標稱型數(shù)據(jù)。 假設類別為 c 1 , c 2 c_1,c_2 c 1 ? , c 2 ? : 如果 p 1 ( x , y ) p 2 ( x , y ) p1(x,y) p2(x,y) p 1 ( x , y ) p 2 ( x , y ) ,那么類別為 c 1 c_1 c

    2024年02月13日
    瀏覽(24)
  • 第四章 應用SysML基本特性集的汽車示例 P1|系統(tǒng)建模語言SysML實用指南學習

    第四章 應用SysML基本特性集的汽車示例 P1|系統(tǒng)建模語言SysML實用指南學習

    僅供個人學習記錄 主要就是應用練習建模了 Automobile Domain包 將模型組織入包的包圖 汽車規(guī)范中包含系統(tǒng)需求的需求圖 汽車域塊定義圖 描述車輛主要功能的用例圖

    2024年02月06日
    瀏覽(23)
  • 計算機網絡——自頂向下方法(第四章學習記錄)

    計算機網絡——自頂向下方法(第四章學習記錄)

    本章學習網絡層:數(shù)據(jù)平面 前一章中我們學習了運輸層依賴于網絡層的主機到主機的通信服務,提供了各種形式的進程到進程的通信。在本章中我們將看到與運輸層和應用層不同的是,在網絡中的每一臺主機和路由器中都有一個網絡層部分。 網絡層能夠被分解為兩個相互作

    2024年02月11日
    瀏覽(29)
  • 數(shù)據(jù)庫第四章習題_完整版

    數(shù)據(jù)庫第四章習題_完整版

    1.1 請考慮以下 SQL 查詢,該查詢旨在查找 2017 年春季講授的所有課程的標題以及教師的姓名的列表。 請問這個查詢有什么問題? 首先 section 中并沒有我們需要使用到的屬性,所以這里 “natural join setion” 是多余的。 其次,更重要的一點是:在 instructor 關系和 course 關系中都有

    2024年02月07日
    瀏覽(44)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包