目錄
6.1 基本概念
6.1.1 關(guān)于數(shù)據(jù)的基本概念
6.1.2 數(shù)據(jù)庫(kù)管理系統(tǒng)的功能
6.1.3 數(shù)據(jù)各個(gè)發(fā)展階段的特點(diǎn)
6.1.4 數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)
6.2 數(shù)據(jù)模型
6.2.1 三級(jí)模式兩級(jí)映像
6.2.2 數(shù)據(jù)模型_模型分類
6.2.3?數(shù)據(jù)模型_組成要素
6.2.4?概念模型中的基本概念
6.2.5 數(shù)據(jù)模型
6.3 數(shù)據(jù)存儲(chǔ)與查詢
6.4 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘基礎(chǔ)知識(shí)?
6.4.1 數(shù)據(jù)倉(cāng)庫(kù)
6.4.2 數(shù)據(jù)挖掘?
6.4.3?商業(yè)智能BI
前言:
筆記來(lái)自《文老師軟考數(shù)據(jù)庫(kù)》教材精講,精講視頻在b站,某寶都可以找到,個(gè)人感覺通俗易懂。
6.1 基本概念
6.1.1 關(guān)于數(shù)據(jù)的基本概念
- 數(shù)據(jù):是數(shù)據(jù)庫(kù)中存儲(chǔ)的基本對(duì)象,是描述事物的符號(hào)記錄數(shù)據(jù)的種類:文本、圖形、圖像、音頻、視頻、學(xué)生的檔案記錄、貨物的運(yùn)輸情況等。
-
數(shù)據(jù)庫(kù)(DB):是長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi)、有組織的、可共享的大量數(shù)據(jù)的集合。
數(shù)據(jù)庫(kù)的基本特征:數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和存儲(chǔ),可為各種用戶共享,幾余度較小;數(shù)據(jù)獨(dú)立性較高;易擴(kuò)展。 - 數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS:是位于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件,用于科學(xué)地獲取、組織、存儲(chǔ)和維護(hù)數(shù)據(jù),是一個(gè)大型復(fù)雜的軟件系統(tǒng)。
-
數(shù)據(jù)庫(kù)系統(tǒng)(DBS)是計(jì)算機(jī)系統(tǒng)中引入數(shù)據(jù)庫(kù)后的系統(tǒng)構(gòu)成。
數(shù)據(jù)庫(kù)庫(kù)系統(tǒng)的構(gòu)成:數(shù)據(jù)庫(kù);硬件平臺(tái);軟件 (應(yīng)用程序) ;數(shù)據(jù)庫(kù)管理員。
6.1.2 數(shù)據(jù)庫(kù)管理系統(tǒng)的功能
DBMS的組成部分:
●?數(shù)據(jù)定義語(yǔ)言DDL及編譯處理程序
●?數(shù)據(jù)操縱語(yǔ)言DML及其編譯程序
●?數(shù)據(jù)庫(kù)運(yùn)行控制程序
●?實(shí)用程序?
DBMS的主要功能:
●?數(shù)據(jù)定義
●?數(shù)據(jù)操縱
●?數(shù)據(jù)庫(kù)運(yùn)行管理
●?數(shù)據(jù)組織、存儲(chǔ)和管理
●?數(shù)據(jù)庫(kù)的建立和維護(hù)
●?數(shù)據(jù)通信接口
●?數(shù)據(jù)控制功能
數(shù)據(jù)控制功能?
(1)數(shù)據(jù)的安全性(Security) 保護(hù)保護(hù)數(shù)據(jù),以防止不合法的使用造成的數(shù)據(jù)的泄密和破壞。
(2)數(shù)據(jù)的完整性(Integrity)檢查將數(shù)據(jù)控制在有效的范圍內(nèi),或保證數(shù)據(jù)之間滿足一定的關(guān)系。
(3)并發(fā)(Concurrency)控制對(duì)多用戶的并發(fā)操作加以控制和協(xié)調(diào),防止相互干擾而得到錯(cuò)誤的結(jié)果。
(4)數(shù)據(jù)庫(kù)恢復(fù)(Recovery) 將數(shù)據(jù)庫(kù)從錯(cuò)誤狀態(tài)恢復(fù)到某一已知的正確狀態(tài)
6.1.3 數(shù)據(jù)各個(gè)發(fā)展階段的特點(diǎn)
6.1.4 數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)
- 從數(shù)據(jù)庫(kù)應(yīng)用開發(fā)人員或數(shù)據(jù)庫(kù)管理系統(tǒng)的角度看(內(nèi)部體系結(jié)構(gòu)): 數(shù)據(jù)庫(kù)采用三級(jí)模式結(jié)構(gòu),是數(shù)據(jù)庫(kù)系統(tǒng)的內(nèi)部的系統(tǒng)結(jié)構(gòu),外模式、模式、內(nèi)模式。
- 從數(shù)據(jù)庫(kù)最終用戶角度看(外部體系結(jié)構(gòu)):
(1)集中式:數(shù)據(jù)、數(shù)據(jù)管理、功能應(yīng)用、用戶接口到DBMS核心都集中在DBMS所在的計(jì)算機(jī)上。
(2)分布式數(shù)據(jù)庫(kù)系統(tǒng)是數(shù)據(jù)庫(kù)系統(tǒng)和計(jì)算機(jī)網(wǎng)絡(luò)相結(jié)合的產(chǎn)物。是針對(duì)面向地理上分散,而管理上又需要不同程度集中管理的需求而提出的一種數(shù)據(jù)管理信息系統(tǒng)。
(3)客戶-服務(wù)器結(jié)構(gòu):一個(gè)處理機(jī)(客戶端)的請(qǐng)求被送到另一個(gè)處理機(jī)(服務(wù)器上執(zhí)行。
(4)并行式:使用相連接的多個(gè)CPU和多個(gè)磁盤進(jìn)行并行操作,提高數(shù)據(jù)處理和I/O速度。
(5)數(shù)據(jù)庫(kù)技術(shù)是計(jì)算機(jī)處理與數(shù)據(jù)存儲(chǔ)最有效、最成功的技術(shù),而Web技術(shù)的特點(diǎn)是資源共享,因此數(shù)據(jù)與資源共享這兩種技術(shù)的結(jié)合即形成了今天廣泛應(yīng)用的IWeh數(shù)據(jù)庫(kù)(即網(wǎng)絡(luò)數(shù)據(jù)庫(kù))
6.2 數(shù)據(jù)模型
6.2.1 三級(jí)模式兩級(jí)映像
- 模式(概念模式、邏輯模式):就是我們通常使用的表這個(gè)級(jí)別;是數(shù)據(jù)庫(kù)中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是所有用戶的公共數(shù)據(jù)視圖,綜合了所有用戶的需求;一個(gè)數(shù)據(jù)庫(kù)只有一個(gè)模式。如公司的所有員工管理信息系統(tǒng)。
- 外模式(子模式、用戶模式):對(duì)應(yīng)數(shù)據(jù)庫(kù)中的視圖這個(gè)級(jí)別;是數(shù)據(jù)庫(kù)用戶 (包括應(yīng)用程序員和最終用戶使用的局部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,數(shù)據(jù)庫(kù)用戶的數(shù)據(jù)視圖,是與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。員工管理員和薪酬管理員關(guān)注的不同方面。介于模式與應(yīng)用之間,可以有多個(gè)外模式,通常是模式的子集;反映了不同的用戶的應(yīng)用需求外模式的用途:保證數(shù)據(jù)庫(kù)安全性的一個(gè)有力措施每個(gè)用戶只能看見和訪問(wèn)所對(duì)應(yīng)的外模式中的數(shù)據(jù)。
- 內(nèi)模式《存儲(chǔ)模式):管理如何存儲(chǔ)物理的數(shù)據(jù),是數(shù)據(jù)物理結(jié)構(gòu)和存儲(chǔ)方式的描述,是數(shù)據(jù)在數(shù)據(jù)庫(kù)內(nèi)部的表示方法;一個(gè)數(shù)據(jù)庫(kù)只有一個(gè)內(nèi)模式。?
【三個(gè)級(jí)別】
●?用戶級(jí)數(shù)據(jù)庫(kù):對(duì)應(yīng)于外模式,是用戶看到和使用的數(shù)據(jù)庫(kù),又稱用戶視圖,一個(gè)數(shù)據(jù)庫(kù)可有多個(gè)不同的用戶視圖;
●?概念級(jí)數(shù)據(jù)庫(kù):對(duì)應(yīng)于概念模式,是所有用戶視圖的最小并集,一個(gè)數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)只有一個(gè)DBA視圖。
●?物理級(jí)數(shù)據(jù)庫(kù):對(duì)應(yīng)于內(nèi)模式,是數(shù)據(jù)庫(kù)的底層表示,它描述數(shù)據(jù)的實(shí)際存儲(chǔ)組織,是最接近于物理存儲(chǔ)的,又稱為內(nèi)部視圖。
6.2.2 數(shù)據(jù)模型_模型分類
數(shù)據(jù)模型,現(xiàn)實(shí)世界的模擬,對(duì)現(xiàn)實(shí)世界中的概念進(jìn)行抽象、表示和處理(對(duì)數(shù)據(jù)進(jìn)行描述、組織和操作)的工具。數(shù)據(jù)模型是數(shù)據(jù)庫(kù)系統(tǒng)的核心和基礎(chǔ)。
●?概念模型(信息模型):按用戶的觀點(diǎn)來(lái)對(duì)數(shù)據(jù)和信息建模,通常用ER圖進(jìn)行描述,用于數(shù)據(jù)庫(kù)設(shè)計(jì)。與計(jì)算機(jī)無(wú)關(guān)。
●?邏輯模型:按計(jì)算機(jī)系統(tǒng)的觀點(diǎn)對(duì)數(shù)據(jù)建模,用于DBMS實(shí)現(xiàn)。主要包括:網(wǎng)狀模型、層次模型、關(guān)系模型、面向?qū)ο竽P偷取Ec計(jì)算機(jī)有關(guān)
●?物理模型:是對(duì)數(shù)據(jù)最底層的抽象,描述數(shù)據(jù)在系統(tǒng)內(nèi)部的表示方式和存取方法。與計(jì)算機(jī)有關(guān)。
6.2.3?數(shù)據(jù)模型_組成要素
- 實(shí)體完整性:實(shí)體完整性是指實(shí)體的主屬性不能取空值。實(shí)體完整性規(guī)則規(guī)定實(shí)體的所有主屬性都不能為空。
- 參照完整性:在關(guān)系數(shù)據(jù)庫(kù)中主要是外鍵參照的完整性。
- 用戶定義完整性:用戶定義完整性是針對(duì)某一個(gè)具體關(guān)系的約束條件。
6.2.4?概念模型中的基本概念
- 實(shí)體型之間的聯(lián)系:E-R圖(實(shí)體-關(guān)系圖)
概念模型用于信息世界的建模是數(shù)據(jù)庫(kù)設(shè)計(jì)的有力工具,也是數(shù)據(jù)庫(kù)設(shè)計(jì)人員和用戶之間進(jìn)行交流的語(yǔ)言,主要通過(guò)E-R圖進(jìn)行描述。
(1)實(shí)體(Entity):客觀存在并可相互區(qū)別的事物稱為實(shí)體??梢允蔷唧w的人、事、物或抽象的概念客觀實(shí)體:人、課桌、書本......
抽象實(shí)體:賬戶、貸款......
(2)屬性(Attribute):實(shí)體所具有的某一特性稱為屬性。一個(gè)實(shí)體可以由若干個(gè)屬性來(lái)刻畫如員工實(shí)體由員工編號(hào)、姓名、年齡、職務(wù)、部門......
(3)碼(Key):標(biāo)識(shí)實(shí)體的屬性集稱為碼。
(4)域(Domain):屬性的取值范圍稱為該屬性的域
(5)實(shí)體型(Entity Type):用實(shí)體名及其屬性名集合來(lái)抽象和刻畫同類實(shí)體稱為實(shí)體型
-
屬性的分類:
●?簡(jiǎn)單屬性:原子的、不可再分的。
●?復(fù)合屬性:可細(xì)分為多個(gè)屬性部分,如name有first name和last name。或者家庭地址:北京市朝陽(yáng)區(qū)望京街道
●?單值屬性:定義的屬性對(duì)于一個(gè)特定的實(shí)體都只有單獨(dú)的一個(gè)值。
●?多值屬性:一個(gè)屬性可能對(duì)應(yīng)一組值。如員工的電話號(hào)碼:每個(gè)員工就可能有0、1或多個(gè)與之相對(duì)應(yīng)。
●?NULL屬性:當(dāng)實(shí)體在某個(gè)屬性上沒有值或?qū)傩灾滴粗獣r(shí),使用NULL值。
●?派生屬性:這類屬性的值可以從別的相關(guān)屬性或?qū)嶓w中派生(計(jì)算出來(lái))
【概念模型-E-R圖-聯(lián)系(2個(gè)實(shí)體)】
- 一對(duì)一聯(lián)系(1:1)定義:如果對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中至多有一個(gè)(也可以沒有)實(shí)體與之聯(lián)系,反之亦然,則稱實(shí)體集A與實(shí)體集B具有一對(duì)一聯(lián)系,記為1:1。
- 一對(duì)多聯(lián)系(1:n)定義:如果對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n20)與之聯(lián)系,反之,對(duì)于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中至多只有一個(gè)實(shí)體與之聯(lián)系,則稱實(shí)體集A與實(shí)體集B有一對(duì)多聯(lián)系,記為1:n。
- 多對(duì)多聯(lián)系(m:n)定義:如果對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n20)與之聯(lián)系,反之,對(duì)于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中也有m個(gè)實(shí)體(m20)與之聯(lián)系,則稱實(shí)體集A與實(shí)體B具有多對(duì)多聯(lián)系,記為m:n。
6.2.5 數(shù)據(jù)模型
- 層次模型(Hierarchical Model)
- 網(wǎng)狀模型(Network Model)
- 關(guān)系模型(Relational Model)
- 面向?qū)ο竽P?Object Oriented Model)
- 對(duì)象關(guān)系模型(Object Relational Model)
層次模型用樹形結(jié)構(gòu)來(lái)表示各類實(shí)體以及實(shí)體間的聯(lián)系層次模型只能表示1:n聯(lián)系,不能表示mn聯(lián)系。層次模型中的術(shù)語(yǔ):根結(jié)點(diǎn),雙親結(jié)點(diǎn),兄弟結(jié)點(diǎn),葉結(jié)點(diǎn)。層次模型兩個(gè)基本條件:有且只有一個(gè)結(jié)點(diǎn)沒有雙親結(jié)點(diǎn),這個(gè)結(jié)點(diǎn)稱為根結(jié)點(diǎn);根以外的其它結(jié)點(diǎn)有且只有一個(gè)雙親結(jié)點(diǎn)。
關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)采用關(guān)系模型作為數(shù)據(jù)的組織方式,以關(guān)系代數(shù)為數(shù)據(jù)基礎(chǔ),數(shù)據(jù)用二維表表示。大多數(shù)數(shù)據(jù)庫(kù)均為關(guān)系數(shù)據(jù)模型。優(yōu)點(diǎn):建立在嚴(yán)格的數(shù)學(xué)概念基礎(chǔ)上;概念單一、結(jié)構(gòu)簡(jiǎn)單、清晰,用戶易懂易用,存取路徑對(duì)用戶透明從而數(shù)據(jù)獨(dú)立性、安全性好,簡(jiǎn)化數(shù)據(jù)庫(kù)開發(fā)工作。缺點(diǎn):由于存取路徑透明,查詢效率往往不如非關(guān)系數(shù)據(jù)模型。?
●?關(guān)系:一個(gè)關(guān)系對(duì)應(yīng)一張表(Relation);
●?元組(Tuple):表中的一行即為一個(gè)元組;
●?屬性(Attribute):表中的一列即為一個(gè)屬性;
●?主碼(Key):唯一確定一個(gè)元組屬性集合;
●?域(Domain):屬性的取值范圍;
●?分量:元組中的一個(gè)屬性值;
●?關(guān)系模式:對(duì)關(guān)系的描述基本形式,關(guān)系名 (屬性1,屬性2,...,屬性n)示例:學(xué)生(學(xué)號(hào),姓名,年齡,性別,系,年級(jí));
●?關(guān)系的規(guī)范化理論-屬性的原子性,即屬性是不可再分,表中不再包含表同一關(guān)系中屬性唯一性;
●?關(guān)系中元組唯一性關(guān)系中元組的有限性;
●?關(guān)系中元組次序無(wú)關(guān)緊要;
●?關(guān)系中屬性次序無(wú)關(guān)緊要
6.3 數(shù)據(jù)存儲(chǔ)與查詢
- 存儲(chǔ)管理器在數(shù)據(jù)庫(kù)系統(tǒng)中負(fù)責(zé)在數(shù)據(jù)庫(kù)中存儲(chǔ)的低層數(shù)據(jù)與應(yīng)用程序以及向系統(tǒng)提交的查詢之間提供接口的部件,負(fù)責(zé)數(shù)據(jù)庫(kù)中數(shù)據(jù)的存儲(chǔ)、檢索和更新。存儲(chǔ)管理器部件包括以下四個(gè):
(1)權(quán)限及完整性管理器:檢查訪問(wèn)數(shù)據(jù)庫(kù)的用戶權(quán)限,檢測(cè)數(shù)據(jù)是否滿足完整性約束;
(2)事務(wù)管理器:保證一旦發(fā)生故障,數(shù)據(jù)庫(kù)的一致性狀態(tài),以及并發(fā)事務(wù)執(zhí)行時(shí)不發(fā)生沖突(3)文件管理器:管理磁盤存儲(chǔ)空間的分配。
(4)緩沖區(qū)管理器:負(fù)責(zé)將數(shù)據(jù)從硬盤放入內(nèi)存,并決定哪些數(shù)據(jù)應(yīng)被緩沖區(qū)放入內(nèi)存 - 查詢處理器其組件包括:
DDL解釋器:解釋DDL語(yǔ)句并將其放入數(shù)據(jù)字典中;
DML編譯器:將查詢語(yǔ)言中的DML語(yǔ)句翻譯為一個(gè)計(jì)算方案,包括一系列查詢計(jì)算引擎能理解的命令。
6.4 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘基礎(chǔ)知識(shí)?
6.4.1 數(shù)據(jù)倉(cāng)庫(kù)
- 數(shù)據(jù)倉(cāng)庫(kù)四大特點(diǎn):
(1)面向主題:按照一定的主題域進(jìn)行組織的;
(2)集成的:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。
(3)相對(duì)穩(wěn)定的:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少通常只需要定期的加載、刷新。
(4)反映歷史變化:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息系統(tǒng)記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。
6.4.2 數(shù)據(jù)挖掘?
- 概念:是從大量數(shù)據(jù)中發(fā)現(xiàn)并提取隱藏在內(nèi)的,人們事先不知道的但可能有用的信息和知識(shí)的一種新技術(shù)。
- 目的:幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)經(jīng)營(yíng)者被忽略的要素。
- 數(shù)據(jù)挖掘技術(shù)涉及數(shù)據(jù)庫(kù)技術(shù)、人工智能技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等多種技術(shù)。
- 數(shù)據(jù)挖掘和傳統(tǒng)分析方法的區(qū)別:數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息,發(fā)現(xiàn)知識(shí)。其得到的信息應(yīng)具有事先未知、有效和可實(shí)用3個(gè)特征。
- 數(shù)據(jù)挖掘的應(yīng)用過(guò)程:確定挖掘?qū)ο?準(zhǔn)備數(shù)據(jù)-建立模型-數(shù)據(jù)挖掘-結(jié)果分析-知識(shí)應(yīng)用。
數(shù)據(jù)挖掘分析方法:
(1)關(guān)聯(lián)分析:關(guān)聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個(gè)事件發(fā)生的同時(shí),另一個(gè)事件也經(jīng)常發(fā)牛。
(2)序列分析:序列分析主要用于發(fā)現(xiàn)一定時(shí)間間隔內(nèi)接連發(fā)生的事件,這些事件構(gòu)成一個(gè)序列,發(fā)現(xiàn)的序列應(yīng)該具有普遍意義。
(3)分類分析:分類分析通過(guò)分析具有類別的樣本特點(diǎn),得到?jīng)Q定樣本屬于各種類別的規(guī)則或方法。分類分析時(shí)首先為每個(gè)記錄賦予一個(gè)標(biāo)記(一組具有不同特征的類別),即按標(biāo)記分類記錄,然后檢查這些標(biāo)定的記錄,描述出這些記錄的特征。
(4)聚類分析:聚類分析是根據(jù)“物以類聚”的原理,將本身沒有類別的樣本聚集成不同的組,并且對(duì)每個(gè)這樣的組進(jìn)行描述的過(guò)程。
數(shù)據(jù)挖掘算法(了解分類即可) :
●?EM:在概率模型中尋找參數(shù)最大似然估計(jì)的算法;
●?Apriori:先驗(yàn)算法是關(guān)聯(lián)規(guī)則學(xué)習(xí)的經(jīng)典算法之一;
●?K-means:是非監(jiān)督學(xué)習(xí)中的聚類算法;
●?SVM:中文名為支持向量機(jī),是常見的一種判別方法。在機(jī)器學(xué)習(xí)領(lǐng)域,是一個(gè)有監(jiān)督的學(xué)習(xí)模型,通常用來(lái)進(jìn)行模式識(shí)別、分類以及回歸分析;
●?決策樹:典型的分類算法。?文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-451993.html
6.4.3?商業(yè)智能BI
BI系統(tǒng)主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)展現(xiàn)四個(gè)主要階段建立數(shù)據(jù)倉(cāng)庫(kù)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-451993.html
- 數(shù)據(jù)預(yù)處理是整合企業(yè)原始數(shù)據(jù)的第一步,它包括數(shù)據(jù)的抽取(Extraction)、轉(zhuǎn)換(Transformation)和加載(Load)三個(gè)過(guò)程(ETL過(guò)程);
- 建立數(shù)據(jù)倉(cāng)庫(kù)則是處理海量數(shù)據(jù)的基礎(chǔ);
- 數(shù)據(jù)分析是體現(xiàn)系統(tǒng)智能的關(guān)鍵,一般采用聯(lián)機(jī)分析處理(OLAP)和數(shù)據(jù)挖掘兩大技術(shù)。聯(lián)機(jī)分析理不僅進(jìn)行數(shù)據(jù)匯總/聚集,同時(shí)還提供切片、切塊、下鉆、上卷和旋轉(zhuǎn)等數(shù)據(jù)分析功能,用戶可以便地對(duì)海量數(shù)據(jù)進(jìn)行多維分析。數(shù)據(jù)挖掘的目標(biāo)則是挖掘數(shù)據(jù)背后隱藏的知識(shí),通過(guò)關(guān)聯(lián)分析、聚和分類等方法建立分析模型,預(yù)測(cè)企業(yè)未來(lái)發(fā)展趨勢(shì)和將要面臨的問(wèn)題;
- 數(shù)據(jù)據(jù)展現(xiàn):在海量數(shù)據(jù)和分析手段增多的情況下,數(shù)據(jù)展現(xiàn)則主要保障系統(tǒng)分析結(jié)果的可視化。
【軟考數(shù)據(jù)庫(kù)】第一章 計(jì)算機(jī)系統(tǒng)基礎(chǔ)知識(shí)
【軟考數(shù)據(jù)庫(kù)】第二章 程序語(yǔ)言基礎(chǔ)知識(shí)
【軟考數(shù)據(jù)庫(kù)】第三章 數(shù)據(jù)結(jié)構(gòu)與算法
【軟考數(shù)據(jù)庫(kù)】第四章 操作系統(tǒng)知識(shí)
到了這里,關(guān)于【軟考數(shù)據(jù)庫(kù)】第六章 數(shù)據(jù)庫(kù)技術(shù)基礎(chǔ)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!