国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

無(wú)涯教程-聚類(lèi)算法 - K-Means

2年前作者：Hi無(wú)涯教程分類(lèi)：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了無(wú)涯教程-聚類(lèi)算法 - K-Means。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

K-均值聚類(lèi)算法計(jì)算質(zhì)心并進(jìn)行迭代，直到找到最佳質(zhì)心為止，它假定群集的數(shù)目是已知的，它也稱為扁平聚類(lèi)算法。通過(guò)算法從數(shù)據(jù)中識(shí)別出的簇?cái)?shù)以K均值中的" K"表示。

在該算法中，將數(shù)據(jù)點(diǎn)分配給群集，以使數(shù)據(jù)點(diǎn)和質(zhì)心之間的平方距離之和最小。應(yīng)當(dāng)理解，簇內(nèi)的較少變化將導(dǎo)致相同簇內(nèi)的更多相似數(shù)據(jù)點(diǎn)。

K均值算法

無(wú)涯教程可以通過(guò)以下步驟來(lái)了解K-Means聚類(lèi)算法的工作原理-

第1步? ?- 首先，需要指定需要由該算法生成的簇?cái)?shù)K。

第2步? ?- 接下來(lái)，隨機(jī)選擇K個(gè)數(shù)據(jù)點(diǎn)并將每個(gè)數(shù)據(jù)點(diǎn)分配給一個(gè)群集，簡(jiǎn)單來(lái)說(shuō)，就是根據(jù)數(shù)據(jù)點(diǎn)的數(shù)量對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。

第3步? ?- 現(xiàn)在，它將計(jì)算聚類(lèi)質(zhì)心。

第4步? ?- 接下來(lái)，繼續(xù)迭代以下步驟，直到找到最佳質(zhì)心為止，這是將數(shù)據(jù)點(diǎn)分配給不再變化的群集的情況

? ? ? 4.1 - 首先，將計(jì)算數(shù)據(jù)點(diǎn)和形心之間的平方距離之和。
? ? ? 4.2 - 現(xiàn)在，必須將每個(gè)數(shù)據(jù)點(diǎn)分配給比其他群集(質(zhì)心)更近的群集。
? ? ? 4.3 - 最后，通過(guò)獲取聚類(lèi)的所有數(shù)據(jù)點(diǎn)的平均值來(lái)計(jì)算聚類(lèi)的質(zhì)心。

K均值遵循期望最大化方法來(lái)解決此問(wèn)題，期望步驟用于將數(shù)據(jù)點(diǎn)分配給最近的群集，而最大化步驟用于計(jì)算每個(gè)群集的質(zhì)心。

使用K-means算法時(shí)，需要注意以下事項(xiàng)-

在使用包含K-Means的聚類(lèi)算法時(shí)，建議對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化，因?yàn)榇祟?lèi)算法使用基于距離的測(cè)量來(lái)確定數(shù)據(jù)點(diǎn)之間的相似性。
由于K-Means的迭代性質(zhì)和質(zhì)心的隨機(jī)初始化，K-Means可能停留在局部最優(yōu)中，而可能不會(huì)收斂于全局最優(yōu)。因此建議使用不同的質(zhì)心初始化。

代碼實(shí)現(xiàn)

以下兩個(gè)實(shí)施K-Means聚類(lèi)算法的示例將幫助無(wú)涯教程更好地理解-

K-Means示例1

這是了解k均值如何工作的簡(jiǎn)單示例。在此示例中，將首先生成包含4個(gè)不同Blob的2D數(shù)據(jù)集，然后將應(yīng)用k-means算法查看輸出。

首先，將從導(dǎo)入必要的包開(kāi)始-

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

以下代碼將生成2D，其中包含四個(gè)Blob-

from sklearn.datasets.samples_generator import make_blobs
X, y_true=make_blobs(n_samples=400, centers=4, cluster_std=0.60, random_state=0)

接下來(lái)，以下代碼將幫助可視化數(shù)據(jù)集-

plt.scatter(X[:, 0], X[:, 1], s=20);
plt.show()

接下來(lái)，使KMeans為對(duì)象，并提供聚類(lèi)數(shù)量，訓(xùn)練模型并按以下方式進(jìn)行預(yù)測(cè)-

kmeans=KMeans(n_clusters=4)
kmeans.fit(X)
y_kmeans=kmeans.predict(X)

現(xiàn)在，借助以下代碼，可以繪制和可視化由k-means Python估計(jì)器選擇的群集中心-

from sklearn.datasets.samples_generator import make_blobs
X, y_true=make_blobs(n_samples=400, centers=4, cluster_std=0.60, random_state=0)

接下來(lái)，以下代碼將幫助可視化數(shù)據(jù)集-

plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=20, cmap=summer)
centers=kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c=blue, s=100, alpha=0.9);
plt.show()

K-Means示例2

讓無(wú)涯教程轉(zhuǎn)到另一個(gè)示例，在該示例中，將對(duì)簡(jiǎn)單數(shù)字?jǐn)?shù)據(jù)集應(yīng)用K均值聚類(lèi)， K-means將嘗試在不使用原始標(biāo)簽信息的情況下識(shí)別相似的數(shù)字。

首先，將從導(dǎo)入必要的包開(kāi)始-

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans

接下來(lái)，從sklearn加載數(shù)字?jǐn)?shù)據(jù)集并使其成為對(duì)象。還可以在此數(shù)據(jù)集中找到行數(shù)和列數(shù)，如下所示:

from sklearn.datasets import load_digits
digits=load_digits()
digits.data.shape

(1797, 64)

上面的輸出顯示此數(shù)據(jù)集包含1797個(gè)具有64個(gè)特征的樣本。

可以像上面的示例1一樣執(zhí)行聚類(lèi)-

kmeans=KMeans(n_clusters=10, random_state=0)
clusters=kmeans.fit_predict(digits.data)
kmeans.cluster_centers_.shape

(10, 64)

上面的輸出顯示K-means創(chuàng)建了具有64個(gè)特征的10個(gè)聚類(lèi)。

fig, ax=plt.subplots(2, 5, figsize=(8, 3))
centers=kmeans.cluster_centers_.reshape(10, 8, 8)
for axi, center in zip(ax.flat, centers):
axi.set(xticks=[], yticks=[])
axi.imshow(center, interpolation=nearest, cmap=plt.cm.binary)

作為輸出，將獲得以下圖像，該圖像顯示了通過(guò)k均值學(xué)習(xí)的聚類(lèi)中心。

以下代碼行將學(xué)習(xí)到的集群標(biāo)簽與在其中找到的真實(shí)標(biāo)簽匹配:

from scipy.stats import mode
labels = np.zeros_like(clusters)
for i in range(10):
   mask = (clusters == i)
   labels[mask] = mode(digits.target[mask])[0]

接下來(lái)，無(wú)涯教程可以檢查準(zhǔn)確性，如下所示:

from sklearn.metrics import accuracy_score
accuracy_score(digits.target, labels)

0.7935447968836951

上面的輸出顯示精度約為80％。

聚類(lèi)算法 - K-Means - 無(wú)涯教程網(wǎng)無(wú)涯教程網(wǎng)提供K-均值聚類(lèi)算法計(jì)算質(zhì)心并進(jìn)行迭代，直到找到最佳質(zhì)心為止，它假定群集的數(shù)目是已知的...https://www.learnfk.com/python-machine-learning/machine-learning-with-python-clustering-algorithms-k-means.html文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-682517.html

到了這里，關(guān)于無(wú)涯教程-聚類(lèi)算法 - K-Means的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

K-means聚類(lèi)算法原理及實(shí)現(xiàn)
1.1概念聚類(lèi)分析，也稱為分割分析或分類(lèi)分析，可將樣本數(shù)據(jù)分成一個(gè)個(gè)組（即簇）。同一簇中的對(duì)象是相似的，不同簇中的對(duì)象則明顯不同。 Statistics and Machine Learning Toolbox? 提供了幾種聚類(lèi)方法和相似性度量（也稱為距離度量）來(lái)創(chuàng)建簇。此外，簇計(jì)算可以按照不同的計(jì)
2024年03月18日
瀏覽(21)
K-means聚類(lèi)算法的三種改進(jìn)(K-means++,ISODATA,Kernel K-means)介紹與對(duì)比
? 目錄 ?一、概述二、經(jīng)典K-means算法三、K-means++算法四、ISODATA算法六、數(shù)據(jù)集測(cè)試 ????? 在本篇文章中將對(duì)四種聚類(lèi)算法(K-means,K-means++,ISODATA和Kernel K-means)進(jìn)行詳細(xì)介紹，并利用數(shù)據(jù)集來(lái)真實(shí)地反映這四種算法之間的區(qū)別。 ????? 首先需要明確的是上述四種算法都屬
2024年01月23日
瀏覽(18)
K-means聚類(lèi)算法（附Python實(shí)現(xiàn)代碼）
本文的代碼與數(shù)據(jù)地址已上傳至github：https://github.com/helloWorldchn/MachineLearning 1、基于劃分的聚類(lèi) 劃分算法的思想是，將給定待挖掘數(shù)據(jù)集中的數(shù)據(jù)對(duì)象劃分成K組（k≤N，N代表數(shù)據(jù)集中對(duì)象數(shù)目），每一組表示一個(gè)聚類(lèi)的簇。并且要滿足任何一個(gè)數(shù)據(jù)對(duì)象僅可以屬于一個(gè)聚類(lèi)，
2024年02月07日
瀏覽(27)
傳統(tǒng)機(jī)器學(xué)習(xí)(三)聚類(lèi)算法K-means(一)
K-Means算法是無(wú)監(jiān)督的聚類(lèi)算法，它實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單，聚類(lèi)效果也不錯(cuò)，因此應(yīng)用很廣泛。K-Means基于歐式距離認(rèn)為兩個(gè)目標(biāo)距離越近，相似度越大。 1.1.1 算法流程（1）圖a表達(dá)了初始的數(shù)據(jù)集，假設(shè)k=2；（2）在圖b中，隨機(jī)選擇兩個(gè)k類(lèi)的對(duì)應(yīng)的類(lèi)別質(zhì)心，即圖中的紅色質(zhì)
2023年04月15日
瀏覽(17)
K-means聚類(lèi)算法及Python代碼實(shí)現(xiàn)
K-means聚類(lèi)算法（事先數(shù)據(jù)并沒(méi)有類(lèi)別之分！所有的數(shù)據(jù)都是一樣的） 1、概述 K-means算法是集簡(jiǎn)單和經(jīng)典于一身的基于距離的聚類(lèi)算法采用距離作為相似性的評(píng)價(jià)指標(biāo)，即認(rèn)為兩個(gè)對(duì)象的距離越近，其相似度就越大。該算法認(rèn)為類(lèi)簇是由距離靠近的對(duì)象組成的，因此把得到
2023年04月24日
瀏覽(25)
K-means聚類(lèi)算法原理、步驟、評(píng)價(jià)指標(biāo)和實(shí)現(xiàn)
1、聚類(lèi) 聚類(lèi)與分類(lèi)不同，聚類(lèi)分析分通過(guò)分析大量含有一定規(guī)律但雜亂數(shù)據(jù)，得到數(shù)據(jù)間內(nèi)在的邏輯，將雜亂的數(shù)據(jù)按照所得的數(shù)據(jù)規(guī)律劃分成不同的種類(lèi)。K-measn、DBSCAN和層次是當(dāng)前廣泛使用的三種聚類(lèi)方法。以下對(duì)三種方法進(jìn)行分析，選擇適合的聚類(lèi)方法。方法 K-means
2024年02月07日
瀏覽(52)
K-Means（K-均值）聚類(lèi)算法理論和實(shí)戰(zhàn)
目錄 K-Means 算法 K-Means 術(shù)語(yǔ) K 值如何確定 K-Means 場(chǎng)景美國(guó)總統(tǒng)大選搖爭(zhēng)取擺選民電商平臺(tái)用戶分層給亞洲球隊(duì)做聚類(lèi) ?編輯其他場(chǎng)景 K-Means 工作流程 K-Means 開(kāi)發(fā)流程 K-Means的底層代碼實(shí)現(xiàn) K-Means 的評(píng)價(jià)標(biāo)準(zhǔn) 對(duì)于 n 個(gè)樣本點(diǎn)來(lái)說(shuō)，根據(jù)距離公式（如歐式距離）去計(jì)?算它們的
2024年02月11日
瀏覽(25)
【機(jī)器學(xué)習(xí)】K-means聚類(lèi)算法：原理、應(yīng)用與優(yōu)化
一、引言 1、簡(jiǎn)述聚類(lèi)分析的重要性及其在機(jī)器學(xué)習(xí)中的應(yīng)用 ??聚類(lèi)分析，作為機(jī)器學(xué)習(xí)領(lǐng)域中的一種無(wú)監(jiān)督學(xué)習(xí)方法，在數(shù)據(jù)探索與知識(shí)發(fā)現(xiàn)過(guò)程中扮演著舉足輕重的角色。它能夠在沒(méi)有先驗(yàn)知識(shí)或標(biāo)簽信息的情況下，通過(guò)挖掘數(shù)據(jù)中的內(nèi)在結(jié)構(gòu)和規(guī)律，將數(shù)據(jù)對(duì)象自動(dòng)
2024年04月13日
瀏覽(37)
【聚類(lèi)算法】帶你輕松搞懂K-means聚類(lèi)（含代碼以及詳細(xì)解釋?zhuān)?/a>
聚類(lèi)是一個(gè)將數(shù)據(jù)集中在某些方面相似的數(shù)據(jù)成員進(jìn)行分類(lèi)組織的過(guò)程，聚類(lèi)就是一種發(fā)現(xiàn)這種內(nèi)在結(jié)構(gòu)的技術(shù)，聚類(lèi)技術(shù)經(jīng)常被稱為無(wú)監(jiān)督學(xué)習(xí) 。 k均值聚類(lèi)是最著名的劃分聚類(lèi)算法，由于簡(jiǎn)潔和效率使得他成為所有聚類(lèi)算法中最廣泛使用的。給定一個(gè)數(shù)據(jù)點(diǎn)集合和需要
2024年02月01日
瀏覽(23)
k-means聚類(lèi)算法心得分享（含python實(shí)現(xiàn)代碼）
目錄 1.K-means聚類(lèi)算法 1.1 引言： 1.2 K-Means 算法的基本思想 1.3 K-Means 算法的優(yōu)缺點(diǎn)： 1.4 K-Means 算法的應(yīng)用： 2.K-means聚類(lèi)算法的實(shí)現(xiàn)具體步驟 2.1初始化聚類(lèi)中心 2.2計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到聚類(lèi)中心的距離 2.3確定每個(gè)數(shù)據(jù)點(diǎn)所屬聚類(lèi)簇 2.4更新聚類(lèi)中心 2.5循環(huán)執(zhí)行步驟2-4，直到達(dá)到最
2024年02月02日
瀏覽(25)