国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Linux-Stream內(nèi)存帶寬及MLC內(nèi)存延遲性能測(cè)試方法

2年前作者：S-Gavin分類：Toy博客閱讀(15)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Linux-Stream內(nèi)存帶寬及MLC內(nèi)存延遲性能測(cè)試方法。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、Stream內(nèi)存帶寬測(cè)試

??Stream是業(yè)界主流的內(nèi)存帶寬測(cè)試程序，測(cè)試行為相對(duì)簡(jiǎn)單可控。該程序?qū)PU的計(jì)算能力要求很小，對(duì)CPU內(nèi)存帶寬壓力很大。隨著處理器核心數(shù)量的增大，而內(nèi)存帶寬并沒有隨之成線性增長(zhǎng)，因此內(nèi)存帶寬對(duì)提升多核心的處理能力就越發(fā)重要。Stream具有良好的空間局部性，是對(duì)TLB友好，Cache友好的一款測(cè)試程序，其分為Copy、Scale、Add和Triad四個(gè)更基本的測(cè)試功能。

Copy為最簡(jiǎn)單的操作，即從一個(gè)內(nèi)存單元中讀取一個(gè)數(shù)，并復(fù)制到另一個(gè)內(nèi)存單元，有2次訪存操作。
Scale是乘法操作，從一個(gè)內(nèi)存單元中讀取一個(gè)數(shù)，與常數(shù)scale相乘，得到的結(jié)果寫入另一個(gè)內(nèi)存單元，有2次訪存。
Add是加法操作，從兩個(gè)內(nèi)存單元中分別讀取兩個(gè)數(shù)，將其進(jìn)行加法操作，得到的結(jié)果寫入另一個(gè)內(nèi)存單元中，有2次讀和1次寫共3次訪存。
Triad是前面三種的結(jié)合，先從內(nèi)存中讀取一個(gè)數(shù)，與scale相乘得到一個(gè)乘積，然后從另一個(gè)內(nèi)存單元中讀取一個(gè)數(shù)與之前的乘積相加，得到的結(jié)果再寫入內(nèi)存。所以，有2次讀和1次寫共3次訪存操作。

??從上述的結(jié)果我們可以看出，測(cè)試的內(nèi)存帶寬Add>Triad>Copy>Scale。這是因?yàn)樵L存次數(shù)越多，內(nèi)隱藏的訪存延遲越大，得到的帶寬越大。同理，運(yùn)算的操作越復(fù)雜，操作時(shí)間就越長(zhǎng)，程序運(yùn)行時(shí)間就越長(zhǎng)，得到的訪存帶寬就相應(yīng)減少。這就是為什么3次訪存的操作得到的帶寬比2次訪存操作得到的要大，而相同訪存次數(shù)的操作，加法要比乘法得到的結(jié)果要好。

2、MLC內(nèi)存延遲測(cè)試

??影響應(yīng)用程序性能的一個(gè)關(guān)鍵因素是應(yīng)用程序從處理器緩存和從內(nèi)存子系統(tǒng)獲取數(shù)據(jù)所消耗的時(shí)間，（Intel Memory Latency Checker(Intel MLC) 是一個(gè)用于測(cè)試延遲和帶寬隨著系統(tǒng)負(fù)載增加而變化的工具; 支持 Linux 、Windows；實(shí)現(xiàn)方法是: MLC 創(chuàng)建壓測(cè)主機(jī)邏輯處理器數(shù)量減 1 個(gè)線程，然后使用這些線程生成壓測(cè)流量，余下的 1 個(gè) vCPU 用于運(yùn)行一個(gè)測(cè)量延遲的線程。

類型	預(yù)期結(jié)果	測(cè)試步驟
stream內(nèi)存帶寬測(cè)試	Best Rate數(shù)值越高越好	1、安裝gcc下載http://www.cs.virginia.edu/stream/FTP/Code/stream.c 2、編寫測(cè)試腳本stream_test.sh 3、執(zhí)行腳本 #!/bin/bash #獲取可用memory available_memory_size=$(free -m \| grep Mem \| awk ?' { print ($4)10241024 } ' ) #計(jì)算最大array_size array_size=$((available_memory_size/8/6)) #編譯stream gcc -O stream.c -fopenmp -DSTREAM_ARRAY_SIZE=$array_size -DNTIME=30 -mcmodel=medium -o stream.o #執(zhí)行測(cè)試 ./stream.o
MLC內(nèi)存延遲測(cè)試	ns的值越低越好	1、下載wget https://downloadmirror.intel.com/736634/mlc_v3.9a.tgz 并解壓tar -zxvf mlc_v3.9.tgz 2、執(zhí)行命令 ./Linux/mlc --idle_latency -e -r -l128 -D8192

?　　鏈接：CPU/內(nèi)存/磁盤/網(wǎng)絡(luò)/redis/MQ測(cè)試工具合集文章來源地址http://www.zghlxwxcb.cn/news/detail-710259.html

到了這里，關(guān)于Linux-Stream內(nèi)存帶寬及MLC內(nèi)存延遲性能測(cè)試方法的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

性能測(cè)試分析案例-定位redis響應(yīng)延遲
預(yù)先安裝 docker、sysstat 、git、make 等工具，如 apt install docker.io sysstat 案例由 Python 應(yīng)用 +Redis 兩部分組成。其中，Python 應(yīng)用是一個(gè)基于 Flask 的應(yīng)用，它會(huì)利用 Redis ，來管理應(yīng)用程序的緩存，并對(duì)外提供三個(gè) HTTP 接口： /：返回 hello redis； /init/：插入指定數(shù)量的緩存數(shù)據(jù)，如果
2024年01月16日
瀏覽(21)
Redis【性能 02】Redis-5.0.14偽集群和Docker集群搭建及延遲和性能測(cè)試（均無法提升性能）
使用的是騰訊的云服務(wù)器 1核心2G內(nèi)存50G存儲(chǔ) ，系統(tǒng)信息如下：每個(gè)Redis節(jié)點(diǎn)必須要有一個(gè)備機(jī)，例如搭建3個(gè)節(jié)點(diǎn)的集群就要有6個(gè)Redis實(shí)例。數(shù)據(jù)按照slots分布式存儲(chǔ)在不同的Redis節(jié)點(diǎn)上，節(jié)點(diǎn)中的數(shù)據(jù)可共享，可以動(dòng)態(tài)調(diào)整數(shù)據(jù)的分布。可擴(kuò)展性強(qiáng)，可以動(dòng)態(tài)增刪節(jié)點(diǎn) ，最
2024年02月05日
瀏覽(23)
嵌入式linux設(shè)備網(wǎng)口帶寬-測(cè)試方法
iperf是一個(gè)基于Client/Server的網(wǎng)絡(luò)性能測(cè)試工具，可以測(cè)試TCP、UDP和SCTP帶寬質(zhì)量，能夠提供網(wǎng)絡(luò)吞吐率信息，以及震動(dòng)、丟包率，最大段和最大傳輸單元大小等統(tǒng)計(jì)信息，幫助我們測(cè)試網(wǎng)絡(luò)性能，定位網(wǎng)絡(luò)瓶頸。其中抖動(dòng)和丟包率適應(yīng)于UDP測(cè)試，二帶寬測(cè)試適應(yīng)于TCP和UDP。一
2024年02月10日
瀏覽(23)
08-linux網(wǎng)絡(luò)管理-nc命令（TCP|UDP網(wǎng)絡(luò)聯(lián)通測(cè)試，文件傳輸，帶寬測(cè)試）
- 監(jiān)聽TCP端口（默認(rèn)）說明： -l 啟動(dòng)監(jiān)聽模式（作為服務(wù)器監(jiān)聽指定端口） -v 顯示信息和錯(cuò)誤 - 監(jiān)聽UDP端口說明： -u UDP模式 - 鏈接TCP端口 - 鏈接UDP端口說明： -z 鏈接不傳輸數(shù)據(jù) - 接收數(shù)據(jù)重定向 - 上傳數(shù)據(jù) 檢查本地服務(wù)器是和 10.10.239.65的80端口是否能建立TCP鏈接。如上
2024年01月24日
瀏覽(28)
udx大帶寬大延遲網(wǎng)絡(luò)與xquic bbr, tcp bbr實(shí)測(cè)比較
quic在其白皮書中聲稱可以在大延遲大帶寬網(wǎng)絡(luò)中表現(xiàn)良好，為此我對(duì)比過目前xq,lsq,pq,tq幾種實(shí)現(xiàn)，因?yàn)檫@些都是開源項(xiàng)目通過不斷的折騰，向這方面研究的同學(xué)索取不同版本的實(shí)現(xiàn)進(jìn)行實(shí)際測(cè)試。經(jīng)過，對(duì)不同國家的主機(jī)，到國內(nèi)的實(shí)測(cè)總結(jié)出其實(shí)quic說是在大代寬，高延遲
2024年02月17日
瀏覽(23)
性能測(cè)試，python 內(nèi)存分析工具 -memray
Memray是一個(gè)由彭博社開發(fā)的、開源內(nèi)存剖析器；開源一個(gè)多月，已經(jīng)收獲了超8.4k的star，是名副其實(shí)的明星項(xiàng)目。今天我們就給大家來推薦這款python內(nèi)存分析神器。 Memray可以跟蹤python代碼、本機(jī)擴(kuò)展模塊和python解釋器本身中內(nèi)存分配，可以生成多種不同類型的報(bào)告，幫助您分
2024年02月15日
瀏覽(21)
iOS性能測(cè)試方法-獲取手機(jī)內(nèi)存數(shù)據(jù)
最近在研究如何獲取iOS手機(jī)性能數(shù)據(jù)（主要是內(nèi)存），看了一圈目前主流的方法主要是兩種： 1.阿里開源的iOS自動(dòng)化測(cè)試工具tidevice；2.xcode自帶的instruments； 1.cpu 正常在20%-40%左右，超過80%需要引起重視。 2.內(nèi)存 rss：私有內(nèi)存+所有共享內(nèi)存，pss：私有內(nèi)存+比例分配共享內(nèi)存，
2024年02月07日
瀏覽(19)
Linux性能優(yōu)化--性能工具：系統(tǒng)內(nèi)存
本章概述了系統(tǒng)級(jí)的Linux內(nèi)存性能工具。本章將討論這些工具可以測(cè)量的內(nèi)存統(tǒng)計(jì)信息，以及如何使用各種工具收集這些統(tǒng)計(jì)結(jié)果。閱讀本章后，你將能夠：理解系統(tǒng)級(jí)性能的基本指標(biāo)，包括內(nèi)存的使用情況。明白哪些工具可以檢索這些系統(tǒng)級(jí)性能指標(biāo)。每一種系統(tǒng)級(jí)Linu
2024年02月07日
瀏覽(22)
Linux性能優(yōu)化--性能工具：特定進(jìn)程內(nèi)存
本章介紹的工具使你能診斷應(yīng)用程序與內(nèi)存子系統(tǒng)之間的交互，該子系統(tǒng)由Linux內(nèi)核和CPU管理。由于內(nèi)存子系統(tǒng)的不同層次在性能上有數(shù)量級(jí)的差異，因此，修復(fù)應(yīng)用程序使其有效地使用內(nèi)存子系統(tǒng)會(huì)對(duì)程序性能產(chǎn)生巨大的影響。閱讀本章后，你將能夠：確定一個(gè)應(yīng)用程序使
2024年02月07日
瀏覽(28)
linux性能優(yōu)化-內(nèi)存原理
只有內(nèi)核才可以直接訪問物理內(nèi)存，Linux內(nèi)核給每個(gè)進(jìn)程都提供了一個(gè)獨(dú)立的虛擬地址空間，并且這個(gè)地址空間是連續(xù)的。這樣，進(jìn)程通過訪問虛擬內(nèi)存來訪問內(nèi)存。虛擬地址空間的內(nèi)部又被分為內(nèi)核空間和用戶空間兩部分，不同字長(zhǎng)（也就是單個(gè) CPU 指令可以處理數(shù)據(jù)的最
2024年02月01日
瀏覽(23)