??smartctl是一個用于監(jiān)測和分析硬盤健康狀態(tài)的工具,可以用于檢測是否存在壞的磁盤。以下是使用smartctl檢查磁盤健康狀態(tài)的步驟:
-
安裝smartctl軟件
在Linux系統(tǒng)中,smartctl通常包含在smartmontools軟件包中。如果您還沒有安裝smartmontools,可以使用以下命令安裝(大部分NAS自帶,如TrueNas):sudo apt-get install smartmontools # Debian/Ubuntu sudo yum install smartmontools # RedHat/CentOS
-
查找磁盤設(shè)備名稱
使用以下命令查找磁盤設(shè)備名稱:sudo fdisk -l
-
運行smartctl檢查磁盤
使用以下命令運行smartctl檢查磁盤:sudo smartctl -a /dev/sda
將
/dev/sda
替換為您要檢查的磁盤設(shè)備名稱。該命令將列出有關(guān)磁盤健康狀態(tài)的詳細(xì)信息,包括錯誤計數(shù)和預(yù)測故障時間等。請注意,您可能需要使用root權(quán)限才能運行smartctl。 -
檢查smartctl輸出
在smartctl輸出中查找關(guān)于磁盤健康狀態(tài)的信息。重點關(guān)注以下字段:- SMART overall-health self-assessment test result:如果該字段的值為“PASSED”,則磁盤沒有發(fā)現(xiàn)健康問題。如果該字段的值為“FAILED”或“UNKNOWN”,則磁盤存在健康問題。
- Reallocated_Sector_Ct:這是已經(jīng)重新分配的扇區(qū)的數(shù)量。如果該值不為0,則磁盤存在壞扇區(qū)。正常情況的RAW_VALUE如下:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
- Current_Pending_Sector:這是目前正在等待重新分配的扇區(qū)數(shù)量。如果該值不為0,則磁盤存在潛在的壞扇區(qū)。
- SMART overall-health self-assessment test result:如果該字段的值為“PASSED”,則磁盤沒有發(fā)現(xiàn)健康問題。如果該字段的值為“FAILED”或“UNKNOWN”,則磁盤存在健康問題。
??如果smartctl輸出中沒有發(fā)現(xiàn)健康問題,那么磁盤應(yīng)該是正常的。否則,您可能需要更深入地分析問題或考慮更換磁盤。
??以下是我個人在檢測過程中遇到的一些問題。
1 什么情況下需要使用smartctl -t?
??smartctl命令的“-t”選項用于執(zhí)行一次磁盤自檢測,以便發(fā)現(xiàn)磁盤上的任何潛在問題。使用“-t”選項后,smartctl將在后臺啟動自檢測,并在完成后提供結(jié)果。因此,如果您想要獲得磁盤的最新自檢測結(jié)果,您需要使用“-t”選項運行smartctl。
??但是,如果您只是想檢查磁盤的當(dāng)前狀態(tài),而不需要運行一次自檢測,您可以直接運行“smartctl -a”命令來獲取磁盤的健康狀態(tài)信息。這個命令將列出有關(guān)磁盤的當(dāng)前狀態(tài)和屬性信息,例如溫度、電源周期、故障計數(shù)等等。
??綜上所述,如果您想要運行自檢測以獲取最新的磁盤狀態(tài)信息,您應(yīng)該使用“smartctl -t”命令。如果您只是想獲取磁盤的當(dāng)前狀態(tài)信息,您可以直接使用“smartctl -a”命令。
2 如何查看我的磁盤的類型,以及其支持的SMART屬性?
??您可以使用smartctl命令來查看您的磁盤類型和支持的SMART屬性。以下是如何查看它們的方法:
-
運行“smartctl -i”命令,以獲取磁盤的基本信息。該命令將列出磁盤的制造商、型號和序列號等信息。例如:
$ sudo smartctl -i /dev/sda smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-89-generic] (local build) Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Samsung based SSDs Device Model: Samsung SSD 970 EVO Plus 500GB Serial Number: S5H7NX0N659415D LU WWN Device Id: 5 002538 8b0c6d96d Firmware Version: 2B2QEXM7 User Capacity: 500,107,862,016 bytes [500 GB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Form Factor: M.2 TRIM Command: Available, deterministic, zeroed Device is: Not in smartctl database [for details use: -P showall] ATA Version is: ACS-4, ATA8-ACS T13/1699-D revision 4 SATA Version is: SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Tue Feb 15 19:48:47 2022 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled
-
查找“Device Model”屬性,以獲取磁盤型號。例如,在上面的輸出中,“Device Model”屬性的值為“Samsung SSD 970 EVO Plus 500GB”。
-
運行“smartctl -A”命令,以獲取磁盤支持的SMART屬性列表。該命令將列出磁盤支持的SMART自檢測和報告屬性。例如:
3 電源周期和故障計數(shù)怎么看?
??電源周期(Power-On Hours,縮寫為POH)和故障計數(shù)(Error Counters)是smartctl命令輸出中的兩個常見磁盤屬性。以下是如何查看它們的方法:
??運行“smartctl -a”命令以獲取磁盤的詳細(xì)信息。在命令輸出的最后一部分,您可以看到所有SMART屬性及其當(dāng)前值。
??查找“Power_On_Hours”屬性。它是磁盤的電源周期屬性,表示磁盤啟動以來的累計使用時間,以小時為單位。
??查找“Error_Counters”屬性。這是一個包含多個子屬性的屬性,它們記錄磁盤的錯誤計數(shù)。例如:
- “Raw_Read_Error_Rate”記錄從磁盤讀取數(shù)據(jù)時未能糾正的錯誤數(shù)。
- “Seek_Error_Rate”記錄尋道時出現(xiàn)錯誤的數(shù)量。
- “Spin_Retry_Count”記錄在旋轉(zhuǎn)磁盤時需要重新嘗試讀取數(shù)據(jù)的次數(shù)。
- “Reallocated_Sector_Ct”記錄已經(jīng)重新分配的壞扇區(qū)數(shù)。
- “Current_Pending_Sector”記錄當(dāng)前未能讀取的壞扇區(qū)數(shù)。
- “Offline_Uncorrectable”記錄離線狀態(tài)下發(fā)現(xiàn)的無法校正的壞扇區(qū)數(shù)。
??這些屬性中的任何一個都可能表示磁盤存在問題,需要進(jìn)一步檢查或更換。
??請注意,不同的磁盤可能會使用不同的屬性名稱和計數(shù)單位。在查看SMART屬性時,請務(wù)必查看smartctl命令輸出的完整內(nèi)容,并仔細(xì)查看所有可能表示磁盤問題的屬性。
4 在輸出信息里沒有看到Error_Counters屬性?
??如果您在運行“smartctl -a”命令后未看到“Error_Counters”屬性,則可能是因為您的磁盤不支持該屬性,或者該屬性未被正確報告。不同的磁盤可能支持不同的SMART屬性,因此某些屬性可能不適用于您的磁盤。
??在這種情況下,您可以查看“smartctl -a”命令輸出的其他部分,以查找其他可能指示磁盤問題的屬性。例如,您可以查看與磁盤健康狀況相關(guān)的屬性,例如溫度、噪音、振動、磁盤旋轉(zhuǎn)速度等等。您還可以查看任何報告磁盤錯誤或警告的消息。
??請注意,如果您認(rèn)為磁盤存在問題,但無法通過SMART屬性來確認(rèn)它們,您可以使用其他工具來進(jìn)行更全面的磁盤診斷和測試。例如,您可以使用磁盤制造商提供的磁盤測試工具,或者使用第三方工具來進(jìn)行全面的磁盤掃描和測試。
5 Seek_Error_Rate非常多是正常的嗎?
??在 SMART 報告中看到大量的 Seek_Error_Rate 值通常是不正常的。該屬性指的是磁盤尋道時發(fā)生錯誤的頻率,是一個關(guān)鍵的SMART指標(biāo)之一。值越高通常意味著出現(xiàn)問題的可能性越高,應(yīng)引起注意。
??但是,應(yīng)該根據(jù)磁盤制造商的建議來解釋磁盤SMART屬性。不同的制造商可能會使用不同的算法和尺度來計算SMART屬性值。此外,一些磁盤可能具有自動糾正錯誤的功能,這意味著即使 SMART 報告中出現(xiàn)了一些錯誤,磁盤仍然可以正常工作。
??因此,建議您查看磁盤制造商的文檔,以了解有關(guān)SMART屬性值的詳細(xì)信息,或者您可以將SMART報告提供給制造商進(jìn)行分析,以獲得更準(zhǔn)確的解釋。如果您對磁盤的健康狀況感到擔(dān)憂,最好備份重要數(shù)據(jù),并考慮更換磁盤。文章來源:http://www.zghlxwxcb.cn/news/detail-497297.html
我的硬件型號是:ST16000NM000J-2TW103。希捷對Seek_Error_Rate的計算方式不同,詳見b站文章:希捷機械硬盤讀取錯誤率和尋道錯誤率很高?讓我們看看到底是怎么計算的吧!文章來源地址http://www.zghlxwxcb.cn/news/detail-497297.html
到了這里,關(guān)于【記錄】smartctl|Linux如何通過smartctl查看有沒有壞的磁盤?以及使用時長、電源周期、故障記錄等的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!