Linux 硬盘状态监控:保护数据重要一步(linux硬盘状态)

Linux是如今热门应用的一种操作系统,尤其是运行服务器端程序时。在服务器端,根据业务需求,硬件是需要提供稳定性与可靠性的,因为服务器硬件要处理的数据通常都是非常重要的,而Linux的硬盘状态监控可以提前发现隐患,从而提高服务器端的可靠性。

一般而言,Linux硬盘状态监控是根据S.M.A.R.T.原理来完成监视硬盘状态,SMART全称为”Self-Monitoring,Analysis&Reporting Technoology”,意即“自我监控,分析和报告技术”。简单来说,Linux根据该原理可以监控硬盘上各类电子部件的状态。

用于Linux监控硬盘状态的工具名为“hdparm”,可以安装在Debian和Fedora系统。安装完成后,可以使用以下命令查询硬盘的SMART信息:

$ sudo hdparm -I /dev/sda | grep -i 'S.M.A.R.T'
S.M.A.R.T enabled
S.M.A.R.T features: Enabled

以上代码可以看到硬盘是否开启了SMART功能,假如看到的不是“Enabled”,则需要用以下的代码开启SMART功能:

$ sudo hdparm -s on /dev/sda
/dev/sda: S.M.A.R.T. saet to on

SMART功能开启完成后,就可以使用以下命令来查看硬盘状态:

$ sudo smartctl -A /dev/sda
smartctl 6.4 2015-06-04 r4109 [x86_64-libreos-4.4.3-1-amd64] {LibreSSL 2.2.7}
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SEC⁩TION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG value WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 1843233704
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
3 Spin_Up_Time 0x0003 100 100 025 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 79
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
.....

上面的代码会显示硬盘的所有SMART信息,包括硬盘的新旧程度、写入/读取出错信息、温度等。一般来说,每个属性都有一个“Raw Value”,若该属性变为0,就代表硬盘出了故障,此时应该及时去更换硬盘。

Linux硬盘状态监控虽然实际操作比较繁琐,但对保护重要的数据具有重要的意义,有效的监控可以及时发现硬盘的实际情况,从而有效提前预防一些故障,保护重要数据,这是保障稳定的一步,也是服务器稳定运行非常重要的环节之一。


数据运维技术 » Linux 硬盘状态监控:保护数据重要一步(linux硬盘状态)