服务器电源故障:PSU丢失 (服务器psu lost)

随着技术的不断进步和应用的广泛,我院的服务器已经成为了科研、学习等多种场合必不可少的工具。然而,在日常使用中,我们也不可避免地会遇到各种各样的问题。今天,我要说的就是服务器电源故障——PSU丢失。

一、PSU是什么?为什么重要?

PSU(Power Supply Unit),即电源单元,是服务器的核心组成部分之一,主要作用是将交流电转换为稳定的直流电,为服务器设备提供稳定的电源供应。电源单元的重要性相信大家都非常清楚,一旦出现故障,整个服务器可能就会瘫痪,并且可能对硬件设备造成不可逆的损坏。

二、为什么会出现PSU丢失的故障?

1.供电线路问题:PSU丢失也有可能是由于供电线路的问题而引起的。在供电线路某个部分出现故障、电缆脱落或者接触不良,都可能影响整个服务器的正常运行。

2.电源单元质量问题:安装在服务器上的电源单元质量差可能也是PSU丢失的原因。比如电源单元内部元器件老化、质量不过关等,都会引起电源单元供电不稳定、甚至丢失的问题。

3.人为错误:在使用过程中不当操作也可能导致电源单元供电不正常。比如在更换硬件设备的时候没有关掉电源开关,导致PSU出现丢失。

三、PSU丢失的处理方法

遇到服务器电源故障,最需要做的就是及时对其进行处理,避免对服务器的正常运行造成过大的影响。处理方式如下:

1.排除线路问题:首先需要检查服务器的电源线路是否连接正常,电线是否老化脱落等,如果发现问题要及时修复,确保线路畅通无阻。

2.更换电源单元:如果发现电源单元内部存在元器件老化、电源模块存在裂缝等质量问题,需要及时更换。在更换电源单元的过程中,需要保证操作人员有一定的专业知识。

3.检查人为错误:如果发现电源单元丢失是由于人为操作不当引起的,要及时排查问题,避免不必要的损失。

四、如何预防PSU丢失的故障?

1.选择质量过关的电源单元:在购买电源单元时,要选择质量过关的品牌和型号,比如Intel、Delta、Cisco等。因为质量过关的电源单元性能更稳定,安全性更高,也更不容易发生故障。

2.开展定期维护:在日常使用中要注意定期进行维护和保养,比如清洁和更换适合的散热器,确保电源单元的正常工作。

3.加强培训:在使用服务器前,需要对操作人员进行一定的培训,包括如何更换硬件、如何操作电源等方面,加强人员技能的培养,减少不必要的操作失误引起的故障。

PSU丢失是服务器电源故障中常见的故障之一,也是最容易对服务器整体造成影响的故障。因此,我们在服务器日常使用中需要引起足够的重视,提高操作人员的技能培训,同时对服务器进行定期维护和保养,确保服务器的正常、安全运行。

相关问题拓展阅读:

服务器宕机什么意思?

宕机什么意思?

  宕机是计算机术语,口语里面我们简单的把停掉机乱握器叫做down机,转换为汉字是“宕机”,但很多人都叫做“当机”/“死机”,虽然不规范但却流行。

  down就是up的反义,就是计算机不能正常工作了,包括一切原因而导致出现的死机。

  (1)一般情况下指的就是计算机主机出现意外故障而死机;(2)一些服务器故障,包括服务器主机,数据库死锁或者DNS故障都可以称为宕机,一切服务旦陪世器的某些服务挂掉了,都可以这么说。

  一般来说,普通的电脑出现故障,称之为“死机”,很少会说宕机;而一些知名网站或者媒体服务器出现故障时,通常会被报道为宕机,比如此前微信就出现很多次服务器宕机现象,导致用户无法登陆,被不少媒体报道过。

 其实,宕机是一种非常常见的现象,一般是指网站服务器出现故障,导致服务中断。由于服务器通常都是365天不间断的工作,因此很多网站模肢都会出现宕机故障,比如苹果、百度、京东等知名大网站也出现过。由于这些大网站,通常会配备多台服务器,因此宕机出现的概率极少。

  而对一些中小网站来说,其实每天都在上演宕机,只是鲜为人知罢了。媒体从来只会曝光成功的大型网站宕机故障,一些失败的企或小网站,是没有理会或在乎的,因此宕机事件也不是经常有报道,但是很多宕机现象在很多中小网站中,基本天天都在上演。

可以罩亩棚简单的理解为死机.服务器是硬件设备耐隐.而且是全年二十四小时不间断运行的.通常负载量也较大.所以时间一长就容易出现

宕物则机

的情况.只要不是太频繁.就是完全正常的.一般常用服务器的人都知道.每隔一段时间定期手动重启下机器.对机器的性能有很大帮助.而且可以避免宕机的情况.毕竟服务器也是硬件.长期运行中间也应该有个喘气的过程.

服务器宕机即服务器无法正常工作,出现故障死机。服务器宕机的原因有很多,会导致服务器服务中断。

意思就是服务器挂了!

挂了的意思就是死了!

死了的意思就是不工作了!

服务器宕机就是死机,挂了,不工作的意思

能耗峰值建模Peak Power Modeling for Data Center Servers with Switched-Mode Power Supplies

针对问题:CPU利用率可以建模平均能耗,但是对于预测峰值粒度过粗。

提出模型:表征服务器利用率和电源行为之间的关系,对实际峰值功耗建模。引入新的操作系统指标,捕获所需信息,以较低的开销设计峰值功率。

如今,数据中心运营商普遍以几十分钟到几小时的采样间隔收集实用跟踪信息。 由于存储和处理的开销,对成千上万的服务器禁止更细粒度的采样。 例如,对于1000个节点的群集,以OS调度程序的粒度(100Hz)采样将每周产生225 GB数据。

要确定服务器的峰值功率,就要了解服务器 开关模式电源单元(PSU插座式电源) 的行为。这些设备效率很高,但是依赖于开关和电荷存储机制,从而将 RC(电阻-电容)行为 引入了功耗。我们的贡献是将服务器的操作系统视图与电源能耗峰值相连接。

介绍一个易于采集的操作系统级别的度量(30ms),该度量可确定一段时间内的峰值功耗。通过模型合并PSU的RC行为,并以较低的开销跟踪峰值功率。这种机制可以记录随时间变化的峰值功率,并有助于大规模数据中心能耗供应研究。

贡献:

说明了以细粒度采集利用率所面临的挑战,以及峰值和平均度量之间的重要差异。

服务器开关电源单元的特性及其能耗与服务器利用率之间关系的解析信号处理模型。

一种新的操作系统级度量标准,可捕获峰值功率信息以用于服务器检测。

通常PDU会被过度配置,预配置容量远高于平均负载。

功率上限power capping是一种数据中心级别的技术,可以对服务器的峰值功耗(例如,使用控制回路)进行硬限制。节流服务器电源DVFS(通过频率/电压缩放)用作安全机制,以确保不超过更大功率水平并且断路器不跳闸。使得PDU和其他电源供应基础架构就可以得到超额订购,从而降低了有效的资本成本。由于负载/功率峰值很少,因散埋此节流性能几乎没有损失。通过使用电源路由可以进一步降低资本成本,这可以在负载不平衡时在PDU之间转移负载。

所有这些技术都需要软件机制来跟踪和预测峰值功率,以管理每个服务器,电路和PDU的功率预算,同时更大程度地降低性能节流。尽管可以通过显式计量和记录来跟踪峰值功率,但是直接从操作系统级别的指标评估峰值功率可以大大降低成本。要从操作系统级别的指标推断和记录峰值功率,我们必须了解服务器电源的操作及其与利用率的关系。

服务器中PSU设备的行为以及其与OS观察到的利用率的关系。

研究对象: 两种不同的系统:具有便宜商品PSU(“商品”)的小型系统和具有企业级PSU(“服务器”)的大型系统。 由于PSU的设计不同,这些系统在行为上存在一些差异。 但是,与预测峰值能耗方面相似。

商品PSU的峰值传输电流比服务器更明显。 这种差异是由于在高端设备中常见的之一级额外开关调节,用于产生更连续的电流。

使用工作负载SQUARE观察 利用率 变化 频率 的影响。使内核在 矩阵乘法 与处理器 空闲模式 之间切换,使系统利用率产生方波。工作负载的 占空比(占空比是指在一个脉冲循环内,通电时间相对于总时间所占的比例) 固定为50%,平均利用率为50%。改变方波的频率,并观察PSU的响应。

使用工作负载STEP表征 利用率变化和PSU响应之间的延迟 。使系统处于空闲状态,等待直到PSU行为达到稳定状态。然后在所有内核上进行矩阵乘法。由于无法直接从外部观察CPU利用率,因此在过渡到在示波器上开始计时之前立即发送了一个信号(使用比预期的PSU响应快得多的通用I / O)。

图5表明:调制频率对观察到的功率波形有很大影响。 只要对CPU的利用率进行缓慢调制,功耗的包络就大致类似于方波,与CPU的行为相匹配。 然而,随着频率增加,功率消耗变得更加均匀。

对PSU峰值进行建模,以细粒度纳链(在许多系统的内核调度间隔附近)监控利用率。

使用STEP工作负载研究PSU电源负载的相位延迟。 瞬洞掘孙时功率响应存在一个延迟,该延迟随着RC滤波的阶跃函数的期望而增加。 图示利用率转换的I / O信号(“trigger”)以及隐含的利用率波形(“ Utilization”)。 最后,我们显示了一个已过滤(“filter”)的阶跃函数,该函数适合观察到的上升波形。 该信号由具有界限频率30 Hz的一阶RC滤波器产生。

低于20HZ的更细微的变化会被电源的RC行为过滤掉,因此不考虑。 通过对PSU的运行及其与服务器利用率的关系的新了解,我们构建了一种开销低的方法,可以从操作系统内核的利用率中推断出峰值功率。 然后,我们使用真实的机器验证我们的模型,并表明我们可以预测峰值功率曲线,且误差低于20%。

实验设置:两种服务器配置验证能耗模型。

在系统执行Linux内核的并行编译时收集能耗,该工作负载产生了混乱的突发使用模式。

 瞬时能耗(“实测”)。预测能耗(“ Predicted”)很好地跟踪能耗峰值,但有时能耗仍然超出预测值。 幸运的是,该模型趋于保守,并且高估的能耗多于低估的能耗。 因此,它将在例如功率预算/封顶研究中提供保守估计。 商品计算机和服务器计算机的标准化均方根偏差(NRMSD)分别为14%和19%。

总结

1.使用CPU利用率对服务器的峰值功耗建模。

2.描述了OS级利用率与现代服务器中PSU行为之间以前被忽略的关系。 

3.通过测量真实的服务器PSU,证明必须以 33 ms或更低的粒度监视利用率以预测峰值功率 。 我们基于轻量级PSU的RC行为的信号处理启发模型,介绍了OS级解决方案,并演示了峰值功率可以近似在20%的NRMSD之内。

关于服务器psu lost的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。


数据运维技术 » 服务器电源故障:PSU丢失 (服务器psu lost)