ProLiant ML115の高温注意

最近、起動するたびに怪しいメッセージが表示されるようになってしまった。

10秒程度放置しておくか、F1キーを押すと普通に起動するのだが非常に気になる。

https://hkjunk0.com/wp-content/uploads/ml115_warning01.jpg

何かのイベントが起こっているっぽい。

何かのイベントが起こり、ログが満杯になっているということだけは分かるので、BIOSから確認してみることに。

早速再起動し、BIOS画面から「Event Log Configuration」を選択。

https://hkjunk0.com/wp-content/uploads/ml115_warning02.jpg

各種情報を表示する機能のうち、イベントログを選択。

ここで、「View Event Log」を選択してみたが、全てのイベントが既読ということで何も手がかりが見付からなかった。

https://hkjunk0.com/wp-content/uploads/ml115_warning03.jpg

試しにイベントログを参照してみるが...

https://hkjunk0.com/wp-content/uploads/ml115_warning04.jpg

全然よく分からない...残念。

色々とBIOSの設定を探してみて、次に「Advenced Settings」から「IPMI Configuration」を選択。

ところで、IPMIって一体何なのか調べてみると、「Intelligent Platform Management Interface」の略であり、Intelが提唱している規格らしく、ハードウェアとかOSとかに依存しないでネットワーク経由でBIOSを操作とかできてしまうインターフェイスっぽい。

そういえば、起動時に表示されるメッセージに「BMC Responding」とあったので、この絡みかも知れない。

https://hkjunk0.com/wp-content/uploads/ml115_warning05.jpg

高度なセッティングから、IPMIの設定を選択。

ここで、関係ありそうな「SEL Configuration」を選択する前に、一番下にある「Hardware health information」を選択すると、CPUの温度とかCPUファンのスピードとかが確認できる。

...なんだかCPUの温度が非常に高くなっている...もしかして、これが原因か?

https://hkjunk0.com/wp-content/uploads/ml115_warning06.jpg

先にハードウェアの健康状態を確認するのだ。

https://hkjunk0.com/wp-content/uploads/ml115_warning07.jpg

周囲の温度に比べ、CPU温度が高過ぎ?

で、「SEL Configuration」を選択し、「View BMC System Event Log」を選択すると、かなり細かい情報が表示される。

https://hkjunk0.com/wp-content/uploads/ml115_warning08.jpg

イベントログとは別にこんな所に別のログを発見。

出現したイベントログを見てみると...やはりCPUが高温を発しているのでセンサーが異常を感知したというログがざっくざくと現れた。

https://hkjunk0.com/wp-content/uploads/ml115_warning09.jpg

記録されているログが383個もあった。

https://hkjunk0.com/wp-content/uploads/ml115_warning10.jpg

高温で致命的というログメッセージ。非常に危険。

一応原因は判明したので、ログをクリアすることに。

クリアの方法は、単に「Clear BMC System Event Log」を選択して同意するだけと非常に楽チン。

ということで、きれいさっぱりとログをクリアすることができましたとさ...しかし全然原因の対策ができていない(^^;)。

ま、CPUを冷却すれば良いだけなんで、あとからぼちぼちとやりますか...

https://hkjunk0.com/wp-content/uploads/ml115_warning11.jpg

BMCイベントログをクリアしますか?という確認。

https://hkjunk0.com/wp-content/uploads/ml115_warning12.jpg

きれいさっぱりとクリアされたBMCのイベントログ。