富士通/RAIDチップ/ 放熱対策
06 01, 2022

富士通サーバーTX2550M4にはRAIDコントローラーカードとしてEP420iが搭載されています。iRMCの表示ではチップ温度が通常運転時で85度にもなります。半導体温度が常時75度を超えているのは異常に感じます。観察すると小さな放熱板がついているだけです。対策として50x50x20mmの放熱板+熱密着に高熱伝導シリコンシートを採用。チップ温度は一気に60度まで下がり安定しました。
富士通の警告温度が110度なので、知らずに運用を続けていたら熱でチップが劣化してシステムが壊れていたのでしょう。iRMCで観察してなければ全く気がつかないサイレント爆弾。
他の富士通サーバーのRAIDコントローラーのチップ温度も80度を超えていました。
恐怖のエラーメッセージ RAID Ctrl SAS /Controller encountered a fatal error and was reset『RAIDコントローラーが致命的なエラーに遭遇したのでリセットした』も届かなくなりました。
下記はTX1320m3 の様子。こちらはFANの増設で対応しました。85度→58度。
