2020年7月30日 星期四

HPE DL380-Gen7 P410i 512M Cache &Battery Upgrade 1G Cache & Battery(BBWC)


HPE DL380-Gen7 P410i 512M Cache & Battery Upgrade 1G Cache & Battery(BBWC)

故障情況
RAID卡電池故障要更換RAID卡電池

操作步驟
1.          Server正常程序將作業系統關機(客戶執行)
2.          啟動UUID燈號,確認後方機器位置及移除網路線
3.          確認面板LED為恆亮橘燈後,待30秒後,將後方電源線移除
4.          移除上蓋及PCI擴充卡
5.          確認新舊Cache與電池料號,經工程師比對發現兩者為不同的料號,查詢後新的料件為1GB Cache SP料號 505908-001 電池料號 P/N 571436-002
6.          發現新舊電池的接頭大小不相同
7.          在未經確認原512MCache升級到1G Cache是否會有問題的情況下,將新的1G Cache與電池 模組安裝在機器上
8.          在更換完 1G Cache與電池模組 後,發生了無法進入作業系統開機程序,進 RAID BIOS 後查看,看不到任何磁碟陣列
9.          現場當下先告知客戶,看不到原先的RAID Configuration的狀況,並告知客戶要更換回原先的舊Cache與電池模組
10.      更換回原先舊的512M Cache與電池

11.      開機後,依舊無法進入作業系統,進入RAID BIOS後查看,出現以下訊息

12.      與供應商聯繫,廠商說他們公司確認過料件是正常,且也可以安裝在DL380 G7上,詢問是否有可以解決的方式,廠商回覆說,請客戶啟動備份回原機制或是備機機制,再次確認有無解決方式,回覆說應該是無解
13.      與精技的工程師聯繫之後,經查核,新的1G Cache與電池模組 是符合DL380 G7的選購相容性套件,從上敘的錯誤訊息得知是因為cache大小不同或是硬碟大小與原先的設定檔不同,RAID系統進一步的將邏輯硬碟設為Disable,導致無法開機
14.      精技的工程師建議先把新的1G Cache及電池裝上去並把硬碟移除,在開機的過程,檢視RAID Controller訊息旁的光棒是否有在旋轉,若有在旋轉,則代表該Cache與電池是正常的,然後在找另一組新512M的電池及Cache,做交叉測試,因擔心造成更大的資料損失,因此,並未將新的1G Cache及電池安裝上去做測試,也無其他512MCache與電池料件,故未執行該兩種測試方式,已確保RAID的設定與資料的保護
15.      與群環的工程師-Hank聯繫,工程師懷疑是因為原先的RAID設定中的Cache大小參數值為512M,但當將新的1G Cache裝上去時,與原先的設定檔不符,因此,將邏輯硬碟設為Disable,這是正常的情況
16.      工程師建議,關機後,將電源線移除,把原先512MCache及電池模組裝回去,並將SAS Cable從主機板上移除,只留512MCache與電池,送電開機,偵測看原先的512M Cache與電池是否能偵測到?
17.      送電開機後,RAID Controller 顯示有偵測到512MCache與電池故障的訊息後,正常程序跳離RAID Controller後,關機斷電
18.      把原先的SAS Cable在接回原先的位置,送電開機,RAID Controller有偵測到原本的RAID Configuration與電池故障的訊息,正常程序離開RAID BIOS後,可進入作業系統開機程序

缺失檢討
1.          新舊料號不同時,工程師未在確認過是否會導致磁碟陣列有無問題下就先行安裝新的cache與電池模組
2.          在更換前Cache與電池前,未與客戶確認是否已經有先行做系統及資料的備份
3.          未告知客戶,更換過後可能發生的風險
4.          日後若有新品規格料件與原先舊品不同時,則一律不更換,以確保責任歸屬問題,若客戶執意要更換,則需先簽署資料遺失不負責之相關切結書
5.          以往的經驗都Raid卡原先的電池故障就只更換電池,並不需要更換cache卡,因為新舊電池的接頭種類大小不同的關係,如要安裝新款的電池,則必須連同Cache卡一起更換,Cache的功能在於保護機器未正常關機,突然中斷電力時,電池可以提供短暫的電力,以確保cache上資料能回寫到硬碟,而RAIDConfiguration會存放在硬碟及RAID主機板上,理論上更換Cache會增加RAID的效能,原先的資料,應該是不受影響


料件品名
512M Cache的料號為P/N & AS# 都為 013224-002SPS 462975-001
原電池料號為P/N 460499-001SPS料號為462976-001AS# 013277-001

到貨的品名為 HP Smart Array Controller Battery(With 1GB Cache) P/N 587324-001(571436-002)
1GB Cache SP料號 505908-001 AS# 570501-002
電池料號 P/N 571436-002

參考資料
更換電池的相關步驟
https://support.hpe.com/hpesc/public/docDisplay?docId=c02912639&docLocale=zh_TW
https://support.hpe.com/hpesc/public/docDisplay?docId=c02860211&docLocale=zh_TW

BBWCFBWC的差異
https://community.hpe.com/t5/proliant-servers-ml-dl-sl/difference-between-bbwc-and-fbwc/td-p/4667799

國外論壇也有案例,把原先的cache256M Upgrade 512M的討論
https://serverfault.com/questions/427670/hp-p410i-array-controller-what-happens-if-i-add-memory

1 則留言:

  1. HP DL380 Gen9 Rack Server in UAE, Proliant 2U Rack Server in UAE, Rack Server in UAE
    https://gccgamers.com/hp-dl380.html
    HP DL380 Gen9 Rack Server in UAE, Safe Shopping Multiple Payment Options Express Delivery GCC Gamers Moneyback Guarantee.
    1634536053196-7

    回覆刪除