高可用的SAP系統架構的實現
SAP的高可用軟件提供給我們很方便的配置接口,讓汽車用戶可以配置多樣的高可用汽車軟件。SAP系統穩定性是建立在不斷完善的監控基礎上的,需要不斷的從系統運行過程中彌補完善,穩定的系統是建立在穩定的規范的使用者上的,所以上線前的必須注意到統一安裝,在上線后要做好審計等工作,這樣系統在投入運行中才會確保數據的安全性。整個系統的穩定,高可用是建立在系統調研,設計,實施,測試,部署上線和運維中的,互相彌補,相輔相成,得以形成一個統一的穩定的可靠的ERP汽車系統。
1、ERP系統架構的擴容歷史及范圍
公司從成立項目組開始至目前XX品牌的XX汽車的上市,ERP系統經歷了多次擴容和升級,期間更涉及一次平臺轉換的遷移,兩次SAP版本的升級。具體的版本是ECC5.0升級到ECC6.0,又從ECC6.0升級到目前我們使用的SAP的EHP4版本。硬件設備從四臺服務器的SERVER擴展到二十四臺服務器的高可用的分布式的架構,涉及各類功能服務器有R3,APO,EWM系統,涉及的五個汽車工廠。在系統不斷擴張,業務應用需求不斷地提升的情況下,IT是如何保障用戶的高可用性,并保證系統的運維性能指標從99.96% 提升到99.99%乃至100%,下面我會分別闡述IT是如何在構建,運維,管理上確保該系統的安全可靠,高可用性。
2、ERP建構的高可用集群是技術的基礎
IT的ERP總體構建為高可用性架構,主要系統為R3和SCM系統目前使用的是HP的64位BL870c i2的刀片機,操作系統版本為HP-UX 11.31,配置高可用性使用的軟件是Service Extension for SAP version B.05.10。支持應用的數據庫和核心的central instance應用在系統出現硬件問題或網路交換機之間出現連接問題時,會觸發共享的磁盤陣列進行切換,關鍵的應用系統被接管到了另一個節點,從而保證了外圍應用服務器 DVEBMGS00,D02,D0n可以不間斷的支持客戶端用戶使用。保證了系統在故障時可以切換到可用的節點,繼續為用戶提供必需的所有汽車業務應用。
3、SAP修改機制確保業務修改后的穩定性
大家一定知道汽車業務ERP系統的穩定性和汽車業務新的不斷變化的需求之間是一對矛盾,IT在新汽車業務變化時系統往往不得不進行系統更改,程序版本更新,程序修正等等,這些不穩定的因素將使日常業務的穩定性和系統的穩定性受到影響,嚴重的將會造成系統服務器宕機,汽車整車廠生產線停線等。所以一個良好的ERP系統必須提供給用戶良好的修改和配置的功能,才能適應不斷變化的企業級汽車應用。SAP Change Request功能就為靈活的變更提供了變更方面的技術支持和技術控制,用戶在修改程序時SAP會在開發機提供一個變更請求號,所有的程序修改,權限的修改,配置的修改,程序的版本記錄都通過修改號記錄在數據庫中,便于用戶檢查,回退等控制操作。在這些修改結束后的發布階段,通過helpdesk人員手工傳輸程序的改變到測試機,在測試機進行用戶驗證完成后,才能傳入生產機最終上線提供給最終用戶使用。該傳輸路徑在系統投入后基本就保持不變。Change Request的運行機制確保了系統修改的穩定性,版本管理的一致性,并提供測試后發現問題的回退的可能。
4、SAP運維管理監控功能
4.1 SOLUTION_MANAGER的統一管理
SAP的運維管理軟件SOLUTION_MANAGER它運行于一臺單獨的服務器,它提供給用戶一個一致的登陸入口,實際是它提供給helpdesk 人員統一監控平臺來監控系統運行狀況,并能通過它還可以進行版本管理,業務流程變化管理,系統性能ALERT REPORT管理,LICENSE管理,用戶賬號管理,變更統一管理, 以及項目執行管理等等功能,下文就常用的功能做介紹給大家。在提供這些管理功能前首先要將這些監控的系統納入SOLUTION _MANAGER系統就是要進行合理的配置,配置完畢后就可以的看到目前公司所有納入 SOLUTION_MANAGER管理的被管理服務器。我們目前的運維的目標是保證SAP所有這些服務器運行能力達到99.99%甚至100%的'指標。
SAP系統作為XX整車ERP系統,它和其他系統如DMS,MES,GBOM,XX電子采購系統,XX售后倉庫管理系統等等系統有數據共享,所以系統的100%的穩定是IT必須努力達到的目標。利用SOLUTION_MANAGER的報表功能,各系統會自動生成ALERT_REPORT的性能分析報告,用戶根據報告可以知道目前系統的存在哪些運行方面潛在的問題,維護的IT人員就可以直接根據ALERT_REPORT的建議進行調整方案的制定。圖二所示是SAP的報警報表。
以上報表指出3個緊急的需要處理的紅色問題:1)目前汽車ERP系統備份狀況不夠頻繁,需要增加備份頻率。2)SAP新發布的安全NOTES沒有及時的提供給相關的系統,需要及時打上安全方面的補丁3)標準的用戶沒有更改初始密碼等等,建議用戶修改密碼。該報表還提供了系統的負荷歷史的記錄,可以讓監控人員對突變的系統負荷有比對的圖形基礎,這些所有的歷史報表同樣被存儲在一個數據庫里以備查看。SOLUTION_MANAGER還提供了SAP版本的管理能力和LICENSE 的管理能力。SAP的每次版本的升級都會在網站上進行發布,新的安裝軟件包并不能隨意下載下來安裝。必須通過SOLUTION_MANAGER工具經過用戶驗證后才可以下載安裝,在安裝過程中該機制避免了系統升級過程中的操作錯誤,和SAP的盜版等問題的出現,也相應的減少了系統升級的隨意性,提高了整體汽車ERP軟件的穩定性和可靠性。
4.2 運維機制的保證
為了保證業務的連續性,運維的監控日志也是非常關鍵的一環。目前HELPDESK每天二次會巡檢SAP系統所有檢查點,每一項檢查都是應用系統平滑運行的基礎保證,HELPDESK 檢查項目點會隨系統的不斷發展而持續補充修改,逐漸形成系統穩定運行的保護傘,并在IT的組織管理下,具有自我補充,自我完善檢查點的功能。IT每天會有運維例會,處理每天所有發生的問題,并有跟蹤人員對問題進行跟蹤,而且會落實到相關的IT技術人員,對問題進行的分析,并找出問題根源,并試圖從技術和管理等多方面著手徹底解決問題,下面我們會舉例說明HELPDESK人員進行的主要的檢查項目來說明。對SAP系統來說其中尤為關鍵的有四點 1)CPU和內存的使用狀況,以確保操作系統使用。2)操作系統的目錄使用率百分比,該檢查是為避免系統因為誤操作而產生了大量的數據,這會將目錄占滿,影響數據的處理能力。3)每天的系統數據庫的備份狀況,確保信息系統數據不會丟失。4)JOB的運行狀況,確保系統業務數據的準確性,系統間數據傳輸的QUEUE的狀況,也同樣保證了SAP系統穩定的主數據信息和其他系統之間的良好傳輸能力。
5、新SAP系統上線后規范的文檔和審計
5.1 SAP規范安全,監控設置文檔,OA操作文檔,安裝文檔等的形成
在汽車ERP系統上線前SAP的基礎部門會對系統進行相關的參數設置,其內容包括,OS級別的用戶權限設置,SAP 運行設置參數的設置,安全監控能力的設置,SAP用戶權限管理的設置等等。這些基礎的設置是在不斷SAP系統實施經驗中總結得到,并不斷的進行完善補充的,在系統安裝前已經形成規范的文檔,提交給安裝人員,以此規避安裝過程中的不一致性,提供統一的安裝規范,在此我們可以舉例說明,在運維過程中我們有發現一次某銷售店不能從系統調到新車,發現SAP在處理DOL發來的整車信息數據運行不正常,經過檢查系統,發現系統服務器時鐘由于參照源時鐘變化,發生了時間向后跳轉的現象,經過研究,修改了該時鐘調整的機制,采取漸進式時間調整。在以后的操作系統的安裝文檔中統一修正了該漏洞,并修改了安裝文檔,杜絕漏洞再次出現。
汽車ERP系統上線前技術支持人員還會搜集日常運維將會遇到的問題,以及預設計解決問題的預置方案,這些文檔在上線前就已經形成了,確保系統一旦上線發生問題了有應急的處理方法。系統在上線之前還必須經過操作系統的切換測試。并能提供全程安裝的技術文檔,以及測試文檔,以備系統以后歸檔查看。
5.2 SAP系統上線后的審計
每次系統上線后會有安全審計的檢查,一般會對操作系統,數據庫,應用用戶的權限進行檢查,對目前應用的用戶,賬號管理小組會檢查有沒有不適當的權限賦予特別是上汽財務數據,有外部審計和賬號小組,技術人員確認權限后才可以使用。這些權限檢查會提高了SAP系統的安全性,保證機密數據,如我們的整車財務成本數據,相關供應商信息,合同數據等數據不被泄露,對整車廠的安全生產,整車汽車的商業機密有著重要的保護作用。
6、SAP的可擴展性
6.1 SAP系統的可擴展
由于SAP提供了很強的可擴展性這是SAP在設計系統時就已經支持的,它可以通過擴展服務器的方法來擴張硬件的配置,并可以在線擴展系統。安裝系統時只需要提供數據庫的地址就可以連接到核心數據庫系統,安裝完成后通過設置服務器組就可以將新的服務器納入系統,并給連接的用戶提供負載均衡的功能,系統管理員也可以通過配置后臺JOB的方法來自定義些大負荷的運算運行于新指定的服務器上。實際應用中我們的一些報表,如當月汽車售后備件物料的收發存報表,由于涉及所有售后物料庫存情況,運行時間將很長,我們會對這類報表,安排指定的新服務器上運行。當系統有新的服務器加入后,系統會根據當時性能狀況,分配新的JOB到新的服務器。
6.2 SAP SCM系統的負荷分流
SAP系統主要的業務數據都存在于R3系統里,但它的部分功能可以劃分到新的SCM汽車供應鏈ERP系統里,我們的汽車整車BOM的分級打散,MRP汽車物料需求計算,創建發布預測下周的汽車供應商的物料供貨計劃程序,這些程序都分布在SCM汽車供應鏈系統內,其中BOM的計算打散等還使用了其他的服務器,該服務器使用了LIVECACHE的技術,將整車訂單和物料BOM的計算保留在該服務器的內存中直接計算。該體系結構使得在計算汽車零件供應預測報表時,相關負荷不會只集中在R3的服務器中,而是分布在R3,SCM,LIVECACHE不同的服務器里,達到了分散負荷的能力。
SCM汽車供應鏈系統還提供了臨港售后配件倉庫的管理的功能,R3系統會將售后配件的采購物料單傳輸到臨港SCM系統里。在新的系統里進行庫存管理,完成收貨,上架,下架,發貨,并傳回R3 系統,進行收貨財務過帳管理。該功能使汽車售后配件的整體管理過程完全從R3系統中獨立出來,在SCM汽車供應鏈管理系統里運行,減輕了主R3系統的負荷壓力。這種配置可以保證系統有新的倉庫管理系統時,可以平穩增加新的SCM系統。并使得SCM系統的功能和R3進行無縫的汽車業務融合,即保證了系統的穩定,又使得系統的汽車業務能力得到了擴展。
【高可用的SAP系統架構的實現】相關文章:
8.秒殺系統架構分析