- 確定哪些應用程序和網絡服務是關鍵任務應用的組織,需要高可用性。
- 確定哪些集群技術來執行,以確保高可用性的關鍵任務應用先前確定。 在這裡,您應該查明這些申請應使用群集服務,而這些應用程序應使用的NLB 。
- 在您決定了集群技術,你必須確定服務器容量的要求。
- 確定網絡的風險。
- 確定所有潛在的點故障和網絡連接問題。
- 確定是否是首選節點配置為支持某一特定資源。
- 時間確定故障性質和故障恢復時間,這對你將要執行。
- 確定每台服務器的作用範圍內的應用和服務將運行。 服務器可以配置為成員服務器或域控制器。
- 確定群集配置模型符合本組織的要求。
- 在您決定了集群技術和集群配置模式,你必須確定服務器的硬件要求。
- 確定如何在群集服務器將得到保障。
- 確定你要備份數據的聚類。
- 當創建一個新組,您需要提供以下信息:
- 主機名來指定的群集。
- IP地址設置為群集。
- 域名將主辦集群。
- 的名稱和密碼的群集服務帳戶。
- 當確定應用集群和故障轉移,請考慮以下幾點:
- 應用程序使用傳輸控制協議/ Internet協議( TCP / IP ) ,或者分佈式組件對象模型( DCOM )和命名管道,或遠程過程調用( RPC ) TCP / IP上的群集功能。
- NTLM驗證必須支持該應用程序。
- 應用程序必須能夠存儲的數據的磁盤連接到共享總線如果要列入容錯進程。
要求安裝群集服務
有幾個要求安裝群集服務分列如下:
- 管理權限,需要在每個節點上的群集。
- 應當有足夠的磁盤空間系統驅動器上,並共享設備群集服務安裝。
- 適當的網絡適配器驅動程序必須使用。
- 網絡適配器必須有適當的TCP / IP配置。
- 文件和打印共享Microsoft網絡已經成為一個節點上安裝群集服務配置。
- 節點應該配置相同的硬件和設備驅動程序。
- 每個節點必須屬於相同的域。
- 域帳戶使用相同的應在每個群集節點。
- 該系統的分頁文件必須有足夠的空間,以防止性能下降。 當文件沒有足夠的空間,它可以導致系統鎖死。
- 這是良好的做法,審查制度和事件日誌之前,並在安裝群集服務。
- 然後再安裝任何額外的節點群集,首先確保以前安裝的節點正在運行。
- 您可以使用系統監視器來解決虛擬內存的問題。
有幾個共享磁盤,硬件和網絡的具體考慮執行群集服務這裡列出:
- 共享驅動器必須實際附加到節點屬於群集。
- NTFS文件系統應採用格式的分區的共享磁盤
- 共享磁盤必須配置為基本磁盤。
- 的SCSI驅動器和適配器必須都有唯一的SCSI標識符( ID ) 。
- 每個服務器必須有兩個 故障時間 ;群集服務啟動時的故障恢復過程的資源集團已是一個失敗。 資源組,然後轉移到花藥節點群集。 您可以配置群集服務,試圖重新啟動的資源,沒有資源組收到移動組到其它節點。
- 故障恢復時間 ;失敗的資源組移回主節點組的資源時,再次上線。 您可以配置故障恢復只發生在非繁忙時間。
- 推薦節點 ;設置首選節點資源集團確保資源集團是自動搬回到指定的首選節點。
規劃安全群集
這一事實本身集群主機關鍵任務應用和服務,即表明您已經確保群集。
有幾個策略,以確保群集這裡列出:
- 身體安全的節點群集。
- 限制實際存取集群的基礎設施。
- 確保所有 群集管理器( GUI工具) :群集管理的主要工具是用來管理和排查群集。 群集管理器安裝在每個節點上的群集。 您也可以安裝群集管理器的電腦上,不屬於集束如果你想遠程管理群集。
- Cluster.exe (命令行實用程序) :如果您想執行管理任務的組從命令行,那麼你可以使用Cluster.exe 。
的行政任務,您可以執行群集通過群集管理器這裡列出:
- 查看資料 , 該國的群集 。
- 查看屬性的默認群集組,並且默認磁盤組 。
- 名稱變更的群集 。 對於群集名稱變更,以反映,雖然有你第一次把群集名稱資源脫機,然後在線上。
- 創建群集資源 ,並指定資源的依賴性。
- 刪除資源 。 您可以刪除但只有當所有資源分配給它的依賴性將被刪除。
- 創建新的資源組的集群,並配置故障轉移和故障恢復政策資源組。
- 刪除資源集團群集。 資源的資源組中刪除時,一組被刪除。
- 應用程序添加到組 :您可以啟動群集應用程序嚮導從叢集系統管理員如果您想應用程序添加到群集。
- 改變所有權的資源組 。 資源可以從一個資源組,另一組,您可以將資源組從一個節點到另一個群集節點的群集。 您通常會改變所有權的資源組維護任務時,必須履行的群集。
- 改變性質的現有資源和資源組 。 您也可以重新命名現有的資源和資源組。
- 改變現狀的資源組 。 當你改變現狀的資源組,以在線或離線,那麼資源的特別小組將自動更新,以反映修改國家的變化。
- 配置的位置法定人數資源和更改默認大小的法定人數日誌文件 。
- 您可以發起一個失敗的群集 。 這通常會做測試配置故障轉移的政策,並測試資源如何重新啟動。
如何創建新的資源組
- 單擊開始,管理工具,然後單擊群集管理器。
- 當打開連接組對話框打開,輸入的名稱,集群要添加一個新的集團。
- 單擊打開。
- 右鍵單擊組,然後選擇新建,然後組的快捷菜單。
- 新建組嚮導啟動。
- 在名稱框中,輸入一個名稱為新的組。
- 在說明框中,提供了一個簡短的描述為新的組。 單擊下一步。
- 輸入節點是首選所有者為新的組中的首選所有者列表框中。
- 點擊完成創建新組。
如何將資源組到另一個節點
- 單擊開始,管理工具,然後單擊群集管理器。
- 展開的節點,其中包含資源組要移動。
- 單擊Active組。
- 雙擊組。
- 右鍵單擊資源組要移動,然後選擇移動組從快捷菜單。
如何創建一個文件共享資源
- 單擊開始,管理工具,然後單擊群集管理器。
- 擴大集團的文件夾中。
- 右鍵單擊群集打印機,並選擇新建,然後資源從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和組。 單擊下一步。
- 輸入適當的節點可能的所有者列表。 單擊下一步。
- 新增的依賴資源的資源依存關係列表中,然後單擊下一步。
- 當文件共享參數對話框打開,提供共享名稱,路徑和評論信息。
- 單擊完成。
如何創建一個虛擬服務器
- 單擊開始,管理工具,然後單擊群集管理器。
- 當打開連接組對話框打開,輸入的名稱群集,然後單擊打開。
- 右鍵單擊組,然後選擇新建,然後組的快捷菜單。
- 新建組嚮導啟動。
- 在名稱框中,輸入一個名稱為新的組。
- 在說明框中,提供了一個簡短的描述為新的組。 單擊下一步。
- 輸入節點是首選業主的首選所有者列表框中。
- 點擊完成創建新組。
- 要創建一個IP地址資源,在群集管理器中,展開組文件夾
- 右鍵單擊虛擬服務器,並選擇新建,然後資源從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和組。 單擊下一步。
- 輸入適當的節點可能的所有者列表。 單擊下一步。
- 確保資源依存關係列表中不包含任何信息。 單擊下一步。
- 在TCP / IP地址參數對話框中,提供的地址,子網掩碼和網絡信息。
- 單擊完成。
- 要創建一個網絡名稱資源在群集管理器中,展開組文件夾。
- 右鍵單擊虛擬服務器,並選擇新建,然後資源從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和組。 單擊下一步。
- 輸入適當的節點可能的所有者列表。 單擊下一步。
- 在資源依存關係列表中,添加的IP地址資源。 單擊下一步。
- 進入信息網絡名稱參數對話框。
- 單擊完成。
如何創建一個用戶帳戶,用於管理集群
- 單擊開始,管理工具,然後單擊Active Directory用戶和計算機,打開Active Directory用戶和計算機管理控制台。
- 導航到用戶容器。
- 右鍵單擊用戶,並選擇新建,然後用戶從快捷菜單。
- 提供必要的資料的名字,姓氏和用戶登錄名的文本框。 單擊下一步。
- 在密碼和確認密碼文本框,提供的密碼新的集群用戶帳戶。
- 使用戶不能更改密碼複選框。
- 啟用密碼永不過期複選框。
- 單擊下一步。 單擊完成。
如何暫停和恢復一個節點
- 單擊開始,管理工具,然後單擊群集管理器。
- 在左窗格中,選擇節點要暫停。
- 選擇暫停節點命令從文件菜單中的項目。
- 恢復被暫停的節點上,單擊開始,管理工具,然後單擊群集管理器。
- 在左窗格中,選擇的節點是暫停。
- 選擇恢復節點命令從文件菜單中的項目。
如何執行維護節點上沒有驅逐的節點
- 單擊開始,管理工具,然後單擊群集管理器。
- 在左窗格中,選擇節點要執行維護任務。
- 選擇暫停節點命令從文件菜單中的項目。
- 在詳細信息窗格中,雙擊主動組,然後每組執行下列:選擇組,選擇文件菜單,然後選擇移動組命令。
- 著手做了必要的維修節點被暫停。
- 完成後,打開群集管理。
- 在左窗格中,選擇的節點。
- 選擇恢復節點命令從文件菜單中的項目。
如何執行維護節點上的節點與驅逐
- 單擊開始,管理工具,然後單擊群集管理器。
- 停止群集服務運行。
- 選擇退出節點命令從文件菜單中的項目。
- 刪除節點從共享總線。
- 卸載群集服務。
- 著手做了必要的維修任務。
- 完成後,連接的節點的共享總線。
- 安裝群集服務,然後加入群集。
如何更改大小的法定人數日誌
- 單擊開始,管理工具,然後單擊群集管理器。
- 在左窗格中,右鍵單擊群集名稱,然後選擇屬性從快捷菜單。
- 開關法定人數標籤。
- 變更大小的法定人數登錄重置法定人數登錄框。
- 單擊確定。
群集服務日誌文件
當群集服務活動,如當一個新的資源集團是創建發生,事件寫入日誌文件組。 群集日誌包含的信息對每個群集服務活動所發生的群集。 測井是由默認。
群集日誌文件的最大大小8MB的,是位於% windir % \集束\ cluster.log目錄。 當最大日誌文件大小達到事件條目從日誌文件中的順序,他們補充說。
所有群集日誌條目有下列資料:
由於群集服務包含了若干部分,每個執行特定功能的集群的一個組成部分事件日誌條目中包含的信息的互操作的群集服務的組成部分。 A 資源DLL的日誌條目另一方面包含的信息是特定於資源群體群集。
中所載資料的一個組成部分事件日誌項包括以下內容:
- 該部分結果在事件被記錄在案。
- 節點的狀態時,活動記錄。
- 合併後組成部分和國家。
這裡還有一些群集日誌條目有一個狀態碼,錯誤代碼,或國家代碼。 一個國家代碼與以下類型的對象:
疑難解答群集服務
有幾個策略,您可以使用排查群集服務和服務器群集問題是本節中詳細的規定。
群集服務的運作;共享SCSI總線必須存在和必要的SCSI設備必須連接。 一個設備必須存在仲裁磁盤上的共享總線。 有一些系統事件日誌錯誤有關集束SCSI設備的問題。
當故障排除SCSI設備事件日誌錯誤 ,您可以使用下面的清單作為一項準則。
- 內部終端的BIOS中的控制器應禁用。
- 自動SCSI總線重置選項應該禁用。
- 總電纜長度的巴士不得大於最大的SCSI長度確定的製造商。
- 檢查是否電纜及連接器引腳身體受損。
- 檢查是否有任何鬆動的連接。
- 檢查驅動程序和固件版本是相同的每台服務器駐留在群集。
- 確認SCSI匯流排已正確終止。 檢查重複終止。
- 檢查是否有重複的SCSI總線上的ID 。
- 如果其中一個群集節點可以連接到群集驅動器和另一個節點不能:
- 確保有問題的節點連接到的群集驅動器。
- 檢查的SCSI ID是獨一無二的。
- 檢查SCSI控制器的正確配置。 他們應該傳輸數據以同樣的速度。
- 相同的驅動器字母應指派的驅動器的每個節點上的群集。
當客戶無法訪問資源的群集 ,驗證以下事項:
- 對於每個群集節點上,研究中的錯誤系統事件日誌中。
- 對於每個資源組無法訪問,確保該集團有一個IP地址資源和網絡名稱資源。
- 對於客戶端連接到一個資源組, IP地址資源和網絡名稱資源應上網。
- 確保網絡連接存在的特定節點誰是所有者的資源,因此無法訪問。
- 確保客戶使用的是正確的IP地址或網絡名稱連接到該資源在群集。
您可以查看該國的網絡接口,和國家的私營和公共網絡 , 通過群集管理器 :
網絡接口可在以下國家:
- 行動;表明,該接口可以與其他的網絡接口。
- 無法使用;表明,該節點的界面了。
- 無法訪問;表明,該接口無法與其他接口的網絡,是在狀態。
- 失敗;表明,該接口無法與任何其他的網絡接口。 通常情況下造成的網絡適配器和驅動器故障,或電纜故障。
私營和公共網絡可以在以下國家:
- 行動;表明,界面上的群集可以溝通。
- 降低;表明,界面上的群集不能彼此間的溝通,以及與其他主機。
- 分割;表明,一個或多個接口上的集群是在無法到達的國家,但至少有兩個接口的群集可以溝通。
- 無法使用;表明,界面上的群集不可用。
當故障排除仲裁磁盤的問題 ,使用的戰略如下:
- 如果仲裁磁盤失敗,您無法啟動群集服務,然後重新啟動群集服務,沒有法定人數資源。 一旦啟動群集服務指定一個新的仲裁資源。
- 如果仲裁資源無法啟動:
- 確保所有的連接和電纜連接。
- 確保SCSI設備得到妥善終止。
- 確保設備的SCSI總線連接,並投入使用。
- 如果法定人數記錄已損壞,群集服務首次嘗試自動重置日誌。 如果群集服務無法啟動,因為腐敗的法定人數日誌中,您必須手動重置法定人數日誌。
當故障節點的問題 ,使用的戰略如下:
- 如果群集下降,第一次嘗試,使一個節點網絡。 下一步,檢查日誌信息以獲取更多信息的問題。
- 如果一個節點是下跌,試圖使一個節點在線然後檢查日誌信息供參考。 您應該首先確保儘管資源的失敗節點失敗到另一個節點的群集。
- 如果一個節點失敗後,經營不善,檢查是否正在運行的CPU接近百分之百。 您可能已經超載的CPU 。
- 如果群集服務無法啟動故障時,節點失敗,檢查是否正在執行群集服務的更新。 當更新正在執行,群集服務將不會啟動故障轉移過程。
- 如果資源不回的時間,同時所有的節點業務,檢查是否電源失敗。 建議您使用不間斷電源( UPS ) 。
- 如果一個節點不能訪問所有驅動器:
- 檢查驅動器之間的佈線和節點。
- 檢查共享驅動器從另一個節點。
- 檢查配置群集。
- 檢查您是否可以訪問該驅動器從一個不同的節點。
- 如果您無法連接到一個節點使用群集管理器,檢查是否群集服務, RPC服務和節點的運行。
當故障排除資源組的問題 ,使用的戰略如下:
- 如果你不能把一個資源組在線:
- 確保該磁盤可以被訪問。
- 檢查是否硬件問題或配置問題存在的磁盤資源的問題組。
- 檢查是否所有的依賴資源已經明確。
- 移動資源組到另一個節點,然後檢查是否可以聯機。
- 企圖使每項資源集團在線一次。
- 如果一個資源組不容錯到另一個節點的群集:
- 確保資源的影響組選項已被選中。
- 確保節點中指定可能的所有者名單資源。
- 如果一個資源組未能超過,但沒有重新啟動:
- 檢查節點在線。
- 檢查中的信息可能所有者列表組和資源。
- 試圖查明的資源,是個大問題,使每項資源在線一次。
- 如果一個資源組不失敗回:
- 確認您期望的節點的資源不能回的定義是首選所有者的資源組。
- 確認允許故障恢復選項已被選中。
- 確認防止故障恢復複選框是明確的。
當故障排除資源問題 ,使用的戰略如下:
- 如果你不能把一個資源在線:
- 檢查是否已安裝的應用程序。
- 檢查是否正確配置資源。
- 確認資源的可運行群集服務。
- 如果某一特定資源並不故障:
- 請檢查設備的配置是否正確。
- 請檢查設備和電纜業務。
- 如果資源沒有失敗回:
- 檢查硬件工作正常。
- 驗證網絡連接的業務。
- 檢查配置的故障恢復的政策。
- 如果沒有資源不會再次上線:
- 檢查不重新啟動選項的資源處於未選中狀態。
- 檢查是否沒有門檻的資源已達到
- 檢查是否有任何依賴的資源是離線。
- 檢查所有相依的資源已被正確配置。
- 當你的IP地址資源的問題,確保IP地址是獨一無二的。 下一步,確保
書籤實施Windows群集服務
最新的博客帖子