Tháng 1
–
2 2013 [ 11 ]
T
RUNG TÂM DỮ LIỆU
tương lai của TTDL.
• Hỗ trợ quy trình chuẩn
cho việc thay đổi thiết bị.
• Cung cấp tài nguyên tin
cậy để quản lý tài sản.
• Nâng cao khả năng dự báo
về không gian, nguồn điện,
hệ thống làm mát, giúp tiết
kiệm thời gian và tăng hiệu
quả hoạch định.
• Giám sát tình trạng nguồn
điện, hệ thống làm mát, môi
trường, nâng cao độ sẵn sàng
cho TTDL.
• Giảm chi phí hoạt động
bằng cách sử dụng năng
lượng hiệu quả và tiết kiệm.
Trong nghiên cứu với
chủ đề Datacenter Infrastruc-
ture Management Software:
Monitoring, Managing and
Optimizing the Datacenter,
Andy Lawrence–Giám đốc
bộ phận nghiên cứu của
The
451 Group
đánh giá hiệu quả
của DCIM: “Chúng tôi tin
rằng việc quản lý hiệu quả
và toàn diện TTDL sẽ khó
đạt được mức độ cao hơn
nếu không sử dụng những
công cụ DCIM”, và đi đến
kết luận: “Ba lợi ích chính mà
DCIM mang lại là hiệu quả
kinh tế, nâng cao tính sẵn
sàng và cải thiện khả năng
quản lý, độ linh hoạt”.
Tính năng của DCIM
Quản lý Tài sản/Thay đổi/
Cấu hình
Quản lý
tài sản
là một tính
năng chính của DCIM. Trong
TTDL, có hàng ngàn thiết bị
cần được theo dõi liên tục: từ
server, thiết bị storage, thiết
bị mạng cho đến nguồn điện,
hệ thống làm mát và các thiết
bị cơ sở hạ tầng khác...
Digital Realty Trust
đã
tiến hành một cuộc khảo sát
các nhà quản lý TTDL với
câu hỏi: mất bao nhiêu thời
gian để tìm ra một server bị
lỗi trong TTDL? Chỉ có 26%
cho biết họ mất một phút
để tìm ra, 54% mất từ 4 giờ
đồng hồ đến một ngày, và
20% còn lại thậm chí cần hơn
một ngày để tìm ra server bị
lỗi. Việc không thể xác định
được vị trí các thiết bị của
mình đặt ở đâu trong TTDL
là nguyên nhân làm tăng thời
gian trung bình để phục hồi
(MTTR) và giảm độ sẵn sàng
của toàn hệ thống.
Tuy nhiên, quản lý
tài
sản
không đơn thuần chỉ là
xác định vị trí chúng được
đặt ở đâu, mà còn bao gồm
cả việc quản lý thông tin
cấu
hình
của thiết bị. Lấy một
server làm ví dụ: nguồn
server có thể được cung cấp
bởi hai thanh nguồn (PDU)
khác nhau. Ngắt điện những
thanh nguồn này, server sẽ
tắt. Server còn có thể được
kết nối đến một hoặc nhiều
thiết bị switch hoặc router
khác. Do đó, việc định tuyến
lại hệ thống mạng sẽ khiến
server bị mất kết nối. Trong
trường hợp có các máy ảo
đang hoạt động trên server,
việc tắt server sẽ dẫn đến
tắt máy ảo. Nếu không nắm
được chi tiết thông tin về cấu
hình của server, sẽ rất khó để
nhân viên quản lý có thể đưa
ra quyết định nên hành xử ra
sao với chúng và những hệ
thống liên quan khác.
Ngoài ra, để quản lý tài
sản và cấu hình của các thiết
bị trong hệ thống một cách
Hơn một
ngày: 20%
Trong vài
phút: 26%
Trong bốn
giờ: 32%
Trong một
ngày: 22%
Th i gian tìm ra v trí c a m t server b l i trong trung tâm d li u
(Ngu n: Digital Realty Trust)
chính xác, chúng ta cũng phải
quản lý cả những
thay đổi
.
Những thay đổi là nguyên
nhân gây ra 80% lỗi khiến hệ
thống ngưng hoạt động và
80% thời gian trung bình để
phục hồi (MTTR) được dùng
để xác định những gì đã thay
đổi. Do đó, quản lý
thay đổi
là một tính năng quan trọng
trong phải pháp DCIM.
Giám sát thời gian thực
Có ba hệ thống giám sát thời
gian thực trong TTDL:
•
Hệ thống quản lý tòa
nhà (BMS)–
Hệ thống BMS
thường dựa vào các thiết bị
sử dụng giao thức Modbus,
BACnet, OPC, LonWorks
hoặc SNMP để theo dõi, kiểm
soát các thiết bị cơ và thiết
bị điện. Quy mô của một hệ
thống tùy thuộc vào số lượng
data point (điểm dữ liệu) cần
theo dõi (một data point có
thể là thông số tải của một
UPS hoặc thông tin nhiệt độ
của phòng server tại một thời
điểm nhất định). Trong một
vài trường hợp, hệ thống
BMS có thể mở rộng vào
bên trong TTDL để theo dõi,
kiểm soát nguồn điện và hệ
thống làm mát.
•
Hệ thống quản lý mạng
(NMS)–
Hệ thống NMS hoạt
động dựa trên giao thức
SNMP để theo dõi các thiết bị
trong TTDL.
•
Hệ thống giám sát TTDL
(DCMS)–
Hệ thống DSMS
theo dõi TTDL dựa trên các
thiết bị phần cứng lẫn phần
mềm, sử dụng các giao thức
SNMP, Modbus, IPMI hoặc
một vài giao thức khác.
Để đánh giá năng lực
giám sát theo thời gian thực
của một giải pháp DCIM, có
thể xem xét dựa trên một số
thuộc tính chủ yếu. Câu hỏi
cốt lõi đặt ra là: bạn muốn
theo dõi thiết bị nào? Trả lời
câu hỏi này sẽ giúp chúng
ta lựa chọn được giải pháp
DCIM phù hợp.
Cụ thể, nếu muốn theo
dõi một số thiết bị với giao
thức SNMP và một vài thiết
bị khác qua giao thức Mod-
bus, phải lựa chọn giải pháp
có hỗ trợ cho cả hai giao thức
trên. Hạ tầng CNTT luôn có
rất nhiều loại thiết bị khác
nhau, không thể lựa chọn
một giải pháp quản lý chỉ hỗ
trợ cho một vài giao thức cụ
thể. Lựa chọn lý tưởng ở đây
sẽ là giải pháp DCIM với khả
năng giao tiếp được với hầu
hết thiết bị phần cứng của
nhiều nhà sản xuất.
Một khía cạnh quan trọng
khác cần được xem xét, đó là
nên sử dụng giải pháp/thiết
bị phần cứng hay phần mềm?
Theo nhìn nhận khách quan,
hệ thống phần cứng thường
mang lại hiệu suất cao hơn,
thu thập thông tin nhanh
và thường xuyên hơn. Tuy
nhiên, đi đôi với đó, một hệ
thống với nhiều thiết bị phần
cứng khác nhau sẽ khiến giá
thành triển khai DCIM tăng
lên nhiều lần.
Điều cuối cùng cần xác
định là: hệ thống có cần hỗ
trợ tính năng auto-discovery
không? Auto-discovery cung
cấp nhiều tiện ích như cài đặt
nhanh và dễ dàng hơn, ít xảy
ra lỗi so với thao tác bằng
tay. Tuy nhiên, tùy thuộc vào
giao thức giao tiếp của từng