logo
ngọn cờ ngọn cờ

Chi tiết blog

Created with Pixso. Trang chủ Created with Pixso. blog Created with Pixso.

Các tính năng NAS của X67: Các khái niệm, nguyên tắc và ứng dụng của công nghệ RAID

Các tính năng NAS của X67: Các khái niệm, nguyên tắc và ứng dụng của công nghệ RAID

2025-01-07

RAID (Redundant Array of Independent Disks), ban đầu được gọi là Redundant Array of Inexpensive Disks, được Giáo sư D. A. Patterson của Đại học California, Berkeley đề xuất lần đầu tiên trong bài báo "A Case of Redundant Array of Inexpensive Disks" vào năm 1988. Vào thời điểm đó, các ổ đĩa dung lượng lớn rất đắt đỏ, vì vậy ý tưởng cơ bản của RAID là kết hợp hữu cơ nhiều ổ đĩa dung lượng nhỏ và tương đối rẻ tiền để đạt được dung lượng, hiệu suất và độ tin cậy tương đương với các ổ đĩa dung lượng lớn đắt tiền với chi phí thấp hơn. Khi chi phí và giá của ổ đĩa tiếp tục giảm, thuật ngữ "inexpensive" (rẻ tiền) trở nên vô nghĩa, và Ban Tư vấn RAID (RAB) đã quyết định thay thế "inexpensive" bằng "independent" (độc lập).

 

Ý tưởng thiết kế RAID này nhanh chóng được ngành công nghiệp áp dụng. Công nghệ RAID, với tư cách là một công nghệ lưu trữ hiệu suất cao và độ tin cậy cao, đã được ứng dụng rộng rãi. RAID chủ yếu sử dụng các công nghệ phân mảnh dữ liệu (data striping), nhân bản dữ liệu (mirroring) và dữ liệu chẵn lẻ (data parity) để đạt được hiệu suất cao, độ tin cậy, khả năng chịu lỗi và khả năng mở rộng. Theo các chiến lược và kiến trúc sử dụng hoặc kết hợp ba công nghệ này, RAID có thể được chia thành các cấp độ khác nhau để đáp ứng nhu cầu của các ứng dụng dữ liệu khác nhau. Các cấp độ RAID ban đầu RAID1-RAID5 được định nghĩa trong bài báo của D. A. Patterson và cộng sự, và RAID0 và RAID6 đã được mở rộng kể từ năm 1988. Trong những năm gần đây, các nhà cung cấp lưu trữ đã liên tục giới thiệu các cấp độ RAID như RAID7, RAID10/01, RAID50, RAID53 và RAID100, nhưng không có tiêu chuẩn thống nhất. Hiện tại, các tiêu chuẩn được ngành công nghiệp công nhận là RAID0-RAID5, và bốn cấp độ ngoại trừ RAID2 đã được đặt làm tiêu chuẩn công nghiệp. Các cấp độ RAID được sử dụng phổ biến nhất trong lĩnh vực ứng dụng thực tế là RAID0, RAID1, RAID3, RAID5, RAID6 và RAID10.

 

Từ góc độ triển khai, RAID chủ yếu được chia thành ba loại: RAID phần mềm, RAID phần cứng và RAID lai. Đối với RAID phần mềm, tất cả các chức năng được hoàn thành bởi hệ điều hành và CPU, và không có chip điều khiển/xử lý RAID độc lập và chip xử lý I/O, do đó hiệu quả thấp nhất. RAID phần cứng được trang bị chip điều khiển/xử lý RAID chuyên dụng và chip xử lý I/O cũng như bộ đệm mảng, và không chiếm tài nguyên CPU, nhưng chi phí rất cao. RAID lai có chip điều khiển/xử lý RAID nhưng thiếu chip xử lý I/O, và cần CPU và chương trình điều khiển để hoàn thành, và hiệu suất cũng như chi phí của nó nằm giữa RAID phần mềm và RAID phần cứng.

 

Mỗi cấp độ RAID đại diện cho một phương pháp triển khai và công nghệ, và không có sự phân biệt giữa cấp độ cao và thấp. Trong các ứng dụng thực tế, cấp độ RAID phù hợp và phương pháp triển khai cụ thể nên được lựa chọn theo đặc điểm của các ứng dụng dữ liệu người dùng, và tính khả dụng, hiệu suất và chi phí nên được xem xét toàn diện.

 

Nguyên tắc cơ bản

 

RAID, tức là Redundant Array of Independent Disks, thường được viết tắt là mảng đĩa. Nói tóm lại, RAID là một hệ thống con lưu trữ bao gồm nhiều ổ đĩa độc lập hiệu suất cao, cung cấp hiệu suất lưu trữ và công nghệ dự phòng dữ liệu cao hơn so với một ổ đĩa đơn. RAID là một công nghệ quản lý đa ổ đĩa cung cấp khả năng lưu trữ hiệu quả về chi phí, độ tin cậy dữ liệu cao và hiệu suất cao cho môi trường máy chủ. Định nghĩa RAID của SNIA là: một mảng đĩa mà một phần không gian lưu trữ vật lý được sử dụng để ghi thông tin dự phòng của dữ liệu người dùng được lưu trữ trong không gian còn lại. Khi một ổ đĩa hoặc đường truy cập bị lỗi, thông tin dự phòng có thể được sử dụng để tái tạo dữ liệu người dùng. Mặc dù phân mảnh dữ liệu không tuân theo định nghĩa của RAID, nó thường cũng được gọi là RAID (tức là RAID0).

 

Ý định ban đầu của RAID là cung cấp các chức năng lưu trữ cao cấp và bảo mật dữ liệu dự phòng cho các máy chủ lớn. Trong toàn bộ hệ thống, RAID được coi là một không gian lưu trữ bao gồm hai hoặc nhiều ổ đĩa, và hiệu suất I/O của hệ thống lưu trữ được cải thiện bằng cách đọc và ghi dữ liệu trên nhiều ổ đĩa đồng thời. Hầu hết các cấp độ RAID có các biện pháp kiểm tra và sửa lỗi dữ liệu hoàn chỉnh, và thậm chí cả phương pháp nhân bản, giúp tăng cường đáng kể độ tin cậy của hệ thống, và đó là nơi thuật ngữ "Redundant" (Dự phòng) xuất phát.

 

Ở đây chúng ta cần đề cập đến JBOD (Just a Bunch of Disks - Chỉ một đống ổ đĩa). Ban đầu, JBOD được sử dụng để đại diện cho một tập hợp các ổ đĩa không có phần mềm điều khiển để cung cấp điều khiển phối hợp, đây là yếu tố chính phân biệt RAID với JBOD. Hiện tại, JBOD thường đề cập đến một vỏ ổ đĩa, bất kể nó có cung cấp chức năng RAID hay không.

 

Hai mục tiêu chính của RAID là cải thiện độ tin cậy dữ liệu và hiệu suất I/O. Trong mảng đĩa, dữ liệu được phân tán trên nhiều ổ đĩa, nhưng đối với hệ thống máy tính, nó trông giống như một ổ đĩa đơn. Khả năng dự phòng đạt được bằng cách ghi cùng một dữ liệu vào nhiều ổ đĩa (thường là nhân bản) hoặc ghi dữ liệu chẵn lẻ đã tính toán vào mảng, để không gây mất dữ liệu khi một ổ đĩa bị lỗi. Một số cấp độ RAID cho phép nhiều ổ đĩa bị lỗi cùng lúc, chẳng hạn như RAID6, nơi hai ổ đĩa có thể bị hỏng cùng lúc. Dưới cơ chế dự phòng này, ổ đĩa bị lỗi có thể được thay thế bằng một ổ đĩa mới, và RAID sẽ tự động tái tạo dữ liệu bị mất theo dữ liệu và dữ liệu chẵn lẻ trong các ổ đĩa còn lại để đảm bảo tính nhất quán và toàn vẹn của dữ liệu. Dữ liệu được phân tán và lưu trữ trên nhiều ổ đĩa khác nhau trong RAID, và việc đọc và ghi dữ liệu đồng thời tốt hơn nhiều so với một ổ đĩa đơn, do đó có thể đạt được băng thông I/O tổng hợp cao hơn. Tất nhiên, mảng đĩa sẽ làm giảm tổng dung lượng lưu trữ khả dụng của tất cả các ổ đĩa, hy sinh không gian để đổi lấy độ tin cậy và hiệu suất cao hơn. Ví dụ, hiệu suất sử dụng dung lượng lưu trữ của RAID1 chỉ là 50%, và RAID5 sẽ mất dung lượng lưu trữ của một ổ đĩa, và hiệu suất sử dụng không gian là (n-1)/n.

 

Mảng đĩa có thể đảm bảo hoạt động liên tục của hệ thống mà không bị gián đoạn khi một số ổ đĩa (một hoặc nhiều, tùy thuộc vào cách triển khai) bị hỏng. Trong quá trình tái tạo dữ liệu của ổ đĩa bị lỗi sang ổ đĩa mới, hệ thống có thể tiếp tục hoạt động bình thường, nhưng hiệu suất sẽ giảm ở một mức độ nhất định. Một số mảng đĩa phải tắt máy khi thêm hoặc xóa ổ đĩa, trong khi một số hỗ trợ trao đổi nóng (hot swapping), cho phép thay thế ổ đĩa mà không cần tắt máy. Mảng đĩa cao cấp này chủ yếu được sử dụng trong các hệ thống ứng dụng có yêu cầu cao về độ tin cậy, và hệ thống không thể tắt máy hoặc thời gian tắt máy phải càng ngắn càng tốt. Nói chung, RAID không thể thay thế việc sao lưu dữ liệu. Nó bất lực đối với việc mất dữ liệu do các lỗi không phải do ổ đĩa gây ra, chẳng hạn như virus, phá hoại do con người, xóa nhầm, v.v. Tại thời điểm này, việc mất dữ liệu là tương đối so với hệ điều hành, hệ thống tệp, trình quản lý ổ đĩa hoặc hệ thống ứng dụng. Đối với bản thân hệ thống RAID, dữ liệu là nguyên vẹn và không có tổn thất nào xảy ra. Do đó, sao lưu dữ liệu, phục hồi sau thảm họa và các biện pháp bảo vệ dữ liệu khác là rất cần thiết, bổ sung cho RAID và bảo vệ an ninh dữ liệu ở các cấp độ khác nhau để ngăn ngừa mất dữ liệu.

 

Có ba khái niệm và công nghệ cốt lõi trong RAID: nhân bản (mirroring), phân mảnh dữ liệu (data striping) và dữ liệu chẵn lẻ (data parity). Nhân bản sao chép dữ liệu sang nhiều ổ đĩa. Một mặt, nó có thể cải thiện độ tin cậy, và mặt khác, nó có thể đọc dữ liệu từ hai hoặc nhiều bản sao đồng thời để cải thiện hiệu suất đọc. Rõ ràng, hiệu suất ghi của nhân bản hơi thấp hơn, và mất nhiều thời gian hơn để đảm bảo dữ liệu được ghi chính xác vào nhiều ổ đĩa. Phân mảnh dữ liệu lưu trữ các phần dữ liệu trên nhiều ổ đĩa khác nhau, và nhiều phần dữ liệu cùng nhau tạo thành một bản sao dữ liệu hoàn chỉnh, khác với các bản sao của nhân bản và thường được sử dụng để xem xét hiệu suất. Phân mảnh dữ liệu có độ hạt đồng thời cao hơn. Khi truy cập dữ liệu, có thể đọc và ghi dữ liệu trên các ổ đĩa khác nhau cùng lúc, do đó đạt được sự cải thiện hiệu suất I/O rất đáng kể. Dữ liệu chẵn lẻ sử dụng dữ liệu dự phòng để phát hiện và sửa lỗi dữ liệu. Dữ liệu dự phòng thường được tính toán bằng các thuật toán như mã Hamming và phép toán XOR. Sử dụng chức năng chẵn lẻ có thể cải thiện đáng kể độ tin cậy, khả năng phục hồi và khả năng chịu lỗi của mảng đĩa. Tuy nhiên, dữ liệu chẵn lẻ cần đọc dữ liệu từ nhiều nơi và thực hiện tính toán và so sánh, điều này sẽ ảnh hưởng đến hiệu suất hệ thống. Các cấp độ RAID khác nhau áp dụng một hoặc nhiều công nghệ trên để đạt được độ tin cậy dữ liệu, tính khả dụng và hiệu suất I/O khác nhau. Đối với loại RAID nào (ngay cả các cấp độ hoặc loại mới) để thiết kế hoặc chế độ RAID nào để áp dụng, cần đưa ra lựa chọn hợp lý trên cơ sở hiểu sâu sắc các yêu cầu của hệ thống và đánh giá toàn diện độ tin cậy, hiệu suất và chi phí để đưa ra lựa chọn thỏa hiệp.

 

Ưu điểm của RAID

 

  • Dung lượng lớn: Đây là một ưu điểm rõ ràng của RAID. Nó mở rộng dung lượng ổ đĩa, và hệ thống RAID bao gồm nhiều ổ đĩa có không gian lưu trữ khổng lồ. Hiện nay dung lượng của một ổ đĩa đơn có thể đạt hơn 1TB, do đó dung lượng lưu trữ của RAID có thể đạt cấp độ PB, và hầu hết các yêu cầu lưu trữ có thể được đáp ứng. Nói chung, dung lượng khả dụng của RAID nhỏ hơn tổng dung lượng của tất cả các ổ đĩa thành viên. Các thuật toán RAID khác nhau yêu cầu một chi phí dự phòng nhất định, và chi phí dung lượng cụ thể liên quan đến thuật toán được áp dụng. Nếu thuật toán RAID và dung lượng được biết, dung lượng khả dụng của RAID có thể được tính toán. Thông thường, hiệu suất sử dụng dung lượng của RAID nằm trong khoảng từ 50% đến 90%.

  • Hiệu suất cao: Hiệu suất cao của RAID có lợi từ công nghệ phân mảnh dữ liệu. Hiệu suất I/O của một ổ đĩa đơn bị giới hạn bởi các công nghệ máy tính như giao diện và băng thông, và thường là nút thắt cổ chai của hiệu suất hệ thống. Thông qua phân mảnh dữ liệu, RAID phân phối I/O dữ liệu cho từng ổ đĩa thành viên, do đó đạt được hiệu suất I/O tổng hợp cao gấp nhiều lần so với một ổ đĩa đơn.

  • Độ tin cậy: Tính khả dụng và độ tin cậy là những tính năng quan trọng khác của RAID. Về lý thuyết, độ tin cậy của một hệ thống RAID bao gồm nhiều ổ đĩa lẽ ra phải kém hơn một ổ đĩa đơn. Có một giả định ngầm ở đây: một ổ đĩa bị lỗi sẽ khiến toàn bộ RAID không khả dụng. RAID sử dụng các công nghệ dự phòng dữ liệu như nhân bản và dữ liệu chẵn lẻ để phá vỡ giả định này. Nhân bản là công nghệ dự phòng nguyên thủy nhất, sao chép hoàn toàn dữ liệu trên một nhóm ổ đĩa nhất định sang một nhóm ổ đĩa khác để đảm bảo luôn có một bản sao dữ liệu khả dụng. So với chi phí dự phòng 50% của nhân bản, dữ liệu chẵn lẻ nhỏ hơn nhiều, và nó sử dụng thông tin dự phòng chẵn lẻ để xác minh và sửa dữ liệu. Công nghệ dự phòng của RAID giúp cải thiện đáng kể tính khả dụng và độ tin cậy của dữ liệu, và đảm bảo rằng khi một số ổ đĩa bị lỗi, dữ liệu sẽ không bị mất và hoạt động liên tục của hệ thống sẽ không bị ảnh hưởng.

  • Khả năng quản lý: Trên thực tế, RAID là một công nghệ ảo hóa, ảo hóa nhiều ổ đĩa vật lý thành một ổ đĩa logic dung lượng lớn. Đối với hệ thống máy chủ bên ngoài, RAID là một ổ đĩa đơn, nhanh chóng và đáng tin cậy, dung lượng lớn. Bằng cách này, người dùng có thể tổ chức và lưu trữ dữ liệu hệ thống ứng dụng trên ổ đĩa ảo này. Từ góc độ ứng dụng người dùng, nó có thể làm cho hệ thống lưu trữ đơn giản, dễ sử dụng và quản lý. Vì RAID đã hoàn thành một lượng lớn công việc quản lý lưu trữ bên trong, quản trị viên chỉ cần quản lý một ổ đĩa logic đơn lẻ, điều này có thể tiết kiệm rất nhiều công việc quản lý. RAID có thể động thêm hoặc xóa ổ đĩa và tự động thực hiện kiểm tra dữ liệu và tái tạo dữ liệu, điều này có thể đơn giản hóa đáng kể công việc quản lý.

ngọn cờ
Chi tiết blog
Created with Pixso. Trang chủ Created with Pixso. blog Created with Pixso.

Các tính năng NAS của X67: Các khái niệm, nguyên tắc và ứng dụng của công nghệ RAID

Các tính năng NAS của X67: Các khái niệm, nguyên tắc và ứng dụng của công nghệ RAID

RAID (Redundant Array of Independent Disks), ban đầu được gọi là Redundant Array of Inexpensive Disks, được Giáo sư D. A. Patterson của Đại học California, Berkeley đề xuất lần đầu tiên trong bài báo "A Case of Redundant Array of Inexpensive Disks" vào năm 1988. Vào thời điểm đó, các ổ đĩa dung lượng lớn rất đắt đỏ, vì vậy ý tưởng cơ bản của RAID là kết hợp hữu cơ nhiều ổ đĩa dung lượng nhỏ và tương đối rẻ tiền để đạt được dung lượng, hiệu suất và độ tin cậy tương đương với các ổ đĩa dung lượng lớn đắt tiền với chi phí thấp hơn. Khi chi phí và giá của ổ đĩa tiếp tục giảm, thuật ngữ "inexpensive" (rẻ tiền) trở nên vô nghĩa, và Ban Tư vấn RAID (RAB) đã quyết định thay thế "inexpensive" bằng "independent" (độc lập).

 

Ý tưởng thiết kế RAID này nhanh chóng được ngành công nghiệp áp dụng. Công nghệ RAID, với tư cách là một công nghệ lưu trữ hiệu suất cao và độ tin cậy cao, đã được ứng dụng rộng rãi. RAID chủ yếu sử dụng các công nghệ phân mảnh dữ liệu (data striping), nhân bản dữ liệu (mirroring) và dữ liệu chẵn lẻ (data parity) để đạt được hiệu suất cao, độ tin cậy, khả năng chịu lỗi và khả năng mở rộng. Theo các chiến lược và kiến trúc sử dụng hoặc kết hợp ba công nghệ này, RAID có thể được chia thành các cấp độ khác nhau để đáp ứng nhu cầu của các ứng dụng dữ liệu khác nhau. Các cấp độ RAID ban đầu RAID1-RAID5 được định nghĩa trong bài báo của D. A. Patterson và cộng sự, và RAID0 và RAID6 đã được mở rộng kể từ năm 1988. Trong những năm gần đây, các nhà cung cấp lưu trữ đã liên tục giới thiệu các cấp độ RAID như RAID7, RAID10/01, RAID50, RAID53 và RAID100, nhưng không có tiêu chuẩn thống nhất. Hiện tại, các tiêu chuẩn được ngành công nghiệp công nhận là RAID0-RAID5, và bốn cấp độ ngoại trừ RAID2 đã được đặt làm tiêu chuẩn công nghiệp. Các cấp độ RAID được sử dụng phổ biến nhất trong lĩnh vực ứng dụng thực tế là RAID0, RAID1, RAID3, RAID5, RAID6 và RAID10.

 

Từ góc độ triển khai, RAID chủ yếu được chia thành ba loại: RAID phần mềm, RAID phần cứng và RAID lai. Đối với RAID phần mềm, tất cả các chức năng được hoàn thành bởi hệ điều hành và CPU, và không có chip điều khiển/xử lý RAID độc lập và chip xử lý I/O, do đó hiệu quả thấp nhất. RAID phần cứng được trang bị chip điều khiển/xử lý RAID chuyên dụng và chip xử lý I/O cũng như bộ đệm mảng, và không chiếm tài nguyên CPU, nhưng chi phí rất cao. RAID lai có chip điều khiển/xử lý RAID nhưng thiếu chip xử lý I/O, và cần CPU và chương trình điều khiển để hoàn thành, và hiệu suất cũng như chi phí của nó nằm giữa RAID phần mềm và RAID phần cứng.

 

Mỗi cấp độ RAID đại diện cho một phương pháp triển khai và công nghệ, và không có sự phân biệt giữa cấp độ cao và thấp. Trong các ứng dụng thực tế, cấp độ RAID phù hợp và phương pháp triển khai cụ thể nên được lựa chọn theo đặc điểm của các ứng dụng dữ liệu người dùng, và tính khả dụng, hiệu suất và chi phí nên được xem xét toàn diện.

 

Nguyên tắc cơ bản

 

RAID, tức là Redundant Array of Independent Disks, thường được viết tắt là mảng đĩa. Nói tóm lại, RAID là một hệ thống con lưu trữ bao gồm nhiều ổ đĩa độc lập hiệu suất cao, cung cấp hiệu suất lưu trữ và công nghệ dự phòng dữ liệu cao hơn so với một ổ đĩa đơn. RAID là một công nghệ quản lý đa ổ đĩa cung cấp khả năng lưu trữ hiệu quả về chi phí, độ tin cậy dữ liệu cao và hiệu suất cao cho môi trường máy chủ. Định nghĩa RAID của SNIA là: một mảng đĩa mà một phần không gian lưu trữ vật lý được sử dụng để ghi thông tin dự phòng của dữ liệu người dùng được lưu trữ trong không gian còn lại. Khi một ổ đĩa hoặc đường truy cập bị lỗi, thông tin dự phòng có thể được sử dụng để tái tạo dữ liệu người dùng. Mặc dù phân mảnh dữ liệu không tuân theo định nghĩa của RAID, nó thường cũng được gọi là RAID (tức là RAID0).

 

Ý định ban đầu của RAID là cung cấp các chức năng lưu trữ cao cấp và bảo mật dữ liệu dự phòng cho các máy chủ lớn. Trong toàn bộ hệ thống, RAID được coi là một không gian lưu trữ bao gồm hai hoặc nhiều ổ đĩa, và hiệu suất I/O của hệ thống lưu trữ được cải thiện bằng cách đọc và ghi dữ liệu trên nhiều ổ đĩa đồng thời. Hầu hết các cấp độ RAID có các biện pháp kiểm tra và sửa lỗi dữ liệu hoàn chỉnh, và thậm chí cả phương pháp nhân bản, giúp tăng cường đáng kể độ tin cậy của hệ thống, và đó là nơi thuật ngữ "Redundant" (Dự phòng) xuất phát.

 

Ở đây chúng ta cần đề cập đến JBOD (Just a Bunch of Disks - Chỉ một đống ổ đĩa). Ban đầu, JBOD được sử dụng để đại diện cho một tập hợp các ổ đĩa không có phần mềm điều khiển để cung cấp điều khiển phối hợp, đây là yếu tố chính phân biệt RAID với JBOD. Hiện tại, JBOD thường đề cập đến một vỏ ổ đĩa, bất kể nó có cung cấp chức năng RAID hay không.

 

Hai mục tiêu chính của RAID là cải thiện độ tin cậy dữ liệu và hiệu suất I/O. Trong mảng đĩa, dữ liệu được phân tán trên nhiều ổ đĩa, nhưng đối với hệ thống máy tính, nó trông giống như một ổ đĩa đơn. Khả năng dự phòng đạt được bằng cách ghi cùng một dữ liệu vào nhiều ổ đĩa (thường là nhân bản) hoặc ghi dữ liệu chẵn lẻ đã tính toán vào mảng, để không gây mất dữ liệu khi một ổ đĩa bị lỗi. Một số cấp độ RAID cho phép nhiều ổ đĩa bị lỗi cùng lúc, chẳng hạn như RAID6, nơi hai ổ đĩa có thể bị hỏng cùng lúc. Dưới cơ chế dự phòng này, ổ đĩa bị lỗi có thể được thay thế bằng một ổ đĩa mới, và RAID sẽ tự động tái tạo dữ liệu bị mất theo dữ liệu và dữ liệu chẵn lẻ trong các ổ đĩa còn lại để đảm bảo tính nhất quán và toàn vẹn của dữ liệu. Dữ liệu được phân tán và lưu trữ trên nhiều ổ đĩa khác nhau trong RAID, và việc đọc và ghi dữ liệu đồng thời tốt hơn nhiều so với một ổ đĩa đơn, do đó có thể đạt được băng thông I/O tổng hợp cao hơn. Tất nhiên, mảng đĩa sẽ làm giảm tổng dung lượng lưu trữ khả dụng của tất cả các ổ đĩa, hy sinh không gian để đổi lấy độ tin cậy và hiệu suất cao hơn. Ví dụ, hiệu suất sử dụng dung lượng lưu trữ của RAID1 chỉ là 50%, và RAID5 sẽ mất dung lượng lưu trữ của một ổ đĩa, và hiệu suất sử dụng không gian là (n-1)/n.

 

Mảng đĩa có thể đảm bảo hoạt động liên tục của hệ thống mà không bị gián đoạn khi một số ổ đĩa (một hoặc nhiều, tùy thuộc vào cách triển khai) bị hỏng. Trong quá trình tái tạo dữ liệu của ổ đĩa bị lỗi sang ổ đĩa mới, hệ thống có thể tiếp tục hoạt động bình thường, nhưng hiệu suất sẽ giảm ở một mức độ nhất định. Một số mảng đĩa phải tắt máy khi thêm hoặc xóa ổ đĩa, trong khi một số hỗ trợ trao đổi nóng (hot swapping), cho phép thay thế ổ đĩa mà không cần tắt máy. Mảng đĩa cao cấp này chủ yếu được sử dụng trong các hệ thống ứng dụng có yêu cầu cao về độ tin cậy, và hệ thống không thể tắt máy hoặc thời gian tắt máy phải càng ngắn càng tốt. Nói chung, RAID không thể thay thế việc sao lưu dữ liệu. Nó bất lực đối với việc mất dữ liệu do các lỗi không phải do ổ đĩa gây ra, chẳng hạn như virus, phá hoại do con người, xóa nhầm, v.v. Tại thời điểm này, việc mất dữ liệu là tương đối so với hệ điều hành, hệ thống tệp, trình quản lý ổ đĩa hoặc hệ thống ứng dụng. Đối với bản thân hệ thống RAID, dữ liệu là nguyên vẹn và không có tổn thất nào xảy ra. Do đó, sao lưu dữ liệu, phục hồi sau thảm họa và các biện pháp bảo vệ dữ liệu khác là rất cần thiết, bổ sung cho RAID và bảo vệ an ninh dữ liệu ở các cấp độ khác nhau để ngăn ngừa mất dữ liệu.

 

Có ba khái niệm và công nghệ cốt lõi trong RAID: nhân bản (mirroring), phân mảnh dữ liệu (data striping) và dữ liệu chẵn lẻ (data parity). Nhân bản sao chép dữ liệu sang nhiều ổ đĩa. Một mặt, nó có thể cải thiện độ tin cậy, và mặt khác, nó có thể đọc dữ liệu từ hai hoặc nhiều bản sao đồng thời để cải thiện hiệu suất đọc. Rõ ràng, hiệu suất ghi của nhân bản hơi thấp hơn, và mất nhiều thời gian hơn để đảm bảo dữ liệu được ghi chính xác vào nhiều ổ đĩa. Phân mảnh dữ liệu lưu trữ các phần dữ liệu trên nhiều ổ đĩa khác nhau, và nhiều phần dữ liệu cùng nhau tạo thành một bản sao dữ liệu hoàn chỉnh, khác với các bản sao của nhân bản và thường được sử dụng để xem xét hiệu suất. Phân mảnh dữ liệu có độ hạt đồng thời cao hơn. Khi truy cập dữ liệu, có thể đọc và ghi dữ liệu trên các ổ đĩa khác nhau cùng lúc, do đó đạt được sự cải thiện hiệu suất I/O rất đáng kể. Dữ liệu chẵn lẻ sử dụng dữ liệu dự phòng để phát hiện và sửa lỗi dữ liệu. Dữ liệu dự phòng thường được tính toán bằng các thuật toán như mã Hamming và phép toán XOR. Sử dụng chức năng chẵn lẻ có thể cải thiện đáng kể độ tin cậy, khả năng phục hồi và khả năng chịu lỗi của mảng đĩa. Tuy nhiên, dữ liệu chẵn lẻ cần đọc dữ liệu từ nhiều nơi và thực hiện tính toán và so sánh, điều này sẽ ảnh hưởng đến hiệu suất hệ thống. Các cấp độ RAID khác nhau áp dụng một hoặc nhiều công nghệ trên để đạt được độ tin cậy dữ liệu, tính khả dụng và hiệu suất I/O khác nhau. Đối với loại RAID nào (ngay cả các cấp độ hoặc loại mới) để thiết kế hoặc chế độ RAID nào để áp dụng, cần đưa ra lựa chọn hợp lý trên cơ sở hiểu sâu sắc các yêu cầu của hệ thống và đánh giá toàn diện độ tin cậy, hiệu suất và chi phí để đưa ra lựa chọn thỏa hiệp.

 

Ưu điểm của RAID

 

  • Dung lượng lớn: Đây là một ưu điểm rõ ràng của RAID. Nó mở rộng dung lượng ổ đĩa, và hệ thống RAID bao gồm nhiều ổ đĩa có không gian lưu trữ khổng lồ. Hiện nay dung lượng của một ổ đĩa đơn có thể đạt hơn 1TB, do đó dung lượng lưu trữ của RAID có thể đạt cấp độ PB, và hầu hết các yêu cầu lưu trữ có thể được đáp ứng. Nói chung, dung lượng khả dụng của RAID nhỏ hơn tổng dung lượng của tất cả các ổ đĩa thành viên. Các thuật toán RAID khác nhau yêu cầu một chi phí dự phòng nhất định, và chi phí dung lượng cụ thể liên quan đến thuật toán được áp dụng. Nếu thuật toán RAID và dung lượng được biết, dung lượng khả dụng của RAID có thể được tính toán. Thông thường, hiệu suất sử dụng dung lượng của RAID nằm trong khoảng từ 50% đến 90%.

  • Hiệu suất cao: Hiệu suất cao của RAID có lợi từ công nghệ phân mảnh dữ liệu. Hiệu suất I/O của một ổ đĩa đơn bị giới hạn bởi các công nghệ máy tính như giao diện và băng thông, và thường là nút thắt cổ chai của hiệu suất hệ thống. Thông qua phân mảnh dữ liệu, RAID phân phối I/O dữ liệu cho từng ổ đĩa thành viên, do đó đạt được hiệu suất I/O tổng hợp cao gấp nhiều lần so với một ổ đĩa đơn.

  • Độ tin cậy: Tính khả dụng và độ tin cậy là những tính năng quan trọng khác của RAID. Về lý thuyết, độ tin cậy của một hệ thống RAID bao gồm nhiều ổ đĩa lẽ ra phải kém hơn một ổ đĩa đơn. Có một giả định ngầm ở đây: một ổ đĩa bị lỗi sẽ khiến toàn bộ RAID không khả dụng. RAID sử dụng các công nghệ dự phòng dữ liệu như nhân bản và dữ liệu chẵn lẻ để phá vỡ giả định này. Nhân bản là công nghệ dự phòng nguyên thủy nhất, sao chép hoàn toàn dữ liệu trên một nhóm ổ đĩa nhất định sang một nhóm ổ đĩa khác để đảm bảo luôn có một bản sao dữ liệu khả dụng. So với chi phí dự phòng 50% của nhân bản, dữ liệu chẵn lẻ nhỏ hơn nhiều, và nó sử dụng thông tin dự phòng chẵn lẻ để xác minh và sửa dữ liệu. Công nghệ dự phòng của RAID giúp cải thiện đáng kể tính khả dụng và độ tin cậy của dữ liệu, và đảm bảo rằng khi một số ổ đĩa bị lỗi, dữ liệu sẽ không bị mất và hoạt động liên tục của hệ thống sẽ không bị ảnh hưởng.

  • Khả năng quản lý: Trên thực tế, RAID là một công nghệ ảo hóa, ảo hóa nhiều ổ đĩa vật lý thành một ổ đĩa logic dung lượng lớn. Đối với hệ thống máy chủ bên ngoài, RAID là một ổ đĩa đơn, nhanh chóng và đáng tin cậy, dung lượng lớn. Bằng cách này, người dùng có thể tổ chức và lưu trữ dữ liệu hệ thống ứng dụng trên ổ đĩa ảo này. Từ góc độ ứng dụng người dùng, nó có thể làm cho hệ thống lưu trữ đơn giản, dễ sử dụng và quản lý. Vì RAID đã hoàn thành một lượng lớn công việc quản lý lưu trữ bên trong, quản trị viên chỉ cần quản lý một ổ đĩa logic đơn lẻ, điều này có thể tiết kiệm rất nhiều công việc quản lý. RAID có thể động thêm hoặc xóa ổ đĩa và tự động thực hiện kiểm tra dữ liệu và tái tạo dữ liệu, điều này có thể đơn giản hóa đáng kể công việc quản lý.