기술 교육

RAID (Redundant Array of Inexpensive Disks) 란 무엇입니까?

RAID는 독립 디스크 중복 배열 (Redundant Array of Independent Disks) 또는 중복 배열의 저렴한 디스크를 나타내는 저장 기술 기반의 머리글자 어입니다. 문자 "I"는 위에서 언급 한 두 단어를 나타냅니다. 그러나 "독립적"이라는 말은 더 적절하게 들리며 훨씬 주관적이며 대화의 맥락에 달려 있습니다.

평신도의 관점에서 볼 때, RAID는 혼란스러운 기술 문구라고 할 수 있지만 좋은 설명을 하면 간단할 수 있습니다. RAID는 단일 컴퓨터 시스템에서 단일 장치로 작동하기 위해 2 개 또는 여러 개의 하드 드라이브를 구성하는 것입니다. 구성은 용도에 따라 다를 수 있지만 시스템의 실패 나 인프라 오류와 같은 상황에서 전체 데이터 저장소를 분리해야 하는 고 가용성 설치를 제공하는 것이 주 개념입니다.

정보 기술의 세계에서 "고 가용성"이라는 용어는 중복성을 달성함으로써 얻어집니다. 이는 RAID 어레이를 데이터 센터에 배치함으로써 하드 드라이브 고장으로 인한 시스템 고장의 가능성을 줄임으로써 수행할 수 있습니다. 이렇게 하면 제대로 구성된 디스크 배열이 실패하는 것을 방지할 수 있으므로 일반적인 작업도 영향을 받지 않으므로 데이터 센터 사용자가 다운 타임을 경험하지 않습니다.

이 기사에서는 아래에 언급된 기술 용어가 간혹 반복될 것이므로 독자에게 단순화하기 위해 용어를 간략하게 설명했습니다.

리던던시 - 리던던시 란 동일한 기능을 제공하는 수많은 구성 요소를 포함하는 것을 말합니다. 따라서 시스템 기능이 부분적으로 시스템 오류가 발생할 경우에도 계속 작동할 수 있습니다.

내 결함성 - 구성 요소 오류가 발생한 경우 시스템은 서비스 손실을 막기 위해 백업 구성 요소를 사용할 수 있도록 설계되었습니다.

RAID 유형

하드웨어뿐만 아니라 소프트웨어를 사용하여 RAID 기술 배포가 가능합니다.

소프트웨어 RAID와 하드웨어 RAID 소프트웨어 RAID

- 인기 있는 운영 체제의 대부분은 소프트웨어 RAID 지원을 제공하고 있으므로 배포 비용이 약간 줄어듭니다. 그러나 소프트웨어 RAID는 파티션 수준에서 작동하므로 파티션 수가 증가하고 이 단계에서 하드웨어 RAID가 영향을 주면 복잡성이 증가합니다. 전원 공급이 중단된 경우 소프트웨어 RAID가 완전히 실패하고 하드웨어 RAID에서는 배터리 보류가 계속 진행됩니다. 소프트웨어 습격은 Raid 0 및 Raid 1 레벨에서 높은 성능 레벨을 제공합니다. 그러나 레벨이 증가하고 중첩된 RAID 레벨에서는 CPU 성능과 현재 로드에 따라 성능이 저하됩니다. 디스크의 핫 스와핑은 소프트웨어 RAID에서 지원됩니다. 이는 고장 난 하드 디스크를 새것으로 교체하는 것을 의미합니다. 소프트웨어 RAID는 핫 스페어 지원을 제공합니다. 스페어 하드 드라이브는 RAID 배열로 설치되며 활성 드라이브가 실패할 때까지 비활성 상태를 유지한 다음 결함 디스크 작업을 자동으로 수행하여 가동 중지 시간을 줄입니다. 소프트웨어 RAID 사용은 저렴한 비용의 솔루션으로 단일 공급 업체의 잠금장치, 단일 서버 워크스테이션에서 볼 수 없으며 RAID 0 및 RAID 1 수준에서 더 우수하며 가정 및 소규모 비즈니스에 이상적입니다.

하드웨어 RAID

- 기업이 데이터 센터에 하드웨어 RAID를 배치하면 비용 요소가 약간 높아집니다. 그러나 관리의 복잡성과 같은 요소는 낮으며 배터리 백업을 통해 이 습격에서 백업 캐싱을 사용할 수도 있습니다. 하드웨어 RAID의 성능은 뛰어나며 디스크 핫 스와핑 및 핫 스페어 지원을 지원합니다. 하드웨어 RAID는 더 높은 쓰기 처리량을 지원하며 데이터 손실을 빠르게 재구성합니다. 모든 미션 크리티컬 및 성능 지향 솔루션에 이상적입니다.

RAID 아키텍처의 데이터 스토리지

RAID 기술이 컴퓨터 시스템을 속여 하나의 하드 디스크라고 믿게 만듭니다. 그러나 실제로는 여러 개의 하드 디스크 드라이브에 재생된 데이터를 배포합니다. 데이터의 분배는 두 가지 일반화된 개념인 두 가지 방법으로 수행됩니다. 미러링 은 다른 디스크의 데이터 복제를 제공하는 방법 중 하나이며 두 번째 개념은 복제된 데이터를 사용 가능한 디스크 드라이브에서 분할하는 스트라이핑 입니다. 패리티 는 또 다른 저장 방법인 RAID 기술로 간소화된 개념입니다. 디스크 어레이에 정보를 저장하기 때문에 동일한 정보를 사용하여 영향을 받은 데이터를 다시 생성하거나 재구성할 수 있습니다. 그렇지 않은 경우 디스크 드라이브가 고장 나면 오류나 데이터 손실로 가득 찼습니다.

중복성의 개념은 디스크 드라이브가 고장 나자 나머지 디스크 어레이가 계속 기능을 하는 동안 영향을 받습니다. 그러나 IT 관리자의 현명한 임무는 디스크 드라이브 장애를 최소화하는 것입니다. 그 수명이 길어지면 다른 드라이브가 고장 나게 할 수 있습니다. 결함이 있는 드라이브를 교체하여 전체 시스템에 영향을 주지 않고 이 작업을 수행할 수 있으며 이 용어를 핫스왑 이라고 합니다. 그러나 이러한 유형의 교체 유연성은 전체 시스템 작동에 영향을 주지 않고 특정 유형의 RAID 유형에서만 나타납니다. 따라서 데이터 복구는 데이터 센터에 구축된 RAID 레벨에 따라 달라집니다. RAID 아키텍처를 계획하는 동안 핫 스왑 기술은 전체 작업 시스템에 영향을 미치지 않고 결함 있는 드라이브를 교체하기 위해 최대한 중요하게 주어져야 합니다.

완벽한 중복을 보장하기 위해 두 가지 방법의 장점을 제공하는 두 개 이상의 RAID 구성 조합을 구성하는 중첩 RAID 수준을 선택합니다. 패러다임은 RAID 레벨 1과 RAID 레벨 0의 조합인 RAID 10이며, 여기서 RIAD 레벨 1 구성은 RAID 0 기술에서 작동합니다.

RAID 배포 요구 사항 하드웨어

- RAID는 SATA, ATA 및 SCSI를 포함한 하드 드라이브에 배포할 수 있습니다. 하드 디스크의 수는 RAID 레벨 구성의 선택에 따라 다릅니다. 동일한 용량의 일치하는 하드 드라이브를 사용할 때 항상 권장됩니다. 대부분의 어레이가 가장 작은 드라이브의 용량을 사용한다는 것은 사실입니다. 따라서 250GB 용량의 드라이브가 80GB 하드 디스크 드라이브가 있는 RAID 구성에 배포된 경우 170GB는 낭비되며 JBOD 또는 디스크 RAID 수준에서만 유용합니다. 또한 하드웨어 드라이브는 용량이 일치해야 할 뿐만 아니라 쓰기 속도, 전송 속도 등의 면에서 반드시 일치해야 합니다. RAID 컨트롤러는 SCSI, SATA 및 ATA 하드 디스크 용으로 배포되며 일부 시스템은 RAID 어레이가 다른 형식의 컨트롤러에서 작동할 수 있도록 합니다.

RAID 기술에 대해 모르는 사람들을 위해 여기에 세부 사항이 있습니다. RAID 컨트롤러는 모든 하드 드라이브가 연결되는 하드웨어이며 데이터 처리를 담당합니다. 일반적인 드라이브 연결이 있는 마더 보드 배열과 유사합니다.

핫 스왑 가능 드라이브 베이에 대한 요구 사항은 하드 디스크 드라이브가 고장 나서 교체해야 하는 상황에서도 필수적입니다. 케이스에서 드라이브 케이지를 잠금 해제한 다음 잠긴 장소에서 슬라이딩하여 잠긴 장소로 밀어 넣는 간단한 방법으로 고장 난 하드 드라이브를 실제 시스템에서 교체할 수 있습니다.

소프트웨어 요구 사항

- RAID 기술은 RAID 컨트롤러 제조업체가 제공 한 모든 적절한 드라이버가 있는 경우 모든 최신 운영 체제에 배포할 수 있습니다. 운영 체제 및 소프트웨어 요구 사항을 처음부터이 단계 이전에 업그레이드해야 하며 새로 레이드 된 RAID 기술로 복원할 수 있도록 모든 데이터를 백업해야 합니다. RAID 어레이가 데이터 저장을 위해 특별히 유지 관리되고 다른 운영 체제가 실행되는 경우가 아니라면 간단합니다.

RAID 레벨 구성

RAID 기술에는 거의 십여 개의 RAID 레벨 구성 표가 있습니다. 그러나 가장 일반적인 RAID 레벨 체계는 아래에 요약되어 있습니다.

RAID 레벨 0

-이 RAID 레벨 0 구성은 중복성을 제공하지 않으므로 RAID 기술 어레이에 정확히 맞지 않습니다. 이 RAID 레벨 0에서는 두 개의 디스크가 두 개의 드라이브에 교대로 데이터를 쓰는 데 사용됩니다. 이는 스트라이핑입니다. 이것은 패러다임으로 설명할 수 있습니다. 데이터가 10 개 있다고 가정해 봅시다. 1,2,3,4,5,6,7,8,9,10을 말합니다. 그것으로부터 1, 3,5,7,9는 하나를 구동하도록 쓰여지고 나머지는 즉 2, 4, 6, 8,10이 두 번째 드라이브에 쓰여지고 순차적 순서로 기록됩니다. 이렇게 데이터를 분할하면 단일 하드 드라이브의 속도를 두 배로 늘릴 수 있으며 성능을 향상시킬 수 있습니다. 그러나 하나의 드라이브가 이 배열에서 실패하면 데이터 손실이 발생합니다. Raid 0의 용량은 개별 드라이브의 전체 합계와 같습니다. 즉, 두 개의 80GB 하드 디스크를 RAID에 배치하면 전체 용량은 약 160GB의 RAID 0 수준이 됩니다.

RAID 레벨 1

-이 RAID 레벨 1에서 중복성 요소가 영향을 받습니다. 이 레벨에서 하드 드라이브의 최소 사용량은 2이고 데이터는 두 드라이브에 모두 기록됩니다. 첫 번째 드라이브의 데이터를 두 번째 드라이브에 복제하거나 미러링하고 두 번째 드라이브와 동일한 드라이브를 만드는 것과 같습니다. 첫 번째 드라이브에 장애가 발생하면 데이터 백업을 드라이브 2에서 사용할 수 있습니다. 이 RAID 레벨에서 RAID 1 레벨 어레이의 실제 용량은 개별 드라이브의 합계 용량의 절반과 같습니다. 즉, 2 개의 160GB 드라이브가 배치되면 전체 용량은 160GB에 불과합니다.

RAID 레벨 2

-이 형식의 RAID 데이터는 각 순차 비트가 다른 드라이브에 있는 방식으로 스트라이핑됩니다. 각 데이터 단어는 자체 해밍 코드를 가지고 있으며 해독 코드는 데이터 정확도를 확인하고 단일 디스크 오류도 수정합니다. 이 수준에서 어레이는 여러 개의 동시 하드 드라이브 고장을 복구할 수 있습니다. 이 RAID 레벨 2에는 최소 2 개의 드라이브가 필요합니다.

RAID 레벨 3

-이 RAID 레벨에서는 최소 3 개의 드라이브가 구현에 필요합니다. 데이터 블록은 분할되어 데이터 디스크에 기록됩니다. 스트라이프 패리티는 쓰기 시 생성되며 이 쓰기는 패리티 디스크에 기록되며 읽기 시 검사할 수 있습니다. RAID 3 어레이는 하드 드라이브 오류를 복구할 수 있으며 비디오 제작, 비디오 편집 및 라이브 스트리밍과 같은 고속 처리량이 필요한 환경에 배치됩니다. 이 레벨에서는 읽기 / 쓰기 속도가 빠릅니다.

RAID 레벨 4

-이 RAID 레벨에서는 3 개의 드라이브가 필요하며 이 레벨에서는 전체 블록이 디스크에 기록됩니다. 패리티는 쓰기에서 생성되고 패리티 디스크에 기록되고 읽기에서 검사됩니다. 이 RAID 레벨은 높은 읽기 속도를 가지며 매우 효율적입니다.

RAID 레벨 5

-이 RAID 5 레벨에서는 3 개의 드라이브가 구현되고 데이터 블록은 데이터 디스크에 쓰여지고 쓰기에서 생성된 패리티는 3 개의 드라이브에 분산되고 읽기 시 검사됩니다. 드라이브 장애 상황에서는 분산 패리티에서 읽기를 계산할 수 있으며 드라이브 장애는 사용자로부터 마스킹 됩니다. 그러나 단일 드라이브 오류가 발생하는 경우 전체 어레이의 성능이 고갈됩니다.

RAID 레벨 6

-이 RAID 6 레벨 (RAID 6으로 수정됨)은 두 개의 드라이브 오류가 발생해도 시스템 기능이 유지되는 경우 내 결함성을 제공합니다. 이 레벨에서는 이중 분산 패리티와 함께 ​​블록 레벨 스트리핑이 관찰됩니다. 데이터 복구의 경우 복구 시간은 디스크 드라이브의 크기에서 발생합니다. 이중 패리티는 하나의 추가 드라이브가 실패할 경우 위험하지 않은 상태에서 어레이를 재구성하고 재 구축을 통한 데이터 복구가 진행되는 동안 추가시간을 제공합니다.

이제 하이브리드 RAID 레벨이라고도 하는 중첩 수준의 RAID를 두 RAID 레벨의 결합으로 구성합니다.

RAID 레벨 10 (1 + 0)

-이 RAID 레벨의 드라이브에는 최소 4 개의 드라이브가 필요합니다. RAID 10에는 내 결함성이 있으며 중복성도 있습니다. RAID 0 레벨에서 볼 수 있는 데이터 분리 기능이 있으며 RAID 1 레벨에서 미러링 기능이 나타납니다. RAID 10 어레이는 여러 개의 동시 하드 드라이브 오류로부터 복구할 수 있으며 하이 엔드 서버 응용 프로그램에 이상적입니다.

RAID 레벨 0 + 1

-이 RAID 레벨은 최소 4 개의 드라이브가 필요하며 이 RAID 레벨로 여러 개의 드라이브 오류를 처리할 수 ​​있습니다. 이 레벨은 RAID 0과 RAID 1 레벨의 조합으로 파일 서버를 의미하는 이미징 응용 프로그램에 사용됩니다. 고성능을 제공하고 신뢰성에 중점을 두지 않습니다. RAID 0 + 1에서는 기본 세트를 미러링 하는 두 번째 스트라이프 세트가 생성됩니다. 어레이는 미러 세트에서 하나 이상의 드라이브 오류로 계속 작동합니다.

JBOD RAID

- 이것은 디스크 묶음의 약자이며 공식적으로 스패닝으로 알려져 있습니다. 이 JBOD 급습 수준에서 하드 디스크 배열은 단일 디스크 시스템으로 표시됩니다. 그러나 이에 대한 RAID 레벨 구현이 없으므로 내 결함성이 부족합니다.

RAID 서버 오류 및 RAID 복구 소프트웨어

RAID 기술은 저장된 데이터에 대해 중복성을 제공하는 것이지만 RAID를 보호하는 서버의 경우에도 장애 및 데이터 손실 문제가 발생할 수 있습니다. 이것은 다음과 같은 방법으로 가능합니다.

  • 하드웨어 충돌.
  • 소프트웨어 손상 또는 운영 체제 업그레이드로 인한 맬웨어 공격.
  • 호환되지 않는 하드 드라이브가 추가되었습니다.
  • 전체 구성 설정이 손상되거나 손상됩니다.
  • 한 번에 여러 개의 하드 드라이브 오류가 발생합니다.
  • 서버가 충돌하여 어레이 나 볼륨을 다시 마운트 하지 않습니다.
  • RAID 컨트롤러 장애 또는 구성이 변경된 경우.
RAID 실패 시 고려해야 할 사항

RAID 기술이 흔하지 않은 데이터 센터에서 실패할 경우 IT 관리자는 성급한 결정을 내리지 않아야 합니다.

논리적인 문제의 경우 파일 시스템 분석과 작업의 정확성 때문에 작업이 어려워집니다. 미러링 된 RAID 레벨의 경우 두 드라이브의 양호한 섹터에서 데이터를 혼합하여 일치시켜 좋은 드라이브를 재구성할 수 있습니다. 데이터 재구성은 패리티를 사용하는 스트라이프 RAID 체계에서 수행할 수 있습니다. 이 스트립 레벨의 데이터 재구성은 드라이브 기반보다 쉽습니다. 두 개 이상의 드라이브에서 여러 개의 불량 섹터가 있는 경우 개별적으로 수정해야 합니다.

데이터가 누락된 경우 RAID 컨트롤러는 고장이 났을 때 디스크를 오프라인 상태로 만들며 누락된 디스크에서 손실된 데이터를 재구성하기 위해 성능이 저하된 모드에서 작동합니다.

이 모든 것이 너무 지루하다고 여겨지면 여기에 해결책이 있습니다. 요즘 Raid 복구 소프트웨어가 출시되어 많은 회사에서 개발 및 제공하고 있습니다. 이를 통해 RAID 기술로 보호되는 데이터 센터의 중요한 데이터를 예기치 않은 오류가 발생해도 많은 어려움 없이 복구할 수 있습니다.

결론

RAID 기술의 개념에 익숙하지 않은 사용자는 RAID 기술을 구현하기 위한 까다로운 작업처럼 들릴 수 있습니다. 그러나 구현을 통해 얻는 이점은 재난 복구 시에 반드시 기술을 정당화할 것입니다.