디스크 건강 점수 및 스크럽 최적화를위한 몬드리안 컨 포멀 예측
링크 표
초록 및 1. 소개
-
동기 부여 및 디자인 목표
-
관련 작업
-
적합성 예측
4.1. Mondrian Compormal Prediction (MCP)
4.2. 평가 지표
-
디스크 스크럽에 대한 몬드리안 컨 포멀 예측 : 우리의 접근
5.1. 시스템 및 스토리지 통계
5.2. 스크럽 할 디스크 : 건강 예측자를 구동합니다
5.3. 스크럽 할 때 : 워크로드 예측기
-
실험 설정 및 6.1. 오픈 소스 바이두 데이터 세트
6.2. 실험 결과
-
논의
7.1. 최적의 스케줄링 측면
7.2. 성능 지표 및 7.3. 선택적 스크러빙으로 인한 전력 절약
-
결론과 참고 문헌
2. 동기 부여 및 디자인 목표
데이터 센터에서는 잠재 실패 속성으로 인해 상당수의 건강에 해로운 드라이브가 감지되지 않아 실패 시나리오가 발생합니다. 이러한 시나리오를 완화하기위한 일반적인 접근법 중 하나는 디스크 스크럽 빙입니다. 이는 배경 스캔 프로세스를 통해 디스크 데이터를 검증하여 불량 섹터를 식별합니다. 그러나이 프로세스는 트리거 일정에 따라 에너지를 소비하고 성능 저하를 유발할 수 있습니다. 이 시나리오는 특히 디스크 용량이 증가함에 따라 업계의 우려를 제기합니다. 스크럽주기 주파수를 기준으로 스크럽 성능의 영향을 최소화하고 신뢰성을 극대화하는 데 기반을 둔 ‘스크럽 할 때’, ‘스크럽 할 때’주소가 누락 된 링크가 나타납니다. 이 논문에서는이 도전에 대처하기위한 다음과 같은 목표와 설계 접근법을 고려합니다.
\
• 어떤 디스크를 스크럽해야합니까? 특정 스크러빙 프로세스에 따라 드라이브 성능을 일시적으로 저하시킬 수 있습니다. 드라이브가 빠르고 반응이 유지되도록하려면 스크러빙 주파수를 최소화하는 것이 중요합니다. 스토리지 배열의 모든 디스크에 대한 스크럽을 수행하는 대신, 우리의 접근 방식은 필요한 디스크 만 선택적으로 스크러치하는 데 중점을 두어 프로세스를 완료하는 데 필요한 전체 시간을 줄입니다.
\
• 언제 스크럽해야합니까? 시스템의 워크로드, 드라이브에 대한 데이터의 중요성 및 리소스 가용성과 같은 요소를 고려하여 디스크 드라이브 스크러빙 일정을 최적화 할 수 있습니다. 이 접근법은 스크러빙이 가장 적절한 시간에 수행되도록하여 전체 시스템 성능에 미치는 영향을 최소화합니다.
\
3. 관련 작업
저장 장치 신뢰성은 업계에서 오랫동안 중요한 관심사였으며 기존 솔루션은 종종 저장 시스템의 고장 분석에 의존합니다. 그러나 가속화 된 수명 시험 (Cho et al., 2015)과 같은 전통적인 방법은 생산 환경에서 실제 실패율에 대한 신뢰할 수있는 지표로 입증되지 않았습니다. 다변량 시계열 (YU, 2019) 및 시계열 분류 (Ircio et al., 2022)와 같은 최근의 기계 학습 기반 접근법은 모델 정확도 향상에 중점을 두었지만 종종 도메인 지식의 깊은 통합이 부족합니다. 또한, 성능 메트릭 (디스크 레벨 및 서버 레벨)과 디스크 공간 위치를 사용하여 (Lu et al., 2020)의 다중 모달 접근 방식은 실패 스톱 시나리오에만 초점을 맞추므로 잠재 실패를 감지하는 데 도움이되지 않을 수 있습니다. 가장 최근의 연구 (Lu et al., 2023)는 회귀 모델을 사용하여 회색 실패 (실패 드라이브)를 조사하여 개별 드라이브의 과립력에서 실패 슬로우 실패를 정확하게 분석 하여이 문제를 해결했습니다.
\ 디스크 스크럽 빙의 또 다른 중요한 요소는 구현 비용 및 전력 소비입니다. (MI et al., 2008) 및 (Jiang et al., 2019)는 스크러빙으로 인한 성능 저하를 해결하고 유휴 시간 동안 배경 프로세스에 우선 순위를 낮추는 것을 제안합니다. (Liu et al., 2010) 및 (Oprea and Juels, 2010)은 전력 소비를 완화하고 저렴한 데이터를 가진 시스템을 스크럽 할시기를 결정하는 방법을 제안하지만 덜 중요한 데이터를 식별하기 위해 다른 방법을 설계해야합니다. 실패한 디스크 교체의 경우 공간 관리는 빈번한 스크러빙의 필요성과 함께 (Paris et al., 2010)에서 논의됩니다. 이진 분류 설정에서 잠재 섹터 오류를 감지하기 위해 긴 단기 메모리 (LSTM) 모델을 사용하여 다단계 스크럽 빙이 제안되어 있습니다. 그러나 기계 학습 기반 모델을 사용하면 건강하고 비교적 덜 건강한 디스크를 동일하게 처리 할 수있어 건강한 디스크를 불필요하게 문지릅니다.
\ 우리가 아는 한, 우리의 작업은 각 개별 디스크 드라이브에 건강 점수를 할당하고 메트릭을 사용하여 시스템 유휴 시간에 정렬 된 스크러빙 사이클을 설계하기위한 Mondrian Compormal Prediction을 처음으로 채택한 것입니다.
\
::: 정보이 백서는 CC By-NC-ND 4.0 Deed (Attribution-Noncommercial-Noderivs 4.0 International) 라이센스에 따라 ARXIV에서 구입할 수 있습니다.
:::
::: 정보
저자 :
(1) Rahul Vishwakarma, California State University Long Beach, 1250 Bellflower Blvd, Long Beach, CA 90840, 미국 ([email protected]);
(2) Jinha Hwang, California State University Long Beach, 1250 Bellflower Blvd, Long Beach, CA 90840, 미국 ([email protected]);
(3) Soundouss Messoudi, Heudiasyc -UMR CNRS 7253, Compiegne University, 57 Avenue de Landshut, 60203 Compiegne Cedex -France ([email protected]);
(4) Ava Hedayatipour, 캘리포니아 주립 대학교 롱 비치, 1250 Bellflower Blvd, Long Beach, CA 90840, 미국 ([email protected]).
:::
\
Post Comment