실시간 복제를 지원하는 데 얼마나 많은 대역폭이 필요합니까?
다중 사이트 또는 WAN (Wide Area Network) 구성에서 데이터를 복제하려면 먼저 한 가지 중요한 질문에 대답해야합니다. 파티션을 성공적으로 복제하고 원본 파티션이 미러링 상태가되도록 충분한 대역폭이 있습니까? 하루 종일 업데이트 되었습니까? 미러를 미러링 상태로 유지하는 것이 중요합니다. 파티션 전환은 미러가 미러링 상태 일 때만 허용됩니다.
따라서 실시간 복제를 지원하는 대역폭의 양이 네트워크 대역폭 요구 사항을 결정하는 중요한 초기 단계입니다. 데이터를 복제하는 데 필요한 네트워크 대역폭의 양을 나타내는 값인 변화율을 어떻게 측정 할 수 있습니까?
기본 변화율 확립
먼저이 명령을 사용하여 미러링 할 파일 또는 파티션의 기본 일일 변동률을 결정하십시오. 예를 들어, / dev / sda3에 대해 하루에 기록 된 데이터의 양을 측정하려면 다음 명령을 실행하십시오 : MB_START =`awk '/ sda3 / {print $ 10 / 2 / 1024}'/ proc / diskstats `24 시간 기다린 후 다음 명령을 실행하십시오 : MB_END =`awk '/ sda3 / {print $ 10 / 2 / 1024}'/ proc / diskstats` 일일 변경 비율은 메가 바이트 단위로 MB_END – MB_START입니다. 다양한 네트워크 연결을 통해 누를 수있는 데이터의 양은 다음과 같습니다.
- T1 (1.5Mbps) : 14,000MB / 일 (14GB)
- T3 (45Mbps) : 410,000MB / day (410GB)
- 기가비트 (1Gbps) : 5,000,000MB / 일 (5TB)
변화의 구체적인 비율 확립
다음은 실시간 복제를 지원하기 위해 대역폭을 계산하는 방법입니다. 상세한 변화율을 측정해야합니다. 이 데이터를 수집하는 가장 좋은 방법은 일정 기간 (예 : 1 일) 동안 디스크 쓰기 활동을 기록하여 최대 디스크 쓰기 기간을 결정하는 것입니다. 이렇게하려면 시스템의 타임 스탬프를 기록한 다음 / proc / diskstats 덤프를 기록하는 cron 작업을 작성하십시오. 예를 들어 2 분마다 디스크 통계를 수집하려면 다음 링크를 / etc / crontab에 추가하십시오. * / 2 * * * * root (date; cat / proc / diskstats) >> /path_to/filename.txt (예 : 1 일, 1 주일), cron 작업을 비활성화하고 결과 / proc / diskstats 출력 파일을 안전한 위치에 저장하십시오.
변화율 데이터의 분석 및 그래프 작성
다음으로 상세한 변화율 데이터를 분석해야합니다. 이 작업을 위해 roc-calc-diskstats 유틸리티를 사용할 수 있습니다. 이 유틸리티는 / proc / diskstats 출력 파일을 사용하고 데이터 세트의 디스크 변경 비율을 계산합니다. 이 유틸리티를 실행하려면 다음 명령을 사용하십시오. # ./roc-calc-diskstats <interval> <start_time> <diskstats-data-file> [dev-list] 예를 들어 다음은 디스크 별 피크 I / O 정보)를 출력 파일 results.txt에 추가합니다. # ./roc-calc-diskstats 2m "Jul 22 16:04 :01 "/root/diskstats.txt sdb1, sdb2, sdc1> results.txt 다음은 results.txt 파일의 샘플 결과입니다. 샘플 시작 시간 : Tue Jul 12 23:44 :01 2011 샘플 종료 시간 : Wed Jul 13 23:58 :01 2011 샘플 간격 : 120 초 # 샘플 : 727 샘플 길이 : 87240 초 (파일에서 원시 시간 : Tue Jul 12 23:44 :01 EST 2011, Wed Jul 13 23:58 :01 EST 2011) 장치 dm-31, dm-32, dm-33, dm-4, dm-5, 전체 dm-31 피크의 변화율 : 0.0 B / s (@ bue 7 월 12 일 23:44 :01 2011) 평균 : 0.0 B / s (0.0 b / s) dm-32 피크 : 398.7 KB / s (3.1 Mb / s) (@ Wed Jul 13 19:28 :01 2011) 평균 : 19.5 KB / s (156.2 Kb / s) dm-33 피크 : 814.9 KB / s (6.4 Mb / s) (@ Wed Jul 13 23:58 :01 2011) 평균 : 11.6 KB / s (92.9 Kb / s) dm-4 피크 : 185.6 KB / s (1.4 Mb / s) (@ Wed Jul 13 15:18 :01 2011) 평균 : 25.7 KB / s (205.3 Kb / s) dm-5 피크 : 2.7 MB / s (21.8 Mb / s) (@ Wed Jul 13 10:18 :01 2011) average : 293.0 KB / s (2.3 Mb / s) 총 피크 : 2.8 MB / s (22.5 Mb / s) (@ Wed Jul 13 10:18 :2011 년 1 월) average : 349.8 KB / s (2.7 Mb / s) 시간 경과에 따른 특정 대역폭 요구 사항을 이해하는 데 도움이되도록 자세한 변경 속도 데이터를 그래프로 나타낼 수 있습니다. 다음은 results.csv에 그래프 데이터를 덤프합니다 (results.txt에 요약을 덤프 함). # export OUTPUT_CSV = 1 # ./roc-calc-diskstats 2m "Jul 22 16:04 :01 "/root/diskstats.txt sdb1, sdb2, sdc1 2> results.csv> results.txt SIOS는 roc-calc의 데이터로 덮어 쓸 수있는 샘플 데이터가 들어있는 템플릿 스프레드 시트 diskstats-template.xlsx를 만들었습니다 -diskstats. 다음 일련의 이미지는 스프레드 시트를 사용하는 과정을 보여줍니다.
- results.csv를 열고 전체 열을 포함하여 모든 행을 선택합니다.
- diskstats-template.xlsx를 열고 diskstats.csv 워크 시트를 선택하십시오.
- 셀 1-A에서 마우스 오른쪽 버튼을 클릭하고 복사 된 셀 삽입을 선택합니다.
- 복제에 할당 한 대역폭의 양 (초당 메가 비트)을 반영하도록 워크 시트의 왼쪽 하단을 향해 셀의 대역폭 값을 조정합니다 (다음 그림 참조). 오른쪽의 셀은 수집 된 원시 데이터와 일치하도록 초당 바이트로 자동 변환됩니다.
- 다음 행 및 열 번호를 메모하십시오.
-
- 합계 (다음 그림의 행 6)
- 대역폭 (다음 그림의 행 9)
- 마지막 데이터 점 (다음 그림의 열 R)
- 대역폭 대 ROC 워크 시트를 선택하십시오.
- 그래프를 마우스 오른쪽 버튼으로 클릭하고 데이터 선택을 선택하십시오.
- 데이터 원본 선택 대화 상자에서 범례 항목 (계열) 목록에서 대역폭을 선택한 다음 편집을 클릭합니다.
- 시리즈 편집 대화 상자에서 시리즈 값 필드에 다음 구문을 사용하십시오. = diskstats.csv! $ B $ <row> : $ <final_column> $ <row> 다음 그림은 스프레드 B9에서 R9까지의 연속 값을 보여줍니다 .
- 확인을 클릭하여 시리즈 편집 상자를 닫습니다.
- 데이터 원본 선택 상자에서 범례 항목 (계열) 목록에서 ROC를 선택한 다음 편집을 클릭합니다.
- 시리즈 편집 대화 상자에서 시리즈 값 필드에 다음 구문을 사용하십시오. = diskstats.csv! $ B $ <row> : $ <final_column> $ <row> 다음 그림은 스프레드 B6에서 R6까지의 계열 값을 보여줍니다 .
- 확인을 클릭하여 시리즈 편집 상자를 닫은 다음 확인을 클릭하여 데이터 소스 선택 상자를 닫습니다.
대역폭 대 ROC 그래프가 업데이트됩니다. 결과를 분석하여 데이터 복제를 지원할 충분한 대역폭이 있는지 확인하십시오.
다음 단계
변경 비율이 사용 가능한 대역폭을 초과하는 경우 복제 솔루션이 최적의 성능을 발휘할 수 있도록 다음 사항 중 일부를 고려해야합니다.
- 복제 솔루션 또는 네트워크 하드웨어에서 압축을 사용합니다. Linux 용 SteelEye Protection Suite의 일부인 Linux 용 DataKeeper는 이러한 유형의 압축을 지원합니다.
- 복제 할 필요가없는 임시 데이터 및 스왑 파일을위한 복제되지 않은 로컬 저장소를 만듭니다.
- 복제되는 데이터의 양을 줄입니다.
- 네트워크 용량을 늘리십시오.
실시간 복제를 지원하기 위해 대역폭을 계산하는 것과 같은 빠른 방법을 보려면 Linux 클러스터링의 허가로 복제 된 블로그를 읽어보십시오.