DataKeeper for Linux は、使用できるネットワーク内でデータを複製できます。マルチサイト、すなわち広域ネットワーク(WAN)構成では、「ソースパーティションが 1 日中更新されるときに、パーティションを正常に複製してミラーをミラーリング状態に維持するために十分な帯域幅があるか」という質問に対して特別な検討が必要です。
ミラーがミラーリング状態でない場合にはパーティションのスイッチオーバは許可されないので、ミラーをミラーリング状態に維持することが重要です。
SIOS DataKeeper はデータを非同期キューに追加することにより、短期間に急増した書き込み動作を処理します。ただし、長期間にわたって複製されるすべてのボリュームのディスク書き込み動作の合計が、平均して DataKeeper とネットワークが送信できる変化量を下回ることを確認してください。
ネットワーク能力が不十分なためにディスクの変化率に対処できず、非同期キューがいっぱいになった場合、ミラーは同期動作に戻ります。これによりソースサーバのパフォーマンスに悪影響を及ぼすことがあります。
基本変化率の測定
以下のコマンドを使用して、ミラーリングするファイルまたはパーティションを特定してください。例えば /dev/sda3 を使用して、1 日に書き込まれたデータ量を測定します。
MB_START=`awk ‘/sda3 / { print $10 / 2 / 1024 }’ /proc/diskstats`
1 日後
MB_END=`awk ‘/sda3 / { print $10 / 2 / 1024 }’ /proc/diskstats`
1 日の変化率 (単位: MB) は MB_END – MB_START で得られます。
SIOS DataKeeper が 1 日にミラーリングできるおよその量は以下のとおりです。
T1 (1.5Mbps) – 14,000 MB/日(14 GB)
T3(1.5 Mbps) – 410,000 MB/日 (410 GB)
ギガビット(1 Gbps) - 5,000,000 MB/日(5 TB)
詳細変化率の測定
変化率を収集する最良の方法は、一定期間(例: 1 日)ディスクの書き込み動作をログに記録して、ディスクの書き込みのピーク期間を特定することです。
ディスクの書き込み動作を追跡するには、システムのタイムスタンプをログに記録して /proc/diskstats のダンプを行う cron ジョブを作成してください。例えば、2 分間隔でディスクの統計値を収集するには、 /etc/crontab に以下のリンクを追加します。:
*/2 * * * * root ( date ; cat /proc/diskstats ) >> /path_to/filename.txt
1 日、1 週間などの期間が経過した後、cron ジョブを無効にし、得られたデータファイルを安全な場所に保存します。
収集した詳細変化率データの解析
roc-calc-diskstats ユーティリティは、前述の手順で収集したデータを解析します。このユーティリティは、長期間ログに記録された出力を持つ /proc/diskstats 出力ファイルから、データセットに含まれるディスクの変化率を計算します。
roc-calc-diskstats をダウンロードするにはここをクリック
使用法:
# ./roc-calc-diskstats <interval> <start_time> <diskstats-data-file> [dev-list]
使用例(概要のみ):
# ./roc-calc-diskstats 2m “Jul 22 16:04:01” /root/diskstats.txt sdb1,sdb2,sdc1 > results.txt
この例は、概要(およびディスク別のピーク I/O 情報)を results.txt にダンプします。
使用例(概要とグラフデータ):
# export OUTPUT_CSV=1
# ./roc-calc-diskstats 2m “Jul 22 16:04:01” /root/diskstats.txt sdb1,sdb2,sdc1 2> results.csv > results.txt
この例は、グラフデータを results.csv に、概要(およびディスク別のピーク I/O 情報)を results.txt にダンプします。
結果の例(results.txt)
Sample start time: Tue Jul 12 23:44:01 2011
Sample end time: Wed Jul 13 23:58:01 2011
Sample interval: 120s #Samples: 727 Sample length: 87240s
(Raw times from file: Tue Jul 12 23:44:01 EST 2011, Wed Jul 13 23:58:01 EST 2011)
Rate of change for devices dm-31, dm-32, dm-33, dm-4, dm-5, total
dm-31 peak:0.0 B/s (0.0 b/s) (@ Tue Jul 12 23:44:01 2011) average:0.0 B/s (0.0 b/s)
dm-32 peak:398.7 KB/s (3.1 Mb/s) (@ Wed Jul 13 19:28:01 2011) average:19.5 KB/s (156.2 Kb/s)
dm-33 peak:814.9 KB/s (6.4 Mb/s) (@ Wed Jul 13 23:58:01 2011) average:11.6 KB/s (92.9 Kb/s)
dm-4 peak:185.6 KB/s (1.4 Mb/s) (@ Wed Jul 13 15:18:01 2011) average:25.7 KB/s (205.3 Kb/s)
dm-5 peak:2.7 MB/s (21.8 Mb/s) (@ Wed Jul 13 10:18:01 2011) average:293.0 KB/s (2.3 Mb/s)
total peak:2.8 MB/s (22.5 Mb/s) (@ Wed Jul 13 10:18:01 2011) average:349.8 KB/s (2.7 Mb/s)
詳細変化率データのグラフ作成
お客様に固有の経時的な帯域幅のニーズを分かりやすくするために、テンプレートスプレッドシート diskstats-template.xlsx が用意されています。このスプレッドシートにはサンプルデータがあり、 roc-calc-diskstatsで収集したデータで上書きできます。
diskstats-template.xslx をダウンロードするにはここをクリック
- results.csv を開き、total 列を含めて すべての行 を選択してください。
- diskstats-template.xlsx を開き、 diskstats.csv ワークシートを選択してください。
- セル 1-A を右クリックし、 [Insert Copied Cells] を選択してください。
- レプリケーション用に割り当てた帯域幅の量を反映するように、ワークシートの左下にあるセルの bandwidth 値を調整してください。
単位: メガビット/秒(Mb/sec)
注記: その右側にあるセルの値は、収集した生データに合わせて自動的にバイト / 秒単位に変換されます。
- 以下の行/列番号を記録してください。
a. Total(下のスクリーンショットでは行 6)
b. Bandwidth(下のスクリーンショットでは行 9)
c. 最終データポイント(下のスクリーンショットでは列 R)
- bandwidth vs ROC ワークシートを選択してください。
- グラフを右クリックし、 [Select Data…] を選択してください。
a. Bandwidth 系列 を調整してください。
i. 左の [Series] リストから bandwidth を選択してください。
ii. [Edit] をクリックしてください。
iii. 以下の構文を使用して、 [Series Values] フィールドを調整してください。
“=diskstats.csv!$B$<row>:$<final_column>$<row>”
例: “=diskstats.csv!$B$9:$R:$9”
iv. [OK] をクリックしてください。
b. ROC 系列 を調整してください。
i. 左の [Series] リストから ROC を選択してください。
ii. [Edit] をクリックしてください。
iii. 以下の構文を使用して、 [Series Values] フィールドを調整してください。
“=diskstats.csv!$B$<row>:$<final_column>$<row>”
例:“=diskstats.csv!$B$6:$R:$6”
iv. [OK] をクリックしてください。
c. [OK] をクリックしてウィザードを終了してください。
- Bandwidth vs ROC のグラフが更新されます。結果を解析して、データのレプリケーションをサポートするために十分な帯域幅があるかどうかを判断してください。
このトピックへフィードバック