メタデータの末尾にスキップ
メタデータの先頭に移動

データベースにデータをロードするために、Clustrixはclustrix_import 並列インポートツールを提供します。これはプロセスを高速化するために私たちの製品のクラスタ化された性質をうまく利用します。Clustrix Support Forums からインポートツールのコピーのダウンロードをすることができます。インポートツールはPython 2.5以上を必要とします。Python 2.5をインストールしていない場合は、クラスタからインポートツールを直接使用することができます。

  1. MySQLインスタンスのためのmysql dump の実行
  2. mysql dump を 任意のノードの/clustrix ディレクトリにコピーします。
  3. Clustrix インポートツールダウンロードして、dumpfileと同じ/clustrix ディレクトリに配置します。
  4. MySQLDumpと同じサーバ上でファイルを解凍し、以下のコマンドを実行します:

 

bash# ./clustrix_import -H <cluster_ip> -u root --passwd=<password> -i ./mydumpfile.dump

 

Clustrixは管理上の目的でそれぞれのノード上で約400GBの容量を予約しています。

Icon

USB大容量ストレージドライバとClustrixの既知のコンフリクトによる問題を避けるために、外部ドライブにあるdumpをインポートしないでください。常にdumpをノード上の /clustrix にコピーし、そこからインポートします。インポートツールはクラスタ内の全てのノードに接続するため、一度に一回以上のインポートをしないでください。

データをインポートするには、以下のようにインポートツールを起動します:

node# ./clustrix_import -H <cluster_ip> -u root --passwd=<password> -i ./mydumpfile.dump

インポートツールは指定されたIPアドレスに接続し、どのIPアドレスがクラスタに所属しているかを判別します。

clustrix_importのオプション:

 

フラグ

説明

-h, --help

オプションとフラグをリスト表示します。

-i importfile, --import-file=importfile

インポートされるファイルSpecify "-" for stdin.

-H host, --host=host

ホスト。

-P port, --port=port

SQL ポート。デフォルトは3306です。(MySQLと同じ)

-u USER, --user=USER

ユーザ名、デフォルトはclustrix_ui

-p password, --passwd=password

パスワード。

-d databases, --databases=databases

指定されたファイルからインポートする、カンマで区切られたデータベースのリスト。 このオプションを指定した場合は、-Dを省略します。

-D database, --database=database

DMLがロードされる目的のデータベース。

-T n, --threads-per-node=n

一つのノードごとに接続するスレッドデフォルトは8です。

-g, --aggregate

複数の小さなINSERTステートメントを少数の大きなステートメントに集約します。

-S start_table, --start-table=start_table

指定されたテーブルが見つかるまでdumpの中を探します。--start-database が指定された場合は、テーブルの走査を開始する前にデータベースを探します。

-s start_database, --start-database=start_database

指定されたデータベースが見つかるまで、dumpの中を探します。

-A, --no-auto-slice

テーブルのテーブルあたりのスライスの数の自動設定を無効にします (サイズに基づいています)。

v, -verbose

詳細モード。

TOP
inserted by FC2 system