無作為分割

クロス検証の最も単純なメソッドの一つが RandomSpilt クラスとして実装されています。標本は二つのグループに分割されます: 訓練グループとテストグループ。各グループ内の標本の数を調整することができます。

コンストラクタのパラメータ

  • $dataset - Dataset インタフェースを実装するオブジェクト
  • $testSize - テスト分割の断片 (float, 0 から 1, デフォルト: 0.3)
  • $seed - ランダム生成のためのシード (例えば テストのため)
$randomSplit = new RandomSplit($dataset, 0.2);

標本とラベルグループ

テストおよび訓練グループから標本あるいはラベルを取得するために、以下のgetterを使うことができます:

$dataset = new RandomSplit($dataset, 0.3, 1234);

// train group
$dataset->getTrainSamples();
$dataset->getTrainLabels();

// test group
$dataset->getTestSamples();
$dataset->getTestLabels();