無作為分割
クロス検証の最も単純なメソッドの一つが RandomSpilt
クラスとして実装されています。標本は二つのグループに分割されます: 訓練グループとテストグループ。各グループ内の標本の数を調整することができます。
コンストラクタのパラメータ
- $dataset -
Dataset
インタフェースを実装するオブジェクト - $testSize - テスト分割の断片 (float, 0 から 1, デフォルト: 0.3)
- $seed - ランダム生成のためのシード (例えば テストのため)
$randomSplit = new RandomSplit($dataset, 0.2);
標本とラベルグループ
テストおよび訓練グループから標本あるいはラベルを取得するために、以下のgetterを使うことができます:
$dataset = new RandomSplit($dataset, 0.3, 1234);
// train group
$dataset->getTrainSamples();
$dataset->getTrainLabels();
// test group
$dataset->getTestSamples();
$dataset->getTestLabels();