tarファイルについて
tarファイルは複数のファイルを1ファイルにまとめて格納したものとなります。
パイプラインの自動化機能を利用する際に、
モデリングに使用するデータソースをこちらのファイル形式にて作成いただく必要がございます。
データソースを作成する処理内容をPythonで記述いただき、
プリプロセスに.pyファイルをアップロードいただくか、
事前に作成いただいたtarファイルをデータソースにアップロードいただくこととなります。
tarファイル作成時の留意点といたしまして、下図の「dataset.json」にて、
訓練データ(Training)と評価用データ(Validation)がそれぞれに対応するcsvファイルの名称を記載する必要がございます。
“Training”と”Validation”はそれぞれプロジェクトのデータセット名を示すパラメータ名と同じものを使用します。