tarファイルについて

Monday, December 21, 2020

Cloud

Posted by miyamoto

tarファイルについて

tarファイルは複数のファイルを1ファイルにまとめて格納したものとなります。

パイプラインの自動化機能を利用する際に、
モデリングに使用するデータソースをこちらのファイル形式にて作成いただく必要がございます。

データソースを作成する処理内容をPythonで記述いただき、
プリプロセスに.pyファイルをアップロードいただくか、
事前に作成いただいたtarファイルをデータソースにアップロードいただくこととなります。

tarファイル作成時の留意点といたしまして、下図の「dataset.json」にて、
訓練データ(Training)と評価用データ(Validation)がそれぞれに対応するcsvファイルの名称を記載する必要がございます。

“Training”と”Validation”はそれぞれプロジェクトのデータセット名を示すパラメータ名と同じものを使用します。