Mapeamento de caminhos de armazenamento de treinamento gerenciados pelo Amazon SageMaker
Esta página fornece um resumo de alto nível de como a plataforma de treinamento do SageMaker gerencia caminhos de armazenamento para conjuntos de dados de treinamento, artefatos do modelo, pontos de verificação e saídas entre o armazenamento em nuvem AWS e as tarefas de treinamento no SageMaker. Ao longo deste guia, você aprende a identificar os caminhos padrão definidos pela plataforma SageMaker e como os canais de dados podem ser simplificados com suas fontes de dados no Amazon Simple Storage Service (Amazon S3), FSx for Lustre e Amazon EFS. Para obter mais informações sobre opções de armazenamento e modos de entrada de canais de dados, consulte Como configurar trabalhos de treinamento para acessar conjuntos de dados.
Visão geral de como o SageMaker mapeia caminhos de armazenamento
O diagrama a seguir mostra o exemplo mais simples de como o SageMaker gerencia os caminhos de entrada e saída quando você executa um trabalho de treinamento usando a classe Estimador
O SageMaker mapeia caminhos de armazenamento entre um armazenamento (como Amazon S3, Amazon FSx e Amazon EFS) e o contêiner de treinamento do SageMaker com base nos caminhos e no modo de entrada especificados por meio de um objeto estimador do SageMaker. Para mais informações sobre como o SageMaker lê ou grava nos caminhos e a finalidade dos caminhos, consulte. Variáveis de ambiente do SageMaker e caminhos padrão para locais de armazenamento de treinamento
Você pode usar OutputDataConfig
na API CreateTrainingJob para salvar os resultados do treinamento de modelo em um bucket do S3. Use a API ModelArtifacts para descobrir buckets do S3 que contêm os artefatos do modelo. Consulte o caderno abalone_build_train_deploy
Para obter mais informações e exemplos de como o SageMaker gerencia a fonte de dados, os modos de entrada e os caminhos locais nas instâncias de treinamento do SageMaker, consulte Acessar dados de treinamento.