Mapeamento de caminhos de armazenamento de treinamento gerenciados pelo Amazon SageMaker - Amazon SageMaker

Mapeamento de caminhos de armazenamento de treinamento gerenciados pelo Amazon SageMaker

Esta página fornece um resumo de alto nível de como a plataforma de treinamento do SageMaker gerencia caminhos de armazenamento para conjuntos de dados de treinamento, artefatos do modelo, pontos de verificação e saídas entre o armazenamento em nuvem AWS e as tarefas de treinamento no SageMaker. Ao longo deste guia, você aprende a identificar os caminhos padrão definidos pela plataforma SageMaker e como os canais de dados podem ser simplificados com suas fontes de dados no Amazon Simple Storage Service (Amazon S3), FSx for Lustre e Amazon EFS. Para obter mais informações sobre opções de armazenamento e modos de entrada de canais de dados, consulte Como configurar trabalhos de treinamento para acessar conjuntos de dados.

Visão geral de como o SageMaker mapeia caminhos de armazenamento

O diagrama a seguir mostra o exemplo mais simples de como o SageMaker gerencia os caminhos de entrada e saída quando você executa um trabalho de treinamento usando a classe Estimador do SageMaker Python SDK.

Um exemplo de como o SageMaker mapeia os caminhos entre o contêiner do trabalho de treinamento e o armazenamento você executa um trabalho de treinamento usando a classe Estimador do SageMaker Python SDK e de seu método de ajuste.

O SageMaker mapeia caminhos de armazenamento entre um armazenamento (como Amazon S3, Amazon FSx e Amazon EFS) e o contêiner de treinamento do SageMaker com base nos caminhos e no modo de entrada especificados por meio de um objeto estimador do SageMaker. Para mais informações sobre como o SageMaker lê ou grava nos caminhos e a finalidade dos caminhos, consulte. Variáveis de ambiente do SageMaker e caminhos padrão para locais de armazenamento de treinamento

Você pode usar OutputDataConfig na API CreateTrainingJob para salvar os resultados do treinamento de modelo em um bucket do S3. Use a API ModelArtifacts para descobrir buckets do S3 que contêm os artefatos do modelo. Consulte o caderno abalone_build_train_deploy para ver um exemplo de caminhos de saída e como eles são usados em chamadas de API.

Para obter mais informações e exemplos de como o SageMaker gerencia a fonte de dados, os modos de entrada e os caminhos locais nas instâncias de treinamento do SageMaker, consulte Acessar dados de treinamento.