Amazon SageMaker 推論建議程式 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker 推論建議程式

Amazon SageMaker Inference Recommender 是 Amazon SageMaker AI 的功能。透過自動化 SageMaker AI ML 執行個體的負載測試和模型調校,可縮短在生產中取得機器學習 (ML) 模型所需的時間。您可以使用 Inference Recommender 將模型部署到即時或無伺服器推論端點,以最低的成本提供最佳效能。Inference Recommender 可協助您為 ML 模型和工作負載選取最佳執行個體類型和組態。它會考慮執行個體計數、容器參數、模型最佳化、並行上限和記憶體大小等因素。

Amazon SageMaker Inference Recommender 只會針對執行任務時使用的執行個體收取費用。

運作方式

若要使用 Amazon SageMaker Inference Recommender,您可以使用模型成品建立 SageMaker AI 模型或向 SageMaker 模型登錄檔註冊模型。使用 AWS SDK for Python (Boto3) 或 SageMaker AI 主控台,針對不同的 SageMaker AI 端點組態執行基準測試任務。Inference Recommender 任務可幫助您收集效能和資源使用率的指標並以視覺化方式呈現,以協助您決定要選擇的端點類型和組態。

如何開始

如果您是第一次使用 Amazon SageMaker Inference Recommender,建議您執行下列動作:

  1. 請閱讀 使用 Amazon SageMaker Inference Recommender 的先決條件一節,確認您已滿足使用 Amazon SageMaker Inference Recommender 的要求。

  2. 請仔細閱讀Amazon SageMaker Inference Recommender 的建議任務一節,以啟動您的第一個 Inference Recommender 建議任務。

  3. 探索簡介 Amazon SageMaker Inference Recommender Jupyter 筆記本範例,或檢閱下一節的範例筆記本。

範例筆記本

下列 Jupyter 筆記本範例可協助您處理 Inference Recommender 中多個使用案例的工作流程: