本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker 推論建議程式
Amazon SageMaker Inference Recommender 是 Amazon SageMaker AI 的功能。透過自動化 SageMaker AI ML 執行個體的負載測試和模型調校,可縮短在生產中取得機器學習 (ML) 模型所需的時間。您可以使用 Inference Recommender 將模型部署到即時或無伺服器推論端點,以最低的成本提供最佳效能。Inference Recommender 可協助您為 ML 模型和工作負載選取最佳執行個體類型和組態。它會考慮執行個體計數、容器參數、模型最佳化、並行上限和記憶體大小等因素。
Amazon SageMaker Inference Recommender 只會針對執行任務時使用的執行個體收取費用。
運作方式
若要使用 Amazon SageMaker Inference Recommender,您可以使用模型成品建立 SageMaker AI 模型或向 SageMaker 模型登錄檔註冊模型。使用 AWS SDK for Python (Boto3) 或 SageMaker AI 主控台,針對不同的 SageMaker AI 端點組態執行基準測試任務。Inference Recommender 任務可幫助您收集效能和資源使用率的指標並以視覺化方式呈現,以協助您決定要選擇的端點類型和組態。
如何開始
如果您是第一次使用 Amazon SageMaker Inference Recommender,建議您執行下列動作:
-
請閱讀 使用 Amazon SageMaker Inference Recommender 的先決條件一節,確認您已滿足使用 Amazon SageMaker Inference Recommender 的要求。
-
請仔細閱讀Amazon SageMaker Inference Recommender 的建議任務一節,以啟動您的第一個 Inference Recommender 建議任務。
-
探索簡介 Amazon SageMaker Inference Recommender Jupyter 筆記本
範例,或檢閱下一節的範例筆記本。
範例筆記本
下列 Jupyter 筆記本範例可協助您處理 Inference Recommender 中多個使用案例的工作流程:
-
如果您想要對 TensorFlow 模型進行基準測試的入門筆記本,請參閱SageMaker 推論建議工具 TensorFlow
筆記本。 -
如果您想要對 HuggingFace 模型進行基準測試,請參閱筆記本SageMaker 的推論建議程式 HuggingFace
。 -
如果您想要對XGBoost模型進行基準測試,請參閱SageMaker 推論建議工具XGBoost
筆記本。 -
如果您想要檢閱推論建議工具任務的 CloudWatch 指標,請參閱SageMaker 推論建議工具 CloudWatch 指標
筆記本。