- 分析›
- Amazon SageMaker›
- 常見問答集
Amazon SageMaker 常見問答集
一般問題
什麼是下一代 Amazon SageMaker?
下一代 SageMaker 是用於資料、分析和 AI 的統一平台。下一代的 SageMaker 結合廣泛採用的 AWS 機器學習 (ML) 和分析功能,提供分析和 AI 的整合式體驗,並統一存取您的所有資料。SageMaker 可讓您使用熟悉的 AWS 服務進行模型開發、生成式 AI、資料處理和 SQL 分析,從統一的工作室 (預覽) 加快協作和建置,這些工具由 Amazon Q Developer 加速,這是對於軟體開發最有能力的生成式 AI 助理。此外,無論是儲存在資料湖、資料倉儲、第三方或聯合資料來源中,您都可以存取所有資料,內建的管控功能可滿足企業安全需求。
全新的 SageMaker 與我目前在 ML 工作流程中使用的 SageMaker 有何不同?
我們透過全面的 AWS 資料、分析和 AI 功能擴展廣泛採用的 Amazon SageMaker 服務,以提供統一的資料、分析和 AI 平台。展望未來,SageMaker 中用於資料整理、建置、訓練和部署 AI 模型的現有 AI/ML 功能集將稱為 Amazon SageMaker AI。Amazon SageMaker AI 整合在下一代 Amazon SageMaker 中,也可作為獨立服務提供,以供希望專注於大規模建置、訓練和部署 AI 與 ML 模型的使用者使用。
下一代 Amazon SageMaker 包括:
- Amazon SageMaker Unified Studio (預覽版) – 單一開發環境,用於存取和使用專門建置的 AWS 分析和 AI/ML 服務 (例如 Amazon EMR、AWS Glue、Amazon Athena、Amazon Redshift、Amazon Bedrock 和 Amazon SageMaker AI) 中熟悉的工具與功能
- Amazon SageMaker Lakehouse - 跨 Amazon S3 資料湖、Amazon Redshift、第三方和聯合資料來源的統一資料存取
- Amazon SageMaker 資料與 AI 管控 – 讓您安全地探索、管理和協作資料與 AI
下一代 Amazon SageMaker 包含哪些功能?
下一代 Amazon SageMaker 包含下列功能:
- Amazon SageMaker Unified Studio (預覽版) – 使用單一環境中用於分析和 AI 實作的所有資料和工具進行建置。
- Amazon SageMaker Lakehouse – 使用 Amazon SageMaker Lakehouse 可統一 Amazon Simple Storage Service (Amazon S3) 資料湖、Amazon Redshift 資料倉儲、第三方和聯合資料來源中的資料。
- 資料與 AI 管控 — 使用在 Amazon DataZone 基礎上建置的 Amazon SageMaker Catalog 來安全地探索、管控和協作資料與 AI。
- 模型開發 – 藉助 Amazon SageMaker AI (之前稱為 Amazon SageMaker),使用全受管理的基礎設施、工具和工作流程來建置、訓練和部署 ML 與 FM。
- 生成式 AI 應用程式開發 – 使用 Amazon Bedrock 建置並擴展生成式 AI 應用程式。
- SQL 分析 – 藉助最具價格效能的 SQL 引擎 Amazon Redshift 取得洞見。
- 資料處理 – 利用 Amazon Athena、Amazon EMR 和 AWS Glue 上的開放原始碼架構來分析、準備及整合資料以進行分析和 AI 實作。
為什麼我應該使用下一代 Amazon SageMaker?
Amazon SageMaker 是用於資料、分析和 AI 的統一平台。下一代的 SageMaker 結合廣泛採用的 AWS 機器學習和分析功能,提供分析和 AI 的整合式體驗,並統一存取您的所有資料。這種統一的方法可協助您更有效地處理資料,增加團隊間的協作,以及提高整體生產力。
Amazon SageMaker 可讓您
- 使用模型開發、生成式 AI、資料處理和 SQL 分析的熟悉 AWS 服務,透過單一資料和 AI 開發環境進行協作和建置。
- 使用多種工具來開發和擴展您的 AI 使用案例,以訓練、自訂和部署機器學習與基礎模型,並且快速建立針對自身業務量身打造的生成式 AI 應用程式。
- 使用開放式資料湖統一 Amazon S3 資料湖、Amazon Redshift 資料倉儲、第三方或聯合資料來源中的所有資料,從而減少資料孤島。
- 透過內建資料和 AI 管控來控制正確的使用者出於適當目的對合適資料、ML 模型、GenAI 開發成品和運算的存取,從而滿足您的企業安全需求。
我是否可以在不使用 SageMaker 的情況下使用個別 AWS 服務?
是。根據您的特定業務要求,您可以繼續使用個別 AWS 服務,例如 Amazon SageMaker AI (以前稱為 Amazon SageMaker)、用於大數據處理的 Amazon EMR、AWS Glue 以及用於資料倉儲的 Amazon Redshift。這對您目前使用個別服務的方式沒有影響。
Amazon SageMaker 還提供額外的優勢,即提供統一、使用者友好的介面來存取這些服務。這種方法可協助您更有效地使用資料進行創新,增加團隊間的協作,以及提高整體生產力。
我可以在 SageMaker 中使用哪些現有 AWS 服務?
Amazon SageMaker 整合了 Amazon SageMaker Unified Studio (預覽版)、Amazon SageMaker 資料與 AI 管控以及 Amazon SageMaker Lakehouse 等一系列全面的 AWS AI 和分析服務。
透過 Amazon SageMaker Unified Studio,您可以使用現有的 AWS 服務存取資料處理、SQL 分析、機器學習和生成式 AI 應用程式開發功能。針對資料處理,Amazon Athena、AWS Glue、Amazon EMR 以及適用於 Apache Airflow 的 Amazon Managed Workflows 等服務可輕鬆分析、準備、整合和協同運作任何規模的分析和 AI 資料。對於 SQL 分析,Amazon Redshift 與 Amazon SageMaker Lakehouse 無縫整合,為 Redshift 資料倉儲和 Amazon S3 資料湖中的統一資料提供強大的 SQL 分析功能。機器學習功能由 Amazon SageMaker AI (以前稱為 Amazon SageMaker) 提供,用於建置、訓練和部署機器學習與基礎模型。此外,您可以使用 Amazon Bedrock IDE (預覽版) 開發生成式 AI 應用程式。
Amazon SageMaker 資料與 AI 管控透過以 Amazon DataZone 為基礎建置的 Amazon SageMaker Catalog 中的統一資料管理體驗,提供端對端的內建管控,以安全地探索、管控和協作資料與 AI。
Amazon SageMaker Lakehouse 以 AWS Glue Data Catalog、AWS Lake Formation 和 Amazon Redshift 中的多個型錄服務為基礎建置,提供跨 Amazon S3 資料湖、Amazon Redshift 資料倉儲、第三方和聯合資料來源的統一資料存取。
此外,這些服務仍可透過 AWS 管理主控台作為獨立功能提供,從而根據使用案例提供靈活性。我們將於 2025 年透過更多服務增強 Amazon SageMaker 平台,以統一分析和 AI 方面的體驗。這些功能包括使用 Amazon OpenSearch Service 的搜尋分析、使用 Amazon QuickSight 的商業智慧功能,以及使用 AWS 串流服務組合的串流。
如何開始使用 SageMaker?
可以輕鬆開始使用 Amazon SageMaker。第一步是導覽至 Amazon SageMaker Unified Studio (預覽版) 管理主控台以建立網域,即為您的業務單元連線資產、使用者及其專案的組織實體。在管理主控台中,選擇「建立網域」,您會看到兩個選項 – 快速設定和手動設定。選擇「快速設定」以開始使用一組預設組態,稍後可自訂這些組態。或者,您可以選擇「手動設定」,以在建立網域時完全控制設定。建立網域後,您就可以導覽至 Amazon SageMaker Unified Studio (以瀏覽器為基礎的 Web 應用程式),從中使用所有資料和設定的工具進行分析和 AI。若要進一步了解如何開始使用,請參閱 SageMaker 文件。
我目前使用現在包含在 SageMaker 中的現有 AWS 服務。如何升級到 SageMaker 中的統一體驗?
您在 AWS 服務 (例如 Amazon EMR、AWS Glue 和 Amazon Athena ) 中的現有資料開發體驗仍然可用。這意味著您建立的所有現存程式碼和資源都可以繼續使用,而不會產生中斷。我們將於 2025 年第一季度提供易於使用的升級指令碼和全面的指南,以將您現有的程式碼庫引入統一的 SageMaker 體驗中。
下一代 Amazon SageMaker 是否正式推出?
我們正在透過整合客戶目前已在使用的全套 AWS 資料、分析和 AI 工具,將廣泛採用的 ML 服務 Amazon SageMaker 擴展為資料和 AI 平台。我們還為全新 SageMaker 平台新增各種功能,包括 SageMaker Unified Studio (預覽版)、SageMaker Lakehouse (GA) 和 SageMaker Catalog (GA)。
新的 SageMaker 平台幾乎包含了使用 Amazon Redshift 進行 SQL 分析、使用 Amazon EMR 進行資料處理、使用 SageMaker AI 進行 AI 模型開發以及使用新的 BedRock IDE (預覽版) 進行生成式 AI 應用程式開發所需的所有元件,所有這些均透過統一工作室 (預覽版) 中的整合開發體驗提供。
產品體驗
什麼是 SageMaker 中的專案?
SageMaker 中的專案實體可協助使用者組織工作,並針對他們正在執行的任務提供業務內容。專案實體提供一個協作工作區,使用者從中可針對各種資料和成品進行協作,例如 ML 模型、筆記本、查詢、儀表板和生成式 AI 應用程式。專案得到保護,從而只有明確新增至專案中的使用者才能存取其中的資料和工具。專案會根據專案選取的功能 (例如資料湖) 建立 AWS Identity and Access Management (IAM) 角色,這些角色專門為使用者提供完成工作所需的存取權限。專案還可以在相同帳戶內提供工作隔離功能,以及安全性邊界 (安全群組和 IAM 角色)。
Amazon Q Developer 如何提高 SageMaker 中的生產力?
Amazon Q Developer 是整合到 SageMaker 體驗中的生成式 AI 對話助理,可在整個開發生命週期中提高生產力。透過聊天介面,您可以使用自然語言提出有關 SageMaker 的問題、取得程式碼的協助,以及探索資料集等資源。當您與 Amazon Q Developer 聊天時,它會使用您目前對話的內容,在整個 SageMaker 開發體驗中提供個人化指引和自動化協助。Amazon Q Developer 可協助您進行程式碼討論、提供內嵌程式碼完成、產生 SQL 查詢、尋找和整合資料集,並提供針對特定開發需求量身打造的智慧支援。
Amazon Q Developer 透過了解工作的細微差異,提供針對性、內容感知的協助,這些協助可簡化您的開發流程並提高 SageMaker 環境中的整體生產力。
SageMaker 中有哪些工具可用於分析和 AI 任務?
SageMaker 提供統一的 Web 式環境,其中彙集用於完整資料和 AI 工作流程的強大工具。內建 IDE 支援 AI/ML 開發,讓您可以使用 PySpark、AWS Glue 和 Amazon EMR 等架構與服務處理來自各種來源的大量資料。
對於版本控制和工作流程管理,您可以提交至 Git 並使用 Amazon MWAA 定義工作流程。整合式 SQL 查詢編輯器可讓您探索、分析和視覺化資料,並且能夠更輕鬆地儲存和共用查詢,以及建立新資料集。
透過熟悉的 SageMaker AI 工具 (包括 Amazon SageMaker 筆記本、JumpStart、HyperPod、MLFlow、Pipelines 和 Model Registry) 簡化模型開發。在這些程序中,Amazon Q Developer 在 SageMaker 工具之間無縫整合,在資料探索、準備、管道建立、模型建置和訓練以及程式碼部署方面提供智慧協助。
如何在 SageMaker 中建置生成式 AI 應用程式?
整合在 SageMaker Unified Studio (預覽版) 中的 Bedrock IDE (預覽版) 提供了一個用於開發生成式 AI 應用程式的全面環境。此直觀的介面可以協助您在可信、安全的環境中加速應用程式開發,並且提供對高效能 FM 和 Amazon Bedrock 進階自訂功能的存取。
您可以使用各種強大的功能,例如 Amazon Bedrock 知識庫、防護機制、代理程式和提示流程,讓團隊能夠根據您的特定業務需求快速量身打造生成式 AI 應用程式,同時遵守負責任 AI 指南。該平台支援管控式存取,並且透過存取控制共用和 Git 支援的可稽核性實現安全的跨職能協作。
SageMaker 支援哪些類型的資料來源?
Amazon SageMaker Lakehouse 會統一 AWS 資料湖、資料倉儲、第三方應用程式和營運資料庫中的資料。它可讓您透過零 ETL 整合、聯合查詢來源和 240 多個連接器,在一個位置快速、簡化地存取資料。
如何確保 SageMaker 中的資料受到適當的管控和保護?
Amazon SageMaker 透過 Amazon SageMaker Catalog (在 Amazon DataZone 的基礎上建置) 中的統一資料管理體驗,提供端對端的內建管控體驗。這種方法可讓您對整個組織的結構化和非結構化資料資產、機器學習模型與應用程式進行分類、探索、存取、分析和管控。該平台確保正確的人員可以適當地存取合適的資產,同時維持穩健的安全性和合規標準。
如何在 SageMaker 中建立和管理資料管道?
您可以透過多種方式在 SageMaker 中建立和管理資料管道。SageMaker 資料處理整合了 Amazon EMR、Amazon Athena、AWS Glue 和 Amazon MWAA,協助您在統一的體驗中集成、準備和探索資料。您可以使用 SageMaker AI 建置針對 ML 特定模型協同運作的管道,以及使用 Amazon MWAA 建置資料管道和工作流程。您也可以使用零 ETL 整合,該功能透過消除複雜的擷取、轉換和載入 (ETL) 程序並實現跨服務直接資料複製來簡化資料移動。造訪什麼是零 ETL?以了解更多資訊。
定價
SageMaker 定價如何運作?
使用 Amazon SageMaker 時,您將按照可透過 Amazon SageMaker 存取的各種 AWS 服務的定價模式付費。使用 Amazon SageMaker Unified Studio (預覽版) 無需單獨付費,這是在 Amazon SageMaker 內提供整合體驗的資料與 AI 開發環境。如需詳細資訊,請造訪 Amazon SageMaker 定價頁面:SageMaker 定價。
我是否可以免費試用 SageMaker?
SageMaker 免費方案可協助您快速開始使用資料和 AI 進行創新,並且無需支付任何費用。如需詳細資訊,請參閱 SageMaker 定價。
可用性
哪些 AWS 區域可以使用 SageMaker?
下一代 SageMaker 在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、亞太區域 (東京) 和歐洲 (愛爾蘭) AWS 區域提供。SageMaker Unified Studio 和 Amazon Bedrock IDE 預覽版在這些相同 AWS 區域中提供。如需未來的更新,請參閱 AWS 區域服務清單。
SageMaker 是否提供 SLA?
是。SageMaker 旨在提供關鍵任務分析和 AI 工作負載所需的一致效能和正常運行時間。作為由多個服務元件組成的統一平台,服務可用性與所使用的服務元件相關聯。
如需有關每個服務的服務水準協議 (SLA) 的詳細資訊,請參閱其各自的 SLA 文件。SLA 將為您提供構成 SageMaker 體驗的各種服務的具體正常運行時間保證和可靠性承諾。
可用的 SLA 文件包括: