Amazon S3 Tables

เพิ่มประสิทธิภาพและต้นทุนการสืบค้นให้เหมาะสมเมื่อขนาดของ Data Lake ของคุณเพิ่มขึ้น

จัดเก็บข้อมูลแบบตารางทุกระดับใน S3

Amazon S3 Tables นำเสนอพื้นที่เก็บอ็อบเจกต์บนระบบคลาวด์แห่งแรกพร้อมรองรับ Apache Iceberg ในตัว รวมถึงเพิ่มประสิทธิภาพให้กับการจัดเก็บข้อมูลตารางในทุกขนาด การเพิ่มประสิทธิภาพตารางอย่างต่อเนื่องจะสแกนและเขียนข้อมูลตารางซ้ำในพื้นหลังโดยอัตโนมัติ ทำให้ประสิทธิภาพในการสืบค้นเร็วขึ้นถึง 3 เท่าเมื่อเทียบกับตาราง Iceberg ที่ไม่ได้รับการจัดการ การเพิ่มประสิทธิภาพการทำงานเหล่านี้จะดีขึ้นอย่างต่อเนื่องเมื่อเวลาผ่านไป นอกจากนี้ S3 Tables ยังมีการเพิ่มประสิทธิภาพเฉพาะสำหรับเวิร์กโหลดของ Iceberg โดยจัดการธุรกรรมได้สูงขึ้นถึง 10 เท่าต่อวินาทีเมื่อเทียบกับตาราง Iceberg ที่เก็บไว้ในบัคเก็ต S3 สำหรับวัตถุประสงค์ทั่วไป สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการปรับปรุงประสิทธิภาพการสืบค้นของ S3 Tables โปรดดูที่บล็อก

คุณสามารถสืบค้นข้อมูลตารางได้อย่างง่ายดายโดยใช้เอนจินสืบค้นยอดนิยมของ AWS และจากภายนอก รวมถึง Amazon Athena, Redshift, EMR และ Apache Spark ด้วยการรองรับ S3 Tables สำหรับมาตรฐาน Apache Iceberg ใช้ S3 Tables เพื่อจัดเก็บข้อมูลแบบตาราง เช่น ธุรกรรมการซื้อรายวัน ข้อมูลเซ็นเซอร์สตรีมมิ่ง หรือยอดแสดงโฆษณาเป็นตาราง Iceberg ใน S3 รวมถึงปรับประสิทธิภาพและต้นทุนให้เหมาะสมตามการเพิ่มขึ้นของข้อมูลโดยใช้การบำรุงรักษาตารางอัตโนมัติ อ่านบล็อกเพื่อเรียนรู้เพิ่มเติม

ประโยชน์

ลดความซับซ้อนของ Data Lake ทุกขนาด ไม่ว่าคุณจะเพิ่งเริ่มต้นใช้งานหรือจัดการตารางนับพันในสภาพแวดล้อมการใช้งาน Iceberg ของคุณ

รับประสิทธิภาพในการสืบค้นที่เร็วขึ้นถึง 3 เท่าผ่านการเพิ่มประสิทธิภาพตารางอย่างต่อเนื่องเมื่อเทียบกับตาราง Iceberg ที่ไม่ได้รับการจัดการ และการจัดการธุรกรรมจำนวนสูงขึ้นถึง 10 เท่าต่อวินาทีเมื่อเทียบกับตาราง Iceberg ที่เก็บไว้ในบัคเก็ต S3 สำหรับวัตถุประสงค์ทั่วไป

ดำเนินงานด้านการบำรุงรักษาตารางอย่างต่อเนื่อง เช่น การบีบอัด การจัดการสแน็ปช็อต และการลบไฟล์ที่ไม่ได้อ้างอิงเพื่อเพิ่มประสิทธิภาพและต้นทุนในการสืบค้นเมื่อเวลาผ่านไปโดยอัตโนมัติ

เข้าถึงความสามารถในการวิเคราะห์ Iceberg ขั้นสูงและข้อมูลการสืบค้นโดยใช้บริการ AWS ที่คุ้นเคย เช่น Amazon Athena, Redshift และ EMR ผ่านการผสานรวมตัวอย่าง S3 Tables เข้ากับแค็ตตาล็อกข้อมูลของ AWS Glue S3 Tables สามารถใช้งานร่วมกับเครื่องมือโอเพนซอร์สยอดนิยมได้

สร้างตารางเป็นทรัพยากร AWS ที่ดีที่สุดและใช้สิทธิ์เพื่อกำกับดูแลการเข้าถึงได้อย่างง่ายดาย

วิธีทำงาน

S3 Tables มีพื้นที่จัดเก็บข้อมูล S3 ที่สร้างขึ้นโดยเฉพาะสำหรับการจัดเก็บข้อมูลที่มีโครงสร้างในรูปแบบ Apache Parquet ภายในบัคเก็ตตาราง คุณสามารถสร้างตารางเป็นแหล่งข้อมูลชั้นหนึ่งได้โดยตรงใน S3 ตารางเหล่านี้สามารถรักษาความปลอดภัยด้วยสิทธิ์ระดับตารางที่กำหนดไว้ในนโยบายตามข้อมูลระบุตัวตนหรือแหล่งข้อมูล รวมถึงสามารถเข้าถึงได้โดยแอปพลิเคชันหรือเครื่องมือที่รองรับมาตรฐาน Apache Iceberg เมื่อคุณสร้างตารางในบัคเก็ตตาราง ระบบจะจัดเก็บข้อมูลพื้นฐานใน S3 เป็นข้อมูล Parquet จากนั้น S3 จะรักษาข้อมูลเมตาที่จำเป็นเพื่อให้แอปพลิเคชันของคุณสามารถสืบค้นข้อมูล Parquet ได้ บัคเก็ตตารางประกอบด้วยไลบรารีไคลเอนต์ที่ใช้โดยเอนจินสืบค้นเพื่อนำทางและอัปเดตข้อมูลเมตา Iceberg ของตารางในบัคเก็ตตารางของคุณ ไลบรารีนี้ร่วมกับ API ของ S3 ที่ได้รับการอัปเดตสำหรับการดำเนินงานเกี่ยวกับตาราง ช่วยให้ไคลเอนต์หลายรายสามารถอ่านและเขียนข้อมูลไปยังตารางของคุณได้อย่างปลอดภัย เมื่อเวลาผ่านไป S3 จะเพิ่มประสิทธิภาพข้อมูล Parquet พื้นฐานโดยอัตโนมัติด้วยการเขียนอ็อบเจกต์ใหม่หรือ “บีบอัด” อ็อบเจกต์ การบีบอัดจะเพิ่มประสิทธิภาพข้อมูลบน S3 เพื่อปรับปรุงประสิทธิภาพการสืบค้นและลดต้นทุน อ่านข้อมูลผู้ใช้เพื่อเรียนรู้เพิ่มเติม

วิดีโอสาธิต Amazon S3 Tables

ลูกค้า

  • Genesys

    Genesys เป็นผู้นำด้านระบบคลาวด์ระดับโลกสำหรับการควบคุมระบบประสบการณ์ที่ขับเคลื่อนด้วย AI ด้วยความสามารถในการจัดการการมีส่วนร่วมของพนักงาน ดิจิทัล และ AI ขั้นสูง Genesys ช่วยให้องค์กรมากกว่า 8,000 แห่งในกว่า 100 ประเทศสามารถมอบประสบการณ์ลูกค้าและพนักงานที่ปรับให้เหมาะกับแต่ละบุคคลและเห็นอกเห็นใจ ขณะเดียวกันก็ได้รับประโยชน์จากความคล่องตัวทางธุรกิจและผลลัพธ์ที่เพิ่มขึ้น

    Amazon S3 Tables จะเป็นส่วนเสริมที่เปลี่ยนแปลงให้กับสถาปัตยกรรมข้อมูลของเรา โดยเฉพาะอย่างยิ่งด้วยการรองรับ Iceberg ที่มีการจัดการ ซึ่งสร้างเลเยอร์มุมมองผลการสืบค้นสำหรับความต้องการวิเคราะห์ข้อมูลที่หลากหลาย ข้อเสนอนี้มีศักยภาพที่จะช่วยให้ Genesys สามารถลดความซับซ้อนของเวิร์กโฟลว์ข้อมูลที่มีความซับซ้อนได้โดยกำจัดเลเยอร์พิเศษของการจัดการตารางด้วย S3 จัดการงานบำรุงรักษาที่สำคัญ เช่น การบีบอัด การจัดการสแน็ปช็อต และการลบไฟล์ที่ไม่ได้อ้างอิงโดยอัตโนมัติ ความสามารถในการอ่านและเขียนตาราง Iceberg โดยตรงจาก S3 จะช่วยให้เราเพิ่มประสิทธิภาพและสร้างความเป็นไปได้ใหม่สำหรับการรวมข้อมูลอย่างราบรื่นในระบบนิเวศการวิเคราะห์ของเรา การทำงานร่วมกันนี้ ซึ่งรวมเข้ากับการปรับปรุงประสิทธิภาพ ทำให้ S3 Tables กลายเป็นส่วนสำคัญของกลยุทธ์ในอนาคตสำหรับการส่งมอบข้อมูลเชิงลึกที่รวดเร็ว ยืดหยุ่น และเชื่อถือได้

    Glenn Nethercutt ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี - Genesys
  • SnapLogic

    SnapLogic เป็นผู้บุกเบิกด้านการผสานการทำงานที่นำโดย AI แพลตฟอร์ม SnapLogic สำหรับการผสานรวมแบบช่วยสร้างนั้นช่วยเร่งความเร็วในการเปลี่ยนผ่านสู่ระบบดิจิทัลทั่วทั้งองค์กรเพื่อออกแบบ ปรับใช้ และจัดการ AI Agent รวมถึงการผสานรวมที่ดำเนินการโดยอัตโนมัติ ทำการตัดสินใจแบบเรียลไทม์ และผสานรวมเข้ากับเวิร์กโฟลว์ที่มีอยู่ได้อย่างง่ายดาย

    Amazon S3 Tables มาพร้อมการรองรับ Apache Iceberg ในตัวและการผสานรวมบริการ AWS Analytics ช่วยให้บริษัทต่าง ๆ สามารถปรับต้นทุนการวิเคราะห์ข้อมูลให้เหมาะสม ขณะที่เปลี่ยนวิธีใช้ข้อมูลธุรกิจสำหรับการวิเคราะห์ การปฏิบัติตาม และความคิดริเริ่มด้าน AI ทีมสามารถวิเคราะห์ข้อมูลในอดีตได้ทันที รักษาการปฏิบัติตามกฎระเบียบ ตลอดจนเร่งข้อมูลเชิงลึกทางธุรกิจไปพร้อม ๆ กับการลดต้นทุนด้านเทคโนโลยีอย่างมีนัยสำคัญ ด้วยการดำเนินงานด้านการจัดการข้อมูลที่มีความซับซ้อนโดยอัตโนมัติและจัดเตรียมเส้นทางการตรวจสอบการเปลี่ยนแปลงข้อมูลที่สมบูรณ์

    Dominic Wellington สถาปนิกองค์กร - SnapLogic
  • Zus Health

    Zus เป็นแพลตฟอร์มข้อมูลสุขภาพที่มีการใช้งานร่วมกันที่ออกแบบมาเพื่อเร่งความสามารถในการใช้งานข้อมูลสุขภาพร่วมกัน โดยให้ข้อมูลผู้ป่วยที่ใช้งานง่ายผ่าน API, ส่วนประกอบแบบฝังตัว และการผสานรวม EHR โดยตรง

    ในฐานะบริษัทด้านการดูแลสุขภาพที่จัดการข้อมูลผู้ป่วยที่มีการเปลี่ยนแปลงอยู่บ่อยครั้งจำนวนมาก เราได้ตัดสินใจลงทุนใน Apache Iceberg เนื่องจากช่วยแก้ปัญหามากมายโดยใช้ Apache Hive ในด้านการแบ่งพาร์ติชันและระบบอัตโนมัติ พร้อมประโยชน์เพิ่มเติมจากการทำงานร่วมกันที่กว้างขึ้น หนึ่งในปัญหาที่ใหญ่ที่สุดของเรากับ Iceberg คือการทำความเข้าใจและจัดการการเพิ่มประสิทธิภาพตาราง ซึ่งเป็นเหตุผลที่เราตื่นเต้นกับ S3 Tables และความสามารถในการเพิ่มประสิทธิภาพที่มีการจัดการ ความสามารถในการลดค่าใช้จ่ายในการบำรุงรักษาตารางของนักพัฒนาจะช่วยให้เราสามารถโฟกัสที่การนำข้อมูลคุณภาพสูงและข้อมูลเชิงลึกที่มีค่าให้กับลูกค้าของเราได้มากขึ้น

    Sonya Huang วิศวกรซอฟต์แวร์ที่ปรึกษา - Zus Health