Amazon S3 Metadata (ознакомительная версия)

Ускорьте поиск данных с помощью метаданных объектов в режиме реального времени

Найдите и систематизируйте необходимые данные в S3

Amazon S3 Metadata (предварительная версия) раскрывают весь потенциал данных S3, обеспечивая легкий доступ к метаданным объектов и упрощая запросы к ним. Создавайте, храните и запрашивайте метаданные объектов, хранящихся в S3, чтобы быстро найти данные, необходимые для бизнес-аналитики, приложений для построения логических выводов в режиме реального времени и многого другого. Сервис S3 Metadata поддерживает метаданные объектов, включая определенные системой сведения, такие как размер и источник объекта, а также настраиваемые метаданные, позволяющие аннотировать объекты такими данными, как артикул продукта, идентификатор транзакции или рейтинг контента с помощью тегов. Подробнее см. в блоге

Преимущества

Быстро находите и извлекайте нужные данные из триллионов объектов в S3.

Используйте теги для аннотирования объектов специфическими для бизнеса метаданными, чтобы улучшить организацию данных и удобство поиска.

Предназначен для автоматического сбора и организации метаданных объектов в управляемых таблицах S3 со встроенной поддержкой Apache Iceberg.

Анализируйте метаданные с помощью знакомых сервисов AWS, таких как Amazon Athena, Redshift, EMR и QuickSight, благодаря предварительной интеграции таблиц S3 с каталогом данных AWS Glue. S3 Metadata совместима с популярными инструментами с открытым исходным кодом.

Примеры использования

Используйте расширенные метаданные для каталогизации хранимых данных, а также упрощения поиска и использования.

Отслеживайте видео, созданные ИИ, и управляйте ими, включая их происхождение, время создания и модель ИИ, используемую в Amazon Bedrock.

Анализируйте метаданные объекта, чтобы определить возможности снижения затрат и повышения производительности.

Быстро выявляйте и анализируйте соответствующие наборы данных для бизнес-аналитики и принятия решений.

Улучшите организацию данных и соответствие требованиям с помощью специальных аннотаций метаданных.

Клиенты

  • Cambridge Mobile Telematics

    Компания Cambridge Mobile Telematics (CMT) – крупнейший в мире поставщик телематических услуг. Миссия организации – сделать дороги и поездки безопаснее по всему миру. Платформа DriveWell Fusion®, основанная на ИИ, собирает данные с датчиков миллионов устройств Интернета вещей, включая смартфоны, фирменные метки, подключенные транспортные средства, видеорегистраторы и сторонние устройства, и объединяет их с контекстной информацией для создания единого представления о поведении автомобиля и водителя.

    В CMT мы храним и анализируем несколько петабайт данных с мобильных устройств Интернета вещей по всему миру для повышения безопасности водителей и дорожного движения. По мере масштабирования поиск конкретных данных для разработки новых идей и моделей становится все труднее. Метаданные S3, в частности возможность их настройки, позволяют аннотировать и хранить все метаданные в управляемой таблице с возможностью запросов. Теперь для поиска релевантных данных требуется всего один эффективный и экономичный SQL-запрос. Таким образом, S3 Metadata меняет правила игры и позволяет нам предлагать своим клиентам новые возможности.

    Tim Vogel, директор по информационным технологиям, Cambridge Mobile Telematics (CMT)
  • PayPal

    PayPal революционизирует коммерцию во всем мире уже более 25 лет. Создавая инновационные решения, делающие денежные переводы, продажи и покупки простыми, персонализированными и безопасными, PayPal позволяет потребителям и компаниям примерно на 200 рынках присоединиться к мировой экономике и процветать в ней.

    S3 Metadata предоставляет нам простой и понятный механизм анализа триллионов объектов S3 с помощью стандартных инструментов, таких как Amazon Athena и Amazon QuickSight. Благодаря этой функциональности мы можем тратить время на принятие решений, а не на создание сложных конвейеров данных для доступа к метаданным объектов S3 и запросов к ним.

    Jon Southall, вице-президент по проектированию платформ для крупных предприятий, PayPal
  • Roche

    Roche – биотехнологическая компания, которая объединяет фармацевтические препараты и диагностику для продвижения персонализированного здравоохранения и улучшения качества жизни людей.

    S3 Metadata ускоряет реализацию наших инициатив в области генеративного ИИ. По мере того как мы создаем приложения LLM, такие как внутренние чат-боты для наших команд, неструктурированные данные, такие как PDF-файлы, становятся все более ценными. Нам необходимо загрузить множество документов, относящихся к конкретным доменам, в приложении с дополненной извлеченными данными генерацией (RAG), чтобы чат-бот мог адаптироваться к конкретным бизнес-контекстам Roche. Однако это также означает, что у нас появляется все больше и больше неструктурированных данных, которыми нам необходимо управлять. Нам нужна система метаданных для эффективного описания неструктурированных данных, чтобы пользователи могли быстро просматривать наше озеро данных и находить релевантные наборы для приложений на основе генеративного ИИ. С помощью S3 Metadata создание надежной системы метаданных упростилось до нескольких щелчков мышью в Консоли управления AWS. Поскольку мы постоянно получаем все больше неструктурированных данных, S3 Metadata автоматически обрабатывает и поддерживает их в актуальном состоянии. Мы также используем собственную систему Lambda для извлечения специфичных для бизнеса метаданных, таких как классификация документов на основе таксономии, относящейся к Roche, и хранения этих метаданных в одном каталоге вместе с таблицей метаданных S3, чтобы с помощью простого SQL-соединения мы могли получить все необходимые метаданные. S3 Metadata помогает нам быстрее создавать приложения на основе генеративного ИИ, что позволяет нам сосредоточиться на создании, а не на организации данных.

    Andrew Shieh, руководитель отдела коммерческого инжиниринга фармацевтической промышленности, Roche
  • SmugMug / Flickr

    SmugMug и Flickr предоставляют онлайн-пространства, где фотографы могут загружать свои фотографии и видео, делиться ими и вдохновлять других. Компания хранит миллиарды фотографий и видео в своем приложении.

    Представьте, что вы летите на машине времени, просматривая данные Amazon S3. Компании SmugMug и Flickr более 22 лет хранят фотографии своих клиентов и сотни миллиардов объектов в S3. Новая функция S3 Metadata позволяет нам легко и доступно изучать метаданные объектов S3, например отслеживать изменения размера объектов со временем, чтобы лучше понимать динамику наших данных. Ранее для этого требовалось сочетание дорогостоящих запросов к базам данных и анализа инвентаризации объектов. Теперь этот процесс стал намного проще. Понимание того, как наши фотографы используют хранилище, помогает нам совершенствовать платформы и создавать лучшее будущее через фотографию.

    Andrew Shieh, главный инженер, SmugMug
  • Solink предлагает надежные облачные системы видеонаблюдения для предприятий любого размера. Аппаратное и программное обеспечение компании помогает специалистам по ИТ, предотвращению потерь, эксплуатации и безопасности в десятках тысяч объектов в более чем 40 странах мира.

    Solink ежемесячно обрабатывает более 500 миллионов часов видео, объединяя записи с камер наблюдения с критически важными бизнес-данными из более чем 350 источников. AWS поддерживает инфраструктуру, на которую мы полагаемся, и Amazon S3 Metadata пойдет дальше, предоставляя аналитические данные в реальном времени, улучшающие управление контентом: от мониторинга хранения и использования до отслеживания последствий изменений конфигурации клиентов в реальном времени.

    Pranay Ahlawat, технический директор, Solink
  • Commvault

    Commvault – это золотой стандарт киберустойчивости, помогающий более 100 000 организациям обеспечивать безопасность данных, а компаниям – устойчивость и возможность двигаться вперед. Сегодня Commvault предлагает единственную платформу киберустойчивости, которая сочетает в себе наилучшую защиту данных и быстрое их восстановление в масштабе предприятия при любой рабочей нагрузке и в любом месте при минимальной совокупной стоимости владения.

    Amazon S3 стал ведущим поставщиком облачных хранилищ для различных типов данных. Метаданные Amazon S3 позволят таким поставщикам, как Commvault, активно выявлять и защищать конфиденциальную информацию, а также автоматизировать такие элементы, как многоуровневое хранение данных, и улучшать результаты для наших общих клиентов. S3 Metadata способствует эффективной организации данных и упрощает их поиск, позволяя детально аннотировать объекты, что крайне важно для обеспечения киберустойчивости в облаке.

    Pranay Ahlawat, директор по технологиям и ИИ, Commvault
  • New Relic

    Платформа New Relic Intelligent Observability Platform предоставляет клиентам глубокую аналитику производительности для каждой части программной среды. Клиенты могут легко просматривать и анализировать огромные объемы данных и получать полезную информацию в режиме реального времени.

    Являясь лидером в области наблюдаемости, движок обработки данных New Relic ежедневно обрабатывает около 1,3 эксабайта данных Amazon S3. S3 Metadata ускорит наши инновации, автоматически генерируя подробные метаданные объектов, тем самым упрощая изучение данных, необходимых нашим командам для экспериментов с продуктами и подтверждения концепции, например разработки новых метрик, полезных для наших клиентов. S3 Metadata сократит наши усилия по созданию и обслуживанию надежной системы метаданных с сотен часов до нескольких щелчков мышью в консоли управления S3, что позволит нашим инженерам сосредоточиться на анализе данных, а не на их организации.

    Siva Padisetty, технический директор, New Relic