Amazon a annoncé la disponibilité générale d'Amazon SageMaker Lakehouse, une fonctionnalité qui unifie les données entre les lacs de données Amazon Simple Storage Service (Amazon S3) et les entrepôts de données Amazon Redshift, vous aidant à créer des applications d'analyse et d'intelligence artificielle et de machine learning (IA/ML) puissantes sur une seule copie des données. SageMaker Lakehouse fait partie de la nouvelle génération d'Amazon SageMaker, une plateforme unifiée pour les données, l'analyse et l'IA, qui rassemble les capacités d'apprentissage automatique et d'analyse AWS largement adoptées et offre une expérience intégrée pour l'analyse et l'IA.
Les clients veulent faire plus avec les données. Pour accélérer leur parcours analytique, ils choisissent le stockage et les bases de données appropriés pour stocker leurs données. Les données sont réparties entre les lacs de données, les entrepôts de données et différentes applications, créant des silos de données qui rendent l'accès et l'utilisation difficiles. Cette fragmentation conduit à des copies de données dupliquées et à des pipelines de données complexes, ce qui augmente les coûts pour l'organisation. De plus, les clients sont contraints d'utiliser des moteurs et des outils de requête spécifiques, car la façon et l'endroit où les données sont stockées limitent leurs options. Cette restriction entrave leur capacité à travailler avec les données comme ils le souhaitent. Enfin, l'accès incohérent aux données rend difficile pour les clients de prendre des décisions commerciales éclairées.
SageMaker Lakehouse répond à ces défis en vous aidant à unifier les données entre les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift. Il vous offre la flexibilité d'accéder aux données et de les interroger sur place avec tous les moteurs et outils compatibles avec Apache Iceberg. Avec SageMaker Lakehouse, vous pouvez définir des autorisations granulaires de manière centralisée et les appliquer à plusieurs services AWS, simplifiant ainsi le partage des données et la collaboration. L'importation de données dans votre SageMaker Lakehouse est facile. En plus d'accéder de manière transparente aux données de vos lacs de données et entrepôts de données existants, vous pouvez utiliser zero-ETL à partir de bases de données opérationnelles telles qu'Amazon Aurora, Amazon RDS pour MySQL, Amazon DynamoDB, ainsi que des applications telles que Salesforce et SAP. SageMaker Lakehouse s'intègre à vos environnements existants.
J'ai été particulièrement impressionné par l'intégration de SageMaker Lakehouse avec d'autres services AWS. Cette intégration simplifie grandement la gestion et l'analyse des données, la rendant beaucoup plus facile et plus efficace. Je pense que ce service sera extrêmement précieux pour les entreprises qui cherchent à améliorer leurs capacités d'analyse et d'IA.