Google Cloud a annoncé de nouvelles fonctionnalités BigQuery axées sur la gouvernance des données et de l'IA, soulignant l'importance de données de haute qualité et bien gouvernées à l'ère de l'IA générative. Alors que les données constituent la base de l'entraînement des modèles d'IA, leur gouvernance a souvent été négligée. Cependant, avec l'essor de l'IA, elle est désormais au cœur des stratégies de données des entreprises.
Dataplex de Google Cloud vise à relever les défis de la gouvernance des données en fournissant une base de gouvernance unifiée pour l'ensemble de la plateforme BigQuery. Dataplex offre des fonctionnalités telles que la découverte, la conservation et la gestion automatisées des données à grande échelle, ce qui minimise les processus de gouvernance manuelle fastidieux.
L'une des principales mises à jour de Dataplex est la catalogage automatisé, qui englobe désormais Vertex AI et les bases de données opérationnelles telles que Cloud SQL, Spanner et Bigtable. Cette fonctionnalité permet une vue unifiée des actifs de données et d'IA. De plus, le suivi de la lignée amélioré permet de mieux comprendre le parcours des données en intégrant les pipelines Vertex AI et en fournissant une lignée au niveau des colonnes pour BigQuery.
Dataplex améliore également la découverte de données grâce à la recherche sémantique, qui permet aux utilisateurs d'interroger les données en langage naturel. La fonctionnalité de recherche dans l'ensemble du catalogue dans BigQuery sera bientôt disponible, offrant une expérience de découverte de données transparente.
De plus, Dataplex fournit des informations sur les données basées sur l'IA en générant automatiquement des questions suggérées et des requêtes SQL validées, ce qui aide les utilisateurs à obtenir rapidement des informations à partir de leurs données. De plus, de nouvelles règles de gouvernance garantissent la conformité aux politiques de données en permettant aux utilisateurs de définir des règles basées sur les métadonnées pour BigQuery et Cloud Storage.
En conclusion, les nouvelles mises à jour de Dataplex permettent aux organisations de gérer efficacement les complexités de la gouvernance des données, ouvrant la voie à l'exploitation du plein potentiel de l'IA générative. En fournissant une solution robuste de gouvernance des données, Google Cloud permet aux organisations d'adopter des innovations basées sur les données et de prendre des décisions éclairées.