Snowflake lance Polaris Catalog pour l’interopérabilité des données
Dans un monde où les données sont le nerf de la guerre, leur accès et leur interopérabilité sont devenus des enjeux cruciaux pour les entreprises. C'est dans ce contexte que Snowflake, lors de son édition 2024 du Snowflake Summit, a dévoilé une solution innovante : Polaris Catalog, un catalogue de données open source pour le format populaire Apache Iceberg. Une annonce qui promet de révolutionner la façon dont les organisations gèrent et exploitent leurs données.
Polaris Catalog : La clé de l'interopérabilité des données
Avec Polaris Catalog, Snowflake ambitionne de fournir aux entreprises un catalogue de données ouvert et centralisé, permettant à n'importe quel moteur de requête de trouver et d'accéder aux tables Iceberg d'une organisation. Christian Kleinerman, EVP of Product chez Snowflake, souligne l'importance de cette solution :
Ce que nous faisons ici, c'est introduire un nouveau catalogue de données ouvert, appelé Polaris Catalog, qui a pour but d'indexer et d'organiser les données conformes au format de tables ouvert Apache Iceberg.
– Christian Kleinerman, EVP of Product, Snowflake
Un pari sur l'open source
Pour renforcer son engagement envers l'interopérabilité, Snowflake prévoit de publier Polaris Catalog en open source dans les trois prochains mois. Cette décision vise à offrir aux entreprises un maximum de choix, de flexibilité et de contrôle sur leurs données. Grâce au protocole REST open source d'Iceberg, les utilisateurs pourront accéder à leurs données depuis une multitude de moteurs compatibles, tels que :
- Apache Flink
- Apache Spark
- Dremio
- Python
- Trino
Mettre fin au verrouillage des données clients
L'un des principaux avantages de Polaris Catalog réside dans sa capacité à éliminer le verrouillage des fournisseurs. En effet, les entreprises pourront exécuter le catalogue hébergé dans l'AI Data Cloud de Snowflake ou l'auto-héberger dans leur propre infrastructure. Cette flexibilité permettra aux organisations de changer librement d'infrastructure d'hébergement sans craindre de perdre l'accès à leurs précieuses données.
Une adoption déjà bien engagée
Snowflake a également annoncé la disponibilité générale des Iceberg Tables, deux ans après leur lancement initial. Ces tables, qualifiées de "première classe" par Christian Kleinerman, offrent des fonctionnalités avancées de gestion et de manipulation des données. Leur adoption a été rapide, avec environ 40% des clients Snowflake traitant des données non structurées via ces tables.
Avec Iceberg, nous pouvons élargir nos cas d'utilisation de Snowflake en tant que data lakehouse ouvert pour le machine learning, l'intelligence artificielle, la veille stratégique et l'analyse géospatiale, même pour les données stockées à l'extérieur.
– Thomas Davey, Chief Data Officer, Booking.com
En somme, avec Polaris Catalog et les Iceberg Tables, Snowflake propose une solution complète pour libérer le potentiel des données, tout en garantissant l'interopérabilité et l'ouverture. Une approche qui séduira sans nul doute les entreprises soucieuses de maîtriser leur destinée dans un monde toujours plus data-driven.