Le Data Warehouse
Tout ce que vous devez savoir sur un Data Warehouse
Un Data Warehouse est une base de données relationnelle hébergée sur un serveur dans un Data Center ou dans le Cloud. Il recueille des données de sources variées et hétérogènes dans le but principal de soutenir l'analyse et faciliter le processus de prise de décision. En matière d’intégration dans le système de données existant, le fonctionnement du Data Warehouse est basé sur le processus ETL (Extract, Tranform, Load) permettant de charger les données issues des différentes applications.
D'un point de vue plus technique, un Data Warehouse est défini comme un ensemble de données orientées sujet, intégrées, variables dans le temps et non volatiles.
- Orienté sur le sujet : Organisé par thème, il est possible d’utiliser le Data Warehouse pour analyser n'importe quel secteur particulier de l'entreprise.
- Intégré : Avant toute utilisation, les données récupérées de sources hétérogènes internes ou externes sont intégrées au Data Warehouse. Pour cela, il est nécessaire de les mettre en forme et de les unifier pour garantir une certaine cohérence. Les données proviennent principalement de traitement transactionnel en ligne (OLTP).
- Variante temporelle : Les données passées sont également conservées dans le Data Warehouse, contrairement à certains des systèmes transactionnels traditionnels où seules les données les plus récentes sont stockées. Cela permet de visualiser l’évolution dans le temps des différentes données.
- Non volatile : Les données une fois stockées dans l'entrepôt de données ne peuvent jamais être modifiées.
Attention à ne pas confondre Data Warehouse et Data Mart
Un Data Mart est souvent le sous-ensemble d’un Data Warehouse. Tandis que le Data Warehouse couvre plusieurs sujets, un Data Mart est spécialisé sur un seul thème.
Il est conçu pour accéder plus facilement à des données spécifiques. En entreprise, les informations d’un Data Mart ciblent un métier. Il existe, par exemple, des Data Marts commerciaux constitués de données ciblées, organisées et regroupées.
Quelles sont les différences entre un data warehouse et une base de données traditionnelle ?
Bien qu’un Data Warehouse et une base de données stockent des données, ces deux systèmes ont été conçus à des fins différentes. Nous pouvons citer 3 distinctions majeures entre ces deux technologies :
- Le Data Warehouse doit stocker une grande quantité de données historiques et permettre des requêtes rapides et complexes à travers les données en utilisant des technologies comme OLAP et ses dérivés voire In-memory. La base de données sert à stocker les transactions courantes et permet un accès rapide à des transactions spécifiques notamment grâce aux technologies d’indexation.
- Les bases de données sont généralement normalisées, ce qui signifie qu'il existe une copie unique de chaque donnée. Dans le Data Warehouse, il est courant de stocker différentes versions des mêmes données.
- Les bases de données sont généralement optimisées pour les opérations de lecture/écriture. Un Data Warehouse est optimisé pour traiter les requêtes agrégées ainsi que les opérations de lecture/récupération.
Le futur du Data Warehouse
Oracle Autonomous Data Warehouse Cloud offre toutes les capacités analytiques, les fonctions de sécurité et la haute disponibilité de la base de données Oracle sans les complexités de configuration, d'optimisation et d'administration, même lorsque les charges de travail et les volumes de données changent. Cela permet d’offrir aux clients une technologie facile d’utilisation, une performance d'interrogation parmi les plus rapides de l'industrie, sans aucun réglage requis et avec une grande élasticité.
Data Warehouse est conçu comme un service " load and go " : vous démarrez le service, définissez les tables, chargez les données, puis lancez les requêtes. Vous n'avez pas besoin de prendre en compte les détails concernant le parallélisme, le partitionnement, l'indexation ou la compression. Le service configure automatiquement la base de données pour les requêtes.
Oracle Autonomous Data Warehouse Cloud partage les caractéristiques qui définissent les services Oracle Autonomous Database : Self-driving, Self-securing, Self-repairing.
Oracle Autonomous Data Warehouse élimine les erreurs humaines dans l'approvisionnement, la sécurisation, la surveillance, la sauvegarde, la récupération, le dépannage et l'optimisation de la base de données. Il applique automatiquement les mises à jour de sécurité en cours d'exécution pour se protéger contre les cyberattaques et crypte automatiquement toutes les données. Vos données seront protégées contre les attaques externes et les utilisateurs internes malveillants.
Vous souhaitez en savoir plus sur notre expertise en matière de Data Warehouse ?
N’hésitez pas à nous contacter