Et si les organisations transformaient toutes leurs données en aide à la décision ? Que se passerait-il s'ils utilisaient un logiciel spécialisé qui servait à la présentation de l'information et à son analyse ? Nous allons donner quelques Exemples d'entrepôt de données pour répondre à ces questions.

Exemples d'entrepôt de données
En premier lieu, il est important de faire la différence entre deux termes qui, en raison de leur abréviation, peuvent facilement nous confondre, et dès le début, l'intention est que l'utilisateur sache à quoi s'attendre et connaisse certains concepts de base auxquels il va faire face à. Ici, nous allons montrer une infinité d'exemples qui servent à ce que l'individu ait les outils pour distinguer ces éléments.
Définition
Compte tenu de la différence entre les deux termes, nous allons procéder à leur définition formelle, car il s'agit d'un processus qui extrait, transforme, consolide et intègre les données d'une organisation, à la fois internes et externes, afin de les rendre accessibles et utiles à la décision. -faire.
De la même manière, l'entrepôt de données peut également être défini comme une base d'informations du système de fichiers électroniques, qui stocke les données nécessaires à l'analyse des informations et à la prise de décision. Sa différence est qu'il est orienté métier, intégré, variable dans le temps et non volatile.
Fondamentalement, Data Warehousing (DWH) est un processus et Data Warehouse (DW) est une base de données.
Caractéristiques
Il existe plusieurs aspects qui caractérisent l'entrepôt de données qui fournissent les outils nécessaires à son utilisation optimale, respectant ainsi les directives programmées qui génèrent les outils pour son utilisation de la meilleure manière possible. Nous allons détailler les caractéristiques d'un Data Warehouse :
Orienté vers le business
Seules les données pertinentes sont saisies dans l'entrepôt de données à des fins d'analyse et de prise de décision. C'est-à-dire que les données qui n'ont pas de valeur analytique, telles que les adresses des chambres, les codes postaux, les adresses e-mail, entre autres, ne sont pas prises en compte. Mais ils sont d'intérêt variable comme le type de client, la situation géographique, l'âge, etc.
Les entités de haut niveau sont gérées, telles que les clients, les produits, les articles, les zones et autres. Les données sont stockées de manière multidimensionnelle, c'est-à-dire des tableaux de fait et de dimension.
Integrada
Toutes les données provenant de sources hétérogènes sont consolidées pour garantir leur qualité et leur propreté. Les principales sources de données sont :
Selon le type d'utilisateur.
-
- Opérationnel : Daily produit de grandes quantités de données, mais en elles-mêmes elles sont peu pertinentes pour l'analyse requise. Par exemple, les ventes de produits.
- Moyen : Génère des données avec implication à court et moyen terme, à partir de données opérationnelles. Un bon exemple de ce concept est la génération d'inventaire.
- Managérial : Utilise les données issues du processus d'intégration et de transformation. À son tour, il génère de nouvelles informations. Il se réfère essentiellement à l'utilisateur de l'entrepôt de données.
Selon le domaine ou le département de l'organisation
-
- Domaines : Chacun a des responsabilités bien définies. Ils produisent leurs propres données qui sont partagées avec les autres domaines.
- Subdivisions : Elles sont généralement géographiques. Ils fournissent des données de localisation, qui doivent être incorporées avec les autres.
Selon la source
-
- Interne : Ils génèrent leurs propres données, issues des activités quotidiennes de l'entreprise.
- Externes : Elles complètent les données internes, par exemple les recensements et les statistiques.
Variante dans le temps
Il permet d'accéder à différentes versions de la même situation, puisque les données actuelles sont stockées avec les données historiques, dans les exemples d'entrepôt de données.

Non volatile
Il garantit la stabilité de l'information, car une fois les données entrées, elles ne changent pas. C'est-à-dire que les données ne sont manipulées que lorsqu'elles sont saisies et lorsqu'elles sont consultées.
En résumé, les principales qualités du Data Warehouse sont :
qualités
Il traite des données en volume, conséquence de l'accumulation de données historiques, actuelles et agrégées, provenant de diverses sources.
Il place tout le volume de données dans une seule base de données centralisée. Structurer les données de manière multidimensionnelle.
Bienfaits
De par ses caractéristiques et ses qualités, le Data Warehouse présente les avantages suivants :
- Il réduit le temps minimum requis pour collecter toutes les données pertinentes sur un sujet spécifique.
- Fournit des outils d'analyse.
- De nombreux rapports et analyses sont définis par l'utilisateur.
- Il vous permet d'accéder directement, d'analyser et de suivre les indicateurs de l'organisation.
- Il permet d'identifier les facteurs qui affectent le fonctionnement de l'entreprise.
- Il permet d'avancer et de déterminer le comportement futur de l'institution.
- Les utilisateurs peuvent interroger les données rapidement et facilement.
En bref, le Data Warehouse aide l'organisation à répondre aux questions essentielles pour la prise de décision. Cela leur procure des avantages concurrentiels qui optimisent leur position sur le marché sur lequel ils opèrent. Certaines de ces questions sont :
- Quel est le profil des clients ?
- Comment est leur comportement?
- Quelle est la rentabilité de l'entreprise ?
- Quel est le risque pour l'organisation?
- Quels services et produits utilisez-vous et comment pouvez-vous les augmenter ?
portée
Un Data Warehouse peut être adapté à n'importe quelle organisation, quelle que soit sa taille et sa complexité. Ceci est la conséquence de l'agenda de toute institution, entreprise ou organisation lors de la prise de décisions pertinentes concernant les données qu'elle produit.
Risques applicatifs
Cela demande un investissement important de la part de l'organisation. Les bénéfices de sa mise en œuvre ne se voient pas à court terme, mais à moyen et long terme.
La manipulation de données menace la manipulation de données sensibles.
Aspects à prendre en compte
Comme mentionné au début, il y a plusieurs aspects qui doivent être pris en compte pour l'application de ces éléments pour l'utilisation d'un serveur. Parmi eux, nous pouvons citer les suivants :
Frais de candidature
Un entrepôt de données supporte les coûts de construction, d'exploitation et de support. Le coût de construction implique les coûts de ressources humaines, de temps et de technologie, tandis que celui d'exploitation et de maintenance prend en compte les coûts d'évolution, de croissance et ceux produits par les changements dans l'origine des données.
Impact sur les personnes
L'application d'un Data Warehouse génère toujours des attentes chez les utilisateurs, qui devront nécessairement acquérir de nouvelles compétences. Le succès de ce type de données dépend de l'utilisation active et des retours des utilisateurs.
Impact sur les processus commerciaux et décisionnels
Avec l'application d'un entrepôt de données, certaines lacunes dans les processus métier peuvent être révélées, mais en même temps, la confiance dans les décisions prises sur la base des résultats obtenus augmente.
Architecture
L'architecture générale d'un exemple d'entrepôt de données est illustrée dans la figure ci-dessus. Comme on peut le voir, ce système implique une série d'interactions entre ses composants. A cet égard et en résumé, son fonctionnement peut être décrit comme suit :
- Les données proviennent de diverses sources, telles que des services Web, des fichiers et d'autres bases de données, tant internes qu'externes.
- Une fois les données extraites, elles sont intégrées, transformées et nettoyées, pour ensuite être chargées dans le Data Warehouse.
- Afin de générer des informations tactiques et stratégiques, des rapports et des analyses sont obtenus à partir du chargement des données.
- Enfin, les utilisateurs peuvent consulter et explorer les rapports et analyses générés.
éléments
Nous allons maintenant décrire certains des éléments qui peuvent être évalués dans le Data Warehouse et qui devraient être pris en compte.
Sources d'entrepôt de données
Généralement, ils sont le résultat de l'activité quotidienne de l'entreprise, auquel cas ils sont appelés sources internes. Lorsque les données proviennent, par exemple, de serveurs Web, elles sont considérées comme des sources externes. Ils sont différents les uns des autres, car ils dépendent de leur origine, format, fonction, etc.
Extraction, transformation et chargement
Connu sous le nom d'ETL, c'est le processus qui comprend toutes les tâches qui sont effectuées à partir du moment où les données sont obtenues jusqu'à ce qu'elles soient chargées dans le Data Warehouse. Ce sont : l'extraction, la manipulation, le contrôle, l'intégration, le nettoyage des données, le chargement et la mise à jour.
extraction
Il comprend des techniques visant à obtenir, à partir de diverses sources, uniquement les données pertinentes et à les conserver dans un stockage interne. Ce type de stockage permet de manipuler les données sans intervenir ni altérer les sources ou le Data Warehouse avec plus de données, créant une couche d'extraction entre la lecture et le chargement, stockant et gérant les métadonnées générées dans le processus et facilitant l'intégration.
L'extraction est basée sur les besoins des utilisateurs et les exigences définies pour la solution.
Transformation
Ce sont les techniques chargées de rendre compatibles les différents formats, ainsi que de filtrer et de classer les données, et de relier les sources.
Cette fonction est chargée d'appliquer toutes les commandes appropriées par rapport aux données, afin de les promouvoir de manière forte et raisonnable, compatible et cohérente avec le Data Warehouse. De plus, il est responsable de la propreté et de la qualité des données.

Charger
Concernant les techniques du chargement initial des données et de la mise à jour périodique du Data Warehouse.
- Le chargement initial fait référence au premier chargement de données que le Data Warehouse reçoit. En général, cela prend beaucoup de temps en raison du grand nombre d'enregistrements appartenant à de longues périodes.
- La mise à jour périodique fait référence à l'insertion de petits volumes de données. Votre objectif est d'ajouter aux échantillons de l'entrepôt de données uniquement les données générées à partir de la dernière mise à jour. Cela dépend des besoins et des exigences de l'utilisateur.
En bref, grâce au processus de chargement des données, la maintenance du Data Warehouse est garantie.
En résumé, on peut dire que le processus ETL se déroule comme suit :
- Les données, une fois extraites des sources pertinentes, sont déposées dans la mémoire interne.
- Alors que les données sont conservées dans un stockage interne, elles sont intégrées et transformées.
- Lorsque les données sont nettoyées, après l'étape précédente, elles sont transmises au Data Warehouse.
rapports
Les rapports sont des outils graphiques qui permettent à l'utilisateur d'obtenir des rapports détaillés sur les informations de son entreprise. La façon d'interagir avec ces rapports est assez simple pour l'utilisateur, car ce sont des instructions faciles à suivre. Fondamentalement, vous devez sélectionner des options dans un menu, en vous référant aux conditions et aux spécifications du sujet présenté.
OLAP
C'est le composant le plus puissant du Data Warehouse, car il contient le moteur de requête multidimensionnel spécialisé du système.
Il permet l'analyse de l'organisation à partir de différents scénarios historiques. Il projette son comportement et son évolution à partir d'une vision multidimensionnelle, c'est-à-dire en combinant différentes perspectives, sujets d'intérêt ou dimensions. Cela permet de déduire des tendances en découvrant des relations entre des perspectives qui seraient difficiles à trouver au premier coup d'œil.
Data Mining
C'est avant tout un outil statistique, grâce auquel des prédictions peuvent être faites. Il s'agit d'inférer des comportements, sans qu'il y ait de règles préétablies. Il génère des rapports sous forme de tableaux et de graphiques, entre autres, qui favorisent la prise de décision de manière proactive. Il fonctionne sur la base d'informations déjà entièrement traitées.
Différence entre OLAP et Data Mining
Une fois que les principaux aspects d'OLAP et du Data Minig ont été considérés, une différence fondamentale entre eux peut être établie.
- En utilisant OLAP, la situation actuelle de l'entreprise est interprétée, donnant des réponses rapides qui facilitent la prise de décision.
- Le Data Minig prédit des situations, basé sur l'étude des connaissances cachées qui provoquent certains types de comportements.
Par conséquent, les deux systèmes traitent de la résolution de différents types de situations analytiques.
Data Minig et sa relation avec Data Warehouse
Un système Data Minig est une technologie d'assistance à l'utilisateur final, dont l'objectif est d'extraire des informations utiles à partir des informations contenues dans la base de données des entreprises. En d'autres termes, l'origine des informations utilisées par les algorithmes de Data Minig sont généralement des données historiques contenues dans un Data Warehouse.
Il doit y avoir une intégration entre les techniques de Data Minig et les processus impliqués dans le Data Warehouse. En d'autres termes, pour effectuer l'analyse commerciale, il doit y avoir un accord entre le Data Minig, le Data Warehouse et le serveur OLAP.
Chaque fois que Data Warehouse fournit de nouveaux résultats, l'entreprise peut réappliquer Data Minig pour optimiser la prise de décision.
En bref, le Data Minig et le Data Warehouse sont des outils entièrement compatibles. Le Data Warehouse fournit la mémoire et l'intelligence Data Minig.
Bases de données traditionnelles vs Data Warehouse
L'analyse des aspects exposés jusqu'ici, nous amène à comprendre qu'un Data Warehouse diffère des bases de données qui supportent les transactions quotidiennes des organisations. Voici les différences fondamentales
- Dans les bases de données traditionnelles, les informations sont organisées de manière à pouvoir être facilement récupérées et mises à jour. Un Data Warehouse est organisé et orienté vers l'utilisateur final, qui ne peut que se renseigner.
- Les bases de données transactionnelles prennent en charge le traitement quotidien des données. Le Data Warehouse fonctionne avec des données historiques, c'est-à-dire correspondant à de longues périodes de temps.
- Les bases de données traditionnelles sont consultées plusieurs fois au cours d'une journée de travail. Dans un entrepôt de données, les lectures et les requêtes sont minimes, car elles sont accessibles sporadiquement.
- Le volume de données qu'un Data Warehouse gère est bien supérieur à celui géré dans les bases de données traditionnelles.
- La structure des bases transactionnelles est stable. La structure d'un Data Warehouse varie en fonction de sa propre évolution et de son utilisation.
Ensuite, nous établirons quelques Exemples d'entrepôt de données.
Exemples d'entrepôt de données
Une entreprise nationale, dédiée à la vente de produits de nettoyage au gros et au détail, considérée en plus de taille moyenne en raison de son volume de ventes, a pour objectif principal de maximiser ses profits. De même, afin d'obtenir plus de clients, vous souhaitez vous étendre à un nouveau niveau de marché et, plus tard, étendre votre gamme de produits. L'une de ses principales politiques est de s'améliorer continuellement pour obtenir une meilleure position par rapport à ses concurrents des échantillons d'entrepôt de données.
L'application d'un entrepôt de données offre les avantages suivants à l'organisation.
- Il permet aux utilisateurs d'avoir une vue d'ensemble de l'entreprise.
- Transformez les données opérationnelles en informations analytiques, axées sur la prise de décision.
- Générez des rapports dynamiques qui facilitent votre analyse.
- Il facilite la formation de stratégies pour la réalisation des objectifs de l'organisation.
- Il profite à la stabilité de la structure de l'entreprise.
Un autre exemple d'entrepôt de données quotidien fait référence à la gestion d'un établissement d'enseignement, qui présente des lacunes en termes de communication avec ses étudiants. De même, il manque un centre d'information unifié qui a toutes leurs informations. L'objectif de l'établissement est d'accompagner les étudiants tout au long de leur carrière et après l'obtention du diplôme, de proposer de nouvelles propositions qui améliorent la performance de l'organisation et le développement des étudiants.
Avec l'application d'un entrepôt de données, nous cherchons à répondre aux besoins de l'université. En principe, éliminer la duplication d'informations et la présence de détails erronés sur les étudiants, ainsi que toutes les informations qui, en général, sont considérées comme de mauvaise qualité et qui ne sont pas pertinentes. De plus, toutes les informations sont intégrées, formant un dossier unifié des étudiants qui sert de base au bon développement du projet de l'institution.
Enfin, des activités de marketing sont promues, ce qui donne un plus grand avantage à l'université et aide à sa croissance grâce à une gestion correcte de l'information.
En conclusion, dans les exemples d'entrepôt de données, il offre la possibilité de savoir ce qui se passe dans l'organisation, ce qui s'est passé, ce qui peut arriver et pourquoi. Vous pouvez voir l'article types de virus informatiques.



