Co to jest hurtownia danych?
Magazynowanie danych to elektroniczne przechowywanie dużej ilości informacji przez firmę lub organizację. Hurtownia danych jest istotnym składnikiem inteligencji biznesowej, która wykorzystuje techniki analityczne do danych biznesowych.
Pojęcie hurtowni danych zostało wprowadzone w 1988 r. Przez badaczy IBM Barry'ego Devlina i Paula Murphy'ego. Potrzeba magazynowania danych ewoluowała w miarę, jak systemy komputerowe stawały się coraz bardziej złożone i obsługiwały rosnące ilości danych. Kluczową książką na temat hurtowni danych jest „Building the Data Warehouse” WH Inmona, która została po raz pierwszy opublikowana w 1990 r. I od tego czasu była wielokrotnie drukowana.
Jak działa hurtownia danych
Hurtownia danych jest używana do zapewnienia lepszego wglądu w wyniki firmy poprzez porównanie danych skonsolidowanych z wielu heterogenicznych źródeł. Hurtownia danych została zaprojektowana do uruchamiania zapytań i analiz dotyczących danych historycznych pochodzących ze źródeł transakcyjnych.
Po włączeniu danych do hurtowni nie ulega ona zmianie i nie można jej zmienić, ponieważ hurtownia danych przeprowadza analizy zdarzeń, które już miały miejsce, koncentrując się na zmianach danych w czasie. Przechowywane dane muszą być przechowywane w sposób bezpieczny, niezawodny, łatwy do odzyskania i łatwy w zarządzaniu.
Podjęto pewne kroki, aby utworzyć hurtownię danych. Pierwszym krokiem jest ekstrakcja danych, która obejmuje zebranie dużych ilości danych z wielu punktów źródłowych. Po skompilowaniu danych następuje ich czyszczenie, proces przeczesywania danych pod kątem błędów oraz poprawiania lub wykluczania wykrytych błędów.
Oczyszczone dane są następnie konwertowane z formatu bazy danych na format hurtowni. Po zapisaniu w magazynie dane przechodzą sortowanie, konsolidację, podsumowanie itp., Dzięki czemu są bardziej skoordynowane i łatwiejsze w użyciu. W miarę upływu czasu do hurtowni dodawane są kolejne dane w miarę aktualizowania wielu źródeł danych.
Kluczowe dania na wynos
- Hurtownia danych to elektroniczne przechowywanie dużej ilości informacji przez firmę lub organizację. Hurtownia danych została zaprojektowana do uruchamiania zapytań i analiz dotyczących danych historycznych pochodzących ze źródeł transakcyjnych do celów analizy biznesowej i eksploracji danych. Magazynowanie danych służy do zapewnienia większej wgląd w wyniki firmy poprzez porównanie danych skonsolidowanych z wielu heterogenicznych źródeł.
Specjalne uwagi: Data Mining
Firmy mogą magazynować dane do wykorzystania w eksploracji i eksploracji danych, szukając wzorców informacji, które pomogą im usprawnić procesy biznesowe. Dobry system hurtowni danych może również ułatwić innym działom w firmie wzajemny dostęp do danych.
Na przykład hurtownia danych może pozwolić firmie na łatwą ocenę danych zespołu sprzedaży i pomóc w podejmowaniu decyzji o tym, jak poprawić sprzedaż lub usprawnić dział. Firma może skoncentrować się na nawykach zakupowych klientów, aby lepiej pozycjonować swoje produkty i zwiększyć sprzedaż.
Dzięki hurtowni danych firma może gromadzić dane historyczne dotyczące wydatków klientów w ciągu ostatnich - powiedzmy 20 lat - i przeprowadzać analizy tych danych. Uzyskane informacje mogą zapewnić wgląd w preferencje jej konsumentów; pora dnia, miesiąca lub roku z większą sprzedażą; lub klient, który wydaje najwięcej w ciągu roku.
Skuteczne przechowywanie danych i zarządzanie nimi również umożliwiają procesy, takie jak inicjowanie rezerwacji podróży i korzystanie z bankomatów.
Proces eksploracji danych dzieli się na pięć etapów:
- Organizacje zbierają dane i ładują je do swoich hurtowni danych, a następnie przechowują je i zarządzają nimi na serwerach wewnętrznych lub w chmurze. Analitycy biznesowi, zespoły zarządzające i specjaliści ds. Technologii informatycznych uzyskują dostęp do danych i określają sposób ich organizacji. Oprogramowanie aplikacyjne następnie sortuje dane na podstawie wyników użytkownika. Użytkownik końcowy ostatecznie przedstawia dane w łatwym do udostępnienia formacie, takim jak wykres lub tabela.
Hurtownie danych a bazy danych
Hurtownia danych niekoniecznie jest tą samą koncepcją, co standardowa baza danych. Baza danych to system transakcyjny, który jest skonfigurowany do monitorowania i aktualizacji danych w czasie rzeczywistym, aby mieć dostęp tylko do najnowszych danych. Hurtownia danych jest zaprogramowana do agregowania uporządkowanych danych przez pewien okres czasu. Na przykład baza danych może mieć tylko najnowszy adres klienta, podczas gdy hurtownia danych może mieć wszystkie adresy, w których klient mieszkał przez ostatnie 10 lat.
