Skip to content

Instantly share code, notes, and snippets.

@zbigniewTomczak
Created March 3, 2013 15:36
Show Gist options
  • Save zbigniewTomczak/5076548 to your computer and use it in GitHub Desktop.
Save zbigniewTomczak/5076548 to your computer and use it in GitHub Desktop.
OLTP - On-line transactional processing
OLAP - On-line analytical processing
ETL - Extract, transform, load
Po co hurtownia danych:
- Wykonywanie analiz biznesowych bez ingerencji w systemy transakcyjne
- Wspomaganie decyzji
- Całościowy wgląd w dane firmy
- Dostęp do danych historycznych
- Ujednolicenie posiadanych informacji
Typowe zastosowania:
- Analiza trendów i zachowań
- Wykrywanie oszustw
- Wybór celu kampanii marketingowej
- Analiza rentowności
- Zapobieganie odejściu klienta
- Zarządzanie zasobami
- Automatyczne generowanie zamówień
- Analiza ryzyka kredytowego
- Długoterminowa ocena wartości klienta
Architektury:
- scentralizowana
- federacyjna
- wielowarstwowa
RDB - Relational database - ROLAP
MDDB - Multidimensional database - MOLAP
HOLAP - Hybrid OLAP
- Model pojęciowy
- Model logiczny
- Model fizyczny
MDM - Multidimensional data model
Kostka OLAP - n-wymiarowa tablica, której krawędzie są wymiarami, a komórki zawierają podsumowania miar.
Operacje ka kostce OLAP:
- rezwijanie (roll-down, drill-down): miesiące --> dni
- zwijanie (roll-up, drill-up): dni --> miesiące
- drążenie (drill trough)
- selekcja (slicing)
- filtrowanie (screening, selection, filtering)
- obracanie (pivot, rotate)
Przykładowe pytania biznesowe (temat: sprzedarz, wymiary: produktu, klient, obszar, czas):
- które produkty cieszą się coraz większą, a które coraz mniejszą popularnością w rozbiciu na kategorie?
- jakie kategorie produktów są sezonowe?
- czy niektóre produkty są bardziej popularne w pewnych częściach kraju?
- jakie są charakterystyczne cechy naszych najlepszych klientów?
- którzy klienci prawdopodobnie niebawem zamierzają zrezygnować z naszych usług?
Etapy projektowania hurtowni:
1. Określenie wymagań biznesowych, ustalenie tematu hurtowni.
2. Zdefiniowanie poziomu szczegółowości danych.
3. Określenie wymiarów, atrybutów i hierarchii wymiarów.
4. Określenie miar.
Schemat gwiazda. Tabela faktów. Tabele wymiarów.
Niekluczowe kolumny z tabeli faktów, czyli miary, powinny być sumowalne, a przynajmniej częściowo sumowalne.
Schemat płatka śniegu - snowflake schema.
Schemat konstelacyjny - wiele tabel faktów.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment