Analysis Service Nedir ? Temel Kavramları
Bilindiği gibi SQL Server’da veri tabanları OLTP ve OLAP diye ikiye ayrılmaktadır. OLTP (On Line Transactional Processing) veri tabanları; verilerin iki boyutlu -satır ve sütunlardan oluşan- tablolar biçiminde tutulduğu ve bu tablolar arasında ilişkilerin kurulabilmesiyle karakterize tipik ilişkisel veri tabanlarıdır. OLTP, görece az miktardaki verinin olduğu ancak fazla atomik işlem gören veri tabanları için uygundur. Atomik ifadesinden kastedilen anlam transactional çalışma mantığıdır. Bu çalışma mantığı kısaca ACID doktirini diye bilinen prensiplerle özetlenir.
Not : Bu yazı Aykut TAŞDELEN’in Reporting Service kitabından alıntıdır, izinsiz kullanılamaz ve devamı söz konusu kitapta yer almaktadır !
OLAP (On Line Analytical Proccessing) ise; görece fazla miktarda verinin iki boyutlu tablolar yerine çok boyutlu küpler biçiminde tutulduğu ve bu veriler üzerinde istatistiksel analizlerin yapılabildiği veri tabanlarını ifade eder. Özellikle karar destek sistemlerinde kullanılan bu tür veri tabanlarının arkasında çoğu zaman yine OLTP türü veri tabanları bulunmaktadır. Ayrıca OLAP veri tabanları eş zamanlı (concurrent) birden çok kullanıcıya OLTP’ye göre çok daha performanslı sorgu sonuçları üretebilir.
OLTP türü veri tabanlarının sorgulanmasında SQL dili kullanılırken, OLAP için temelde SQL diline benzeyen ancakküp, slice, fact veya dimension gibi OLAP’a özgü olguları destekleyen MDX (Multi Dimensional eXpression language) sorgulama dili kullanılır.
İşte Analysis Services; Microsoft SQL Server’ın OLAP türü veri tabanlarını destekleyen teknolojisidir.
Son yıllarda kullanımı popülerleşen Veri Ambarı (DataWarehouse) kavramı da yine bu konuyla ilgilidir. Kabaca bir kurumun farklı departman ya da veri sahalarından gelen verileri denormalizasyon yaparak merkezi biçimde depolayan yapı anlamına gelir. Kuşkusuz yapılan tek şey denormalizasyon değildir. Yine sıkça kullanılan bir terim olan ETL, veri ambarı oluşturma sürecini ifade eder.
E = Extract : Yani veriyi çeşitli sahalardan (farklı şubeler, farklı departmanlar gibi) ve çeşitli veri tabanlarından elde etmek,
T = Transform : İstenilen şekle dönüştürmek ve
L = Load : Veri ambarına yüklemek şeklinde özetlenebilir.
Data Mart; veri ambarına ilişkin alt kümeleri anlatan bir terimdir. Söz gelimi bir bankayı ele alırsak tüm bankaya ait bilgiler veri ambarını ifade ederken, departmanlar düzeyindeki bilgiler data mart’ları ifade eder. Örneğin ADK, Kredi, Bireysel Bankacılık veya Nakit Yönetimi gibi departmanların verileri somutlaşmış data mart örnekleridir.
Veri Madenciliği (Data Mining) ise; veri ambarındaki aralarında başta bir korelasyon yokmuş gibi gözüken verilerin, istatistiksel bazı metotlar kullanılarak analiz edilmesi, bu yolla verilerin içindeki mantık örgülerinin (patern’lerin) keşfedilerek, verilerin anlamlandırılması ve geleceğe dair öngörülerde bulunulması demektir. Somutlamak gerekirse örneğin geçmiş 50 yıllık seçimlerde belirli bir şehirde yaşayan insanların seçimin yapıldığı mevsime bakılarak hangi mevsimde, en çok hangi partiye oy verdiğini inceleyip sonuca göre de önümüzdeki seçimlerde hangi mevsimde seçim yapılırsa o partinin daha çok oy alacağı kestirilebilir.
Küp (Cube); verinin kendisi ve boyutlarını ifade eden bir terimdir. Boyut (Dimension); basit anlamda verinin analiz edildiği bakış açısıdır. Örneğin bir ürüne ait satış verisi yer, zaman veya kategori boyutlarında analiz edilebilir. Fact’ler ise boyutlardaki özetlenmiş, hesaplanmış değerlerdir. Örneğin satış verisindeki toplam ya da ortalama satış adedi gibi. Bu şekilde oluşturulan küpler sayesinde veri ambarı kullanılabilir hale gelmektedir. Küpler üzerinde çeşitli işlemlerin yapılabildiği yapılardır örneğin;
Dilimleme (Slicing); kabaca ilişkisel veri tabanlarında where ile bir koşul belirleyerek yapılan işlemin karşılığıdır. Burada koşul oluşturmak için boyutlardan faydalanılır. Örneğin yılın üçüncü çeyreğindeki satışlar gibi. Dicing ise; dilimleme işleminin birden çok boyutta yapılması demektir.
Not : Bu yazının devamındaki küplerin raporlama için kullanımı gibi bilgiler Taşdelen’in Reporting Services kitabında yer almaktadır.