Veri Madenciliği ve Bilgi Çıkarımı PDF

Document Details

SustainableJasmine

Uploaded by SustainableJasmine

Dokuz Eylül Üniversitesi

Can Aydın

Tags

data mining knowledge discovery data analysis computer science

Summary

These lecture notes cover data mining and knowledge discovery, exploring the history, methods, and applications of data analysis. It discusses the extraction of useful information from data, referencing historic perspectives and modern techniques. Topics include data analysis methods, statistical analysis, and data mining models.

Full Transcript

VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI DOÇ. DR. CAN AYDIN 1 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI «Ölçemediğiniz hiçbir şeyi kontrol edemez, kontrol edemediğiniz hiçbir şeyi yönetemezsiniz.» Peter Drucker...

VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI DOÇ. DR. CAN AYDIN 1 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI «Ölçemediğiniz hiçbir şeyi kontrol edemez, kontrol edemediğiniz hiçbir şeyi yönetemezsiniz.» Peter Drucker 2 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Scientia Potestas Est (Knowledge is Power)-Sir Francis Bacon Bilgi Güçtür Güç olayları kontrol edebilme veya en azından etkileyebilme yeteneğidir. Bu güce sahip olabilmek, ancak bilginin nasıl kazanılabileceğini bilmekle mümkündür. Bilginin kazanılmasında ise veri ve veri analizi yöntemleri vazgeçilmezdir. 3 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri analizi yöntemlerinin kökeni Isaac Asimov’un Vakıf (Foundation) Serisinde işlediği büyük toplulukların gelecekteki davranışlarını tarih, sosyoloji, matematik, istatistik bilimlerini harmanlayarak tahmin etmeyi amaçlayan psikotarih’e kadar gitmektedir. 4 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri Madenciliği Tarihi 5 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI 1814 yılında Pierre-Simon Laplace 1749-1827 tarafından yayımlanan «Essai philosophique sur les probabilites» (Olasılıklar Hakkında Felsefi bir Deneme) isimli çalışmanın önsözünde, Laplace’ın «bir zeka» ile ifade ettiği ve daha sonra Laplace Şeytanı olarak isimlendirilen bir varlığın Tüm doğa kanunlarını, kainattaki tüm durum, pozisyon ve sürat gibi başlangıç şartlarını bilmesi durumunda, geçmiş ve gelecekteki her bir durumu hesaplayabilmesi ve belirleyebilmesinin mümkün olacağı ifade edilmektedir. 6 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI «In the Land of the Blind, the One-Eyed Man is King» Desiderius Erasmus 1465-1536 «Körler ülkesinde, Tek Gözlü Adam Kraldır» Veri analizi yöntemlerinin tahmin gücünü çok iyi açıklamaktadır. Geleceği hiç görmemektense, alacakaranlıkta görmeye çalışmak evladır. 7 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI ÖLÇMEK YA DA ÖLÇEMEMEK 8 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Adalet Tanrıçası Maat Çifte Gerçeklik Salonu 9 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Yunan mitolojisinden Demirci Procrustes 10 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Bran Şatosu 11 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Mnara Antik Kenti Ölçü (kontrol) kapları Antik dönemde dürüst bir ticaretin gerçekleştirilmesi amacıyla, ticari ürünlerin ağırlığının ve hacminin standart ölçülere uygun olup olmadığının denetlenmesinde kullanılırdı. 12 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Ölçme ve ölçüm referans standart çalışmaları insanlık tarihi ile başladığı söylenebilir. Ölçüm standartlarının oluşturulmasıyla ilgili ilk çalışmaların parmak, ayak, kulaç gibi insan uzuvlarına dayalı ilkel ölçüler olarak şekel, mina, kübit gibi ölçülerin Mısır ve Mezopotamya Bölgesi'nde Asur, Babil, Sümer gibi medeniyetlerde ortaya çıktığı kabul edilmektedir. Daha sonra Yunan ve Roma uygarlıklarında eskisine göre daha modern olan talanton, mina, libra, chous gibi standart hacim, alan, uzunluk ve ağırlık ölçüleri oluşturularak kullanılmıştır. Anadolu'da ise M.Ö. yaklaşık 10. bin Neolitik Dönem'den itibaren Göbekli Tepe, Çayönü, Çatalhöyük gibi yerleşmelerde karşımıza çıkan konut vs. yapıların (araştırmaların yetersiz olmasına karşın) düzenli bir yapıda inşa edildiğini ve belirli bir ölçü anlayışıyla yapıldığını söylemek mümkündür. 13 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Yüzlerce yıl içerisinde her toplum tarafından farklı uzunluk ve ağırlık ölçüleri türetilmiştir. Ülke düzeyinde aynı isim altında çok farklı değerler alabilen bu ölçülerin bir standarda kavuşabilmesi için çeşitli girişimlerde bulunulmuştur. Örneğin 1789 yılında Fransa’da bulunan ölçü birimlerinin çeşitliliği konusundaki karmaşasının daha fazla devam etmemesi için halkın XVI. Louis’ye «Chaiers de doleances» «şikayet dilekçesi» ile yönelttiği talep bu yönde olmuştur. 14 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Bu dileğe uygun olarak günümüzde dünyanın büyük bir kısmında standart hale gelen ölçü birimlerin kullanılmaktadır. Örneğin kilogram ölçüsü için 1889’dan beri, 1879’da Londra’da yüzde 90 platin ve yüzde 10 iridyumdan üretilen ve Paris yakınlarındaki Sevr’de bulunan Uluslararası Ağırlık ve Ölçüler Bürosu’nda bir cam fanus altında saklanan silindir temel alınmaktadır. 15 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI İnsanoğlu ölçme, ölçtüklerini kaydetme ve hesaplama işlemlerini yüzlerce yıldır sürdürmektedir. Yüzyıllar içerisinde kimi zaman ağırlık ve yoğunluk, kimi zaman uzaklık, kimi zamanda zamanın kendisini ölçülmüş ve her biri için farklı birimler kullanılmıştır. Bu ölçü birimleri sırası ile Babil, Antik Mısır ve Antik Yunan uygarlıklarının mirası olarak bir saatin 60, bir günün 24 ve bir haftanın 7 eşit birime ayrılması ile günlük yaşamamamızın vazgeçilmez parçaları olarak yaşamaya devam etmektedir. 16 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Yapılan ölçme işlemleri kimi zaman Sümer’de kil tabletlere, kimi zaman İnka’larda sicimler üzerine atılan düğümlerden meydana gelen kuipu’lara kaydedilmiştir. Abaküs, Pascaline, sürgülü cetveller, Facit ürünü hesap makineleri bu verinin hesaplanmasını sağlamıştır. Günümüzde manyetik ve optik kayıt ortamları terabytelar seviyesindeki verinin saklanmasında, bilgisayarlar ise hesaplanmasında kullanılmaktadır. 17 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Ölçü Skalası Ölçü skalası kavramı psikolog Stanley Smith Stevens tarafından, 1946 yılında Science isimli dergide yayımlanan ‘On the Theory of Scales of Measurement’ isimli makalesinde önerilmiştir. Stevens bu makalesinde bilimdeki bütün ölçülerin, Nominal (isimsel) Ordinal (Sıralı) Interval (Aralıklı) Ratio (Oransal) Ölçü Skalası Kategorik Sürekli Nominal Ordinal Interval Ratio (İsimsel) (Sıralı) (Aralıklı) (Oransal) 18 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Nominal (İsimsel) Skala Nominal kavramı Yunancada isim anlamına gelen onoma kelimesinin çoğulu olan nomina kelimesinden türetilmiştir. Bir özniteliğe (attribute) atanan değerler küçüklük büyüklük gibi bir kriterle herhangi bir şekilde sıralanamıyorsa, herhangi bir sınıflandırma söz konusu değilse ve sadece isimlendirme işlemi gerçekleşiyorsa bu değerler nominal skala altında toplanır. Nesnelerin sadece isimlendirilmesi söz konusu olduğu için örneğin bir futbol takımında 90 sırt numaralı oyuncunun, 10 sırt numaralı oyuncudan 9 kat daha büyük olduğu anlamına gelmemektedir. Yaşadığınız Yer? Cep Telefonu Markanız? Köy Apple İlçe Samsung İl Huawei Büyükşehir 19 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Nominal skalayı kendi içinde alt gruplara ayırarak inceleyebilmek mümkündür. Sadece iki farklı değerin, örneğin cinsiyet özniteliğinde erkek ve kadın değerlerinin atanabildiği nominal skala, ikili bölünme (dicthomous) olarak isimlendirilmektedir. Nominal skalada diğer bir alt sınıflandırma, öznitelik değerleri için 1 ve 0 değerlerinin atandığı ikili (binary) gruptur. 20 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Ordinal (Sıralı) Skala Bu skalada öznitelik değerleri büyüklük küçüklük kriterine göre sıralanmaktadır. Örneğin fakir, orta halli, zengin, genç, yaşlı gibi değerlerin bir diğerine maddi gelir açısından üstün olduğu görülmektedir. Bir diğer örnek; mezun olunan okul, rakamlarla küçükten büyüğe sıralanmaktadır. Bu sayıların arasındaki uzaklıkların hesaplanması söz konusu değildir. Öğrenim Durumu İlköğretim İlköğretim 1=İlköğretim 2=Ortaöğretim OrtaÖğretim 3=Lise Lise 4=Lisans Doktora 5=Yüksek Lisans 6=Doktora Yüksek Lisans İlköğretim 21 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Kategorik Öznitelik Değerleri Skala Öznitelik Öznitelik Değerleri Kategorik Baharat Türü Karabiber Toz biber Nane Kategorik (İkili Bölünme) Cinsiyet Erkek Kadın Kategorik (İkili) Cevap 1 0 22 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Interval (Aralıklı) Skala Bu skalada ordinal skalanın aksine kullanılan sayılar arasındaki uzaklıklar ölçülebilmekle birlikte, skalanın önemli eksikliği doğal bir sıfır noktasının bulunmamasıdır. Örneğin bugün sıcaklık 10 derece iken yarın sıcaklık 20 derece olacaktır. Bu demek değildir ki yarın iki kat daha sıcak olacak! Sıcaklık (C) 0 Sıcaklık (Kelvin)-273 10 -100 20 -200 30 23 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Ratio (Oransal) Skala Interval skala ile en önemli farkı doğal bir sıfır noktasının bulunmasıdır. Örneğin iki gün önce hiç satış yapılmamış olmasına rağmen dün 100 tl bugün ise 200 tl satış yapılmışsa bugün düne göre iki kat fazla satış yapılmış olduğunu ifade edebiliriz. Satışlar 0 100 200 24 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Skala Öznitelik Öznitelik Değeri Matematik/Mantık İstatistik İşlemci Nominal İsim Can =≠ Mod Kategorik Giysi Bedeni S,M,L,XL =≠ Mod Kategorik (İkili Cinsiyet Erkek =≠ Mod Bölünme) Kadın Kategorik Cevap 1 =≠ Mod (İkili) 0 Ordinal (Sıralı) Kan Basıncı Düşük =≠ Medyan Yüksek Normal Interval Doğum Yılı 1958 =≠ Aritmetik (Aralıklı) 1990 +/- Ortalama Ratio Ağırlık 82 =≠ Geometrik (Oransal) Boy 175 +/- Ortalama x/÷ Ratio Beden Kitle 𝐴ğ𝚤𝑟𝑙𝚤𝑘 2 Herhangi bir işlem = (Orantısız) Endeksi 𝐵𝑜𝑦 yapılamaz 25 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Data (veri), Latincede vermek anlamında kullanılan dare fiilinin geçmiş zaman çekimi olan datum kelimesinin çoğuludur. Veri tecrübe, gözlem ve deney sonucunda elde edilen sayı, kelime veya görsellerden oluşan, düzenlenmiş bilgi kümesini ifade etmektedir. Veriden bilgiye giden yolda aşamalar genel olarak bilgi piramidi ile gösterilir. Bu piramidin en temel hali sadece veri (data), enformasyon (information), bilgi (knowledge) ve bilgelik (wisdom) bileşenlerinden meydana geldiği için, piramit bilgi piramidi olarak da isimlendirilmektedir. Bilgelik Bilgi Enformasyon Veri 26 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Bilginin kazanılması mekan ve zaman boyutlarında geçmişin, şimdinin ve geleceğin analizi üzerine kurulmuştur. Bunun temel koşulu ise etkin veri yönetimidir. DAMA Data Management of Knowledge tarafından hazırlanan DAMA-DMBOK’da veri yönetimi, veri ve enformasyon varlıklarının kontrolü, korunması, kullanıcılarla paylaşımı ve değerinin artırılması ile ilgili planların, politikaların, programların ve uygulamaların geliştirilmesi, icra edilmesi ve denetimidir. 27 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri analizinde geliştirilen yöntemlerin tamamında ana fikir, geleceğin geçmişin bir yansıması olduğudur. Bu temel fikre göre geçmişe ilişkin veri dizilerinin etkin yönetimi, uygun yöntemlerin kullanılması ile geleceğin de tahmin edilmesini sağlayacaktır. Günümüzün olağanüstü dinamik koşullarında bu yaklaşımın geçerliliği tartışmaya açıktır. Geçmişin verisini toplamak, analiz etmek veya güncel olayların analizi kısmen mümkün olsa da, geleceğin bilinmesinde kristal küre yaklaşımının dışında bir yöntem mevcut değildir. Bu konuda en tipik örneklerden biri Nokia ile ilgilidir. 2007 yılı Ekim ayında 39,72 dolar kapanış fiyatı ile zirvede olan Nokia hisse senedi fiyatları, 29 Haziran 2007 tarihinde Iphone’un pazara girmesi ile birlikte süratle değer kaybetmiş, Haziran 2012’de 2,07 dolar kapanış fiyatı ile dibe vurmuştur. 28 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri Analizi Günümüzde karar vermede önemli bir rol üstlenen veri analizi, veriden bilgiye giden, yol işaretleri konulmamış, uzun, taşlı çakıllı bir yoldur. Veri analizi en basit tanımı ile verinin toplanması, düzenlenmesi, modellenmesi ve bilgiye erişimin denenmesidir. Veri analizi farklı disiplinlerde; Yönetim Bilişim Sistemleri alanında business intelligence (İş zekası) adı altında odaklanmış işletme içerisinde en uygun kararlarında alınması için kullanılan bir araç olarak Yapay zeka alanında makine öğreniminde sınıflandırma, kümeleme ve geleceğin tahmininde Veri madenciliği adı altında, geleceğin tahmini için enformasyon örüntülerinin çıkarımında veya bu örüntülerin tanımsal veya tahmin amaçlı olarak sınıflandırılmasında 29 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI İstatistik alanında, Tanımlayıcı istatistik (descriptive analytics), Verinin içerdiği özelliklere odaklanan keşfedici veri analizi (exploratory data analyst), Mevcut varsayımların doğruluğunu test eden onaylayıcı veri analizinde (confirmatory data analysis), Büyük veri problemleri için önerilen istatistik çıkarımında (inductive statistics) 30 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri analizinin hedefi etkin kararların verilmesinin sağlanması, diğer bir ifade ile optimum noktanın bulunmasıdır. Ancak her problem bir çözüm içermeyeceği gibi günümüz hesaplanabilirlik olanakları çerçevesinde, bir problemin bir çözümü olsa bile, bu çözümü her zaman veya kesin doğrularla hesaplayabilmek mümkün değildir. 31 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Bir problemin çözümsüzlüğü konusundaki en güzel tarihi örneklerden biri, graf teoreminin de temelleri olarak kabul edilen, Euler’in Königsberg köprüsü problemidir. Bugün Rusya’ya ait olan Kaliningrad’ın içinden geçen Pregel nehri’nin üzerinde, nehrin tam ortasında yer alan adayı, karaya bağlayan yedi köprü bulunmaktadır. 32 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Bu problemde merak edilen konu bütün köprülerden bir ve yalnız bir defa geçmek koşulu ile üç kara parçası gezilebilir mi? 33 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Königsberg köprüsü probleminde olduğu gibi bir çok problem için mümkün bir çözüm olup olmadığını belirlemek ve hesaplanan çözümün o problemin en uygun çözümü olup olmadığını bilebilmek her zaman olası değildir. Bu sebeple tamamen kör olmaktansa körler ülkesinde tek gözlü kral olmak, ancak veri analizi yaklaşımlarının kullanılması ile mümkün olacaktır. 34 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Veri Madenciliği Modelleri Geleneksel olarak veri madenciliği modelleri üç ana başlık altında toplanmaktadır. Sınıflandırma (Classification) Kümeleme (Clustering) Birliktelik Kuralı (Association Rules) ve Ardışık Zamanlı Örüntüler (Sequential Patterns) 35 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Sınıflandırma Veri madenciliği içerisinde iki ana gruptan biri olan sınıflandırma, veri dizisinin istatistik ve / veya makine öğrenimi yöntemleri kullanılarak önceden belirlenen sınıflara atanması işlemidir. Sınıflandırma yöntemleri makine öğrenimi terminolojisinde denetimli öğrenme (supervised learning) başlığı altında toplanmıştır. 36 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Gerek istatistik gerekse makine öğrenimi temelli çeşitli sınıflandırma yöntemleri geliştirilmiştir. İstatistik yöntemler içerisinde lineer ve lineer olmayan başlıca yöntemler Lineer regresyon analizi, Lojistik regresyon analizi, Dikriminanz analiz, Bayes sınıflandırma yöntemleridir. Makine öğrenimi yöntemleri içerisinde ise karar ağaçları, en yakın komşu yöntemi, yapay sinir ağları,destek vektör makineleri başlıca yöntemlerdir. Bu yöntemleri geliştirmeye devam edilen fuzzy temelli sınıflandırma yöntemleri izlemektedir. 37 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Kümeleme Kümeleme yöntemlerinde önceden belirlenen sınıfların bulunmaması nedeni ile sınıf oluşturma işlevi ön plandadır. Küme analizi de bir sınıflandırma yaklaşımıdır. Ancak küme analizinde bağımlı değişken y değerleri bulunmamakta, sadece nesnelerin öznitelik değerlerine göre sınıflandırma yapılmaktadır. Bu nedenle de kümeleme sürecinde bağımlı ve bağımsız değişkenler arasında bir bağ kurmak söz konusu olmadığından, kümeleme yaklaşımı makine öğreniminde denetimsiz öğrenme (unsupervised learning) başlığı altında almaktadır. Bu durumda da öznitelik değerlerinin benzer olduğu nesneler bir araya getirilerek kümeler oluşturulmaktadır. Öznitelik değerlerinin benzerliği ise, bu değerlerin birbirlerine olan uzaklıkları hesaplanarak veya veri uzayında yoğunlaştıkları noktalar gibi yaklaşımları belirlenmektedir. 38 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Birliktelik Kuralları ve Ardışık Zaman Örüntüleri Bir alışveriş sırasında veya birbirini izleyen alışverişlerde müşterinin hangi mal veya hizmet satın almaya eğimli olduğunun belirlenmesi, müşteriye daha fazla ürünün satılmasını sağlama yollarından biridir. Satın alma eğilimlerinin tanımlanmasını sağlayan birliktelik kuralları ve ardışık zamanlı örüntüler, pazarlama amaçlı olarak Pazar sepeti analizi (market basket analysis) adı altında veri madenciliğinde yaygın olarak kullanılabilmektedir. 39 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI Birliktelik kuralları aşağıda sunulan örneklerde görüldüğü gibi eş zamanlı olarak gerçekleşen ilişkilerin tanımlanmasında kullanılır. Müşteriler bira satın aldığında, %75 ihtimalle patates cipsi de satın alır. Düşük yağlı peynir ve yağsız yoğurt alan müşteriler, %85 ihtimalle diyet süt de satın alır. Ardışık zamanlı örüntüler ise aşağıda sunulan örneklerde görüldüğü gibi birbirleri ile ilişkisi olan, ancak birbirini izleyen dönemlerde gerçekleşen ilişkilerin tanımlanmasında kullanılır. X ameliyatı yapıldığında gün içinde %45 ihtimalle Y enfeksiyonu oluşacaktır. Borsa İstanbul endeksi düşerken A hisse senedinin değeri % 15’den daha fazla artacak olursa, üç iş günü içerisinde B hisse senedinin değeri %60 ihtimalle artacaktır. Çekiç satın alan bir müşteri, ilk üç ay içerisinde %15, bu dönemi izleyen üç ay içerisinde %10 ihtimalle çivi satın alacaktır. 40 VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI VERİ MADENCİLİĞİ VE BİLGİ ÇIKARIMI TEŞEKKÜRLER 41