Veri madenciliği şirketlerin veya kurumların bilgi yığınları arasından değerli ve değer potansiyeline sahip bilgileri arama ve çıkarmasında başvurduğu bir yöntemdir. İsim itibarıyla bir madencinin yerin derinliklerine inerek altın gibi değerli madenleri bulmasına benzemektedir.
Aynı doğrultuda çalışan bu yöntem, şirketlerin ve kurumların sahip olduğu büyük veri yığınlarının arasından şu anda şirket ve kurum için değerli olan ve gelecekte de aynı değere sahip olabilecek büyük önem taşıyan verileri veri tarayıcıları ve örüntüleriyle ortaya çıkarmaktadır. Özellikli bilgisayar programları ve kurumların yararına dokunabilecek yazılımlarla birlikte milyarlarca veriyle çalışılabilir. Belirli süreç ve yöntemlerle şirketlerin ve büyük veri tabanlarına sahip kurumların değerli verileri ortaya çıkarmasında büyük yardımcılarıdır.
Veri Madenciliği Aşamaları
Veri madenciliği sistematik aşamalardan oluşur ve bu aşamaların sırasıyla fonksiyonel bir şekilde işlemesi gerekir. Bu süreçteki ilk aşama veri temizliği olup bilgi yığınındaki eksik ve belirsiz verilerin kaldırılması işlemidir. Bir sonraki süreç ise yeni ve eski birçok veri kaynağının birleştirilip bütün haline getirildiği veri birleştirme aşamasıdır.
Sıradaki aşama olan veri dönüşümü ise birleştirilen verilerin istenen sisteme istenen formatta aktarılmasıdır. Veri madenciliğinin kendisi olan veri ayrıştırma aşaması dönüştürülen formattaki bilgilerin örüntüler ve veriler halinde saptanmasıdır. Son aşama olan değerlendirme ve sunum aşamasında elde edilen verilerin amaçlanan veriler olup olmadığı değerlendirilir ve bu veriler amaçlanmış veriler ise diyagramlar ve tablolar halinde sunulur.
Veri Madenciliği Kullanan Sektörler
Günümüzde veri madenciliği, manuel bilgi ayıklama ve manuel veri tabanı incelemenin yerini almıştır. Bu yöntemle kullanıcılar, bilgi yığınlarını ve veri tabanlarını daha kısa sürede inceleyerek işleyişlerinin optimum değerlerini kolay bir şekilde bulmaya başlamışlardır. Bu sayede veri madenciliği yöntemine başvuran sektörler işleyişlerini hızlandırarak müşterilerine daha olumlu geri dönüşler verme eğilimine geçmişlerdir.
Bankacılık sektörü, veri madenciliği kullanımıyla incelenen müşteri veri tabanlarından alınan sonuçlarla faiz ve ödeme planlarını daha iyi optimize edebilmiştir. Perakendecilik sektörü de veri tabanı incelemeleriyle müşterilerine en uygun kampanyaları oluşturup kâr oranını artırmaya başlamakta ve üretim miktarını önceden çıkarttığı verilerle tahmin edip istenen seviyelerde üretim yapmaktadır. Öte yandan; sigortacılık, telekomünikasyon ve medya sektörleri de bu veri ayıklama yönteminden yararlanarak çıkabilecek sorunları en aza indirip müşterilerine en uygun hizmeti sağlamaktadır.