Kredi kartı dolandırıcılık tespitinde makine öğrenme algoritmalarının karşılaştırmalı analizi
Yükleniyor...
Dosyalar
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Gedik Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Finansal sektörün hızla büyümesi ve dijital işlemlerin yaygınlaşması dolandırıcılık faaliyetlerinin artmasına yol açmış ve dolayısıyla dolandırıcılığı tespit etme yöntemlerinin geliştirilmesi gerekliliğini ortaya çıkarmıştır. Bu tez kredi kartı dolandırıcılığını tespit etmek için çeşitli makine öğrenimi ve derin öğrenme tekniklerinin etkinliğini incelemeyi amaçlamaktadır. Lojistik Regresyon, Destek Vektör Makineleri (SVM), Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları (ANN) yöntemleri kullanılmıştır. Veri kümesi Worldline ve Brüksel Libre Üniversitesi (ULB) işbirliği ile toplanmıştır. 284,807 işlem içeren veri kümesinde dolandırıcılık işlemleri toplam işlemlerin %0.172'sine denk gelmektedir. Bu dengesizlik, veri kümesinin yapısını vurgulamaktadır. Lojistik Regresyon ve Destek Vektör Makineleri %95 doğruluk oranları elde etmiştir. Karar Ağaçları ve Rastgele Orman %98 ve %97 doğruluk oranları ile yüksek performans sergilemektedir. Yapay Sinir Ağları (ANN) %100 doğruluk oranı ile öne çıkmaktadır. Modellerin avantajları ve dezavantajları bulunmaktadır. Eğitim süresi, karmaşıklık, anlaşılabilirlik gibi faktörler göz önünde bulundurulmalıdır. Yanlış pozitif ve negatif oranlarının dengelemesi de modelin pratik kullanımını ve maliyetini etkileyebilmektedir. Sonuç olarak bu çalışma kredi kartı dolandırıcılığını tespit etmek için makine öğrenimi ve derin öğrenme modellerini incelemiş olup Karar Ağaçları ve Random Forest gibi modellerin yüksek doğruluk oranı ve dengeli sonuçlar elde etmesiyle literatüre yeni bir katkı sunmaktadır. Farklı algoritmaların farklı performanslar sergilediği gözlemlenmiş ve model seçiminin algoritmanın özelliklerine ve veri kümesine bağlı olarak yapılması gerektiği vurgulanmaktadır. Bu çalışma finansal kurumların maliyet tasarrufu sağlamasına ve güvenli alışveriş deneyimleri sunmasına katkı sağlayacaktır.
As the financial sector continues to grow rapidly and digital transactions become more widespread, the need for effective fraud detection methods is paramount. This thesis aims to examine the effectiveness of various machine learning and deep learning techniques in detecting credit card fraud. Methods such as Logistic Regression, Support Vector Machines (SVM), Decision Trees, Random Forest, and Artificial Neural Networks (ANN) will be explored within this scope. The dataset has been collected through a collaboration between Worldline and Universite Libre de Bruxelles (ULB). Within the dataset containing 284,807 transactions, fraudulent transactions account for 0.172% of the total transactions, underscoring the dataset's inherent imbalance. Logistic Regression and SVM have yielded significant results with accuracy rates of 95%. Decision Trees and Random Forest have demonstrated high performance with accuracy rates of 98% and 97%, respectively. Notably, Artificial Neural Networks (ANN) emerged as the most effective method, achieving a perfect accuracy rate of 100%. Each model has its own advantages and disadvantages, with factors such as training time, complexity, interpretability needing consideration. Balancing the false positive and false negative rates can also impact the practical usage and cost of the model. In conclusion, this study has examined machine learning and deep learning models to detect credit card fraud, contributing a novel insight to the literature on the high accuracy and balanced outcomes of models such as Decision Trees and Random Forest in this context. Observations reveal different algorithms exhibit varying performances, underscoring the necessity of adapting the model selection to the algorithm's characteristics and the dataset. This research could contribute to cost savings for financial institutions and the provision of secure shopping experiences.
As the financial sector continues to grow rapidly and digital transactions become more widespread, the need for effective fraud detection methods is paramount. This thesis aims to examine the effectiveness of various machine learning and deep learning techniques in detecting credit card fraud. Methods such as Logistic Regression, Support Vector Machines (SVM), Decision Trees, Random Forest, and Artificial Neural Networks (ANN) will be explored within this scope. The dataset has been collected through a collaboration between Worldline and Universite Libre de Bruxelles (ULB). Within the dataset containing 284,807 transactions, fraudulent transactions account for 0.172% of the total transactions, underscoring the dataset's inherent imbalance. Logistic Regression and SVM have yielded significant results with accuracy rates of 95%. Decision Trees and Random Forest have demonstrated high performance with accuracy rates of 98% and 97%, respectively. Notably, Artificial Neural Networks (ANN) emerged as the most effective method, achieving a perfect accuracy rate of 100%. Each model has its own advantages and disadvantages, with factors such as training time, complexity, interpretability needing consideration. Balancing the false positive and false negative rates can also impact the practical usage and cost of the model. In conclusion, this study has examined machine learning and deep learning models to detect credit card fraud, contributing a novel insight to the literature on the high accuracy and balanced outcomes of models such as Decision Trees and Random Forest in this context. Observations reveal different algorithms exhibit varying performances, underscoring the necessity of adapting the model selection to the algorithm's characteristics and the dataset. This research could contribute to cost savings for financial institutions and the provision of secure shopping experiences.
Açıklama
Lisansüstü Eğitim Enstitüsü, Yapay Zeka Mühendisliği Ana Bilim Dalı, Yapay Zeka Bilim Dalı
Anahtar Kelimeler
Dolandırıcılık Tespiti, Kredi Kartı Dolandırıcılığı, Makine Öğrenimi, Fraud Deteciton, Credit Card Fraud, Machine Learning