Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων από τα Χρηματοπιστωτικά Ιδρύματα για την Πρόληψη του Οικονομικού Εγκλήματος (Master thesis)

Ντζαβίδα, Στέλλα


This paper is about applying the most sophisticated data mining methods to a real dataset in order to detect possible fraud when opening a bank account. The contribution of this paper focuses on two areas. First, it attempts to highlight the strongest variables that are important indicators of possible fraudulent transactions. The identification, ranking by importance and evaluation of these variables is an important criterion for the acceptance or not of potential customers by a financial institution. Secondly, it suggests the creation of reliable models that can predict with high accuracy the majority of future cases. The paper is organized in three parts. The first part presents the role of financial institutions and in particular the function of the Compliance Unit in the fight against financial crime. It analyses the basic Know Your Customer principle and the institutional-legal framework currently in force in Greece. The definition of Money Laundering is given and the cycle of a money laundering scheme is described. Finally, the main data analysis technologies currently used to combat fraud are mentioned, as well as best practices that have been proposed for adoption in the future. The second part describes the stages of Knowledge Discovery, the four categories of Machine Learning and the most important supervised learning methods. Extensive reference is made to the specific topic of class imbalance, Cost Sensitive Learning and Performance Metrics of classifiers. The third part provides the methodology of this paper. To achieve the objectives, several methods are used. These include data pre-processing, feature selection and balancing the distribution of classes, developing models with machine learning algorithms, validating the models against unknown observations and finally evaluating and ranking in order of importance the variables leading to the generation of the models. Finally, the results of the analysis, conclusions, limitations and possible extensions for research are presented. At the end of each part, the relevant literature is listed.
Institution and School/Department of submitter: Σχολή Οικονομίας και Διοίκησης - Τμήμα Λογιστικής και Πληροφοριακών Συστημάτων
Keywords: Μηχανική μάθηση;Κανονιστική συμμόρφωση;Fraud analytics;AML
Description: Μεταπτυχιακή εργασία - Σχολή Οικονομίας και Διοίκησης - Τμήμα Λογιστικής και Πληροφοριακών Συστημάτων, 2023 (α/α 14159)
URI: http://195.251.240.227/jspui/handle/123456789/16625
Item type: masterThesis
General Description / Additional Comments: Μεταπτυχιακή Εργασία
Submission Date: 2024-06-05T11:23:51Z
Item language: el
Item access scheme: free
Institution and School/Department of submitter: Σχολή Οικονομίας και Διοίκησης - Τμήμα Λογιστικής και Πληροφοριακών Συστημάτων
Publication date: 2023-09
Bibliographic citation: Ντζαβίδα, Σ. (2023) Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων από τα Χρηματοπιστωτικά Ιδρύματα για την Πρόληψη του Οικονομικού Εγκλήματος (Μεταπτυχιακή εργασία). ΔΙΠΑΕ
Abstract: Η παρούσα εργασία αφορά στην εφαρμογή των πιο εξελιγμένων μεθόδων εξόρυξης γνώσης σε ένα πραγματικό σύνολο δεδομένων προκειμένου να ανιχνευτεί πιθανή απάτη κατά το άνοιγμα ενός τραπεζικού λογαριασμού. Η συμβολή της παρούσας εργασίας επικεντρώνεται σε δύο τομείς. Πρώτον, επιχειρεί να αναδειχθούν οι ισχυρότερες μεταβλητές που αποτελούν σημαντικές ενδείξεις για πιθανή διάπραξη δόλιων συναλλαγών. Ο εντοπισμός, ιεράρχηση κατά σπουδαιότητα και αξιολόγηση αυτών των μεταβλητών αποτελεί σημαντικό κριτήριο για την αποδοχή ή μη των εν δυνάμει πελατών από ένα χρηματοπιστωτικό ίδρυμα. Δεύτερον, προτείνει τη δημιουργία αξιόπιστων μοντέλων που να μπορούν να προβλέπουν με υψηλή ακρίβεια την πλειονότητα μελλοντικών περιπτώσεων. Η εργασία οργανώνεται σε τρία μέρη. Το πρώτο μέρος παρουσιάζει τον ρόλο των πιστωτικών ιδρυμάτων και ιδιαίτερα την λειτουργία της μονάδας Κανονιστικής Συμμόρφωσης στον αγώνα για την καταπολέμηση του οικονομικού εγκλήματος. Αναλύεται η βασική αρχή Know Your Customer και το θεσμικό-νομικό πλαίσιο που ισχύει σήμερα στην Ελλάδα. Παρατίθεται ο ορισμός για το Ξέπλυμα Βρώμικου Χρήματος και περιγράφεται ο κύκλος ενός συστήματος νομιμοποίησής του. Τέλος αναφέρονται οι κυριότερες τεχνολογίες ανάλυσης δεδομένων που χρησιμοποιούνται σήμερα για την καταπολέμηση της απάτης καθώς και βέλτιστες πρακτικές που έχουν προταθεί προς υιοθέτηση στο μέλλον. Στο δεύτερο μέρος περιγράφονται τα στάδια Ανακάλυψης Γνώσης, οι τέσσερις κατηγορίες μηχανικής μάθησης καθώς και οι σημαντικότερες μέθοδοι επιβλεπόμενης μάθησης. Εκτενής αναφορά γίνεται στο ειδικό θέμα της ανισοκατανομής των κλάσεων, του κόστους σφάλματος και της μέτρησης της απόδοσης των ταξινομητών. Το τρίτο μέρος παρέχει τη μεθοδολογία της παρούσας εργασίας. Για την επίτευξη των στόχων, χρησιμοποιούνται διάφορες μέθοδοι. Αυτές περιλαμβάνουν την προεπεξεργασία των δεδομένων, την επιλογή χαρακτηριστικών και την εξισορρόπηση της κατανομής των κλάσεων, την ανάπτυξη μοντέλων με αλγορίθμους μηχανικής μάθησης, την επικύρωση των μοντέλων έναντι άγνωστων παρατηρήσεων και τέλος την ταξινόμηση κατά σειρά σημαντικότητας των μεταβλητών που οδηγούν στην παραγωγή των προτύπων. Τέλος παρουσιάζονται τα αποτελέσματα της ανάλυσης, τα συμπεράσματα, οι περιορισμοί και πιθανές επεκτάσεις για έρευνα. Στο τέλος κάθε μέρους παρατίθεται η σχετική βιβλιογραφία.
This paper is about applying the most sophisticated data mining methods to a real dataset in order to detect possible fraud when opening a bank account. The contribution of this paper focuses on two areas. First, it attempts to highlight the strongest variables that are important indicators of possible fraudulent transactions. The identification, ranking by importance and evaluation of these variables is an important criterion for the acceptance or not of potential customers by a financial institution. Secondly, it suggests the creation of reliable models that can predict with high accuracy the majority of future cases. The paper is organized in three parts. The first part presents the role of financial institutions and in particular the function of the Compliance Unit in the fight against financial crime. It analyses the basic Know Your Customer principle and the institutional-legal framework currently in force in Greece. The definition of Money Laundering is given and the cycle of a money laundering scheme is described. Finally, the main data analysis technologies currently used to combat fraud are mentioned, as well as best practices that have been proposed for adoption in the future. The second part describes the stages of Knowledge Discovery, the four categories of Machine Learning and the most important supervised learning methods. Extensive reference is made to the specific topic of class imbalance, Cost Sensitive Learning and Performance Metrics of classifiers. The third part provides the methodology of this paper. To achieve the objectives, several methods are used. These include data pre-processing, feature selection and balancing the distribution of classes, developing models with machine learning algorithms, validating the models against unknown observations and finally evaluating and ranking in order of importance the variables leading to the generation of the models. Finally, the results of the analysis, conclusions, limitations and possible extensions for research are presented. At the end of each part, the relevant literature is listed.
Advisor name: Κύρκος, Ευστάθιος
Examining committee: Κύρκος, Ευστάθιος
Publishing department/division: Σχολή Οικονομίας και Διοίκησης - Τμήμα Λογιστικής και Πληροφοριακών Συστημάτων
Publishing institution: ihu
Number of pages: 77 σελ.
Appears in Collections:Μεταπτυχιακές Διατριβές

Files in This Item:
File Description SizeFormat 
ΝΤΖΑΒΙΔΑ ΣΤΕΛΛΑ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ.pdfΜεταπτυχιακή εργασία 2.28 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/16625
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.