Ανάλυση της συσχέτισης γονιδίων με τον καρκίνο του ήπατος χρησιμοποιώντας μεθόδους Μηχανικής Μάθησης (Master thesis)
Κουρουπέτρογλου, Άγγελος
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Κουρουπέτρογλου, Άγγελος | el |
dc.date.accessioned | 2020-04-30T23:59:02Z | - |
dc.date.available | 2020-04-30T23:59:02Z | - |
dc.identifier.uri | http://195.251.240.227/jspui/handle/123456789/11918 | - |
dc.description | Μεταπτυχιακή εργασία--ΣΤΕΦ-Τμήμα Μηχανικών Πληροφορικής, 2018—10031 | el |
dc.rights | Default License | - |
dc.subject | Μηχανική Μάθηση | el |
dc.subject | μέθοδοι μείωσης διαστάσεων | el |
dc.subject | PCA | en |
dc.subject | fisher score | en |
dc.subject | mutual information | en |
dc.subject | kolmogorov-smirnov 2 samples | en |
dc.subject | ReliefF | en |
dc.subject | mRMR MIQ | en |
dc.subject | SVM | en |
dc.subject | καρκίνος του ήπατος | el |
dc.subject | γονίδια | el |
dc.subject | αλληλούχιση RNA (RNA-seq) | el |
dc.subject | επιλογή γονιδίων | el |
dc.subject | Machine Learning | en |
dc.subject | dimensionality reduction | en |
dc.subject | liver cancer | en |
dc.subject | genes | en |
dc.subject | RNA-seq expression | en |
dc.subject | gene selection | en |
dc.subject.lcsh | Ήπαρ -- Καρκίνος | el |
dc.subject.lcsh | Μηχανική μάθηση | el |
dc.subject.lcsh | Τεχνητή νοημοσύνη | el |
dc.subject.lcsh | Όραση μέσω υπολογιστή | el |
dc.title | Ανάλυση της συσχέτισης γονιδίων με τον καρκίνο του ήπατος χρησιμοποιώντας μεθόδους Μηχανικής Μάθησης | el |
heal.type | masterThesis | - |
heal.type.en | Master thesis | en |
heal.contributorName | Κουρουπέτρογλου, Άγγελος | el |
heal.identifier.secondary | 10031 | - |
heal.dateAvailable | 2020-05-01T00:00:03Z | - |
heal.language | el | - |
heal.access | free | - |
heal.recordProvider | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής | el |
heal.publicationDate | 2018-09-19 | - |
heal.bibliographicCitation | Κουρουπέτρογλου, Α. (2018). Ανάλυση της συσχέτισης γονιδίων με τον καρκίνο του ήπατος χρησιμοποιώντας μεθόδους Μηχανικής Μάθησης (Μεταπτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ, Θεσσαλονίκη. | el |
heal.abstract | Σκοπός της παρούσας διπλωματικής εργασίας είναι ο εντοπισμός ενός μικρού αριθμού γονιδίων, με την χρήση μεθόδων Μηχανικής Μάθησης, τα οποία περιέχουν ικανή πληροφορία για την κατασκευή ενός ταξινομητή που θα διαθέτει την ικανότητα της γενίκευσης. Το σύνολο δεδομένων που εξετάσαμε αφορά τον καρκίνο του ήπατος και προέρχεται από την βάση δεδομένων του TCGA (The Cancer Genome Atlas). Οι μεταβλητές στόχοι είναι ο βαθμός του καρκίνου του ήπατος (Grades) και το στάδιο του καρκίνου του ήπατος (Stages). Οι τιμές των γονιδίων αποτελούν τιμές έκφρασης μετασχηματισμένες από αλληλούχιση RNA (RNA-seq). Αρχικά, με την χρήση των μεθόδων μείωσης διαστάσεων PCA, Fisher Score, Mutual Information, Kolmogorov Smirnov 2 Samples, ReliefF και mRMR MIQ αξιολογήσαμε τα γονίδια και τα ταξινομήσαμε βάση της σημαντικότητάς τους. Έπειτα, επιλέξαμε τα πρώτα 500 σημαντικά γονίδια της κάθε μεθόδου αξιολόγησης χαρακτηριστικών. Χρησιμοποιώντας τα πρώτα 10 σημαντικά γονίδια εκτελέσαμε εξαντλητική αναζήτηση (Grid Search) με χρήση των εκτιμητών SVM Linear και SVM RBF για την εύρεση των παραμέτρων που ο κάθε ταξινομητής πετυχαίνει την καλύτερη τιμή μέσης ακρίβειας (20 Fold Cross Validation). Στην συνέχεια επαναλάβαμε την παραπάνω διαδικασία προσθέτοντας κάθε φορά τα επόμενα 10 σημαντικά γονίδια έως και τα 500. Η ίδια διαδικασία ακολουθήθηκε και για τον έλεγχο όλων των υποσυνόλων τομών και ενώσεων που προκύπτουν από τον συνδυασμό σε ζεύγη όλων των μεθόδων επιλογής χαρακτηριστικών. Τα αποτελέσματα των πειραμάτων έδειξαν ότι το κριτήριο mRMR MIQ υπερέχει των υπόλοιπων κριτηρίων αξιολόγησης που εξετάσαμε. Σε σχέση και με τις δύο μεταβλητές στόχους, το κριτήριο mRMR MIQ κατάφερε να εντοπίσει τον αντίστοιχο μικρότερο αριθμό σημαντικών γονιδίων (χαρακτηριστικών) τα οποία περιέχουν πληροφορία ικανή για την κατασκευή ενός ταξινομητή SVM RBF ο οποίος διαθέτει καλύτερη ικανότητα γενίκευσης έναντι άλλων υποσυνόλων σημαντικών γονιδίων που προήλθαν από τα υπόλοιπα κριτήρια αξιολόγησης που εξετάσαμε | el |
heal.abstract | The purpose of this thesis is to identify a small number of genes using Machine Learning methods, which contain sufficient information for the construction of a classifier capable of generalization. The dataset we examined concerns liver cancer and is from the TCGA database (The Cancer Genome Atlas). The target variables were the grade (Grades) and the stage of liver cancer (Stages). Gene expression data are transformed by RNA sequencing (RNA-seq). Initially, using the dimensional reduction methods PCA, Fisher Score, Mutual Information, Kolmogorov Smirnov 2 Samples, ReliefF, and mRMR MIQ, we evaluated the genes and ranked them based on their significance. Then, we chose the first 500 significant genes of each feature selection method and using the first 10 significant genes, we performed a Grid Search using the SVM Linear and SVM RBF classifiers to find the parameters that each classifier achieves the best mean accuracy value (20 Fold Cross Validation). We then repeated the above procedure by adding the next 10 significant genes each time up to 500. This process was also followed to examine the union and intersection subsets between all combinations of feature selection methods. The results of the experiments showed that the mRMR MIQ criterion is better than the other validation criteria we examined. With respect to both target variables, the mRMR MIQ criterion was able to identify the corresponding smaller number of significant genes that contain information capable of constructing an SVM RBF classifier that has the best generalization capability of all other subsets of important genes examined | en |
heal.advisorName | Διαμαντάρας, Κωνσταντίνος | el |
heal.committeeMemberName | Διαμαντάρας, Κωνσταντίνος | el |
heal.academicPublisher | Τμήμα Μηχανικών Πληροφορικής | el |
heal.academicPublisherID | teithe | - |
heal.numberOfPages | 162 | - |
heal.fullTextAvailability | true | - |
heal.type.el | Μεταπτυχιακή εργασία | el |
Appears in Collections: | Μεταπτυχιακές Διατριβές |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Kouroupetroglou.pdf | 3.51 MB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/11918
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.