Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας (Master thesis)

Καμπατζής, Αριστοτέλης/ Σαρόγλου, Στυλιανός


Full metadata record
DC FieldValueLanguage
dc.contributor.authorΚαμπατζής, Αριστοτέληςel
dc.contributor.authorΣαρόγλου, Στυλιανόςel
dc.date.accessioned2024-08-26T22:38:52Z-
dc.date.available2024-08-26T22:38:52Z-
dc.identifier.urihttp://195.251.240.227/jspui/handle/123456789/16855-
dc.descriptionΜεταπτυχιακή εργασία - Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, 2023 (α/α 14053)el
dc.rightsDefault License-
dc.subjectΕπεξεργασία φυσικής γλώσσαςel
dc.subjectΜηχανική μάθησηel
dc.subjectΒαθιά μάθησηel
dc.subjectTwitter APIen
dc.subjectNLPen
dc.subjectMachine learningen
dc.subjectDeep learningen
dc.subjectBERTen
dc.subjectRoBERTaen
dc.subjectDistilBERTen
dc.subjectGPT-2en
dc.subjectTF-IDFen
dc.subjectWord2Vecen
dc.subjectTransformersen
dc.subjectTensorFlowen
dc.subjectPyTorchen
dc.subjectKerasen
dc.subjectScikit learnen
dc.titleΕξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσαςel
heal.typemasterThesis-
heal.type.enMaster thesisen
heal.generalDescriptionΜεταπτυχιακή εργασίαel
heal.classificationΕξόρυξη δεδομένωνel
heal.classificationΒαθιά μάθηση (Μηχανική μάθηση)el
heal.classificationΑνάλυση συναισθήματοςel
heal.classificationΕπεξεργασία φυσικής γλώσσας (Πληροφορική)el
heal.classificationData miningen
heal.classificationDeep learning (Machine learning)en
heal.classificationSentiment analysisen
heal.classificationNatural language processing (Computer science)en
heal.identifier.secondary14053-
heal.dateAvailable2024-08-26T22:39:52Z-
heal.languageel-
heal.accessfree-
heal.recordProviderΣχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτωνel
heal.publicationDate2023-07-11-
heal.bibliographicCitationΚαμπατζής, Α. & Σαρόγλου Σ. Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας, (Μεταπτυχιακή εργασία), ΔΙ.ΠΑ.Ε.el
heal.abstractΗ εξόρυξη πληροφορίας και η ανάλυση συναισθημάτων σε κείμενα, είναι δύο σημαντικά πεδία στην επιστήμη της πληροφορικής και της τεχνητής νοημοσύνης. Αποτελούν ένα σημαντικό εργαλείο για την κατανόηση των στάσεων και των απόψεων που εκφράζονται σε κοινωνικά δίκτυα όπως το Twitter. Η χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας επιτρέπει την αυτόματη ανάλυση του περιεχομένου κειμένων και την εξαγωγή σημαντικών πληροφοριών από αυτά, προσφέροντας παράλληλα ακρίβεια και ευκολία στην εξαγωγή συμπερασμάτων. Στην παρούσα εργασία, αξιοποιούμε την χρήση του Twitter API για την συλλογή δεδομένων από το Twitter, σε συνδυασμό με την χρήση μεθόδων επεξεργασίας φυσικής γλώσσας (NLP). Ειδικότερα, χρησιμοποιούμε μοντέλα μηχανικής μάθησης της βιβλιοθήκης Scikit-learn, καθώς και πιο μοντέρνα μοντέλα όπως τα BERT, RoBERTa, DistilBERT και GPT-2 με σκοπό την αναγνώριση συναισθημάτων σε κείμενα (tweets) του κοινωνικού δικτύου Twitter, καθώς και σε κριτικές καταστημάτων που περιέχονται σε σύνολο δεδομένων της διαδικτυακής υπηρεσίας Skroutz. Σύμφωνα με τα πειράματά μας, τα μοντέλα που σημειώνουν την καλύτερη απόδοση όσον αφορά την ακρίβεια (accuracy) πρόβλεψης σε νέα δεδομένα, είναι το BERT και το SVM σε συνδυασμό με την κωδικοποίηση TF-IDF.el
heal.abstractData Mining and Sentiment Analysis in texts are two important fields in Computer Science and Artificial Intelligence. They are a valuable tool for understanding attitudes and opinions expressed on social networks, such as Twitter. The use of Machine Learning methods and modern Natural Language Processing models allows for the automatic analysis of text content and the extraction of important information, while also offering, accuracy and convenience in drawing conclusions. In this paper, we utilize the Twitter API for data collection from Twitter, in combination with Natural Language Processing (NLP) methods. Specifically, we use Machine Learning models from the Scikit-learn library, as well as more modern models, such as BERT, RoBERTa, DistilBERT, and GPT-2, with the aim of identifying sentiment in text from the Twitter social network, as well as in reviews of stores contained in a specific dataset from the Skroutz.gr online service. According to our experiments, the models that show the best performance in terms of accuracy for predicting on new data, are BERT and SVM combined with the TF-IDF encoding.en
heal.advisorNameΔιαμαντάρας, Κωνσταντίνοςel
heal.committeeMemberNameΔιαμαντάρας, Κωνσταντίνοςel
heal.academicPublisherΣχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτωνel
heal.academicPublisherIDihu-
heal.numberOfPages228-
heal.fullTextAvailabilitytrue-
heal.type.elΜεταπτυχιακή εργασίαel
Appears in Collections:Μεταπτυχιακές Διατριβές

Files in This Item:
File Description SizeFormat 
Kabatzis, Saroglou.pdf5.04 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/16855
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.