Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας (Master thesis)
Καμπατζής, Αριστοτέλης/ Σαρόγλου, Στυλιανός
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Καμπατζής, Αριστοτέλης | el |
dc.contributor.author | Σαρόγλου, Στυλιανός | el |
dc.date.accessioned | 2024-08-26T22:38:52Z | - |
dc.date.available | 2024-08-26T22:38:52Z | - |
dc.identifier.uri | http://195.251.240.227/jspui/handle/123456789/16855 | - |
dc.description | Μεταπτυχιακή εργασία - Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, 2023 (α/α 14053) | el |
dc.rights | Default License | - |
dc.subject | Επεξεργασία φυσικής γλώσσας | el |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Βαθιά μάθηση | el |
dc.subject | Twitter API | en |
dc.subject | NLP | en |
dc.subject | Machine learning | en |
dc.subject | Deep learning | en |
dc.subject | BERT | en |
dc.subject | RoBERTa | en |
dc.subject | DistilBERT | en |
dc.subject | GPT-2 | en |
dc.subject | TF-IDF | en |
dc.subject | Word2Vec | en |
dc.subject | Transformers | en |
dc.subject | TensorFlow | en |
dc.subject | PyTorch | en |
dc.subject | Keras | en |
dc.subject | Scikit learn | en |
dc.title | Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας | el |
heal.type | masterThesis | - |
heal.type.en | Master thesis | en |
heal.generalDescription | Μεταπτυχιακή εργασία | el |
heal.classification | Εξόρυξη δεδομένων | el |
heal.classification | Βαθιά μάθηση (Μηχανική μάθηση) | el |
heal.classification | Ανάλυση συναισθήματος | el |
heal.classification | Επεξεργασία φυσικής γλώσσας (Πληροφορική) | el |
heal.classification | Data mining | en |
heal.classification | Deep learning (Machine learning) | en |
heal.classification | Sentiment analysis | en |
heal.classification | Natural language processing (Computer science) | en |
heal.identifier.secondary | 14053 | - |
heal.dateAvailable | 2024-08-26T22:39:52Z | - |
heal.language | el | - |
heal.access | free | - |
heal.recordProvider | Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων | el |
heal.publicationDate | 2023-07-11 | - |
heal.bibliographicCitation | Καμπατζής, Α. & Σαρόγλου Σ. Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας, (Μεταπτυχιακή εργασία), ΔΙ.ΠΑ.Ε. | el |
heal.abstract | Η εξόρυξη πληροφορίας και η ανάλυση συναισθημάτων σε κείμενα, είναι δύο σημαντικά πεδία στην επιστήμη της πληροφορικής και της τεχνητής νοημοσύνης. Αποτελούν ένα σημαντικό εργαλείο για την κατανόηση των στάσεων και των απόψεων που εκφράζονται σε κοινωνικά δίκτυα όπως το Twitter. Η χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας επιτρέπει την αυτόματη ανάλυση του περιεχομένου κειμένων και την εξαγωγή σημαντικών πληροφοριών από αυτά, προσφέροντας παράλληλα ακρίβεια και ευκολία στην εξαγωγή συμπερασμάτων. Στην παρούσα εργασία, αξιοποιούμε την χρήση του Twitter API για την συλλογή δεδομένων από το Twitter, σε συνδυασμό με την χρήση μεθόδων επεξεργασίας φυσικής γλώσσας (NLP). Ειδικότερα, χρησιμοποιούμε μοντέλα μηχανικής μάθησης της βιβλιοθήκης Scikit-learn, καθώς και πιο μοντέρνα μοντέλα όπως τα BERT, RoBERTa, DistilBERT και GPT-2 με σκοπό την αναγνώριση συναισθημάτων σε κείμενα (tweets) του κοινωνικού δικτύου Twitter, καθώς και σε κριτικές καταστημάτων που περιέχονται σε σύνολο δεδομένων της διαδικτυακής υπηρεσίας Skroutz. Σύμφωνα με τα πειράματά μας, τα μοντέλα που σημειώνουν την καλύτερη απόδοση όσον αφορά την ακρίβεια (accuracy) πρόβλεψης σε νέα δεδομένα, είναι το BERT και το SVM σε συνδυασμό με την κωδικοποίηση TF-IDF. | el |
heal.abstract | Data Mining and Sentiment Analysis in texts are two important fields in Computer Science and Artificial Intelligence. They are a valuable tool for understanding attitudes and opinions expressed on social networks, such as Twitter. The use of Machine Learning methods and modern Natural Language Processing models allows for the automatic analysis of text content and the extraction of important information, while also offering, accuracy and convenience in drawing conclusions. In this paper, we utilize the Twitter API for data collection from Twitter, in combination with Natural Language Processing (NLP) methods. Specifically, we use Machine Learning models from the Scikit-learn library, as well as more modern models, such as BERT, RoBERTa, DistilBERT, and GPT-2, with the aim of identifying sentiment in text from the Twitter social network, as well as in reviews of stores contained in a specific dataset from the Skroutz.gr online service. According to our experiments, the models that show the best performance in terms of accuracy for predicting on new data, are BERT and SVM combined with the TF-IDF encoding. | en |
heal.advisorName | Διαμαντάρας, Κωνσταντίνος | el |
heal.committeeMemberName | Διαμαντάρας, Κωνσταντίνος | el |
heal.academicPublisher | Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων | el |
heal.academicPublisherID | ihu | - |
heal.numberOfPages | 228 | - |
heal.fullTextAvailability | true | - |
heal.type.el | Μεταπτυχιακή εργασία | el |
Appears in Collections: | Μεταπτυχιακές Διατριβές |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Kabatzis, Saroglou.pdf | 5.04 MB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/16855
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.