Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας

Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας (Master thesis)

Καμπατζής, Αριστοτέλης/ Σαρόγλου, Στυλιανός

Full metadata record

DC Field	Value	Language
dc.contributor.author	Καμπατζής, Αριστοτέλης	el
dc.contributor.author	Σαρόγλου, Στυλιανός	el
dc.date.accessioned	2024-08-26T22:38:52Z	-
dc.date.available	2024-08-26T22:38:52Z	-
dc.identifier.uri	http://195.251.240.227/jspui/handle/123456789/16855	-
dc.description	Μεταπτυχιακή εργασία - Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, 2023 (α/α 14053)	el
dc.rights	Default License	-
dc.subject	Επεξεργασία φυσικής γλώσσας	el
dc.subject	Μηχανική μάθηση	el
dc.subject	Βαθιά μάθηση	el
dc.subject	Twitter API	en
dc.subject	NLP	en
dc.subject	Machine learning	en
dc.subject	Deep learning	en
dc.subject	BERT	en
dc.subject	RoBERTa	en
dc.subject	DistilBERT	en
dc.subject	GPT-2	en
dc.subject	TF-IDF	en
dc.subject	Word2Vec	en
dc.subject	Transformers	en
dc.subject	TensorFlow	en
dc.subject	PyTorch	en
dc.subject	Keras	en
dc.subject	Scikit learn	en
dc.title	Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας	el
heal.type	masterThesis	-
heal.type.en	Master thesis	en
heal.generalDescription	Μεταπτυχιακή εργασία	el
heal.classification	Εξόρυξη δεδομένων	el
heal.classification	Βαθιά μάθηση (Μηχανική μάθηση)	el
heal.classification	Ανάλυση συναισθήματος	el
heal.classification	Επεξεργασία φυσικής γλώσσας (Πληροφορική)	el
heal.classification	Data mining	en
heal.classification	Deep learning (Machine learning)	en
heal.classification	Sentiment analysis	en
heal.classification	Natural language processing (Computer science)	en
heal.identifier.secondary	14053	-
heal.dateAvailable	2024-08-26T22:39:52Z	-
heal.language	el	-
heal.access	free	-
heal.recordProvider	Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων	el
heal.publicationDate	2023-07-11	-
heal.bibliographicCitation	Καμπατζής, Α. & Σαρόγλου Σ. Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας, (Μεταπτυχιακή εργασία), ΔΙ.ΠΑ.Ε.	el
heal.abstract	Η εξόρυξη πληροφορίας και η ανάλυση συναισθημάτων σε κείμενα, είναι δύο σημαντικά πεδία στην επιστήμη της πληροφορικής και της τεχνητής νοημοσύνης. Αποτελούν ένα σημαντικό εργαλείο για την κατανόηση των στάσεων και των απόψεων που εκφράζονται σε κοινωνικά δίκτυα όπως το Twitter. Η χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας επιτρέπει την αυτόματη ανάλυση του περιεχομένου κειμένων και την εξαγωγή σημαντικών πληροφοριών από αυτά, προσφέροντας παράλληλα ακρίβεια και ευκολία στην εξαγωγή συμπερασμάτων. Στην παρούσα εργασία, αξιοποιούμε την χρήση του Twitter API για την συλλογή δεδομένων από το Twitter, σε συνδυασμό με την χρήση μεθόδων επεξεργασίας φυσικής γλώσσας (NLP). Ειδικότερα, χρησιμοποιούμε μοντέλα μηχανικής μάθησης της βιβλιοθήκης Scikit-learn, καθώς και πιο μοντέρνα μοντέλα όπως τα BERT, RoBERTa, DistilBERT και GPT-2 με σκοπό την αναγνώριση συναισθημάτων σε κείμενα (tweets) του κοινωνικού δικτύου Twitter, καθώς και σε κριτικές καταστημάτων που περιέχονται σε σύνολο δεδομένων της διαδικτυακής υπηρεσίας Skroutz. Σύμφωνα με τα πειράματά μας, τα μοντέλα που σημειώνουν την καλύτερη απόδοση όσον αφορά την ακρίβεια (accuracy) πρόβλεψης σε νέα δεδομένα, είναι το BERT και το SVM σε συνδυασμό με την κωδικοποίηση TF-IDF.	el
heal.abstract	Data Mining and Sentiment Analysis in texts are two important fields in Computer Science and Artificial Intelligence. They are a valuable tool for understanding attitudes and opinions expressed on social networks, such as Twitter. The use of Machine Learning methods and modern Natural Language Processing models allows for the automatic analysis of text content and the extraction of important information, while also offering, accuracy and convenience in drawing conclusions. In this paper, we utilize the Twitter API for data collection from Twitter, in combination with Natural Language Processing (NLP) methods. Specifically, we use Machine Learning models from the Scikit-learn library, as well as more modern models, such as BERT, RoBERTa, DistilBERT, and GPT-2, with the aim of identifying sentiment in text from the Twitter social network, as well as in reviews of stores contained in a specific dataset from the Skroutz.gr online service. According to our experiments, the models that show the best performance in terms of accuracy for predicting on new data, are BERT and SVM combined with the TF-IDF encoding.	en
heal.advisorName	Διαμαντάρας, Κωνσταντίνος	el
heal.committeeMemberName	Διαμαντάρας, Κωνσταντίνος	el
heal.academicPublisher	Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων	el
heal.academicPublisherID	ihu	-
heal.numberOfPages	228	-
heal.fullTextAvailability	true	-
heal.type.el	Μεταπτυχιακή εργασία	el
Appears in Collections:	Μεταπτυχιακές Διατριβές

Files in This Item:

File	Description	Size	Format
Kabatzis, Saroglou.pdf		5.04 MB	Adobe PDF	View/Open

Show simple item record

Please use this identifier to cite or link to this item:

http://195.251.240.227/jspui/handle/123456789/16855

This item is a favorite for 0 people.

Add to favorites

Eureka! Institutional Repository

Εξόρυξη πληροφορίας και ανάλυση συναισθήματος με χρήση μεθόδων μηχανικής μάθησης και σύγχρονων μοντέλων επεξεργασίας φυσικής γλώσσας (Master thesis)

Καμπατζής, Αριστοτέλης/ Σαρόγλου, Στυλιανός