Ανάλυση συναισθήματος κριτικών προϊόντων με μεθόδους μηχανικής μάθησης σύμφωνα με τα κυριότερα χαρακτηριστικά τους (Master thesis)
Ζαΐμη, Ασημίνα
With the growing use of the World Wide Web, user-generated content (UGC) isinductively increased, which has been proven to have a significant impact on people'severyday lives, that is why making its effective analysis vital, with a keen interest in thescientific, industrial and even political community. In cases where the content to beanalyzed in terms of its opinion is in the form of text, the concept of Sentiment Analysis ofthe Natural Language Processing (NLP) field is introduced, which aims at the automaticrecognition of subjective information from written sources. In this diploma thesis, SentimentAnalysis is described as a challenging problem and its solution is investigated throughMachine Learning methods, applied to product reviews. Therefore, the problem is treated asa problem of classifying product reviews texts in an emotional class, focusing on theproduct attributes for which the reviewer is expressed. Approach to such problems is thefield that we examine and it is usually implemented at the sentence or aspect level, and theanalysis of this level is referred to as an Aspect Based Sentiment Analysis (ABSA) aimed atboth identifying the aspects (product attributes) in the sentence, as well as the sentimentthey carry. We identify the difficulties of solving such problems and possible MachineLearning algorithms as solutions, as the comprehensive problem solving process isdescribed step by step. Finally, we present a large number of related work that attempted toresolve this problem by quoting a subjective comparison with important observations. Oneof the remarks and the final conclusion of this diploma is that none implemented ABSAsystem has succeeded in solving the problem altogether, a fact that discovers the adversityof managing the natural language
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής |
Keywords: | ανάλυση συναισθήματος;μηχανική μάθηση;ανάλυση συναισθήματος βασισμένη στις λέξεις – κλειδιά;ανάλυση συναισθήματος σε κριτικές προϊóντων;ανάλυση συναισθήματος σε επίπεδο πρóτασης;εξóρυξη γνώμης;sentiment analysis;machine learning;aspect based sentiment analysis;sentiment analysis on product reviews;sentence level sentiment analysis |
Description: | Μεταπτυχιακή εργασία--ΣΤΕΦ-Τμήμα Μηχανικών Πληροφορικής, 2018—10032 |
URI: | http://195.251.240.227/jspui/handle/123456789/11917 |
Item type: | masterThesis |
Name(s) of contributor(s): | Ζαΐμη, Ασημίνα |
Submission Date: | 2020-04-30T23:43:59Z |
Item language: | el |
Item access scheme: | free |
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής |
Publication date: | 2018-09-19 |
Bibliographic citation: | Ζαΐμη, Α. (2018). Ανάλυση συναισθήματος κριτικών προϊόντων με μεθόδους μηχανικής μάθησης σύμφωνα με τα κυριότερα χαρακτηριστικά τους (Μεταπτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ, Θεσσαλονίκη. |
Abstract: | Με την ολοένα και αυξανóμενη ανάπτυξη χρήσης του Παγκοσμίου Ιστού (WorldWide Web) αυξάνεται επαγωγικά και το περιεχóμενο που παράγεται απó τους χρήστες του(User Generated Content - UGC), το οποίο έχει αποδειχθεί πολλάκις óτι επηρεάζει σε σημαντικó βαθμó την καθημερινóτητα των ανθρώπων, γεγονóς που καθιστά την αποτελεσματική ανάλυση αυτού του περιεχομένου ζωτικής σημασίας, με έντονο ενδιαφέρον της επιστημονικής, βιομηχανικής ακóμη και πολιτικής κοινóτητας. Στιςπεριπτώσεις που το περιεχóμενο προς ανάλυση ως προς την γνώμη που εκφέρει εντοπίζεταιμε την μορφή κειμένου, εισχωρείται η έννοια της Ανάλυσης Συναισθήματος (SentimentAnalysis) του πεδίου της Επεξεργασίας Φυσικής Γλώσσας (Natural Language Processing -NLP), η οποία αποσκοπεί στην αυτóματη αναγνώριση υποκειμενικής πληροφορίας απóγραπτές πηγές. Στην παρούσα διπλωματική εργασία αποσαφηνίζεται η Ανάλυση Συναισθήματος ως ένα προκλητικó πρóβλημα και ερευνάται η επίλυσή του με μεθóδους Μηχανικής Μάθησης (Machine Learning), εφαρμοσμένες πάνω σε κριτικές προϊóντων. Επομένως, το πρóβλημα αντιμετωπίζεται ως πρóβλημα ταξινóμησης κειμένων κριτικών προϊóντων σε κάποια συναισθηματική κλάση, εστιάζοντας στα χαρακτηριστικά γνωρίσματα του προϊóντος για τα οποία εκφράζεται ο σχολιαστής. Η προσέγγιση σε τέτοιου είδους προβλήματα είναι το πεδίο που εξετάζουμε και συνήθως υλοποιείται σε επίπεδο πρóτασης ή λέξης και η ανάλυση αυτού του επιπέδου αναφέρεται σαν Ανάλυση Συναισθήματος βασισμένη σε λέξεις - κλειδιά (Aspect Based Sentiment Analysis - ABSA) που έχει ως στóχο τóσο τον εντοπισμó των λέξεων – κλειδιών της πρóτασης (χαρακτηριστικά γνωρίσματα προϊóντος), óσο και την αποτίμηση του συναισθήματος που φέρουν.Επισημαίνονται οι δυσκολίες επίλυσης του προβλήματος και πιθανοί αλγóριθμοι Μηχανικής Μάθησης ως λύσεις σε αυτές, καθώς περιγράφεται βηματικά η ολοκληρωμένη διαδικασία επίλυσης του προβλήματος. Στο τέλος παρουσιάζουμε μεγάλο αριθμó σχετικών εργασιών που επιχείρησαν να επιλύσουν το εν λóγω πρóβλημα, παραθέτοντας μια υποκειμενική σύγκριση με σημαντικές παρατηρήσεις. Μία απó τις παρατηρήσεις που καθορίζεται και το τελικó συμπέρασμα της διπλωματικής αυτής είναι óτι κανένα υλοποιημένο σύστημα της ABSA δεν έχει καταφέρει να επιλύσει εξολοκλήρου το πρóβλημα, γεγονóς που διαλευκαίνει την αντιξοóτητα διαχείρισης της φυσικής γλώσσας With the growing use of the World Wide Web, user-generated content (UGC) isinductively increased, which has been proven to have a significant impact on people'severyday lives, that is why making its effective analysis vital, with a keen interest in thescientific, industrial and even political community. In cases where the content to beanalyzed in terms of its opinion is in the form of text, the concept of Sentiment Analysis ofthe Natural Language Processing (NLP) field is introduced, which aims at the automaticrecognition of subjective information from written sources. In this diploma thesis, SentimentAnalysis is described as a challenging problem and its solution is investigated throughMachine Learning methods, applied to product reviews. Therefore, the problem is treated asa problem of classifying product reviews texts in an emotional class, focusing on theproduct attributes for which the reviewer is expressed. Approach to such problems is thefield that we examine and it is usually implemented at the sentence or aspect level, and theanalysis of this level is referred to as an Aspect Based Sentiment Analysis (ABSA) aimed atboth identifying the aspects (product attributes) in the sentence, as well as the sentimentthey carry. We identify the difficulties of solving such problems and possible MachineLearning algorithms as solutions, as the comprehensive problem solving process isdescribed step by step. Finally, we present a large number of related work that attempted toresolve this problem by quoting a subjective comparison with important observations. Oneof the remarks and the final conclusion of this diploma is that none implemented ABSAsystem has succeeded in solving the problem altogether, a fact that discovers the adversityof managing the natural language |
Advisor name: | Γουλιάνας, Κωνσταντίνος |
Examining committee: | Γουλιάνας, Κωνσταντίνος |
Publishing department/division: | Τμήμα Μηχανικών Πληροφορικής |
Publishing institution: | teithe |
Number of pages: | 133 |
Appears in Collections: | Μεταπτυχιακές Διατριβές |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/11917
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.