Ανάπτυξη εργαλείων για αυτόματη εκτίμηση διάθεσης Ελληνικών κειμένων με χρήση Ημι-Επιβλεπόμενων Αναδρομικών Αυτοσυσχετιστών (Master thesis)
Κοτρότσιος, Κωνσταντίνος
In this master thesis our goal is to develop tools in order to be used in sentiment
analysis applications for texts in Greek language. We have developed a Greek language
dictionary using MySQL and MongoDB database systems, which contains words in
different numbers, genders, tenses etc. A dataset, from users’ opinions about technology
products characterized according to sentiment, has been developed. Two applications, one
for automatic spelling correction and another for lemmatization have also been developed.
A framework of semi-supervised recursive autoencoders, which are trained in vector space
representations for multi-word phrases, is used. These representations in automatic
assessment of text provision outperform other state-of–the-art approaches on commonly
used datasets. This model is applied in on our users’ opinions dataset and the results were
examined to see how they were affected by using our tools use, are tested. Using these tools
for the pretreatment of the dataset, we have improved the results up to 24%.
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής |
Keywords: | Αυτόματη εκτίμηση διάθεσης;Ημι-Επιβλεπόμενοι αναδρομικοι αυτοσυσχετιστές;Βαθιά μάθηση;Λημματοποίηση;Sentiment Analysis;Semi-supervised Recursive Autoencoders;Deep Learning;Lemmatization |
Description: | Μεταπτυχιακή Εργασία -- Σχολή Τεχνολογικών Εφαρμογών -- Τμήμα Μηχανικών Πληροφορικής, 2015 (α/α 6977) |
URI: | http://195.251.240.227/jspui/handle/123456789/13687 |
Item type: | masterThesis |
General Description / Additional Comments: | Μεταπτυχιακή εργασία -- ΠΜΣ "Ευφυείς Τεχνολογίες Διαδικτύου - Web Intelligence" |
Submission Date: | 2021-12-13T16:02:40Z |
Item language: | el |
Item access scheme: | free |
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής |
Publication date: | 2015-07-01 |
Bibliographic citation: | Κοτρότσιος, Κ. (2015). Ανάπτυξη εργαλείων για αυτόματη εκτίμηση διάθεσης Ελληνικών κειμένων με χρήση Ημι-Επιβλεπόμενων Αναδρομικών Αυτοσυσχετιστών (Μεταπτυχιακή εργασία).Αλεξάνδρειο ΤΕΙ Θεσσαλονίκης |
Abstract: | Στην παρούσα μεταπτυχιακή διπλωματική εργασία αναπτύσσονται εργαλεία με σκοπό να χρησιμοποιηθούν σε εφαρμογές αυτόματης εκτίμησης διάθεσης κειμένων στην Ελληνική γλώσσα. Κατασκευάζεται εργαλείο λεξικού της ελληνικής γλώσσας για βάσεις δεδομένων
MySQL και Μongodb, το οποίο περιέχει τις λέξεις σε διαφορετικές πτώσεις, αριθμούς, γένη, χρόνους κτλ. Δημιουργείται συλλογή κειμένων από σχόλια χρηστών για προϊόντα τεχνολογίας χαρακτηρισμένα ως προς το συναίσθημα. Αναπτύσσονται εφαρμογές για
αυτόματη διόρθωση ορθογραφικών λαθών και λημματοποίησης κειμένων. Γίνεται χρήση μοντέλου ημι-επιβλεπόμενων αναδρομικών αυτοσυσχετιστών, οι οποίοι εκπαιδεύονται να
αναπαριστούν τις προτάσεις σε διανυσματικούς χώρους. Η συγκεκριμένη μέθοδος στην
αυτόματη εκτίμηση διάθεσης κειμένων έχει υψηλότερες επιδόσεις από άλλες προσεγγίσεις σε ευρέως χρησιμοποιημένες συλλογές. Το μοντέλο εφαρμόζεται στην συλλογή σχολίων που αναπτύξαμε και εξετάζονται τα αποτελέσματα και το πως αυτά επηρεάστηκαν από την
εφαρμογή των εργαλείων μας. Με την χρήση των εργαλείων για την προ επεξεργασία των σχολίων βελτιώσαμε τα αποτελέσματα μέχρι και 24% . In this master thesis our goal is to develop tools in order to be used in sentiment analysis applications for texts in Greek language. We have developed a Greek language dictionary using MySQL and MongoDB database systems, which contains words in different numbers, genders, tenses etc. A dataset, from users’ opinions about technology products characterized according to sentiment, has been developed. Two applications, one for automatic spelling correction and another for lemmatization have also been developed. A framework of semi-supervised recursive autoencoders, which are trained in vector space representations for multi-word phrases, is used. These representations in automatic assessment of text provision outperform other state-of–the-art approaches on commonly used datasets. This model is applied in on our users’ opinions dataset and the results were examined to see how they were affected by using our tools use, are tested. Using these tools for the pretreatment of the dataset, we have improved the results up to 24%. |
Advisor name: | Διαμαντάρας, Κωνσταντίνος |
Examining committee: | Διαμαντάρας, Κωνσταντίνος |
Publishing department/division: | Τμήμα Μηχανικών Πληροφορικής |
Publishing institution: | teithe |
Number of pages: | 104 |
Appears in Collections: | Μεταπτυχιακές Διατριβές |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Kotrotsios_Konstantinos.pdf | 2.45 MB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/13687
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.