Επεξεργασία φυσικής γλώσσας με τη πλατφόρμα Spacy (Natural language processcing using the spacy platform) (Bachelor thesis)

Παρταλίδου, Ελένη


This paper is an introduction to Natural Language Processing, in the modern form it holds by integrating statistical methods into its application fields, at the stages of information dissemination, and presents some difficulties that arise during its implementation. In addition, there is an analysis of how text data is represented by the computing systems and known text processing architectures are described. Then, reference is made to basic functions of Natural Language Processing and their methodologies for knowledge recovery. In addition, an introduction to spaCy, a computational text processing platform and its models is introduced, and how to use it, as well as the proper introduction of a new language into it. Based on this platform, 2 functions are described for the Greek language, their results are recorded and some conclusions are drawn. Lastly, there is a proposal of future extensions of the implemented applications
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Keywords: επεξεργασία φυσικής γλώσσας;πλατφόρμα Spacy;στατιστικές μέθοδοι;αναπαράσταση δεδομένων φυσικού κειμένου;υπολογιστικά συστήματα;αρχιτεκτονικές μοντέλων επεξεργασίας κειμένου;spaCy;επεκτάσεις εφαρμογών
Description: Πτυχιακή εργασία--ΣΤΕΦ-Τμήμα Μηχανικών Πληροφορικής, 2018—10030
URI: http://195.251.240.227/jspui/handle/123456789/11919
Item type: bachelorThesis
Name(s) of contributor(s): Παρταλίδου, Ελένη
Item language: el
Item access scheme: account
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Publication date: 2018-09-19
Bibliographic citation: Παρταλίδου, Ε. (2018). Επεξεργασία φυσικής γλώσσας με τη πλατφόρμα Spacy (Natural language processcing using the spacy platform) (Πτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ, Θεσσαλονίκη.
Abstract: Στο παρόν έγγραφο γίνεται μια εισαγωγή στην Επεξεργασία Φυσικής Γλώσσας, στη σύγχρονη μορφή που κατέχει με την ενσωμάτωση στατιστικών μεθόδων, στα πεδία εφαρμογής της, στα στάδια διοχέτευσης της πληροφορίας και παρουσιάζονται ορισμένες δυσκολίες που προκύπτουν κατά την εφαρμογή της. Επιπρόσθετα, αναλύεται ο τρόπος αναπαράστασης των δεδομένων φυσικού κειμένου από τα υπολογιστικά συστήματα και περιγράφονται γνωστές αρχιτεκτονικές μοντέλων επεξεργασίας κειμένου. Στη συνέχεια, γίνεται αναφορά σε βασικές λειτουργίες της Επεξεργασίας Φυσικής Γλώσσας και των μεθοδολογιών τους για ανάκτηση γνώσης. Επιπλέον, γίνεται μια εισαγωγή στην spaCy, μια υπολογιστική πλατφόρμα επεξεργασίας κειμένου, των μοντέλων αναπαράστασής της και αναφέρεται ο τρόπος χρήσης της, αλλά και η κατάλληλη εισαγωγή νέας γλώσσας στην ίδια. Με βάση την πλατφόρμα αυτή, περιγράφονται 2 λειτουργίες για την Ελληνική Γλώσσα, καταγράφονται τα αποτελέσματα αυτών και εξάγονται κάποια συμπεράσματα. Τέλος, προτείνονται μελλοντικές επεκτάσεις των εφαρμογών που υλοποιήθηκαν
This paper is an introduction to Natural Language Processing, in the modern form it holds by integrating statistical methods into its application fields, at the stages of information dissemination, and presents some difficulties that arise during its implementation. In addition, there is an analysis of how text data is represented by the computing systems and known text processing architectures are described. Then, reference is made to basic functions of Natural Language Processing and their methodologies for knowledge recovery. In addition, an introduction to spaCy, a computational text processing platform and its models is introduced, and how to use it, as well as the proper introduction of a new language into it. Based on this platform, 2 functions are described for the Greek language, their results are recorded and some conclusions are drawn. Lastly, there is a proposal of future extensions of the implemented applications
Advisor name: Διαμαντάρας, Κωνσταντίνος
Examining committee: Διαμαντάρας, Κωνσταντίνος
Publishing department/division: Τμήμα Μηχανικών Πληροφορικής
Publishing institution: teithe
Number of pages: 84
Appears in Collections:Πτυχιακές Εργασίες

Files in This Item:
There are no files associated with this item.



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/11919
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.