Research and improvement of patent retrieval using machine learning methods (Master thesis)
Σιδέρης, Γεώργιος Νικόλαος
This dissertation researches and compares patent retrieval architectures using a combination
of traditional first-stage retrieval algorithms and second-stage deep learning techniques.
The author conducts experiments using various combinations of tools such as BERT
models, the Pyserini indexing software, and the DeepCT software tools, and evaluates the
effectiveness of each retrieval architecture. The datasets used, the field selection process,
and the algorithm selection procedures are documented, along with the scripts and software
developed for the experiments. The paper aims to determine the best techniques and
methodologies for efficient and effective patent retrieval. The author concludes with their
findings and proposes future research directions in this field. The study highlights the
significance of information retrieval methods and their applications in everyday life in
the 21st century. Furthermore, the paper provides an introduction to artificial intelligence,
machine learning, and deep learning concepts, which are fundamental to understanding
the thesis’s technical aspects.
Institution and School/Department of submitter: | Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων |
Subject classification: | Μηχανική μάθηση Συστήματα αποθήκευσης και ανάκτησης πληροφοριών -- Πατέντες Machine learning Information storage and retrieval systems -- Patents |
Keywords: | Μέθοδοι μηχανικής μάθησης;Ανάκτηση διπλωμάτων ευρεσιτεχνίας;Τεχνητή νοημοσύνη;Βαθιά Μάθηση;Methods of machine learning;Patent recovery;Artificial intelligence;Deep learning |
Description: | Μεταπτυχιακή εργασία - Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, 2023 (α/α 14071) |
URI: | http://195.251.240.227/jspui/handle/123456789/16870 |
Item type: | masterThesis |
General Description / Additional Comments: | Μεταπτυχιακή εργασία |
Subject classification: | Μηχανική μάθηση Συστήματα αποθήκευσης και ανάκτησης πληροφοριών -- Πατέντες Machine learning Information storage and retrieval systems -- Patents |
Submission Date: | 2024-08-28T08:51:47Z |
Item language: | en |
Item access scheme: | free |
Institution and School/Department of submitter: | Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων |
Publication date: | 2023-09-18 |
Bibliographic citation: | Σιδέρης, Γ. Ν. (2023). Research and improvement of patent retrieval using machine learning methods (Μεταπτυχιακή εργασία). ΔΙ.ΠΑ.Ε. |
Abstract: | Αυτή η διπλωματική εργασία ερευνά και συγκρίνει αρχιτεκτονικές ανάκτησης διπλωμάτων
ευρεσιτεχνίας χρησιμοποιώντας συνδυασμό παραδοσιακών αλγορίθμων ανάκτησης
πρώτου σταδίου και τεχνικών βαθιάς μάθησης δεύτερου σταδίου. Ο συγγραφέας
πραγματοποιεί πειράματα χρησιμοποιώντας διάφορα εργαλεία, όπως το μοντέλο λέξ-
εων BERT, το λογισμικό ευρετηρίασης Pyserini και το εργαλείο με δυνατότητες
χρήσης μεθόδων μηχανικής και βαθιάς μάθησης DeepCT, και αξιολογεί την αποτε-
λεσματικότητα κάθε αρχιτεκτονικής ανάκτησης. Τα σύνολα δεδομένων που χρησι-
μοποιήθηκαν, η διαδικασία επιλογής πεδίων και οι διαδικασίες επιλογής αλγορίθμων
καλύπτονται με λεπτομέρεια, μαζί με τα σενάρια και το λογισμικό που αναπτύχθηκε για
τα πειράματα. Στόχος αυτής της διατριβής είναι να ερευνήσει τις καλύτερες τεχνικές
και μεθοδολογίες για αποτελεσματική ανάκτηση διπλωμάτων ευρεσιτεχνίας. Ο συγ-
γραφέας παρουσιάζει τα ευρήματά του και προτείνει περαιτέρω κατευθύνσεις έρευνας
σε αυτό το πεδίο. Επιπρόσθετα, το παρόν εγγραφο περιέχει εισαγωγικές πληροφορίες
για τις έννοιες Τεχνητή Νοημοσύνη, την Μηχανική Μάθηση και την Βαθιά Μάθηση,
οι οποίες είναι σημαντικές για την κατανόηση των τεχνικών και τεχνολογικών πτυχών
της παρούσας διπλωματικής.
3 This dissertation researches and compares patent retrieval architectures using a combination of traditional first-stage retrieval algorithms and second-stage deep learning techniques. The author conducts experiments using various combinations of tools such as BERT models, the Pyserini indexing software, and the DeepCT software tools, and evaluates the effectiveness of each retrieval architecture. The datasets used, the field selection process, and the algorithm selection procedures are documented, along with the scripts and software developed for the experiments. The paper aims to determine the best techniques and methodologies for efficient and effective patent retrieval. The author concludes with their findings and proposes future research directions in this field. The study highlights the significance of information retrieval methods and their applications in everyday life in the 21st century. Furthermore, the paper provides an introduction to artificial intelligence, machine learning, and deep learning concepts, which are fundamental to understanding the thesis’s technical aspects. |
Advisor name: | Σαλαμπάσης, Μιχάλης |
Examining committee: | Σαλαμπάσης, Μιχάλης |
Publishing department/division: | Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων |
Publishing institution: | ihu |
Number of pages: | 57 |
Appears in Collections: | Μεταπτυχιακές Διατριβές |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Sideris2.pdf | 1.14 MB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/16870
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.