Research and improvement of patent retrieval using machine learning methods (Master thesis)

Σιδέρης, Γεώργιος Νικόλαος


This dissertation researches and compares patent retrieval architectures using a combination of traditional first-stage retrieval algorithms and second-stage deep learning techniques. The author conducts experiments using various combinations of tools such as BERT models, the Pyserini indexing software, and the DeepCT software tools, and evaluates the effectiveness of each retrieval architecture. The datasets used, the field selection process, and the algorithm selection procedures are documented, along with the scripts and software developed for the experiments. The paper aims to determine the best techniques and methodologies for efficient and effective patent retrieval. The author concludes with their findings and proposes future research directions in this field. The study highlights the significance of information retrieval methods and their applications in everyday life in the 21st century. Furthermore, the paper provides an introduction to artificial intelligence, machine learning, and deep learning concepts, which are fundamental to understanding the thesis’s technical aspects.
Institution and School/Department of submitter: Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων
Subject classification: Μηχανική μάθηση
Συστήματα αποθήκευσης και ανάκτησης πληροφοριών -- Πατέντες
Machine learning
Information storage and retrieval systems -- Patents
Keywords: Μέθοδοι μηχανικής μάθησης;Ανάκτηση διπλωμάτων ευρεσιτεχνίας;Τεχνητή νοημοσύνη;Βαθιά Μάθηση;Methods of machine learning;Patent recovery;Artificial intelligence;Deep learning
Description: Μεταπτυχιακή εργασία - Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, 2023 (α/α 14071)
URI: http://195.251.240.227/jspui/handle/123456789/16870
Item type: masterThesis
General Description / Additional Comments: Μεταπτυχιακή εργασία
Subject classification: Μηχανική μάθηση
Συστήματα αποθήκευσης και ανάκτησης πληροφοριών -- Πατέντες
Machine learning
Information storage and retrieval systems -- Patents
Submission Date: 2024-08-28T08:51:47Z
Item language: en
Item access scheme: free
Institution and School/Department of submitter: Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων
Publication date: 2023-09-18
Bibliographic citation: Σιδέρης, Γ. Ν. (2023). Research and improvement of patent retrieval using machine learning methods (Μεταπτυχιακή εργασία). ΔΙ.ΠΑ.Ε.
Abstract: Αυτή η διπλωματική εργασία ερευνά και συγκρίνει αρχιτεκτονικές ανάκτησης διπλωμάτων ευρεσιτεχνίας χρησιμοποιώντας συνδυασμό παραδοσιακών αλγορίθμων ανάκτησης πρώτου σταδίου και τεχνικών βαθιάς μάθησης δεύτερου σταδίου. Ο συγγραφέας πραγματοποιεί πειράματα χρησιμοποιώντας διάφορα εργαλεία, όπως το μοντέλο λέξ- εων BERT, το λογισμικό ευρετηρίασης Pyserini και το εργαλείο με δυνατότητες χρήσης μεθόδων μηχανικής και βαθιάς μάθησης DeepCT, και αξιολογεί την αποτε- λεσματικότητα κάθε αρχιτεκτονικής ανάκτησης. Τα σύνολα δεδομένων που χρησι- μοποιήθηκαν, η διαδικασία επιλογής πεδίων και οι διαδικασίες επιλογής αλγορίθμων καλύπτονται με λεπτομέρεια, μαζί με τα σενάρια και το λογισμικό που αναπτύχθηκε για τα πειράματα. Στόχος αυτής της διατριβής είναι να ερευνήσει τις καλύτερες τεχνικές και μεθοδολογίες για αποτελεσματική ανάκτηση διπλωμάτων ευρεσιτεχνίας. Ο συγ- γραφέας παρουσιάζει τα ευρήματά του και προτείνει περαιτέρω κατευθύνσεις έρευνας σε αυτό το πεδίο. Επιπρόσθετα, το παρόν εγγραφο περιέχει εισαγωγικές πληροφορίες για τις έννοιες Τεχνητή Νοημοσύνη, την Μηχανική Μάθηση και την Βαθιά Μάθηση, οι οποίες είναι σημαντικές για την κατανόηση των τεχνικών και τεχνολογικών πτυχών της παρούσας διπλωματικής. 3
This dissertation researches and compares patent retrieval architectures using a combination of traditional first-stage retrieval algorithms and second-stage deep learning techniques. The author conducts experiments using various combinations of tools such as BERT models, the Pyserini indexing software, and the DeepCT software tools, and evaluates the effectiveness of each retrieval architecture. The datasets used, the field selection process, and the algorithm selection procedures are documented, along with the scripts and software developed for the experiments. The paper aims to determine the best techniques and methodologies for efficient and effective patent retrieval. The author concludes with their findings and proposes future research directions in this field. The study highlights the significance of information retrieval methods and their applications in everyday life in the 21st century. Furthermore, the paper provides an introduction to artificial intelligence, machine learning, and deep learning concepts, which are fundamental to understanding the thesis’s technical aspects.
Advisor name: Σαλαμπάσης, Μιχάλης
Examining committee: Σαλαμπάσης, Μιχάλης
Publishing department/division: Σχολή Μηχανικών - Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων
Publishing institution: ihu
Number of pages: 57
Appears in Collections:Μεταπτυχιακές Διατριβές

Files in This Item:
File Description SizeFormat 
Sideris2.pdf1.14 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/16870
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.