Εργαλεία και τεχνικές αυτόματης αναγνώρισης ομιλίας από τον υπολογιστή (Bachelor thesis)

Στογιαννίδης, Κωνσταντίνος


The topic of this thesis is to build an accurate automatic speech recognition system. For this purpose we use Kaldi, an open-source toolkit for speech recognition written in C++. First of all, the main process of automatic speech recognition is explained in details. Secondly, the toolkit Kaldi is explained in details. Furthermore, the installation of the Kaldi toolkit is listed. Next, we analyze the steps required to create the speech recognition system. To train our system, we use two different ways of training, monophonic education and simple trifle education.
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Subject classification: Automatic speech recognition
Αυτόματη αναγνώριση ομιλίας
Markov processes
Διεργασίες Markov
Keywords: αυτόματη αναγνώριση ομιλίας;ακουστικό μοντέλο;γλωσσικό μοντέλο;νευρωνικα δίκτυα;kaldi;hidden Markov models;automatic speech recognition (ASR),;acoustic model;language model;neural networks
Description: Πτυχιακή Εργασία – Σχολή Τεχνολογικών Εφαρμογών – Τμήμα Μηχανικών Πληροφορικής ,2018 α.α 9570
URI: http://195.251.240.227/jspui/handle/123456789/15155
Item type: bachelorThesis
General Description / Additional Comments: Πτυχιακή εργασία
Subject classification: Automatic speech recognition
Αυτόματη αναγνώριση ομιλίας
Markov processes
Διεργασίες Markov
Submission Date: 2022-08-23T17:48:43Z
Item language: el
Item access scheme: free
Institution and School/Department of submitter: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Publication date: 2018-04-03
Bibliographic citation: Στογιαννίδης Κ. (2018). Εργαλεία και τεχνικές αυτόματης αναγνώρισης ομιλίας από τον υπολογιστή (Πτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ Θεσσαλονίκης.
Abstract: Το θέμα αυτής της πτυχιακής εργασίας είναι να δημιουργηθεί ένα ακριβές σύστημα αυτόματης αναγνώρισης ομιλίας. Για το σκοπό αυτό, χρησιμοποιήθηκε το Kaldi, ένα εργαλείο ανοιχτού κώδικα για την αναγνώριση ομιλίας γραμμένο σε C ++. Αρχικά, εξηγείται λεπτομερώς η κύρια διαδικασία της αυτόματης αναγνώρισης ομιλίας. Στη συνέχεια, παρουσιάζεται λεπτομερώς το εργαλείο Kaldi. Επιπρόσθετα, παρατίθεται και η εγκατάσταση του εργαλείου Kaldi. Έπειτα, γίνεται η ανάλυση των βημάτων που απαιτούνται για τη δημιουργία του συστήματος αυτόματης αναγνώρισης ομιλίας. Για την εκπαίδευση του συστήματός μας, χρησιμοποιούμε δυο τρόπους εκπαίδευσης, τη μονοφωνική εκπαίδευση και την απλή εκπαίδευση τριφώνου.
The topic of this thesis is to build an accurate automatic speech recognition system. For this purpose we use Kaldi, an open-source toolkit for speech recognition written in C++. First of all, the main process of automatic speech recognition is explained in details. Secondly, the toolkit Kaldi is explained in details. Furthermore, the installation of the Kaldi toolkit is listed. Next, we analyze the steps required to create the speech recognition system. To train our system, we use two different ways of training, monophonic education and simple trifle education.
Advisor name: Διαμαντάρας, Κωνσταντίνος
Examining committee: Διαμαντάρας, Κωνσταντίνος
Publishing department/division: Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής
Publishing institution: teithe
Number of pages: 55 σ.
Appears in Collections:Πτυχιακές Εργασίες

Files in This Item:
File Description SizeFormat 
Stogiannidis.pdf1.13 MBAdobe PDFView/Open



 Please use this identifier to cite or link to this item:
http://195.251.240.227/jspui/handle/123456789/15155
  This item is a favorite for 0 people.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.