Εργαλεία και τεχνικές αυτόματης αναγνώρισης ομιλίας από τον υπολογιστή (Bachelor thesis)
Στογιαννίδης, Κωνσταντίνος
The topic of this thesis is to build an accurate automatic speech recognition system. For this purpose we use Kaldi, an open-source toolkit for speech recognition written in C++. First of all, the main process of automatic speech recognition is explained in details. Secondly, the toolkit Kaldi is explained in details. Furthermore, the installation of the Kaldi toolkit is listed. Next, we analyze the steps required to create the speech recognition system. To train our system, we use two different ways of training, monophonic education and simple trifle education.
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής |
Subject classification: | Automatic speech recognition Αυτόματη αναγνώριση ομιλίας Markov processes Διεργασίες Markov |
Keywords: | αυτόματη αναγνώριση ομιλίας;ακουστικό μοντέλο;γλωσσικό μοντέλο;νευρωνικα δίκτυα;kaldi;hidden Markov models;automatic speech recognition (ASR),;acoustic model;language model;neural networks |
Description: | Πτυχιακή Εργασία – Σχολή Τεχνολογικών Εφαρμογών – Τμήμα Μηχανικών Πληροφορικής ,2018 α.α 9570 |
URI: | http://195.251.240.227/jspui/handle/123456789/15155 |
Item type: | bachelorThesis |
General Description / Additional Comments: | Πτυχιακή εργασία |
Subject classification: | Automatic speech recognition Αυτόματη αναγνώριση ομιλίας Markov processes Διεργασίες Markov |
Submission Date: | 2022-08-23T17:48:43Z |
Item language: | el |
Item access scheme: | free |
Institution and School/Department of submitter: | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής |
Publication date: | 2018-04-03 |
Bibliographic citation: | Στογιαννίδης Κ. (2018). Εργαλεία και τεχνικές αυτόματης αναγνώρισης ομιλίας από τον υπολογιστή (Πτυχιακή εργασία). Αλεξάνδρειο ΤΕΙ Θεσσαλονίκης. |
Abstract: | Το θέμα αυτής της πτυχιακής εργασίας είναι να δημιουργηθεί ένα ακριβές σύστημα αυτόματης αναγνώρισης ομιλίας. Για το σκοπό αυτό, χρησιμοποιήθηκε το Kaldi, ένα εργαλείο ανοιχτού κώδικα για την αναγνώριση ομιλίας γραμμένο σε C ++. Αρχικά, εξηγείται λεπτομερώς η κύρια διαδικασία της αυτόματης αναγνώρισης ομιλίας. Στη συνέχεια, παρουσιάζεται λεπτομερώς το εργαλείο Kaldi. Επιπρόσθετα, παρατίθεται και η εγκατάσταση του εργαλείου Kaldi. Έπειτα, γίνεται η ανάλυση των βημάτων που απαιτούνται για τη δημιουργία του συστήματος αυτόματης αναγνώρισης ομιλίας. Για την εκπαίδευση του συστήματός μας, χρησιμοποιούμε δυο τρόπους εκπαίδευσης, τη μονοφωνική εκπαίδευση και την απλή εκπαίδευση τριφώνου. The topic of this thesis is to build an accurate automatic speech recognition system. For this purpose we use Kaldi, an open-source toolkit for speech recognition written in C++. First of all, the main process of automatic speech recognition is explained in details. Secondly, the toolkit Kaldi is explained in details. Furthermore, the installation of the Kaldi toolkit is listed. Next, we analyze the steps required to create the speech recognition system. To train our system, we use two different ways of training, monophonic education and simple trifle education. |
Advisor name: | Διαμαντάρας, Κωνσταντίνος |
Examining committee: | Διαμαντάρας, Κωνσταντίνος |
Publishing department/division: | Σχολή Τεχνολογικών Εφαρμογών / Τμήμα Μηχανικών Πληροφορικής |
Publishing institution: | teithe |
Number of pages: | 55 σ. |
Appears in Collections: | Πτυχιακές Εργασίες |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Stogiannidis.pdf | 1.13 MB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
This item is a favorite for 0 people.
http://195.251.240.227/jspui/handle/123456789/15155
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.