ASR en Nederlandstalige dysartrische spraak: een vergelijking tussen wav2vec 2.0 en Whisper
Keywords
Loading...
Authors
Issue Date
2024-09-09
Language
nl
Document type
Journal Title
Journal ISSN
Volume Title
Publisher
Title
ISSN
Volume
Issue
Startpage
Endpage
DOI
Abstract
Moderne systemen voor automatische spraakherkenning (ASR) zijn in staat transcripties te leveren van hoge kwaliteit. Echter kunnen deze prestaties in gevallen van dysartrische spraak aanzienlijk minder zijn. Het huidige onderzoek vergelijkt de modellen wav2vec 2.0 en Whisper op twee toepassingen voor het herkennen van Nederlandstalige dysartrische spraak; het leveren van enerzijds een transcriptie met imperfecties (versprekingen, herhalingen, articulatiefouten) voor diagnostische en onderzoeksdoeleinden en anderzijds een transcriptie zonder deze imperfecties, die gebruikt kan worden om communicatie te bevorderen. Hieruit is gebleken dat Whisper beter in staat is om dysartrische spraak te herkennen ten opzichte van wav2vec 2.0 en in gevallen van milde dysartrie zelfs zeer nauwkeurige transcripties levert. Beide ASR-systemen leken meer moeite te hebben met de ernstigere vormen van dysartrie. Dit zorgde er echter ook voor dat de herkenning van imperfecties in spraak in veel gevallen niet goed vergeleken kon worden.
Description
Citation
Supervisor
Faculty
Faculteit der Letteren
