ASR en Nederlandstalige dysartrische spraak: een vergelijking tussen wav2vec 2.0 en Whisper

Keywords

Loading...
Thumbnail Image

Issue Date

2024-09-09

Language

nl

Document type

Journal Title

Journal ISSN

Volume Title

Publisher

Title

ISSN

Volume

Issue

Startpage

Endpage

DOI

Abstract

Moderne systemen voor automatische spraakherkenning (ASR) zijn in staat transcripties te leveren van hoge kwaliteit. Echter kunnen deze prestaties in gevallen van dysartrische spraak aanzienlijk minder zijn. Het huidige onderzoek vergelijkt de modellen wav2vec 2.0 en Whisper op twee toepassingen voor het herkennen van Nederlandstalige dysartrische spraak; het leveren van enerzijds een transcriptie met imperfecties (versprekingen, herhalingen, articulatiefouten) voor diagnostische en onderzoeksdoeleinden en anderzijds een transcriptie zonder deze imperfecties, die gebruikt kan worden om communicatie te bevorderen. Hieruit is gebleken dat Whisper beter in staat is om dysartrische spraak te herkennen ten opzichte van wav2vec 2.0 en in gevallen van milde dysartrie zelfs zeer nauwkeurige transcripties levert. Beide ASR-systemen leken meer moeite te hebben met de ernstigere vormen van dysartrie. Dit zorgde er echter ook voor dat de herkenning van imperfecties in spraak in veel gevallen niet goed vergeleken kon worden.

Description

Citation

Faculty

Faculteit der Letteren