Iemand heeft een spraakherkenner gebouwd die in het midden van alle klanken in een woord het spectrum meet en dat vergelijkt met modelspectra in een interne database. Welk van de onderstaande woorden zal deze provisorische spraakherkenner het vaakst goed herkennen?
sok
fuif
soes
koud
(Zie het boek op blz. 157.)
Iemand heeft een spraakherkenner gebouwd die in het midden van alle klanken in een woord het spectrum meet en dat vergelijkt met modelspectra in een interne database. Hij merkt dat dat voor plofklanken niet zo goed werkt en bouwt er een mechanisme in dat ervoor zorgt dat er met het meten van het spectrum in plofklanken wordt gewacht tot het plofgedeelte. Denk je dat dit de spraakherkenning bevordert?
Nee, het plofgedeelte van zo’n klank bevat alleen maar ruis en daar kun je niets aan zien.
Nee, voor het goed herkennen van een plofklank moet je vóór de stilte meten.
Ja, het spectrum in de plof laat duidelijke formanten zien die de plofklank uniek definiëren.
Ja, in de plof zit ruis en uit de verdeling van die ruis over het spectrum kun je de plaats van articulatie afleiden, net als bij fricatieven.
(Zie het boek op blz. 158.)
Uit een willekeurig spectrogram snijden we op tijdstip t een reepje in verticale richting. Dit reepje oriënteren we zodanig dat de zwarting op de verticale as wordt uitgezet (hoe zwarter, hoe hoger de lijn) en de frequentie op de horizontale as. Wat hebben we nu gemaakt?
een oscillogram
een spectrum
een spectraallijn
een formantspoor
(Zie het boek op blz. 158.)
We stellen de bandbreedte van het analysefilter van een spectrograaf in op een zeer kleine waarde (ca. 5 Hz) en maken een spectrogram van een sinus van 300 Hz (gedurende 500 ms). Hoe zal dit spectrogram eruitzien?
als een horizontale zwarte balk
als een sinusgolf
als een horizontale lijn
als een verticale lijn
(Zie het boek op blz. 159.)
Volgens de onzekerheidsrelatie van Heisenberg gaat een grotere nauwkeurigheid in frequentie (kleinere bandbreedte) ten koste van de nauwkeurigheid in de tijd. Hoe zal figuur 8.1 eruit komen te zien als we inderdaad de bandbreedte veel kleiner dan 300 Hz kiezen?
De lijnen die nu verticaal door het spectrogram lopen, zullen niet meer van elkaar gescheiden worden (‘versmeren’); in plaats daarvan zullen er horizontale lijntjes verschijnen.
De verticale lijnen die door het spectrogram lopen, zullen dikker worden.
Het spectrogram zal in alle richtingen ‘versmeren’, zodat er een plaatje met vage formantsporen zonder verticale lijnen ontstaat.
Er zullen geen lijnen meer door het spectrogram lopen, maar het zal gevuld zijn met punten die nauwkeurig de frequentie op een bepaald tijdstip aangeven.
(Zie het boek op blz. 166.)
Als we de zwarting over het hele spectrum en de volledige duur van een segment op zouden tellen, welke van de volgende vier klanken zou dan, gemiddeld genomen, het hoogst uitkomen?
een [s] van 100 ms uit een beklemtoonde lettergreep
een [k] van 100 ms uit een beklemtoonde lettergreep
een [a] van 100 ms uit een beklemtoonde lettergreep
een [i] van 100 ms uit een onbeklemtoonde lettergreep
(Zie het boek op blz. 161.)
In figuur 8.2 zien we formantsporen op plekken waar in figuur 8.1 helemaal niets te zien is. Hoe kan dat?
Deze formantsporen worden door de LPC-analyse berekend uit de waarde van de grondtoon.
De computer kan veel nauwkeuriger kijken dan wij.
LPC-analyse verbindt formantlijnen aan weerszijden van een wit stuk met elkaar door te interpoleren.
De loop van formanten is altijd hetzelfde. De computer kan ze dus gewoon uit een database halen en invullen.
(Zie het boek op blz. 162.)
We kunnen in een oscillogram van het woord mama vrij goed bepalen waar de grenzen tussen de segmenten liggen. Maar de [m] en de [a] zijn allebei periodiek, zodat het hele segment opgevuld is met regelmatige golven (anders dan bijvoorbeeld in een fricatief of plofklank). Hoe zien we dan het onderscheid tussen [m] en [a] in een oscillogram?
Dat onderscheid zien we ook niet, maar op de grenzen is in het oscillogram een opvallende discontinuïteit in de golfvorm te zien.
Voor de [m] zijn er twee golven tegelijk in het oscillogram te zien omdat je dan je neusholte openzet, en voor de [a] is er maar één golf.
In de golfvorm van nasalen is duidelijk een nasaalformant zichtbaar.
De golven van nasalen hebben een kleinere amplitude dan klinkergolven, en bovendien zien ze er anders uit.
(Zie het boek op blz. 158-160.)
Hier wordt gesproken over spectra en spectrogrammen, en stationaire en niet-stationaire eigenschappen. Wat hoort bij wat?
Een spectrum vertelt iets over stationaire eigenschappen, en een spectrogram zegt iets over niet-stationaire eigenschappen.
Een spectrum vertelt iets over niet-stationaire eigenschappen, en een spectrogram zegt iets over stationaire eigenschappen.
Een spectrum en een spectrogram zeggen allebei iets over stationaire eigenschappen.
Een spectrum en een spectrogram zeggen allebei iets over niet-stationaire eigenschappen.
(Zie het boek op blz. 146.)
Welke van de klinkers [i], [a] en [u] zal, gezien hun formantwaarden, het minst sonoor zijn?
De [i], omdat voor deze klinker de F1 en de F2 het verst uit elkaar liggen.
De [u], omdat voor deze klinker de F2 het laagst is.
De [a], omdat de F1 en de F2 het dichtst bij elkaar liggen.
De [u], omdat de F1 het laagst is.
(Zie het boek op blz. 146.)
In de onderstaande klinkerdriehoek is met een pijl de formantverschuiving van een tweeklank getekend. Welke denk je dat het is?
[ɛi]
[ɑu]
[œy]
geen tweeklank, maar de combinatie [aj]
(Zie het boek op blz. 165-166.)
Hoeveel metingen moet je doen om een ‘onechte’ tweeklank uniek te definiëren en waar moet je meten?
Drie metingen: een vlak na het begin, een in het midden en een bijna aan het eind.
Twee metingen: een ongeveer op een kwart van de totale duur en een bijna aan het eind.
Eén meting: in het midden.
Twee metingen: een precies aan het begin en een precies aan het eind.
(Zie het boek op blz. 168.)
Hoe zal de F2 in figuur 8.7 lopen als we de sequentie /ada/ uitspreken met een dentale /d/?
De F2 zal van een minder hoge waarde naar de waarde voor de /a/ verglijden dan het geval was voor de alveolaire /d/.
De F2 zal van een hogere waarde naar de waarde voor de /a/ verglijden dan het geval was voor de alveolaire /d/.
De F2 zal zakken tot dezelfde waarde als de F1, omdat bij een dentale /d/ de tong de mond helemaal afsluit.
De F2 zal dezelfde waarde hebben als voor een alveolaire /d/.
(Zie het boek op blz. 169.)
Hieronder vind je drie fases (als in figuur 8.9, maar nu horizontaal) van een klank die uitgesproken wordt op dezelfde plaats als een /t/. Kun je zien wat het is?
een /t/ zonder klinker erachter
de stemhebbende variant /d/
de fricatief /s/
de affricaat /ts/
(Zie het boek op blz. 170.)
De formantbuigingen van /ʋ/ en /j/ zijn bijna hetzelfde als die van de /u/ en de /i/. Waarom horen we dan geen /u/ en /i/ op plaatsen waar die klanken staan?
De duur van halfklinkers is daar te kort voor.
Klinkers met dezelfde formantwaarden hoeven niet hetzelfde te klinken.
Het zijn wel /u/ en/i/, maar ze zijn minder luid, waardoor ze als /ʋ/ en /j/ klinken.
Bij de /ʋ/ en de /j/ is de F0 anders dan bij de /u/ en de /i/.