Timo Baumann : Home Page > LatenzChecksZiel: Messen, ab wann die Ergebnisse der Sphinx-Erkennung stabil und richtig, also brauchbar sind.
Leistungsmaße:
"ab wann":
Beide Maße sind wichtig. Aus ersterer geht vor allem die Qualität der Erkennung (und Probleme mit Ambiguität) hervor, aus letzterer die Geschwindigkeit.
"stabil und richtig":
Testkorpus: Ich brauche ein mindestens mit Wortgrenzen annotiertes Korpus, das möglichst auch etwas mit unserem Anwendungsfall zu tun hat. Das Korpus bedingt dann natürlich auch die Auswahl des Linguists und der akustischen Modelle in Sphinx.
Das Switchboard-Korpus bietet sich an: spontane Sprache, Telefonsituation, Dialoge. Es wird auch für realistisch schlechte Erkennungsraten sorgen...
Letztendlich müsste das Tool so aussehen, dass man es auch schnell für andere Korpora benutzen kann. Dann könnte es als Regression-Test regelmäßig durchlaufen und damit Ver(schlimm?)besserungen der Erkennung dokumentieren.
Außerdem hab ich noch das TIDIGITS-Testkorpus, das ich zunächst benutze.
Vorgehen:
timo, 06/04/07 01:03 (GMT)
Keyword: Latenz, Sphinx