Log on: Remember me
Powered by Elgg
  • Log On





    Register | Forgotten password

  • User Statistics

    There are 13 active users.
    (0 logged on.)

All blogs

You can filter this page to certain types of posts:

Filtered: Showing posts with comments (Remove filter)

May 09, 2007

Gestern stand ich noch wie der Ochs vorm Code-Berg: Der Sphinx-Demo WavFile konnte ich zwar problemlos einen ResultListener hinzufügen, aber der hat einfach keine Zwischenergebnisse ausgespuckt. 

Heute dann der allererste Erfolg: Die Konfiguration der Demo lässt den Decoder die gesamte Audiodatei auf einmal konsumieren, erzeugt also keine Zwischenergebnisse. Lösung: In config.xml die Variable featureBlockSize auf    die gewünschte Anzahl auf einmal zu dekodierender Frames stellen:

    <component name="digitsDecoder" type="edu.cmu.sphinx.decoder.Decoder">
        <property name="searchManager" value="searchManager"/>
        <property name="featureBlockSize" value="1    "/>
    </component>
 

Schon gibt es beliebig viele Zwischenergebnisse.

Ich möchte ja als erstes untersuchen, ab einer wie großen Latenz die Zwischenergebnisse der Erkennung verwertbar sind. Meine aktuelle Planung dazu steht im Wiki auf LatenzCheck.

 

Einen guten Überblick über Sphinx bietet übrigens: http://research.sun.com/techrep/2004/smli_tr-2004-139.pdf

Keywords: Literatur, Sphinx

Posted by Timo Baumann | 3 comment(s)

April 12, 2007

Dies ist der erste Test. Das hier soll jetzt ein allgemein zugänglicher Beitrag werden.

Keywords: emmy, general

Posted by David Schlangen | 1 comment(s)