Timo Baumann : Home Page > hours 20071126
- present: Michaela, David, Timo
- Allgemeines:
- übliche Anwesenheit in Golm
- es ist generell ganz nett, abends bevor man geht noch kurz zu sagen, wann man das nächstemal kommt
- David: Mo, (Di), Fr
- Timo: Meeting-Montage, Di, (Mi), Do
- Michaela: mal abwarten wie schön ihre Wohnung wird
- ansonsten nicht scheuen, auch per IM/E-Mail zu kommunizieren (IM-Status richtig einstellen)
- zur besseren Kommunikation im Institut gibt es realistisch drei Möglichkeiten
- Coffeetalks/Vormittagstalks
- unregelmäßige Postersessions
- häufigeres Kolloquium mit internen Vorträgen
- dabei geht es nicht nur um den wissenschaflichen Austausch, sondern auch um allgemein organisatorische Dinge.
- David schreibt ne Mail an die Professoren um zu erfahren, ob ansonsten auch Interesse an mehr Austausch besteht
- Urlaubsplanung zu Weihnachten:
- Michaela: weiß nicht genau, zwischen den Jahren in Augsburg, danach wohl Umzug
- David: 21.-26. Dezember, ansonten strebsam
- Timo: faul vom 21. Dezember bis 4. Januar in Hamburg/Kiel
- also müssen unsere Ergebnisse so weit wie möglich schon vor Weihnachten stehen
- Paper
- Selling point: Syntax (esp. incrementally)
- What's a turn?
- we should probably distinguish more between turn yield and turn hold instead of just EOT
- we want to be able to try different experiments, thus our feature vectors will be "verdongelt" afterwards and must be able to be identified in different settings
- Syntax: dialogID, wordID
- Prosody: dialogID, channel, time
- currently, the mapping in *words.csv uses information from MSaligned/ and from /projekte/korpora/orig-korpora/pennTreebank/dysfl/mgd/swbd
- Timo will review the scripts that create the mapping until next tuesday
- class feature
- n words still missing
- time to EOT (from end of this word)
- make it easier for the parser:
- possible completion points (PCP?)
- I'm still not sure we completely acknowledge the fact that we are in some areas dealing with EOT and sometimes with EOU.
- features
- additional features
- expected POS after current word
- flags: seen a verb? how many NPs?
- better documentation of our features
- Gold standard
- how do we compare to the Penn treebank data directly
- how would that data have to be "incrementalized"
- difference between inproPitch and GoldPitch
- infrastructure
- Verdengelung of data independent of turns (thus we can still change the notion of turn)
- identification via dialogID/wordID for syntax and dialogID/channel/time for acoustics
- master table has mapping between the two
timo, 11/26/07 05:09 (GMT)
Keyword: inpro,
meetings,
minutesAdd a new page under this one