Академический Документы
Профессиональный Документы
Культура Документы
net/publication/312605007
CITATIONS READS
0 481
4 authors, including:
Some of the authors of this publication are also working on these related projects:
Machine Translation and Automated Analysis of Cuneiform Languages (MTAAC) View project
All content following this page was uploaded by Timo Homburg on 20 February 2017.
Resourcenaufbereitung Prinzip des Karteikartenlernens: Richtig gelernte Vokabeln werden ein Fach weiter geschoben, nicht gewusste
Vokabeln werden ein Fach nach vorne geschoben.
Als unsere Datenbasis dienen Korpora aus der Cuneiform Digital Library Initiative (CDLI) [5]. Jedes Fach besitzt ein eigenes Wiederholungsintervall WI wobei WI(Fach n)<WI(Fach n+1)
Hierbei wurden jeweils die im ATF Format verfügbaren Texte der Korpora für Akkadisch, Hethitisch
und Sumerisch extrahiert und für die weitere Verwendung aufbereitet.
Lernen von Keilschrift mit Anki
Umwandlung von ATF in ein Wörterbuch:
●
ATF Format ist historisch gewachsen und Einsatz von Anki[6] für das Lernen von Vokabeln:
enthält transliterierte Keilschrifttafeln
●
Lernen von Karteikarten erfolgt aus Kartensets
●
Verfügt über verschiedene Dialekte
●
Kartensets können aus Korpora generiert oder mithilfe der Eingabemethoden selbst gestaltet werden
●
Enthält Annotierung wie Tontafelnummern u.ä.
●
Zentrale Datenhaltung auf einem Server
●
Umwandlung in Unicode über eine
●
Integration in die Lehre: Dozenten und Studenten können eigene Lernsets generieren
Transliterationsliste der Uni Frankfurt (AcoLi) [7]
●
Darstellung von Keilschrift mit mitgelieferten Schriftarten behebt Initialproblem des maschinellen Lernens
●
Anschließend Aufbau des Wörterbuchs
●
Lernen von Keilschriftvokabeln auf dem Handy
Anfang einer Tontafel in ATF: Ausgehend von
●
Anreicherung des Wörterbuchs
diesem Format erfolgte die weitere
mit Wortfrequenzen aus
Verarbeitung.
zur Verfügung stehenden Korpora
Referenzen
1. P.A. Wozniak, Optimization Of Learning, Master's Thesis, University Of Technology Poznan, 1990.
2. Timo Homburg. Verfahren zur Wortsegmentierung nichtalphabetische Schriften, Master Thesis, Goethe Universität Frankfurt am Main.
2015.
3. Herman Schaaf, Chinese IME, http://www.chinese-ime.com
4. Timo Homburg WebIME, https://github.com/situx/webime
5. Cuneiform Digital Library Initiative (CDLI) http://cdli.ucla.edu
6. Anki, https://www.ankisrs.net
7. Keilschriftzeichenliste des Lehrstuhls für Computerlinguistik der Uni Frankfurt
Beispieldatenstruktur: Bilden der Worte LUGAL, AN, AT und LU http://www.acoli.informatik.uni-frankfurt.de/resources/cuneiform/signs-final.xml
8. Ibus Input Method Engine https://code.google.com/p/ibus/
Goethe Universität Frankfurt, Institut für Informatik: Timo Homburg ( timo.homburg@gmx.de ), Christian Chiarcos ( chiarcos@em.uni-frankfurt.de )
Goethe Universität Frankfurt, Institut für Archäologie: Thomas Richter ( richter@em.uni-frankfurt.de ), Dirk Wicke ( wicke@em.uni-frankfurt.de )
View publication stats