Yakabikaj – digitale Codierung arabischer Schriftzeichen
Foto: unsplash/Maryam B.
Die digitale Codierung arabischer Schriftzeichen ist generell gesprochen, ergo auch im Internet, ein großes Chaos. Das liegt einerseits daran, dass in Unicode für das identische arabische Schriftzeichen mehrere Codierungen hinterlegt sind, und andererseits daran, dass das System dieser Codierungen vor dem Hintergrund lateinischer Blockbuchstaben entwickelt wurde, womit das Arabische inkompatibel ist. Das Resultat: einfache Internetsuchen auf Arabisch sind extrem zufallsabhängig und etwas komplexere Suchen tendenziell sinnlos.
In Zusammenarbeit mit der Firma decotype wurde an der UHH ein Algorithmus entwickelt, der diese Probleme auffängt: Yakabikaj (spricht man Yâ Kabîkatsch). Er wurde im COBHUNI-Projekt zusammen mit Tom Milo entwickelt und bereits auf drei Kontinenten der Öffentlichkeit vorgestellt (einschließlich Unicode Conference, Santa Clara, CA). Dieser Algorithmus muss nun weiter getestet werden. Das Projekt zielt darauf, die Voraussetzungen für solche umfangreicheren Testungen zu verbessern.
Projektleitung: Prof. Dr. Thomas Eich, Islamwissenschaft
Laufzeit: 2021–2022
Kooperation: decotype
Weitere Informationen: https://www.cobhuni.uni-hamburg.de/
Das Projekt wurde vom Transferfonds der UHH im Rahmen der Exzellenzstrategie von Bund und Ländern vom Bundesministerium für Bildung und Forschung (BMBF) sowie der Freien und Hansestadt Hamburg gefördert.