Arne Rubehn
Doktorand
Arne Rubehn

Lebenslauf
seit 2023: Doktorand am Lehrstuhl für Multilinguale Computerlinguistik, Universität Passau.
2019-2023: Master of Arts, Computerlinguistik, Eberhard Karls Universität Tübingen.
03-07/2018: Auslandssemester (ERASMUS+), Angewandte Sprachwissenschaft, Universitat Pompeu Fabra, Barcelona.
2015-2019: Bachelor of Arts, Allgemeine Sprachwissenschaft und Latein, Eberhard Karls Universität Tübingen.
Publikationen
- Bocklage, K., Georgakopoulos, T., van Dam, K. P., Ciucci, L., Blum, F., Kučerová, A., Rubehn, A., Stephen, A., Snee, D., and List, J.-M. (2025). Testing the Potential of Automatically Inferred Affix Colexifications for Linguistic Typology. Humanities Commons [preprint, not peer-reviewed, under review]. https://doi.org/10.17613/a06m1-c9939
- Rubehn, A., Rzymski, C., Ciucci, L., Bocklage, K., Kučerová. A., Snee, D., Stephen, A., van Dam, K. P., and List, J.-M. (2025). Annotating and Inferring Compositional Structures Across Languages. In Proceedings of the 7th Workshop on Research in Computational Linguistic Typology and Multilingual NLP (SIGTYP). https://doi.org/10.18653/v1/2025.sigtyp-1.4
- Snee, D., Ciucci, L., Rubehn, A., van Dam, K. P., and List, J.-M. (2025). Unstable Grounds for Beautiful Trees? Testing the Robustness of Concept Translations in the Compilation of Multilingual Wordlists. In Proceedings of the 7th Workshop on Research in Computational Linguistic Typology and Multilingual NLP (SIGTYP). https://doi.org/10.18653/v1/2025.sigtyp-1.3
- Rubehn, A. and List, J.-M. (2025). Partial Colexifications Improve Concept Embeddings. InProceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). https://aclanthology.org/2025.acl-long.1004
- Rubehn, A., Nieder, J., Forkel, R., and List, J.-M. (2024). Generating Feature Vectors from Phonetic Transcriptions in Cross-Linguistic Data Formats. In Proceedings of the 2024 Meeting of the Society for Computation in Linguistics (SCiL). https://doi.org/10.7275/scil.2144
- Rubehn, A., Montemagni, S., and Nerbonne, J. (2024). Extracting Tuscan phonetic correspondences from dialect pronunciations automatically. Language Dynamics and Change, 14(1), 1-33. https://doi.org/10.1163/22105832-bja10034
- Rubehn, A. (2022). A feature-based neural model of sound change informed by global lexicostatistical data. Master's thesis, Eberhard Karls Universität Tübingen. https://doi.org/10.15496/publikation-94055
Schwerpunkte
Ich bin als Doktorand im ERC-Projekt „ProduSemy“ beschäftigt und fokussiere mich auf computergestützte, datenbasierte Methoden für historische Linguistik. Mein Ziel ist es, vergleichende historische Sprachforschung durch intelligente algorithmische Methoden voranzubringen, die Forschenden durch die schnelle Sichtung von Daten viel mühsame Arbeit abnehmen soll. Meine derzeitige Forschung fokussiert sich auf die Einbettung von "intuitivem" linguistischem Wissen, um es auch für Computermodelle verfügbar zu machen.
Ich habe in Tübingen Computerlinguistik, Allgemeine Sprachwissenschaft und Latein studiert und im Rahmen meiner Masterarbeit ein neuronales Netzwerk trainiert, das globale Wahrscheinlichkeiten von allen möglichen Lautwandeln abschätzt. Zudem habe ich jahrelang als Softwareentwickler an EtInEn (Etymological Inference Engine) gearbeitet, eine Software für historische Linguist:innen, die derzeit am Lehrstuhl für Allgemeine Sprachwissenschaft in Tübingen entwickelt wird.