Jörg Tiedemann

Henkilö

Tutkimuksen ja opetuksen kuvaus

Sulje

Curriculum Vitae

I work as professor of language technology at the Department of Digital Humanities at the University of Helsinki. My main research interest is in cross-lingual NLP and machine translation.

  • Since August 2015: Professor of Language Technology at the Department of Digital Humanities / HELDIG (formerly at the Department of Modern Languages), University of Helsinki
  • September 2014 – July 2015: Senior Researcher at the Department of Linguistics and Philology, Uppsala University
  • September 2009 – August 2014: Visiting Professor at the Department of Linguistics and Philology, Uppsala University
  • September 2004 – August 2009: PostDoc researcher at the Department of Information Science/Humanities Computing (Informatiekunde), University of Groningen
  • January 2004 – August 2004: Lecturer in computational linguistics and coordinator for the language technology programme, Department of Linguistics and Philology, Uppsala University
  • 2000 – 2003: Ph.D. research at the Department of Linguistics, Uppsala University
  • 2001 – 2002: Visiting Ph.D. student, Division of Informatics, Edinburgh University, UK
  • 1997 – 1999: Research assistent, Department of Linguistics, Uppsala University
  • 1991 – 1997: Masters in Computer Science (Diplom für Informatik), “Otto-von-Guericke” University, Magdeburg, Germany

Recent Projects

Resources and Tools

  • OPUS – a collection of freely available parallel corpora and tools
  • fiskmö translator – a translation demo for the Nordic languages
  • efmaral and eflomal – tools for efficient word alignment
  • WMT en-fi 20162017: official MT test sets for Finnish-English
  • HNMT – the Helsinki Neural Machine Translation system
  • Lingua::Align – a toolbox for tree-to-tree alignment
  • Uplug – a toolbox for processing parallel corpora
  • Lingua::Ident::Blacklists – language identifier for related languages
  • Docent – a document-level SMT decoder
  • pdf2xml – a converter for PDF documents
  • subalign – tools for converting and aligning movie subtitles
  • Helsinki-NLP at github and bitbucket

Active PhD Students

Former PhD Students

Valikoidut julkaisut

  1. The MeMAD Submission to the WMT18 Multimodal Translation Task

    Stig-Arne, G., Huet, B., Kurimo, M., Laaksonen, J., Merialdo, B., Pham, P., Sjöberg, M., Sulubacak, U., Tiedemann, J., Troncy, R. & Vázquez Carrillo, J. R., 1 marraskuuta 2018, Proceedings of the Third Conference on Machine Translation (WMT): Shared Task Papers. Bojar, O., Chatterjee, R., Federmann, C., Fishel, M., Graham, Y., Haddow, B., Huck, M., Yepes, A. J., Koehn, P., Monz, C., Negri, M., Névéol, A., Neves, M., Post, M., Specia, L., Turchi, M. & Verspoor, K. (toim.). Stroudsburg: Association for Computational Linguistics, s. 603-611 9 Sivumäärä

    Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

  2. Emerging Language Spaces Learned From Massively Multilingual Corpora

    Tiedemann, J., 2018, Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference (DHN 2018). Mäkelä, E., Tolonen, M. & Tuominen, J. (toim.). Helsinki: CEUR Workshop Proceedings, Vuosikerta 2084. s. 188-197 (CEUR Workshop Proceedings).

    Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

  3. Findings of the VarDial Evaluation Campaign 2017

    Zampieri, M., Malmasi, S., Ljubešić, N., Nakov, P., Ali, A., Tiedemann, J., Scherrer, Y. & Aepli, N., 1 huhtikuuta 2017, Proceedings of the Fourth Workshop on NLP for Similar Languages, Varieties and Dialects. Stroudsburg: Association for Computational Linguistics, s. 1-15 15 Sivumäärä

    Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKirjan luku tai artikkeliTieteellinen

  4. Synthetic Treebanking for Cross-Lingual Dependency Parsing

    Tiedemann, J. & Agi, Z., tammikuuta 2016, julkaisussa : Journal of Artificial Intelligence Research. 55, s. 209-248 40 Sivumäärä

    Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

  5. Parallel Data, Tools and Interfaces in OPUS

    Tiedemann, J., 1 toukokuuta 2012, Unknown host publication. Calzolari, N., Choukri, K., Declerck, T., Dogan, M. U., Maegaard, B., Mariani, J., Odijk, J. & Piperidis, S. (toim.). s. 2214-2218 5 Sivumäärä

    Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

  6. Efficient word alignment with Markov Chain Monte Carlo

    Östling, R. & Tiedemann, J., 1 lokakuuta 2016, julkaisussa : The Prague Bulletin of Mathematical Linguistics. 106, s. 125-146 22 Sivumäärä

    Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

  7. Bitext Alignment

    Tiedemann, J. & Hirst, G. (toim.), 2011, San Rafael, California (USA): Morgan & Claypool. (Synthesis Lectures on Human Language Technologies)

    Tutkimustuotos: Kirja/raporttiKirjaTieteellinenvertaisarvioitu

Näytä kaikki (99) »

Valikoidut aktiviteetit

  1. What is the meaning of life? I found it in translation ...

    Jörg Tiedemann (Puhuja)
    12 joulukuuta 2018

    Aktiviteetti: Puhe- tai esitystyypitSuullinen esitys

  2. FoTran 2018: Found in translation

    Jörg Tiedemann (Tieteellisen komitean puheenjohtaja), Hande Celikkanat (Järjestäjätoimikunnan jäsen), Juan Raul Vazquez Carrillo (Järjestäjätoimikunnan jäsen)
    28 syyskuuta 2018

    Aktiviteetti: Tapahtumaan osallistumisen ja tapahtuman järjestämisen tyypitKonferensseihin, kursseille ja seminaareihin osallistuminen ja näiden järjestäminen

Näytä kaikki (93) »

Valikoidut projektit

  1. fiskmö: Creation of a parallel corpus of translated documents and machine translation for Finnish and Swedish

    Tiedemann, J., Ginter, F., Papula, N., Aulamo, M., Nieminen, T. & Kanerva, J.

    Svenska kulturfonden

    01/05/201831/05/2020

    Projekti: Tutkimusprojekti

  2. NLPL: Nordic Language Processing Laboratory

    Tiedemann, J. & Scherrer, Y.

    01/01/201731/12/2019

    Projekti: Muu projekti

Näytä kaikki (12) »

ID: 53542946