Marzena Karpinska

Adiunkt na Uniwersytecie Simona Frasera

prof_pic.jpg
 

dla studentów zainteresowanych współpracą

Jeśli jesteś zainteresowany/a współpracą ze mną, wypełnij ten formularz. Wszystkie oferty na semestr jesienny 2026 zostały już przyznane, ale mogę rozważyć zatrudnienie dodatkowych studentów w późniejszych terminach. Jestem również otwarta na współpracę przy konkretnych projektach. Studentów SFU zapraszam do zapisywania się na projekty badawcze w ramach przedmiotów CMPT 415/416.

o mnie

Obecnie pracuję jako adiunkt na Simon Fraser University w pięknym Vancouver w Kanadzie. Wcześniej pracowałam jako starsza pracowniczka naukowa (senior researcher) w firmie Microsoft w Redmond. Staż podoktorski odbyłam w Manning College of Information & Computer Sciences na University of Massachusetts Amherst, współpracując z prof. Mohitem Iyyerem.

Stopień doktora (Ph.D.) uzyskałam na Wydziale Nauk o Języku i Informacji Uniwersytetu Tokijskiego.

badania

Interesuję się tym, jak systemy przetwarzania języka naturalnego (NLP) radzą sobie z długimi formami tekstowymi, zarówno po stronie wejścia, jak i wyjścia. Moja praca obejmuje takie obszary, jak tłumaczenie maszynowe tekstów kreatywnych, generowanie opowiadań, streszczanie długich dokumentów, weryfikacja informacji w tekstach o długości książki oraz wielojęzyczne systemy odpowiadania na pytania na podstawie długich tekstów.

media

aktualności

  • Apr 2026 Our paper on AI-generated text in US news articles was accepted to ACL 2026 (oral, 3.9% papers) 🎉
  • Jan 2026 Started as an assistant professor at Simon Fraser University in Vancouver, Canada.
  • Oct 2025 New paper on AI-generated text in US news articles is out
  • Aug 2025 Papers on interdisciplinary approach to MT, cross-lingual memorization, and quantization effects on long-context tasks accepted to EMNLP 2025 🎉
  • Jul 2025 Our work on multilingual long-context processing was accepted to COLM 🎉
  • Jun 2025 Preprint on interdisciplinary approach to machine translation is out
  • Jun 2025 Serving as a Senior Area Chair at EMNLP
  • May 2025 Our preprint on cross-lingual memorization is out
  • May 2025 Our preprint on the effect of quantization on long-context tasks is out
  • May 2025 Our works on AI-generated text and multilingual long-form QA were accepted to ACL 🎉
  • Mar 2025 Our preprint on multilingual long-context processing is out
  • Jan 2025 Our preprint on machine generated text detection is out
  • Jan 2025 New preprint on slow-down attacks on reasoning models is out
  • Nov 2024 Recognized as an outstanding AC at EMNLP 2024
  • Sep 2024 NoCha was accepted to EMNLP 2024 🎉
  • Sep 2024 ESA was accepted to WMT 2024 🎉
  • Aug 2024 Presented our work on the evaluation of long-context language models at UNSW
  • Jul 2024 Presented our work on the evaluation of long-context language models at RMIT
  • Jul 2024 Presented our work on the evaluation of long-context language models at the University of Melbourne
  • Jul 2024 FABLES was accepted to COLM 2024 🎉
  • Jun 2024 Our preprint on LONG-CONTEXT processing capabilities of language models is out
  • Jun 2024 Our preprint on MULTI-LINGUAL/CULTURAL performance of language models is out
  • Jun 2024 Our preprint on more robust evaluation for machine translation is out
  • Apr 2024 Our preprint on faithfulness in book-length summaries is out
  • Mar 2024 NarrativeTime was accepted to LREC-COLING 2024 🎉
  • Dec 2023 Presented our work at WMT in Singapore.
  • Nov 2023 Launched litmt.org, a platform for sharing machine-translated world literature.
  • May 2023 Virtual talk at Instituto Superior Técnico & Unbabel Seminar on translation with Large Language Models.
  • Apr 2023 Virtual talk at Microsoft MT Reading Group on translation with Large Language Models.
  • Jan 2023 Virtual talk at Polish Academy of Sciences on Evaluation of Long-form Text Generation.
  • Dec 2022 Presented our work on diagnosing automatic evaluation metrics at EMNLP in Abu Dhabi.
  • Dec 2022 Presented our work on document-level MT at EMNLP in Abu Dhabi.
  • Nov 2022 Slator on literary MT and our PAR3 work