existing methods for low-resource language tasks

February 16th, 2026

Scaling Low-Resource MT via Synthetic Data Generation with LLMs (2025)

영어 데이터를 기반으로 문서 수준의 합성 코퍼스를 생성하고, 이를 다시 다른 저자원 언어로 피보팅(Pivoting)하여 데이터 부족 문제를 해결

SynOPUS: Scaling Low-Resource MT with LLM-generated Synthetic Data (2025)

MuRXLS: Multilingual Retrieval-based Cross-lingual Summarization (2025)

다국어 검색(Retrieval)을 결합한 인컨텍스트 러닝(In-context Learning) 프레임워크로, 고자원 언어(영어 등)에서 관련 사례를 동적으로 검색하여 저자원 언어의 요약 성능을 도모

Cross-Lingual Transfer Learning for Low-Resource Hate Speech Detection (2025)

XLM-R과 같은 다국어 사전학습 모델을 고자원 언어에서 먼저 학습시킨 뒤, 최소한의 주석 데이터(Annotated Data)만으로 저자원 언어에 전이 학습(Transfer Learning)을 시키는 최적화 경로를 탐구

Data-Efficient Hate Speech Detection via Cross-Lingual Nearest Neighbor Retrieval with Limited Labeled Data (EMNLP 2025)

AI-Tutor: Interactive Learning of Ancient Knowledge from Low-Resource Languages (ACL 2024)

LoResLM 2025 Workshop (COLING 2025)