burger

Звітуємо про роботу над створенням Національного корпусу кримськотатарської мови

Опубліковано 27 Березня 2023 року, о 9:00

Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.

Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався з жовтня 2022 року. 

За майже пів року були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо. 

Крім того, за цей час було розроблено словник лематизації. Мається на увазі створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик (частина мови, рід, число тощо). Це потрібно для запуску модуля з пошуку слів на онлайн-платформі Нацкорпусу. Розробка відповідного програмного забезпечення триває. 

Нагадаємо, проєкт реалізується за підтримки Мінреінтеграції, швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка. 

Докладніше з результатами роботи над створенням Національного корпусу кримськотатарської мови можна ознайомитися за посиланням.