Українці завантажили понад 70 тисяч друкованих сторінок для розпізнавання кримськотатарської мови
Збір друкованих та електронних текстів кримськотатарською мовою для створення Корпусу розпочався з жовтня 2022 року.
Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ — це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.
«За майже 7 місяців до каталогу було внесено більш як 800 матеріалів понад 200 авторів. Серед них — твори кримськотатарських авторів, газети, журнали, підручники, наукові статті, міжнародно-правові документи тощо. Таким чином опрацьовано більш ніж 70 тисяч друкованих сторінок. Понад 50% матеріалів вже пройшли процедуру розпізнавання та форматування», — повідомили в Мінреінтеграції.
Після завершення тестування програмного забезпечення ці матеріали будуть завантажені на платформу Корпусу.
Докладніше з результатами роботи над створенням Національного корпусу кримськотатарської мови можна ознайомитися за посиланням.
Будь-хто може запропонувати тексти. При чому навіть, якщо вони зіскановані. Додати текст можна тут.
До слова, всеукраїнський рух «Єдині» оголосив про старт набору на 13 онлайн курс переходу на українську.
Наталка МАРКІВ, «Вечірній Київ»