Публікуйте вакансії
Наймайте без комісій
7 переглядів
Національний корпус кримськотатарської мови
Національний корпус кримськотатарської мови (НККМ) — винятковий у своєму роді електронний масив кримськотатарських текстів, що охоплює різні жанри та історичні епохи. НККМ варто розглядати, як інструмент для всеосяжних лінгвістичних досліджень, а також створення та розвитку найрізноманітніших автоматизованих систем (розпізнання мови, машинного перекладу, інформаційного пошуку). Створення і розбудова лінгвістичного корпусу є особливо важливим чинником розвитку кримськотатарської мови, яка на сьогодні класифікується ЮНЕСКО, як мова, що перебуває під серйозною загрозою зникнення.
Мета цього завдання — розробити веб-сервіс, який буде окремою сторінкою на сайті Корпусу, що буде транслітерувати з кримськотатарської кирилиці на латиницю, використовуючи теперішній код для транслітерації на https://github.com/qirimca/Transliterator.
Веб-сервіс дозволить користувачам вибрати текст, написаний кримськотатарською кирилицею, і перетворити його на латиницю відповідно до правил кримськотатарської мови. Веб-сервіс також надасть можливість зворотної транслітерації з латиниці на кирилицю. Веб-сервіс буде сумісний з останніми версіями браузерів і підтримуватиме операційні системи Windows, Mac та Linux.
Функціональні вимоги
Веб-сервіс буде окремою сторінкою на веб-сайті https://ctcorpus.org/index.php/crh/ для транслітерації з кримськотатарської кирилиці на латиницю.
Веб-сервіс використовуватиме існуючий код для транслітерації на https://github.com/qirimca/Transliterator як основну логіку для перетворення між кирилицею та латиницею.
Веб-сервіс повинен дозволяти користувачам завантажувати транслітерований документ у форматі .txt або .docx, або навіть краще, якщо окрім цього можлива конвертація в .pptx, .xlsx.
Веб-сервіс надасть інтерфейс користувача, який дозволить користувачам вибрати текст, написаний кримськотатарською кирилицею, і натиснути кнопку, щоб перекласти його на латиницю (і навпаки). Перетворений текст покаже новий текст в окремому полі. Веб-сервіс також надасть кнопку для зворотної транслітерації з латиниці на кирилицю, якщо користувач хоче скасувати перетворення.
Веб-сервіс збереже форматування оригінального тексту.
Якщо можливо, веб-сервіс визначить мову вибраного тексту і виконає транслітерацію лише якщо текст написано кримськотатарською мовою. Якщо текст написано іншою мовою, веб-сервіс відобразить повідомлення, що інструмент не може транслітерувати текст.
Нефункціональні вимоги
Веб-сервіс повинен бути розроблений зі гнучкою архітектурою для розміщення майбутніх поліпшень та оновлень.
Веб-сервіс повинен відповідати всім відповідним нормам конфіденційності даних та безпеки.
Додаткові вимоги
Веб-сервіс підтримуватиме масову транслітерацію документів.
Веб-сервіс дозволить користувачам перевіряти вимоги та іноземні слова в тексті.
Веб-сервіс буде відкритим кодом і опублікованим у нашому репозиторії GitHub.
Веб-сервіс повинен включати механізм зворотного зв’язку для користувачів, щоб повідомляти про проблеми або пропонувати поліпшення.