Реклама

✍🏻 Grammarly запустили проєкт, що допоможе створювати та покращувати онлайн-сервіси для української мови

У компанії планують створити GEC-корпус для української мови (UA-GEC) і викласти у відкритий доступ для загального користування. Очікується, що це значно прискорить розвиток галузі обробки природної української мови. Долучитись до проєкту зможуть усі охочі.
Čytaty latynkoju
✍🏻 Grammarly запустили проєкт, що допоможе створювати та покращувати онлайн-сервіси для української мови
  1. Головна
  2. Техно
  3. ✍🏻 Grammarly запустили проєкт, що допоможе створювати та покращувати онлайн-сервіси для української мови
  • Сподобався пост? Став вподобайку!
  • 0
У компанії планують створити GEC-корпус для української мови (UA-GEC) і викласти у відкритий доступ для загального користування. Очікується, що це значно прискорить розвиток галузі обробки природної української мови. Долучитись до проєкту зможуть усі охочі.

Проєкт Grammarly

Згідно з планами компанії, у рамках проєкту збиратимуть колекцію текстів, що написали звичайні люди — есеї, дописи в блогах та соцмережах, відгуки, листи тощо.

Лінгвісти Grammarly перевірять тексти на наявність граматичних, стилістичних чи орфографічних помилок. Ці дані будуть викладені у відкритий доступ і їх можна буде використати для тренування та оцінки програм виправлення граматичних помилок.

Загалом для української мови це матиме багато позитивних наслідків, наприклад:

  • нові онлайн-системи виправлення граматики в українськомовних текстах
  • прискорення розвитку українських комунікаційних асистентів
  • сприяння використанню якісної української мови в онлайні

До того ж це сприятиме розвитку галузі обробки природної мови (Natural Language Processing) в Україні, оскільки надасть більше інструментів для досліджень.

Читайте також: 🗺 «Мовна мапа світу»: можна почути есперанто в Полтаві та діалекти Закарпаття

Також в компанії зазначили, що процес знаходження помилок штучним інтелектом в англійській мові істотно відрізняється від української.  Це обумовлено розвиненою морфологією — на відміну від англійської, кожне слово тут має багато словоформ (закінчення, суфікси, префікси тощо).

Саме тому в Grammarly сподіваються, що цей проєкт прискорить розвиток місцевої (і не тільки) NLP-спільноти, а саме — надасть більше інструментів для досліджень та обробки природної мови.

Виправленням помилок в англійській мові займається вже не одне покоління дослідників, які назбирали значні обсяги даних. Для більшості мов, зокрема і для української, такої кількості мовних ресурсів просто немає. Це ще одна причина, чому методи, розроблені для англійської, не спрацюють для української. Однак не слід впадати у відчай! Це гарна нагода спробувати себе у задачі обробки мов з обмеженою кількістю ресурсів (low-resource GEC) або й у навчанні без учителя (unsupervised learning).

Сайт Grammarly

Долучитись до проєкту можна за посиланням. Можна написати есе, перекласти чи надіслати свій текст. Подавати тексти на обробку можна до 13 вересня.

Також ми вже раніше писали? Grammarly показали як змінився тон у листуваннях протягом пандемії, як Grammarly показали як змінився тон у листуваннях протягом пандемії.

Читайте Na chasi у Facebook і Twitter, підписуйтесь на канал у Telegram.

Share
Написати коментар
loading...