✍🏻 Grammarly rozrobyly GEC-korpus ukraїnśkoї — ščo ce take ta ščo daje

Читати кирилицею
✍🏻 Grammarly rozrobyly GEC-korpus ukraїnśkoї — ščo ce take ta ščo daje

GEC-korpus ukraїnśkoї vid Grammarly

GEC-korpus — ce sukupnisť tekstiv, avtoramy jakyh je zvyčajni ljudy. Odnak čerez ljudśkyj faktor taki teksty možuť maty odruky ta pomylky — servis GEC (Grammatical Error Correction) maje na meti vypravyty taki pomylky.

Lingvisty Grammarly pereviryly teksty na najavnisť gramatyčnyh, stylistyčnyh čy orfografičnyh pomylok. Ci dani vyklaly u vidkrytyj dostup i їh možna vykorystaty dlja trenuvannja ta ocinky program vypravlennja gramatyčnyh pomylok. Pryznačennja korpusu — naukove ta praktyčne vyvčennja movy.

GEC-korpus ukraїnśkoї movy✍? Grammarly zapustyly projekt, ščo dopomože stvorjuvaty ta pokraščuvaty onlajn-servisy dlja ukraїnśkoї movy naličuje ponad tysjaču riznožanrovyh tekstiv (a ce biľš niž 20 000 rečeń), jaki napysaly majže 500 volonteriv z usijeї Ukraїny ta z-za kordonu.

Čytajte takož: 😤 Movnyj ombudsmen proponuje stvoryty zastosunok dlja skarg na porušennja zakonu pro movu

Golovnymy perevagamy servisu je:

  • Cej projekt spryjatyme rozvytku onlajn-system vypravlennja gramatyky v ukraїnśkomovnyh tekstah. Ukraїnśka mova vhodyť do 50 najpošyrenišyh mov svitu; vodnočas jakisnyh tekstovyh resursiv dlja doslidžennja ukraїnśkoї zaraz isnuje nebagato. GEC-korpus nadaje ukraїnśkij doslidnyćkij spiľnoti šče odyn instrument dlja opracjuvannja pryrodnoї movy ta može pryskoryty rozvytok ukraїnśkyh komunikacijnyh asystentiv.
  • Populjaryzacija jakisnoї ukraїnśkoї movy v onlajni. Cej korpus bude korysnym dlja naukovoї spiľnoty, adže nadasť biľše instrumentiv dlja doslidžeń ta v rezuľtati bude korysnym dlja tyh, hto spilkujeťsja ukraїnśkoju onlajn.

Okrim togo, projekt zi zboru ta napovnennja GEC-korpusu ukraїnśkoї movy staje postijnym u Grammarly i bude častynoju vnesku kompaniї u rozvytok ukraїnśkogo NLP (natural language processing — opracjuvannja pryrodnoї movy). Komanda prodovžyť napovnjuvaty korpus tekstamy za dopomogoju vebsajtu projektu, a takož pracjuvatyme nad udoskonalennjam jogo tehničnoї cinnosti, ščob zbiľšyty jogo značennja dlja naukovoї spiľnoty.

My vbačajemo v ćomu projekti osoblyvu cinnisť dlja rozvytku ukraїnśkoї komp'juternoї lingvistyky ta ukraїnśkoї movy onlajn i same tomu uhvalyly rišennja zrobyty cej projekt postijnym dlja našoї kompaniї. Jakščo pidsumuvaty prostymy slovamy značennja cijeї iniciatyvy, to ce odyn iz maleńkyh krokiv, jaki nablyžajuť nas do čudovoї mety — navčyty komp'juter šče krašče rozumity ukraїnśku movu. Same ce nadyhaje vsju našu komandu!

Nastasija Osidač, Menedžerka komandy komp'juternyh lingvistiv Grammarly ta kerivnycja projektu zi zboru korpusu

Ci dani buduť korysni tym, hto cikavyťsja lingvistykoju, — vid studenta-naukovcja do pryvatnoї kompaniї — i dlja doslidnyćkoї roboty, i dlja stvorennja abo polipšennja vlasnogo onlajn-zastosunka, produktu toščo.

My zrobyly GEC-korpus zagaľnodostupnym, tož beriť jogo, doslidžujte ta rozvyvajte komp'juterne opracjuvannja ukraїnśkoї movy! Okrim dopovnennja samogo korpusu tekstamy, komanda aktyvno vdoskonaljuvatyme jogo tehničnu cinnisť. Naši lingvisty pidgotujuť dodatkovyj variant anotaciї, ščo dasť zmogu vykorystovuvaty korpus u dvoh riznyh zavdannjah: vypravlenni tiľky gramatyky ta vypravlenni gramatyky j stylju, ščo suttjevo zbiľšuje možlyvosti jogo vykorystannja ta značennja

Oleksij Syvokoń, Inžener-doslidnyk Grammarly

Zavantažyty korpus možna za posylannjam.