.pl .en .de .ru
Interdyscyplinarny blog badawczy pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych UAM

Poprawiamy swoje błędy

Filip Graliński

Po wczorajszym świętowaniu stupościa kol. Daniela mamy kaca (nic to, że piwo było bezalkoholowe). Myśl o tym, ile błędów popełniliśmy do tej pory na naszym blogu, nie daje nam spokoju.

Bierzemy się jednak w garść i chwytamy byka za rogi: w parę chwil skleciliśmy w powłoce (Linuksa oczywiście — koledzy windowsowcy, ile czasu by Wam to zajęło?) skrypt, który szuka błędów językowych na naszym blogu. Skrypt korzysta z dwóch narzędzi: programu Pandoc (by zamienić post w formacie Markdown na czysty tekst) oraz narzędzia LanguageTool (do właściwej korekty).

Swoją drogą, LanguageTool to świetny, acz niedoceniany otwartoźródłowy program do korekty ortograficznej, interpunkcyjnej i gramatycznej. Obsługuje kilkadziesiąt języków, w tym i język polski (pod względem liczby reguł polszczyzna zajmuje 5. miejsce). LanguageTool wykrywa wiele typów błędów, np. brakujące albo zbędne przecinki, podejrzane słowa typu miedzy (jeśli nie „zza miedzy”, to najprawdopodobniej zapomnieliśmy o ogonku), niektóre błędy fleksyjne czy stylistyczne (na przykład czepia się wyrażenia „z wielkiej litery”, o którym już pisaliśmy na naszym blogu). Polskimi regułami opiekuje się Marcin Miłkowski.

02/04