.pl .en .de .ru
Interdyscyplinarny blog badawczy pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych UAM

Poprawiamy swoje błędy

Filip Graliński

Po wczorajszym świętowaniu stupościa kol. Daniela mamy kaca (nic to, że piwo było bezalkoholowe). Myśl o tym, ile błędów popełniliśmy do tej pory na naszym blogu, nie daje nam spokoju.

Bierzemy się jednak w garść i chwytamy byka za rogi: w parę chwil skleciliśmy w powłoce (Linuksa oczywiście — koledzy windowsowcy, ile czasu by Wam to zajęło?) skrypt, który szuka błędów językowych na naszym blogu. Skrypt korzysta z dwóch narzędzi: programu Pandoc (by zamienić post w formacie Markdown na czysty tekst) oraz narzędzia LanguageTool (do właściwej korekty).

Swoją drogą, LanguageTool to świetny, acz niedoceniany otwartoźródłowy program do korekty ortograficznej, interpunkcyjnej i gramatycznej. Obsługuje kilkadziesiąt języków, w tym i język polski (pod względem liczby reguł polszczyzna zajmuje 5. miejsce). LanguageTool wykrywa wiele typów błędów, np. brakujące albo zbędne przecinki, podejrzane słowa typu miedzy (jeśli nie „zza miedzy”, to najprawdopodobniej zapomnieliśmy o ogonku), niektóre błędy fleksyjne czy stylistyczne (na przykład czepia się wyrażenia „z wielkiej litery”, o którym już pisaliśmy na naszym blogu). Polskimi regułami opiekuje się Marcin Miłkowski.

02/04

Anatomia pliku tekstowego — część I (wstęp)

Filip Graliński

Plik tekstowy? Cóż może być prostszego niż plik tekstowy?

Ala ma kota.

Widziałem ludzi walących głową w monitor. Widziałem zmarnowaną prace i zmarnowane tysiące dolarów. Widziałem całe pokoje pracowników kręcących się w kółko.

Wszystko dlatego że ktoś założył bezmyślnie, że plik tekstowy to najprostsza rzecz na świecie.

10/16