.pl .en .de .ru
Interdyscyplinarny blog badawczy pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych UAM

Anatomia pliku tekstowego — część IIb (piekło końca wiersza, cd.)

Filip Graliński

Piekło końca wiersza ma zakątki, o których dowiedziałem się dopiero niedawno…

Jak wiemy z poprzedniego wpisu z tego cyklu w różnych systemach operacyjnych różnie zaznacza się koniec wiersza — w Linuksie używamy znaku o kodzie (szesnastkowo) 0a, w Windowsie — dwuznaku 0d-0a. A co jeśli użyjemy samego znaku o kodzie 0d (w wielu językach programowania oznaczanego za pomocą sekwencji \r)??

03/04

Poprawiamy swoje błędy

Filip Graliński

Po wczorajszym świętowaniu stupościa kol. Daniela mamy kaca (nic to, że piwo było bezalkoholowe). Myśl o tym, ile błędów popełniliśmy do tej pory na naszym blogu, nie daje nam spokoju.

Bierzemy się jednak w garść i chwytamy byka za rogi: w parę chwil skleciliśmy w powłoce (Linuksa oczywiście — koledzy windowsowcy, ile czasu by Wam to zajęło?) skrypt, który szuka błędów językowych na naszym blogu. Skrypt korzysta z dwóch narzędzi: programu Pandoc (by zamienić post w formacie Markdown na czysty tekst) oraz narzędzia LanguageTool (do właściwej korekty).

Swoją drogą, LanguageTool to świetny, acz niedoceniany otwartoźródłowy program do korekty ortograficznej, interpunkcyjnej i gramatycznej. Obsługuje kilkadziesiąt języków, w tym i język polski (pod względem liczby reguł polszczyzna zajmuje 5. miejsce). LanguageTool wykrywa wiele typów błędów, np. brakujące albo zbędne przecinki, podejrzane słowa typu miedzy (jeśli nie „zza miedzy”, to najprawdopodobniej zapomnieliśmy o ogonku), niektóre błędy fleksyjne czy stylistyczne (na przykład czepia się wyrażenia „z wielkiej litery”, o którym już pisaliśmy na naszym blogu). Polskimi regułami opiekuje się Marcin Miłkowski.

02/04

Anatomia pliku tekstowego — część II (piekło końca wiersza)

Filip Graliński

(Zobacz I odcinek cyklu).

Przetwarzasz prosty plik tekstowy i dzieje się coś dziwnego. Wiersze zdają się mieć inną długość niż to, co widzisz na ekranie. Albo duży plik tekstowy jest traktowany tak, jakby wszystko było zapisane w jednej linii.

Witamy w piekle końca wiersza. W kotle diabły gotują Billa Gatesa.

01/28

Bez komentarza 10

Filip Graliński

01/09

XIX-wieczni programiści

Daniel Dzienisiewicz

Dziś będzie nieco fragmentarycznie, ale to nic: miłe wrażenia należy dozować z głową i czasem warto pozostawić niedosyt.

Czy programista to nowy wyraz? I tak i nie. Tak, bo w znaczeniu ‘osoba, która tworzy programy komputerowe’ występuje co najmniej odkąd powstały komputery. Nie, bo… w takiej formie graficznej istniał już stosunkowo dawno. Należy zatem uznać go za neosemantyzm.

10/28

Anatomia pliku tekstowego — część I (wstęp)

Filip Graliński

Plik tekstowy? Cóż może być prostszego niż plik tekstowy?

Ala ma kota.

Widziałem ludzi walących głową w monitor. Widziałem zmarnowaną prace i zmarnowane tysiące dolarów. Widziałem całe pokoje pracowników kręcących się w kółko.

Wszystko dlatego że ktoś założył bezmyślnie, że plik tekstowy to najprostsza rzecz na świecie.

10/16

Komputer – kto da wcześniej?

Daniel Dzienisiewicz

Kolejny konkurs chronologizacyjny! Tym razem na tapet bierzemy wyraz komputer.

W naszych zbiorach rzeczownik ten ujawnia się najwcześniej w 1965 r. Kontekst odsyła nas jednak do tekstu starszego o rok:

oai:http://bbc.uw.edu.pl:274

Kto da wcześniej?

09/21