.pl .en .de .ru
Interdyscyplinarny blog badawczy pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych UAM

Na froncie płci

Filip Graliński

Przypominamy o naszym wyzwaniu „rozpoznaj płeć po krótkim fragmencie tekstowym”. Wyzwanie jest otwarte dla wszystkich chętnych na platformie Gonito.net.

Wyzwanie podjęli moi studenci uczestniczący w zajęciach z „Przetwarzania języka naturalnego”. Wpierw, w ramach rozgrzewki przygotowali proste rozwiązania oparte na ręcznie przygotowanych słownikach czy regułach. Oto jeden z tych (żeńskich) słowniczków: http://gonito.net/gitlist/petite-difference-challenge2.git/blob/submission-00210/Source/sjp-odm-20161121/Women.tsv (zaczyna się od ciąży i miesiączki). Takie prymitywne rozwiązania dają dokładność 51-52%, a więc niewiele większą niż gdyby zgadywać chybił-trafił (co daje 50% — korpus jest zrównoważony co do liczby tekstów męskich i żeńskich).

01/26

Zdrowe słowa — wyzwanie

Rafał Jaworski

Na platformie Gonito.net ruszyło kolejne wyzwanie. Tym razem szukamy poprawnych, czyli „zdrowych” słów w całym oceanie przeróżnych OCR-owych śmieci.

12/11

Seks-wyzwanie

Filip Graliński

Czy potrafisz rozpoznać płeć? Płeć autora krótkiego tekstu, na przykład takiego:

Przy okazji sie wydalo… Od zeszlego sylwestra odkrylem w sobie cos nowego i juz nie moge sie dluzej ukrywac :D

albo takiego:

Zanim natrafiłem na artykuł wykonałem już parę kroków, tj:

11/16