Čínsky jazykový korpus

Čínsky korpus

Na našom akademickom pracovisku sme v roku 2016 začali s budovaním čínskeho monolingválneho korpusu Hanku. Hanku je synchrónny korpus čínskeho jazyka dostupný cez webové rozhranie na stránkach <konfuciovinstitut.sk>. Korpus vznikol vďaka podpore Chinese National Office for Teaching Chinese as a Foreign Language (2016).

Korpus má rozsah viac ako 1 miliardu tokenov (slov) a je využívaný v lingvistickom výskume i v otázkach didaktiky jazyka. Korpus je dostupný cez webové rozhranie s pokročilým korpusovým manažérom. Texty v korpuse sú doplnené o štýlovo-žánrovú anotáciu, slová o slovnodruhovú (POS) a pripravujeme syntaktickú anotáciu.

Via o korpuse pozri: 

http://konfuciovinstitut.sk/corpus-hanku/

alebo video.