KorpusDK og dansk sprogteknologi

Et initiativ, jeg har vanvittig lyst til at rose og viderebringe: http://www.ordnet.dk/korpusdk/. Tidligere var korpusset opdelt i Korpus2000 og Korpus90, men altså nu samlet med en noget lækrere søgeflade, som bl.a. understøtter – hey – regulære udtryk:-D Eller i hvert fald simple regex-konstruktioner, men bedre end ingenting.

Jeg skal være ærlig og indrømme, at jeg ikke altid har været lige imponeret over niveauet i dansk sprogteknologi, som i vidt omfang bærer præg af alt for få resurser, for lidt teknisk pondus osv. – de, der lever for det, gør det helt sikkert godt, men tyngden gør, at det stadig kun er en garage(ba)rocksk undergrundsgeschäft – (pistolen er ikke kun rettet mod ‘de andre’ – det gælder desværre for så vidt også mine egne fritidsprojekter).

Men lad os få de gode projekter frem i lyset – og KorpusDK er et af dem!

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s