Åbne .NET sprogresurser

www.m-8.dk har jeg frigivet en række .NET sprogresurser, som jeg har arbejdet med det sidste stykke tid.

Formålet har været at udvikle nogle kodestumper, som nogle af de få udviklere, der arbejder med tekst, har mulighed for at anvende i deres arbejde.

Det drejer sig fx som en HtmlTextDocument-klasse, der automatisk kan hente hjemmesider og udtrække ord, sætninger m.v. på baggrund af tags – fx samles alle ord, der forekommer i overskrifter, i alt-attributter, i p-tags m.v.

Mulighed for automatisk at skjule alle forekomster af mailadresser på en hjemmeside for spam-robotter.

Blandt resurserne er der også en række regulære udtryk til at udtrykke ord og sætninger af tekst, genkende mailadresser og andet.

Jeg har desuden udviklet en binær database, som er specialdesignet til at indeksere tekstdata.

En del af resurserne er udviklet på preview-plan, men måske det kan anvendes. Resurserne er skrevet i C# og kan downloades som .NET dll-filer.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s