<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:media="http://search.yahoo.com/mrss/"
		>
<channel>
	<title>Comments on: Automatiske søgeord på hjemmesider</title>
	<atom:link href="http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/feed/" rel="self" type="application/rss+xml" />
	<link>http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/</link>
	<description>.NET, language technology, and a teaspoon of linguistics</description>
	<lastBuildDate>Mon, 09 Nov 2009 17:57:50 +0000</lastBuildDate>
	<generator>http://wordpress.com/</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: retkomma</title>
		<link>http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-11</link>
		<dc:creator>retkomma</dc:creator>
		<pubDate>Sat, 18 Aug 2007 10:01:14 +0000</pubDate>
		<guid isPermaLink="false">http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-11</guid>
		<description>Hej igen

Efter dine kommentarer er der tilføjet den funktion til testudgaven, at den kan analysere html-sider, der ikke opmærker tekst i p-tags.

Der er foreløbigt lagt den restriktion på, at det kun gælder sider, der helt udelader brugen af p-tags, således at for hjemmesider, der anvender en blanding af opmærket og ikke-opmærket tekst, vil kun den opmærkede del blive medtaget.

Således kan fx http://ordkloveren.mono-hq.com/ nu analyseres:)

Vh. Morten</description>
		<content:encoded><![CDATA[<p>Hej igen</p>
<p>Efter dine kommentarer er der tilføjet den funktion til testudgaven, at den kan analysere html-sider, der ikke opmærker tekst i p-tags.</p>
<p>Der er foreløbigt lagt den restriktion på, at det kun gælder sider, der helt udelader brugen af p-tags, således at for hjemmesider, der anvender en blanding af opmærket og ikke-opmærket tekst, vil kun den opmærkede del blive medtaget.</p>
<p>Således kan fx <a href="http://ordkloveren.mono-hq.com/" rel="nofollow">http://ordkloveren.mono-hq.com/</a> nu analyseres:)</p>
<p>Vh. Morten</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: retkomma</title>
		<link>http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-10</link>
		<dc:creator>retkomma</dc:creator>
		<pubDate>Fri, 17 Aug 2007 10:59:26 +0000</pubDate>
		<guid isPermaLink="false">http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-10</guid>
		<description>Hej igen!

Det er rigtigt, at testudgaven har flere begrænsninger. Forskellen på testudgaven og den egentlige implementering af nøgleordsgeneratoren er kort fortalt:

- testudgaven er nødt til at &#039;requeste&#039; en hjemmeside på baggrund af den adresse, du indtaster, og er herefter nødt til selv at regne ud, hvad i html-koden der er &#039;rigtig&#039; tekst

- i den egentlige implementering vil man nøjes med automatisk at sende den del af teksten på hjemmeside, som er &#039;rigtig&#039; tekst til nøgleordsgeneratoren og på den måde sikre sig, at al tekst og kun den rigtige tekst bliver analyseret.

På din hjemmeside (www.ordkloeveren.dk) anvendes der fx ikke -tags, som er det sted på en hjemmeside, hvor man normalt indtaster almindelig tekst. I stedet er teksten indtastet uden at være opmærket. Det er der som sådan ingenting i vejen med - det ændrer ikke noget for brugeren - men det kan gøre det vanskeligere at arbejde med sidens html-kode automatisk.

For at illustrere forskellen har jeg tilladt mig at kopiere teksten over i en ny fil og indsætte p-tags omkring den: http://www.m-8.dk/ordkloeveren.htm. Hvis denne tekst analyseres, finder nøgleordsgeneratoren p.t. frem til følgende nøgleord:

- kvalitetsniveau
- konsulentvirksomhed
- konkurrenceparameter
- tekster
- forst
- samarbejdspartner
- kriterium
- omverden
- parameter
- sparring
- organisation
- niveau
- bevidsthed
- sproglig
- genre

Som det fremgår er nogle af ordene ubrugelige (fx forst), hvilket næsten altid vil være tilfældet. Andre af dem er ganske fine. Fx vil disse søgeord styrke søgninger efter fx &#039;sproglig rådgivning&#039; eller &#039;konsulent tekster&#039;.

Eksemplet her giver et nogenlunde pejlemærke for, hvordan nøgleordsgeneratoren vil fungere i praksis, omend en implementeret analyse af det enkelte websted naturligvis altid er at foretrække.

Med hensyn til bloggen (blogbogstaver.dk) vil en implementering her kræve lidt større arbejde, især fordi du anvender en del fremmedsprog, hvilket generatoren har vanskeligt ved at håndtere (svensk, engelsk og vist også tysk, hvis jeg husker rigtigt). Samtidig er generatoren målrettet mellemlange tekststykker, og blogforsiden giver således heller ikke optimale søgeord.

De enkelte blogindlæg giver derimod bedre resultater. Fx giver dit seneste indlæg fra en sommerhus-tur:

redskabsskur
uret
post
redskab
trækvogn
gasflaske
ketsjer
dynge
sommerhus
søster
depression
blod
reference
time
værktøj


Formålet med denne første udgave af generatoren har været at skabe et redskab, der er reelt anvendeligt. Vi arbejder løbende videre med at forbedre og tilpasse resultaterne af generatoren. 

Foreløbigt har vi hovedsageligt fokuseret på at implementere en matematisk algoritme, som beskriver ordenes relevans. Den vil vi supplere yderligere med mere lingvistiske elementer, fx kunne man forsøge at vægte ord højere pba. syntaktisk funktion, sætningernes placering i teksten m.v. Desuden arbejder vi på at nå så generelle betydninger som muligt, fx vil &#039;kvalitet&#039; sikkert være et bedre ord end &#039;kvalitetsniveau&#039; som søgeord på sin hjemmeside, jf. ovenstående eksempel.

Den nyeste udgave af generatoren kan altid findes på www.m-8.dk/keywords/.

Håber det var til nogen hjælp.

Vh. Morten</description>
		<content:encoded><![CDATA[<p>Hej igen!</p>
<p>Det er rigtigt, at testudgaven har flere begrænsninger. Forskellen på testudgaven og den egentlige implementering af nøgleordsgeneratoren er kort fortalt:</p>
<p>- testudgaven er nødt til at &#8216;requeste&#8217; en hjemmeside på baggrund af den adresse, du indtaster, og er herefter nødt til selv at regne ud, hvad i html-koden der er &#8216;rigtig&#8217; tekst</p>
<p>- i den egentlige implementering vil man nøjes med automatisk at sende den del af teksten på hjemmeside, som er &#8216;rigtig&#8217; tekst til nøgleordsgeneratoren og på den måde sikre sig, at al tekst og kun den rigtige tekst bliver analyseret.</p>
<p>På din hjemmeside (www.ordkloeveren.dk) anvendes der fx ikke -tags, som er det sted på en hjemmeside, hvor man normalt indtaster almindelig tekst. I stedet er teksten indtastet uden at være opmærket. Det er der som sådan ingenting i vejen med &#8211; det ændrer ikke noget for brugeren &#8211; men det kan gøre det vanskeligere at arbejde med sidens html-kode automatisk.</p>
<p>For at illustrere forskellen har jeg tilladt mig at kopiere teksten over i en ny fil og indsætte p-tags omkring den: <a href="http://www.m-8.dk/ordkloeveren.htm" rel="nofollow">http://www.m-8.dk/ordkloeveren.htm</a>. Hvis denne tekst analyseres, finder nøgleordsgeneratoren p.t. frem til følgende nøgleord:</p>
<p>- kvalitetsniveau<br />
- konsulentvirksomhed<br />
- konkurrenceparameter<br />
- tekster<br />
- forst<br />
- samarbejdspartner<br />
- kriterium<br />
- omverden<br />
- parameter<br />
- sparring<br />
- organisation<br />
- niveau<br />
- bevidsthed<br />
- sproglig<br />
- genre</p>
<p>Som det fremgår er nogle af ordene ubrugelige (fx forst), hvilket næsten altid vil være tilfældet. Andre af dem er ganske fine. Fx vil disse søgeord styrke søgninger efter fx &#8217;sproglig rådgivning&#8217; eller &#8216;konsulent tekster&#8217;.</p>
<p>Eksemplet her giver et nogenlunde pejlemærke for, hvordan nøgleordsgeneratoren vil fungere i praksis, omend en implementeret analyse af det enkelte websted naturligvis altid er at foretrække.</p>
<p>Med hensyn til bloggen (blogbogstaver.dk) vil en implementering her kræve lidt større arbejde, især fordi du anvender en del fremmedsprog, hvilket generatoren har vanskeligt ved at håndtere (svensk, engelsk og vist også tysk, hvis jeg husker rigtigt). Samtidig er generatoren målrettet mellemlange tekststykker, og blogforsiden giver således heller ikke optimale søgeord.</p>
<p>De enkelte blogindlæg giver derimod bedre resultater. Fx giver dit seneste indlæg fra en sommerhus-tur:</p>
<p>redskabsskur<br />
uret<br />
post<br />
redskab<br />
trækvogn<br />
gasflaske<br />
ketsjer<br />
dynge<br />
sommerhus<br />
søster<br />
depression<br />
blod<br />
reference<br />
time<br />
værktøj</p>
<p>Formålet med denne første udgave af generatoren har været at skabe et redskab, der er reelt anvendeligt. Vi arbejder løbende videre med at forbedre og tilpasse resultaterne af generatoren. </p>
<p>Foreløbigt har vi hovedsageligt fokuseret på at implementere en matematisk algoritme, som beskriver ordenes relevans. Den vil vi supplere yderligere med mere lingvistiske elementer, fx kunne man forsøge at vægte ord højere pba. syntaktisk funktion, sætningernes placering i teksten m.v. Desuden arbejder vi på at nå så generelle betydninger som muligt, fx vil &#8216;kvalitet&#8217; sikkert være et bedre ord end &#8216;kvalitetsniveau&#8217; som søgeord på sin hjemmeside, jf. ovenstående eksempel.</p>
<p>Den nyeste udgave af generatoren kan altid findes på <a href="http://www.m-8.dk/keywords/" rel="nofollow">http://www.m-8.dk/keywords/</a>.</p>
<p>Håber det var til nogen hjælp.</p>
<p>Vh. Morten</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Ordkløveren</title>
		<link>http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-9</link>
		<dc:creator>Ordkløveren</dc:creator>
		<pubDate>Fri, 17 Aug 2007 07:25:14 +0000</pubDate>
		<guid isPermaLink="false">http://retkomma.wordpress.com/2007/08/13/automatiske-s%c3%b8geord-pa-hjemmesider/#comment-9</guid>
		<description>Det er en sjov ide. Men hvis jeg fx prøver at indskrive min blog (www.blogbogstaver.dk) er det nogle ret ubrugelige ord, der kommer op. Er det fordi den kun tager den synlige del af blogposterne eller...?

Bagefter prøvede jeg på min hjemmeside www.ordkloeveren.dk - og der kommer slet ikke noget op.... æh... gør jeg noget galt?</description>
		<content:encoded><![CDATA[<p>Det er en sjov ide. Men hvis jeg fx prøver at indskrive min blog (www.blogbogstaver.dk) er det nogle ret ubrugelige ord, der kommer op. Er det fordi den kun tager den synlige del af blogposterne eller&#8230;?</p>
<p>Bagefter prøvede jeg på min hjemmeside <a href="http://www.ordkloeveren.dk" rel="nofollow">http://www.ordkloeveren.dk</a> &#8211; og der kommer slet ikke noget op&#8230;. æh&#8230; gør jeg noget galt?</p>
]]></content:encoded>
	</item>
</channel>
</rss>
