Powerset Labs semantisk søgning

Så modtog jeg omsider en invitation til at afprøve Powerset Labs. Jeg så den i min indbakke i går aftes og har næsten ikke kunnet sove af spænding.

For kort at resumere: Powerset Labs er en af de helt nye bud på fremtidens (semantiske) søgning. Deres søgemaskine er endnu ikke offentlig, men er netop blevet lagt ud til betatest.

Betaudgaven byder indtil videre på mere eller mindre natursproglige søgninger i WikiPedia a la: Hvem grundlage Hotmail? Hvad har Haruki Murakami skrevet?

 Det er naturligvis ret sejt i det omfang, det kan lade sig gøre. Det tegner meget godt, og man skal huske på, at det kun er en beta-udgave, men her kommer et par skærmbilleder og en bette kommentar til det foreløbige arbejde.

 PowerSet Labs søgning på B&O

(Klik på billedet for at se det i fuld størrelse) 

Jeg synes, dette skærmbillede er meget sigende. I kolonnen til venstre kommer resultaterne fra PowerSet Labs, og i kolonnen til højre har de listet resultater fra ‘the other guys’ – hvem det så end er…

Det er interessant at se, hvordan powerset forsøger at svare på spørgsmålet ved at liste artikler, som handler om, hvad B&O rent faktisk har lavet eller medvirket til at udvikle – fx et Magnetic cartridge og noget Dolby noise reduction system. I modsætning hertil svarer ‘the other guys’ det, som vi er vant til – de leverer indgangssiden til B&O på WikiPedia. Umiddelbart er dette resultat mere anvendeligt – især fordi vi er vant til at tænke søgning på en bestemt måde, men det er interessant, hvordan PowerSets søgning virkelig forsøger at besvare det konkrete spørgsmål. Hvor godt det så lykkes – det kan man så altid diskutere;)

PowerSet Labs har også gjort en funktion tilgængelig, hvor det er muligt at dykke lidt ned i teknologien – PowerMouse kalder de det. Og det er mindst lige så interessant.

PowerMouse1 

(Klik på billedet for at se det i fuld størrelse) 

Øverst kan man se tre felter, der er bygget op i noget, der minder om en engelsk sætning: nogen (agent) gør noget (patient) – subjekt verbal objekt – eller Verbal(subjekt, objekt).

Blandt de eksempler, Powerset Labs selv fremhæver, er ‘batman : tell : robin’. Ovenfor ses et udsnit heraf, hvor man kan se, hvornår Batman har sagt hvad til Robin. Det er sådan set meget interessant. Men det er også interessant, at man kan udelade dele af queriet, fx: ____ invented HotMail:

Who invented hotmail - query 

(Klik på billedet for at se det i fuld størrelse) 

Af skærmbilledet fremgår det, at Powerset Labs ikke har ordet invented i sin database, men den har fundet andre Connections såsom acquire, back, found, include og launch. Det resulterer bl.a. i følgende resultater:

who invented hotmail, results

(Klik på billedet for at se det i fuld størrelse) 

Listen er ca. dobbelt så lang, og den giver brugeren en række muligheder, hvoraf flere er ganske interessante. Hvis man udfolder udvalgte elementer, ser det sådan ud:

Who invented hotmail - udfoldet resultater

(Klik på billedet for at se det i fuld størrelse) 

Her får man de informationer, man leder efter: Sabeer Bhatia var en af stifterne, og han solgte Hotmail til Microsoft i 1998 for $400 millioner. Denne form for behandling af naturlig sprog beror naturligvis på, at kilden er præcis og korrekt – her står der fx i én aftikel, at Sabeer Bhatia er Founder, og i en anden, at han er co-founder. Men overordnet, er det nogle meget fine resultater.

Med denne velkomst til PowerSet venter jeg spændt på at se en mere udbygget udgave og især til, at den egentlige udgave bliver præsenteret, hvilket vistnok bliver til næste år.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s