ScandSum

Automatisk resumering af avistekster på de skandinaviske sprog


Nu kan man få nyhedsresumeer på mobilen
Det første automatiske tekstresumeringsværktøj til nyheder på dansk, norsk og svensk, ScandSum, er udviklet af en forskergruppe fra den Kongelige Tekniske Højskole i Stockholm, Center for Sprogteknologi ved Københavns Universitet og Universitetet i Bergen. Projektet  blev støttet af Nordisk Ministerråd gennem NorFA

ScandSum kan bearbejde en nyhedstekst på et hvilket som helst af de tre skandinaviske sprog og komprimere teksten  til 20 procent af originallængden med bibeholdelse af 80 procent af  indholdet.  Et tekstresumeringsværktøj er et program, som automatisk udtrækker de mest relevante dele af en tekst og konstruerer en kortere ikke-redundant version af originalteksten.

ScandSum bygger på velafprøvet tekstresumeringsteknologi med inddragelse af de nyeste resultater inden for sprokteknologien. ScandSum er forsynet med en speciel algoritme for de skandinaviske sprog, som identificerer de vigtigste nøgleord i teksten.  Forskergruppen har arbejdet i 5 år med at udvikle systemet og har testet det på et antal aviser i Norden.

Forskergruppen planlægger nu at kommercialisere teknikken og søger partnere til dette. Et stort anvendelsesområde for teknologien findes inden for resumerede nyheder til de små  skærme på mobiltelefoner og PDA’er. Teknologien er også relevant inden for området Business Intelligence, hvor man--blandt andet--er interesseret i at få resumeer af komplekse begivenheder.  I kombination med en søgemaskine kan specifikke nøgleord, som ScandSum identificerer i forbindelse med resumering af et dokument, bruges til at finde andre dokumenter med lignende indhold. Nøgleordene kan også bruges til at få et hurtigt overblik over andre dokumenter, som man har fået som hits på sin søgning. Systemet kan også anvendes til at resumere tekster, der efterfølgende skal læses op med syntetisk tale fx for bilister eller blinde.

”Vi tror at denne teknologi kommer til at revolutionere hele nyhedsbranchen når nyhederne kan tilpasses til brugerne. Dette betyder også, at aviserne  kunne trykkes hurtigere, og digitale nyheder kunne skræddersyes til flere forskellige typer af læsere”, siger projektleder Docent Hercules Dalianis.

Tekstresumeringssystemet kan afvikles enten over Internettet eller lokalt på en server.  ScandSum kan afprøves gratis på adressen http://swesum.nada.kth.se

For yderligere information kontakt docent Hercules Dalianis på email: hercules@kth.se eller tel +46 70-568 13 59.

ScandSum-resume af teksten på den foregående side

Nu kan man få nyhedsresumeer på mobilen
Det første automatiske tekstresumeringsværktøj til nyheder på dansk, norsk og svensk, ScandSum, er udviklet af en forskergruppe fra den Kongelige Tekniske Højskole i Stockholm, Center for Sprogteknologi ved Københavns Universitet og Universitetet i Bergen.
ScandSum kan bearbejde en nyhedstekst på et hvilket som helst af de tre skandinaviske sprog og komprimere teksten til 20 procent af originallængden med bibeholdelse af 80 procent af indholdet. ScandSum er forsynet med en speciel algoritme for de skandinaviske sprog, som identificerer de vigtigste nøgleord i teksten.

Lexicon: Danish
Words before 351
Words after 92
Summary length: 26%
Type of text: tidningstext
Keywords: nyhed tekst forskergruppe identificerer universitet teknologi nøgleord sprog docent dokument