ScandSum
Automatisk resumering af avistekster på de
skandinaviske sprog
Nu kan man få nyhedsresumeer
på mobilen
Det første automatiske tekstresumeringsværktøj til
nyheder på dansk, norsk og svensk, ScandSum, er udviklet af en
forskergruppe fra den Kongelige Tekniske Højskole i Stockholm,
Center for Sprogteknologi ved Københavns Universitet og
Universitetet i Bergen. Projektet blev støttet af Nordisk
Ministerråd gennem NorFA
ScandSum kan bearbejde en nyhedstekst på et hvilket som helst af
de tre skandinaviske sprog og komprimere teksten til 20 procent
af originallængden med bibeholdelse af 80 procent af
indholdet. Et tekstresumeringsværktøj er et program,
som automatisk udtrækker de mest relevante dele af en tekst og
konstruerer en kortere ikke-redundant version af originalteksten.
ScandSum bygger på velafprøvet tekstresumeringsteknologi
med inddragelse af de nyeste resultater inden for sprokteknologien.
ScandSum er forsynet med en speciel algoritme for de skandinaviske
sprog, som identificerer de vigtigste nøgleord i teksten.
Forskergruppen har arbejdet i 5 år med at udvikle systemet og har
testet det på et antal aviser i Norden.
Forskergruppen planlægger nu at kommercialisere teknikken og
søger partnere til dette. Et stort anvendelsesområde for
teknologien findes inden for resumerede nyheder til de små
skærme på mobiltelefoner og PDA’er. Teknologien er
også relevant inden for området Business Intelligence, hvor
man--blandt andet--er interesseret i at få resumeer af komplekse
begivenheder. I kombination med en søgemaskine kan
specifikke nøgleord, som ScandSum identificerer i forbindelse
med resumering af et dokument, bruges til at finde andre dokumenter med
lignende indhold. Nøgleordene kan også bruges til at
få et hurtigt overblik over andre dokumenter, som man har
fået som hits på sin søgning. Systemet kan
også anvendes til at resumere tekster, der efterfølgende
skal læses op med syntetisk tale fx for bilister eller blinde.
”Vi tror at denne teknologi kommer til at revolutionere hele
nyhedsbranchen når nyhederne kan tilpasses til brugerne. Dette
betyder også, at aviserne kunne trykkes hurtigere, og
digitale nyheder kunne skræddersyes til flere forskellige typer
af læsere”, siger projektleder Docent Hercules Dalianis.
Tekstresumeringssystemet kan afvikles enten over Internettet eller
lokalt på en server. ScandSum kan afprøves gratis
på adressen http://swesum.nada.kth.se
For yderligere information kontakt docent Hercules Dalianis på
email: hercules@kth.se eller tel +46 70-568 13 59.
ScandSum-resume af teksten på
den foregående side
Nu kan man få nyhedsresumeer
på mobilen
Det første automatiske tekstresumeringsværktøj til
nyheder på dansk, norsk og svensk, ScandSum, er udviklet af en
forskergruppe fra den Kongelige Tekniske Højskole i Stockholm,
Center for Sprogteknologi ved Københavns Universitet og
Universitetet i Bergen.
ScandSum kan bearbejde en nyhedstekst på et hvilket som helst af
de tre skandinaviske sprog og komprimere teksten til 20 procent af
originallængden med bibeholdelse af 80 procent af indholdet.
ScandSum er forsynet med en speciel algoritme for de skandinaviske
sprog, som identificerer de vigtigste nøgleord i teksten.
Lexicon: Danish
Words before 351
Words after 92
Summary length: 26%
Type of text: tidningstext
Keywords: nyhed tekst
forskergruppe identificerer universitet teknologi nøgleord sprog
docent dokument