Du er her: Forside / Sprog / Ordbøger og sprogteknologi / DanNet

DanNet

I DanNet er det betydningerne og ikke ordene der er i centrum. Projektet går ud på at beskrive forbindelser mellem betydninger i et leksikalsk-semantisk netværk.

DanNet er et forsknings- og udviklingsprojekt der går ud på at udarbejde et leksikalsk-semantisk wordnet for dansk efter samme principper som flere tilsvarende internationale WordNets. Et WordNet er opbygget af en samling af begreber eller “betydninger” (fx ‘apparat der modtager tv-signaler og omsætter dem til bevægelige billeder på en skærm’) med tilknyttede leksikaliserede udtryk (fx fjernsyn, tv, tossekasse). Sådanne helheder bestående af begreber og deres leksikaliserede udtryk udgør ordnettets byggestene. De enkelte synonymsæt forbindes med hinanden ved at definere de betydningsmæssige relationer der hersker mellem dem, fx over- og underbegreber (fx ‘kop’ – ‘tekop’), del-helhed (fx ‘hank’ – ‘kop’) og funktionsrelationer (fx ‘beholder’ – ‘indeholde’). Gennem relationerne etableres en leksikalsk semantisk beskrivelse i form af et semantisk net.

Formålet med DanNet og de tilsvarende internationale projekter for mange af verdens sprog er primært forskellige former for informationsnavigering i elektroniske tekster, fx på internettet. At kunne håndtere og navigere i store informationsmængder er absolut nødvendigt i dagens – og ikke mindst i fremtidens – informationssamfund. Trenden går i retningen af at navigationsværktøjer bliver mere indholdsbaserede og dermed mere raffinerede, og i denne sammenhæng udgør et wordnet en helt central resurse. Det er vigtigt at nye værktøjer til informationshåndtering også understøtter dansk.

Projektet er gennemført som et samarbejde mellem Det Danske Sprog- og Litteraturselskab og Center for Sprogteknologi, Københavns Universitet, og udnytter to allerede eksisterende datasamlinger for dansk, dels Den Danske Ordbog, dels den sprogteknologiske ordbase STO/SIMPLE.

Projektets første fase blev finansieret af Forskningsrådet for Kultur og Kommunikation, og ved projektperiodens udløb marts 2009 blev en første version af resursen stillet til rådighed for offentligheden som open source. DanNet kan frit downloades fra projektets hjemmeside.

I perioden 2009-2011 blev databasen videreudviklet inden for rammerne af DK-CLARIN, finansieret af Forsknings- og Innovationsstyrelsens nationale pulje for forskningsinfrastruktur. Derved er det samlede omfang på ca. 65.000 synonymsæt.

DanNet indgår også i redigeringen af Den Danske Begrebsordbog.

Gå til DanNets hjemmeside

 

Over-/underbegrebshierarki
Over-/underbegrebshierarki