Nicolai Hartvig Sørensen

Seniorredaktør

  • Musik og sprog i reformationstidens danske salmesang
  • Ordnet.dk
  • Sproget.dk

Det Danske Sprog- og Litteraturselskab, DSL
Christians Brygge 1
DK-1219 København K
Tlf. +45 33 13 06 60 (DSL)

Direkte tlf. +45 50 777 464
E-mail: nhs@dsl.dk

Nicolai Hartvig Sørensen er seniorredaktør og sprogteknolog på Det Danske Sprog- og Litteraturselskab. Han har ansvar for udviklingen af ordbogsteknologien bag onlineversionerne af ordnet.dk og de historiske ordbøger Meyers Fremmedordbog, Holbergordbog, Moths Ordbog Latinsk-dansk Ordbog, Kalkars Ordbog og Svensk-Danskordbog samt for udviklingen af apps til ordbøgerne. Han er en del af webredaktionen på ordnet.dk og nyhedsredaktionen på dsl.dk.

I 2019 arbejder han på en digitalisering af Bergs Græsk-Dansk Ordbog og en renæssanceordbog baseret på flere mindre ordlister, en ny version af backend for ordbogsplatformen, med digital udnyttelse af de rigt opmærkede data i Brandes-projektet til forskning i litteratur og med evaluering og forbedring af en word2vec-model for dansk trænet på Den Danske Ordbogs 1 milliard ord store korpus i samarbejde med Center for Sprogteknologi. Han arbejder desuden med udgivelsen af opdateringer af Den Danske Ordbog.

Ansat på DSL siden 2005.

Fra 2018 en del af censorkorpset for lingvistik.

I sin tid på DSL har Nicolai tidligere arbejdet på:

  • DanNet (2005-2009) – Udvikling af et dansk leksikalsk-semantisk ordnet
  • Digitalisering og onlineversion af Ordbog over det danske Sprog (2005, 2010)
  • Grænseflade til KorpusDK (2007-08)
  • Onlineversion af Den Danske Ordbog (2008-09)
  • "Mente du"-funktion til ordbogsopslag (2009)
  • Anagramspillet Krasser (hobbyprojekt) (2009)
  • Digitalisering af og grænseflade til Holbergordbog (2009, 2010-11)
  • Opdatering af onlineversionen af Ordbog over det danske Sprog (2010)
  • Udviklingen af app til Den Danske Ordbog (2013) og historiske ordbøger (2014-15)
  • Onlineversionen af Moths Ordbog (2013-14)
  • Digitalisering af og onlineversion af Meyers Fremmedordbog (2014-15)
  • Onlineversion af Gammeldansk Ordbog (2015)
  • Medredaktør af Nyhedsbrev fra Det Danske Sprog- og Litteraturselskab (udgave 2, 3 og 4) (2016)
  • Onlineversion af Latinsk-dansk Ordbog (projektleder) (2016-18)
  • Digitalisering og onlineversion af Kalkars Ordbog (2016)
  • "Ord i nærheden", visning af ord fra Den Danske Begrebsordbog direkte i Den Danske Ordbog (2017-18)
  • "Word2Dict", et hjælpeværktøj til redigering af Den Danske Ordbog baseret på word embeddings trænet på ordbogens korpus (2017)
  • Onlineversion af Svensk-Dansk Ordbog (2018)
  • Visning af tilføjelser fra Supplement til Ordbog over det danske Sprog (2018)

 

Artikler m.m.

  • "From standalone thesaurus to integrated related words in the Danish Dictionary" (sammen med Nimb, Sanni og Thomas Troelsgård), In: Proceedings from Euralex 2018, Ljubliana, Slovenia, 2018 [PDF]
  • "Word2Dict – Lemma Selection and Dictionary Editing Assisted by Word Embeddings" (sammen med Nimb, Sanni), In: Proceedings from Euralex 2018, Ljubliana, Slovenia, 2018 [PDF]
  • "Combining Dictionaries, Wordnets and other Lexical Resources - Advantages and Challenges" (sammen med Pedersen, Bolette Sandford; Nimb, Sanni; Olsen, Sussi). In: Globalex Proceedings 2018, Miyasaki, Japan. 2018.
  • "The SemDaX Corpus - sense annotations with scalable sense inventories" (sammen med Pedersen, Bolette Sandford; Braasch, Anna; Johannsen, Anders Trærup; Martinez Alonso, Hector; Nimb, Sanni; Olsen, Sussi; Søgaard, Anders). In: Proceedings of the 10th edition of the Language Resources and Evaluation Conference, LREC 2016. Portorož, Slovenia. 2016
  • "Supersense tagging for Danish« (sammen med Martinez Alonso, Hector; Johannsen, Anders Trærup; Olsen, Sussi; Nimb, Sanni; Braasch, Anna; Søgaard, Anders; Pedersen, Bolette Sandford). In:Proceedings of the 20th Nordic Conference of Computational Linguistics NODALIDA 2015. Vol. 109 Linköping University Electronic Press. (NEALT (Northern European Association of Language Technology) Proceedings Series, Vol. 23), 2015
  • "Enriching a wordnet from a thesaurus" (sammen med Bolette S. Pedersen, Sanni Nimb, Anna Braasch & Thomas Troelsgård). In: Workshop Proceedings on Lexical Semantic Resources for NLP from the 19th Nordic Conference on Computational Linguistics (NODALIDA). Linköping Electronic Conference Proceedings; Volume 85 (ISSN 1650-3740), 2013
  • Nyt liv til støvede ordbøger (sammen med Thomas Troelsgård), In: Nordiske Studier i Leksikografi 15, 2015
  • Den Danske Ordbog som app: Hvorfor og hvordan? (sammen med Henrik Lorentzen, Lars Trap-Jensen), In: Nordiske Studier i Leksikografi 15, 2015
  • An odd couple – Corpus frequency and look-up frequency: what relationship? (sammen med Henrik Lorentzen, Lars Trap-Jensen) In: Iztok Kosem & Michael Rundell (eds.), Slovenščina 2.0, Volume 2 (2014), Issue 2, Trojina, Institute for Applied Slovene, Slovenia, pp. 94-113. [læs online]
  • Den Danske Ordbog som begrebsordbog (sammen med Lars Trap-Jensen), In: Nordiska Studier i Lexikografi 10, 2010, Rapport från Konferens om lexikografi i Norden, Tammerfors 3.-5. juni 2009, pp. 164-179.
  • DanNet: the challenge of compiling a wordnet for Danish by reusing a monoligual dictionary (sammen med Jørg Asmussen, Henrik Lorentzen, Sanni Nimb, Bolette Sandford Pedersen, Lars Trap-Jensen). In: Language Resources and Evaluation, Computational Linguistics Series, vol. 43, nr. 3. Springer, Netherlands, 2009, pp. 269-299
  • DanNet – leksikalsk semantisk WordNet for dansk (sammen med Sanni Nimb). I: Peter Widell og Mette Kunøe (red.) 11. Møde om Udforskningen af Dansk Sprog, Århus 2007.
  • Towards sounder taxonomies in wordnets (sammen med Bolette S. Pedersen). I: Alessandro Oltramari, Chu-Ren Huang, Alessandro Lenci, Paul Buitelaar, Christiane Fellbaum (eds.): Ontolex 2006, pp. 9-16. Genova, Italy. download
  • Når arvesølvet går online om modtagelsen af "ODS på nettet". I: LEDA-Nyt nr. 41, s. 26-29, 2006
  • DanNet – a wordnet for Danish. Bolette S. Pedersen, Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen, Henrik Lorentzen. In: Proceedings from Third International Conference on Global Wordnets. Jeju, South Corea. 2006. [rtf]

Foredrag

  • Dealing with "unwanted words" in an online dictionary - a non-invasive strategy (sammen med Henrik Lorentzen, Lars Trap-Jensen), ved eLex 2015. electronic lexicography in the 21st century: Linking lexical data in the digital age, Herstmoneaux, 12. oktober 2015
  • Om forskellene mellem den trykte version af Den Danske Ordbog og onlineversionen, ved besøg af Foreningen for Boghaandværk, Det Danske Sprog- og Litteraturselskab, København 29. september 2014
  • An odd couple - corpus frequency and look-up frequency: what relationship? (sammen med Henrik Lorentzen, Lars Trap-Jensen), ved eLex 2013. Electronic lexicography in the 21st century: thinking outside the paper, Tallinn, 18. oktober 2013
  • Den Danske Ordbog som begrebsordbog (sammen med Lars Trap-Jensen), ved 10. konference om leksikografi i Norden, Universitetet i Tampere,. 3.-5. juni 2009

Se medarbejdere