Nicolai Hartvig Sørensen

Seniorredaktør

  • Musik og sprog i reformationstidens danske salmesang
  • Ordnet.dk
  • Sproget.dk

Det Danske Sprog- og Litteraturselskab, DSL
Christians Brygge 1
DK-1219 København K
Tlf. +45 33 13 06 60 (DSL)

Direkte tlf. +45 50 777 464
E-mail: nhs@dsl.dk

Nicolai Hartvig Sørensen er seniorredaktør og sprogteknolog på Det Danske Sprog- og Litteraturselskab. Han har ansvar for udviklingen af ordbogsteknologien bag onlineversionerne af ordnet.dk og de historiske ordbøger Meyers Fremmedordbog, Holbergordbog, Moths Ordbog Latinsk-dansk Ordbog og Kalkars Ordbog samt for udviklingen af apps til ordbøgerne. Han er desuden af og til vikarierende Twitterredaktør for Den Danske Ordbog og en del af webredaktionen på ordnet.dk.

I 2018 arbejder han på udgivelsen af den endelige version af Jensen og Goldschmidts Latinsk-dansk Ordbog, en ny version af Ordbog over det danske Sprog der inkluderer supplementsbindene til ordbogen og en onlineversion af Svensk-Dansk Ordbog. Han arbejder med en afprøvning af en lemmatiser for Brandes-projektet og med evaulering af en word2vec-model for dansk trænet på Den Danske Ordbogs korpus, begge i samarbejde med Center for Sprogteknologi. Han arbejder desuden med udgivelsen af opdateringer af Den Danske Ordbog og er en del af redaktionen på sproget.dk.

Ansat på DSL siden 2005.

Fra 2018 en del af censorkorpset for lingvistik.

I sin tid på DSL har Nicolai tidligere arbejdet på:

  • DanNet (2005-2009) – Udvikling af et dansk leksikalsk-semantisk ordnet
  • Digitalisering og onlineversion af Ordbog over det danske Sprog (2005, 2010)
  • Grænseflade til KorpusDK (2007-08)
  • Onlineversion af Den Danske Ordbog (2008-09)
  • "Mente du"-funktion til ordbogsopslag (2009)
  • Anagramspillet Krasser (hobbyprojekt) (2009)
  • Digitalisering af og grænseflade til Holbergordbog (2009, 2010-11)
  • Opdatering af onlineversionen af Ordbog over det danske Sprog (2010)
  • Udviklingen af app til Den Danske Ordbog (2013) og historiske ordbøger (2014-15)
  • Onlineversionen af Moths Ordbog (2013-14)
  • Digitalisering af og onlineversion af Meyers Fremmedordbog (2014-15)
  • Onlineversion af Gammeldansk Ordbog (2015)
  • Medredaktør af Nyhedsbrev fra Det Danske Sprog- og Litteraturselskab (udgave 2, 3 og 4) (2016)
  • Onlineversion af Latinsk-dansk Ordbog (projektleder) (2016-18)
  • Digitalisering og onlineversion af Kalkars Ordbog (2016)
  • "Ord i nærheden", visning af ord fra Den Danske Begrebsordbog direkte i Den Danske Ordbog (2017-18)
  • "Word2Dict", et hjælpeværktøj til redigering af Den Danske Ordbog baseret på word embeddings trænet på ordbogens korpus (2017)
  • Onlineversion af Svensk-Dansk Ordbog (2018)

 

Artikler m.m.

  • "From standalone thesaurus to integrated related words in the Danish Dictionary" (sammen med Nimb, Sanni og Thomas Troelsgård), In: Proceedings from Euralex 2018, Ljubliana, Slovenia, 2018 [PDF]
  • "Word2Dict – Lemma Selection and Dictionary Editing Assisted by Word Embeddings" (sammen med Nimb, Sanni), In: Proceedings from Euralex 2018, Ljubliana, Slovenia, 2018 [PDF]
  • "Combining Dictionaries, Wordnets and other Lexical Resources - Advantages and Challenges" (sammen med Pedersen, Bolette Sandford; Nimb, Sanni; Olsen, Sussi). In: Globalex Proceedings 2018, Miyasaki, Japan. 2018.
  • "The SemDaX Corpus - sense annotations with scalable sense inventories" (sammen med Pedersen, Bolette Sandford; Braasch, Anna; Johannsen, Anders Trærup; Martinez Alonso, Hector; Nimb, Sanni; Olsen, Sussi; Søgaard, Anders). In: Proceedings of the 10th edition of the Language Resources and Evaluation Conference, LREC 2016. Portorož, Slovenia. 2016
  • "Supersense tagging for Danish« (sammen med Martinez Alonso, Hector; Johannsen, Anders Trærup; Olsen, Sussi; Nimb, Sanni; Braasch, Anna; Søgaard, Anders; Pedersen, Bolette Sandford). In:Proceedings of the 20th Nordic Conference of Computational Linguistics NODALIDA 2015. Vol. 109 Linköping University Electronic Press. (NEALT (Northern European Association of Language Technology) Proceedings Series, Vol. 23), 2015
  • "Enriching a wordnet from a thesaurus" (sammen med Bolette S. Pedersen, Sanni Nimb, Anna Braasch & Thomas Troelsgård). In: Workshop Proceedings on Lexical Semantic Resources for NLP from the 19th Nordic Conference on Computational Linguistics (NODALIDA). Linköping Electronic Conference Proceedings; Volume 85 (ISSN 1650-3740), 2013
  • Nyt liv til støvede ordbøger (sammen med Thomas Troelsgård), In: Nordiske Studier i Leksikografi 15, 2015
  • Den Danske Ordbog som app: Hvorfor og hvordan? (sammen med Henrik Lorentzen, Lars Trap-Jensen), In: Nordiske Studier i Leksikografi 15, 2015
  • An odd couple – Corpus frequency and look-up frequency: what relationship? (sammen med Henrik Lorentzen, Lars Trap-Jensen) In: Iztok Kosem & Michael Rundell (eds.), Slovenščina 2.0, Volume 2 (2014), Issue 2, Trojina, Institute for Applied Slovene, Slovenia, pp. 94-113. [læs online]
  • Den Danske Ordbog som begrebsordbog (sammen med Lars Trap-Jensen), In: Nordiska Studier i Lexikografi 10, 2010, Rapport från Konferens om lexikografi i Norden, Tammerfors 3.-5. juni 2009, pp. 164-179.
  • DanNet: the challenge of compiling a wordnet for Danish by reusing a monoligual dictionary (sammen med Jørg Asmussen, Henrik Lorentzen, Sanni Nimb, Bolette Sandford Pedersen, Lars Trap-Jensen). In: Language Resources and Evaluation, Computational Linguistics Series, vol. 43, nr. 3. Springer, Netherlands, 2009, pp. 269-299
  • DanNet – leksikalsk semantisk WordNet for dansk (sammen med Sanni Nimb). I: Peter Widell og Mette Kunøe (red.) 11. Møde om Udforskningen af Dansk Sprog, Århus 2007.
  • Towards sounder taxonomies in wordnets (sammen med Bolette S. Pedersen). I: Alessandro Oltramari, Chu-Ren Huang, Alessandro Lenci, Paul Buitelaar, Christiane Fellbaum (eds.): Ontolex 2006, pp. 9-16. Genova, Italy. download
  • Når arvesølvet går online om modtagelsen af "ODS på nettet". I: LEDA-Nyt nr. 41, s. 26-29, 2006
  • DanNet – a wordnet for Danish. Bolette S. Pedersen, Sanni Nimb, Jørg Asmussen, Nicolai H. Sørensen, Lars Trap-Jensen, Henrik Lorentzen. In: Proceedings from Third International Conference on Global Wordnets. Jeju, South Corea. 2006. [rtf]

Foredrag

  • Dealing with "unwanted words" in an online dictionary - a non-invasive strategy (sammen med Henrik Lorentzen, Lars Trap-Jensen), ved eLex 2015. electronic lexicography in the 21st century: Linking lexical data in the digital age, Herstmoneaux, 12. oktober 2015
  • Om forskellene mellem den trykte version af Den Danske Ordbog og onlineversionen, ved besøg af Foreningen for Boghaandværk, Det Danske Sprog- og Litteraturselskab, København 29. september 2014
  • An odd couple - corpus frequency and look-up frequency: what relationship? (sammen med Henrik Lorentzen, Lars Trap-Jensen), ved eLex 2013. Electronic lexicography in the 21st century: thinking outside the paper, Tallinn, 18. oktober 2013
  • Den Danske Ordbog som begrebsordbog (sammen med Lars Trap-Jensen), ved 10. konference om leksikografi i Norden, Universitetet i Tampere,. 3.-5. juni 2009

Se medarbejdere