Viden
Gennem enkeltfaget skal den studerende opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:
Praktiske metoder til præprocessering af tekst, f.eks. struktureret og ustruktureret data, fx tekst og netværksdata.
Fundamentale data mining og machine learning metoder, herunder
- Prædiktive metoder såsom regression og klassifikation; finde fx meninger (sentiments) om produkter eller services baseret på reviewtekster, likes, klik, etc.
- Deskriptive metoder såsom gruppering af dataobjekter (clustering), finde fx kunde-/brugergrupper i sociale netværk
Regulariseringsmetoder til behandling af højdimensionelle data.
Der lægges vægt på metoder, der er skalerbare til Big Data, så der sammenhæng med det efterfølgende enkeltfag.
Den studerende skal ydermere kunne forholde sig kritisk og refleksivt i forhold til ovenstående emner; specielt er det vigtigt at den studerende opnår færdighed i at udvælge den rigtige type af machine learning metode til brug i en given kontekst.
Færdigheder
Den studerende skal kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete data-funderede problemstillinger. Den studerende skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal den studerende kunne reflektere over betydningen for den sammenhæng løsningen indgår i. Konkret forventes det at den studerende efter gennemførelse af fagpakken er i stand til:
- At forstå og anvende en række data mining og machine learning metoder til vidensopdagelse i både ustrukturerede og strukturerede data-eksempler.
- At forstå og sammenligne algoritmerne bag forskellige data mining og machine learning metoder.
- At matche og eventuelt kombinere metoder til et fornuftigt brug i en given praktisk kontekst.
Kompetencer
Efter gennemførelse af faget er det målet, at deltagerne har opnået kompetencer til at;
- Træffe informerede valg omkring anvendelse af avancerede data mining og machine learning teknikker.
- Parameterisere avancerede data mining og machine learning algoritmer til et givet data materiale, inkl. ustruktureret tekst og behandling af højdimensionelle data. 38
- Designe og udvikle en komplet løsning for en kompleks, realistisk problemstilling.
- Formidle og diskutere løsningerne med fagfæller og ikke-specialister.