Viden
Gennem enkeltfaget skal deltagerne opnå viden om, hvordan man i praksis kan danne sig et overblik over større datasæt, hvordan man kan finde og rette fejl og inkonsistens i data, samt hvordan værktøjer kan understøtte god statistisk praksis.
Konkrete emner:
- Introduktion til data science: begreber, konkrete Big Data-eksempler, muligheder og begrænsninger.
- Indlæsning af data; data i forskellige formater, kombination af data fra forskellige kilder.
- Udforskning af data; visualisering, data summaries, detektion af outliers.
- Praktisk præprocessering og rensning af data.
- Programmering i og avanceret brug af et statistisk værktøj.
- Dokumentation og reproducerbarhed af analyser.
- Centrale statistiske analyser med statistikværktøjer.
Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.
Færdigheder
Efter at have gennemført faget skal deltagerne kunne bruge et statistisk værktøj i indledende undersøgelser af større datasæt.
De skal kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til konkrete statistiske analyser. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag.
Kompetencer
Deltagerne skal efter gennemførelse af faget kunne:
- reflektere over betydningen af resultaterne af de udarbejdede analyser, samt hvordan disse kan anvendes i praksis,
- formidle og diskutere løsningerne med fagfæller og ikke-specialister,
- træffe informerede valg omkring statistiske metoder, herunder hvordan et givet datasæt skal undersøges, bearbejdes og analyseres.