Viden
Gennem enkeltfaget skal deltagerne opnå viden om teorier, metoder, teknikker og værktøjer inden for følgende områder:
Principper for Big Data-skalering, herunder
- Typiske maskinelplatforme til Big Data-håndtering
- Basale modeller for distribueret databehandling
- CAP-sætningen
- Fejltolerance
Teknologier og værktøjer til Big Data-skalering, herunder
- Opsamling og lagring af Big Data
- Processering af Big Data
- Data mining på Big Data
- Håndtering af data med høj velocitet
Deltagerne skal kunne forholde sig kritisk og refleksivt i forhold til disse teoretiske emner.
Færdigheder
Efter at have gennemført faget skal deltagerne kunne anvende teorier, metoder og modeller fra ovennævnte områder til at identificere, analysere, vurdere og komme med forslag til løsning af konkrete problemstillinger i praksis. De skal kunne argumentere for relevansen af de valgte teorier, metoder og modeller samt for det udarbejdede løsningsforslag. Desuden skal de kunne reflektere over betydningen for den sammenhæng, løsningen indgår i.
Konkret forventes det, at deltagerne efter gennemførelse af fagpakken er i stand til at:
- designe et system til at opsamle, gemme og behandle Big Data,
- implementere et avanceret Big Data-system,
- skalere det implementerede system på en distribueret platform,
- skalere udvælgelse og forberedelse af Big Data på en distribueret platform,
- skalere relevante data mining-metoder til Big Data på en distribueret platform.
Kompetencer
Efter gennemførelse af faget er det målet, at deltagerne har opnået kompetencer til at:
- træffe informerede valg omkring avancerede Big Data-teknologier,
- vælge den rigtige type Big Data-metode til en given avanceret problemstilling, at konfigurere avancerede Big Data-algoritmer til et givent datasæt og at analysere avancerede Big Data-resultater,
- designe og udvikle et komplet Big Data-system for en kompleks, realistisk problemstilling,
- formidle og diskutere løsningerne med fagfæller og ikke-specialister.