Spring til indhold
Forside

Nyhed

CLAAUDIA lancerer ny AI-transskriptionsløsning til forskere

Lagt online: 21.11.2023

Forskere fra AAU fik i sommer en ny og kraftfuld allieret i deres forskningsarbejde. Takket være CLAAUDIAs seneste lancering, Whisper Transcription, er det slut med at bruge flere timers arbejde på at transskribere data, nu kan forskere nemlig transskribere video og lydfiler ved hjælp af kunstig intelligens.

Nyhed

CLAAUDIA lancerer ny AI-transskriptionsløsning til forskere

Lagt online: 21.11.2023

Forskere fra AAU fik i sommer en ny og kraftfuld allieret i deres forskningsarbejde. Takket være CLAAUDIAs seneste lancering, Whisper Transcription, er det slut med at bruge flere timers arbejde på at transskribere data, nu kan forskere nemlig transskribere video og lydfiler ved hjælp af kunstig intelligens.

Tekst: Nana Møller Larsen, ITS     Foto: AAU

Bag Whisper Transcription står et dedikeret team fra CLAAUDIA bestående af Data Steward Freya Vamberg Delfs og Data Scientists Robert Smith og Pelle Rosenbeck Gøeg, hvor sidstnævnte har stået for udvikling af applikationen. Freya fortæller:

- Idéen til Whisper Transcription opstod, fordi vi fik rigtig mange henvendelser fra forskere, der søgte vejledning til hvilke transskriptionsservices, de kunne benytte til deres databehandling. Problemet er dog, at vi ikke kan garantere sikker behandling af sensitive data ved de forskellige transskriberingsservices, som vi har fået henvendelser om, fortæller Freya og fortsætter:

- Derfor gik vi i CLAAUDIA i gang med at udvikle vores egen løsning, som kan behandle sensitive data, og som vi kan supportere, hvis forskere har behov for hjælp.

Sikker og hurtig transskribering

CLAAUDIAs nye transskriberingsværktøj er en værdifuld ressource for forskere, som arbejder med kvalitative data i form af interviews, da de ofte indeholder fortrolige eller følsomme informationer og derfor skal håndteres og opbevares sikkert. Med Whisper Transcription kan forskere få hjælp til transskribering af deres data uden at gå på kompromis med sikkerheden. Applikationen er tilgængelig i version 1.0 på DeiCs interaktive HPC-platform, UCloud, der med sikker infrastruktur sørger for, at forskere trygt kan uploade og opbevare både fortrolige og følsomme data på platformen. Faktisk er applikationen den eneste AI-baserede transskriberingsløsning til danske forskere, hvor der er garanti for, at deres data opbevares sikkert og lokalt på danske servere hos DeiC.

- Whisper Transcription er baseret på OpenAis Whisper sprogmodel og applikationen giver forskere mulighed for at uploade og transskribere enkelte filer samt hele mapper med video eller lydfiler. Applikationen kan transskribere i realtid – nogle gange endda hurtigere alt efter hvilken CPU, man vælger at gøre brug af, forklarer Freya.

Med Whisper Transcription kan brugeren vælge op til syv forskellige output formater, man kan bl.a. vælge at eksportere sin transskriberede data i rent tekstformat eller som en srt fil, der er det format, der bruges til undertekster. Derudover er det muligt at transskribere sin data på flere forskellige sprog, så selvom der bliver talt engelsk i ens lydfil, så har man mulighed for at vælge, at applikationen skal transskribere på dansk.

Et værktøj til forskere, studerende og ansatte

Selvom CLAAUDIA har udviklet Whisper Transcription på baggrund af et behov fra forskere på AAU, så vil både forskere fra andre universiteter, studerende og ansatte også have mulighed for at få glæde af det nye værktøj. Applikationen ligger frit tilgængelig på UCloud for alle med et wayf login, fortæller Freya, der desuden ser en fordel i, at den nye transskriptionsløsning kan være medvirkende til, at flere forskere stifter bekendtskab med UCloud:

- Vi håber på, at Whisper Transcription vil introducere forskere, der hovedsageligt arbejder med kvalitative data, til UCloud. I den forbindelse vil de forhåbentligt opdage, at der, udover Whisper Transcription, ligger en masse værdifulde ressourcer, som de kan benytte til databehandling i deres forskning, fortæller Freya.

I CLAAUDIA-temaet er de på nuværende tidspunkt i gang med at undersøge muligheden for at præsentere nye features i de kommende versioner af applikationen:

- Vi arbejder på at gøre det muligt for brugerne at tilvælge Word-fil som output format. Derudover er speech recognition, som vil gøre det muligt for applikationen at genkende de forskellige talere i en given lydfil, i vores udviklingspipeline. Vi håber på at kunne præsentere førnævnte features i næste opdatering, fortæller Freya.

I de måneder hvor den første version af Whisper Transcription har været tilgængelig, har CLAAUDIA allerede fået mange positive tilbagemeldinger fra forskere, der har benyttet applikationen, som i øvrigt er den ottende mest brugte applikation på UCloud.

Siden artiklen blev skrevet, har CLAAUDIA opdateret Whisper Transcription til version 1.1. I den nye release er der tilføjet yderligere eksportmuligheder, herunder kan transskriberet data nu eksporteres som MS Word-fil. Derudover kan outputtet eksporteres og komprimeres i .zip-fil, og for at øge sikkerheden kan brugerne beskytte .zip-filer med adgangskode, der anvender AES-kryptering, hvilket gør det muligt for brugerne at overføre filerne sikkert og fortroligt. Desuden tillader den nye version, at filnavne indeholder mellemrum, uden at det forhindrer brugeren i at uploade dem og anvende dem i applikationen.

Webinar: Kom godt igang med at bruge Whisper Transcription

Deltag i ReachAAUt Forskernetværks webinar og lær mere om Whisper Transcription, hvordan du tilgår applikationen, og hvordan den kan hjælpe dig som forsker. 

Webinaret afholdes d. 30. november kl. 09-10. 

Hvis du er interesseret i at deltage, kan du finde invitationen her. Du kan også kontakte Dagmar Knudsen Fallesen på dagmarkf@its.aau.dk

Nyttige links

Hvis du ønsker at bruge Whisper Transcription til din databehandling, kan du logge ind og finde applikationen på UCloud her.

Du kan læse mere om Whisper Transcription på CLAAUDIAs hjemmeside her

CLAAUDIA har lavet en demovideo, der viser de forskellige funktioner i Whisper Transcription, den kan du se her.

Hvis du er nysgerrig på at læse mere om OpenAIs Whisper sprogmodel, som Whisper Transcription er bygget på, så kan du klikke her.

Henvendelser til CLAAUDIA er velkomne på claaudia@aau.dk.