Hoe los je een misdaad op met ChatGPT?

26 maart 2024 | Onderzoek

Bij de opleiding Forensisch ICT leren studenten de nieuwste technologieën gebruiken, zoals ChatGPT. Maar hoe zet je ChatGPT in bij digitaal forensisch onderzoek? In een tijd van snelle technologische ontwikkelingen is het essentieel voor forensische wetenschap om zich aan te passen en criminelen voor te blijven. Hans Henseler, lector bij de onderzoeksgroep Digital Forensics & E-Discovery, zet zich hiervoor in.

Student bekijkt dna en binair op computer

Met de introductie van ChatGPT eind 2022 werd duidelijk dat taalmodellen goed met taal kunnen omgaan en succesvolle gesprekken kunnen voeren met gebruikers. Ondanks beperkingen zijn er veel voorbeelden waarin een taalmodel gebruikers kan helpen als assistent.

Rechercheurs verwerken vaak grote hoeveelheden informatie. Het leek Hans een goed idee om te onderzoeken of een taalmodel daarbij van dienst kan zijn. Eerste experimenten hebben laten zien dat ChatGPT effectief kan helpen bij het formuleren van zoekvragen en het samenvatten van conversaties, zoals chatberichten of e-mails op de telefoon van een verdachte.

De opkomst van AI, zoals ChatGPT, opent nieuwe mogelijkheden voor forensische wetenschap. Door deze technologieën te omarmen, kunnen rechercheurs efficiënter werken en sneller cruciale informatie vinden. Dit helpt hen criminelen beter op te sporen en gerechtigheid te bevorderen.

Binnen de onderzoeksgroep onderzoeken ze of taalmodellen op eigen computers kunnen draaien, in plaats van in de cloud. Dit voorkomt de upload van gevoelige onderzoeksgegevens naar de cloud. Daarnaast onderzoeken ze hoe ze kunnen voorkomen dat het taalmodel ‘hallucineert’, wat inhoudt dat het onjuiste informatie genereert. Daarbij werkt de onderzoeksgroep samen met andere professionals zoals Jakub Zavrel van het Amsterdamse bedrijf Zeta Alpha. Zij passen Retrieval Augmented Generation (RAG) toe om hallucinaties te voorkomen.

RAG is snel opgekomen als de methode om grote taalmodellen zoals ChatGPT te verbeteren en te gebruiken voor vertrouwelijke of bedrijfsinterne informatie. ChatGPT is getraind op internetdata en heeft kennis van taal en van de wereld. Maar alleen voor zover dat in de trainingsdata beschikbaar was. Bij een vraag over hele nieuwe of over niet-publieke informatie kan het tekortschieten. Dit kan resulteren in antwoorden die logisch lijken, maar niet op feiten zijn gebaseerd, de ‘hallucinaties’. Het uitbreiden van ChatGPT met een Retrieval-module, oftewel zoekmachine, biedt een oplossing voor dit probleem. Door de vraag in de zoekmachine te plaatsen, genereert het zoekresultaten in de vorm van relevante documenten. Met de informatie uit deze documenten kan ChatGPT wél goed antwoorden.

Een taalmodel moet rechercheurs op verschillende manieren ondersteunen. Het helpt bij het formuleren van zoekvragen, samenvatten van conversaties, en het leggen van verbanden met andere digitale sporen of gesprekken. Denk bijvoorbeeld aan het analyseren van internetgeschiedenis en identificeren van relevante conversaties. Ook bij het bespreken van verklaringen van verdachten, slachtoffers en getuigen, en bij het opstellen van onderzoeksvragen.

ChatGPT kan helpen bij het generen van zoekvragen vanuit meerdere perspectieven. Een grotere variatie zoekvragen zorgt voor completere antwoorden en voorkomt dat er informatie achterblijft. Daarnaast kan ChatGPT vele duizenden of zelfs miljoenen woorden per seconde lezen en begrijpen. Dit is een veel grotere capaciteit dan een menselijk rechercheteam heeft. Het kan substantieel grotere hoeveelheden mogelijk bewijs evalueren, waardoor alleen de meest relevante stukken door mensen beoordeeld hoeven te worden. ChatGPT heeft ook parate kennis van veel talen en synoniemen, waardoor meertalig en multicultureel onderzoek makkelijker wordt. Het kan niet alleen tekst, maar ook plaatjes, scans, audio en video begrijpen.

Als lector met een achtergrond in kunstmatige intelligentie en ervaring in het lesgeven over dit onderwerp, heeft Hans altijd al interesse gehad in AI-toepassingen. Met ChatGPT zag hij meteen de mogelijkheden voor toepassing in het digitale forensische werkveld.

Bij het NFI kreeg hij de kans om nieuwe technologieën in het digitale forensische platform Hansken te onderzoeken en uit te proberen. Door de nauwe samenwerking tussen het NFI en de onderzoeksgroep speelt dit onderwerp een centrale rol in zijn werk.

Op dinsdag 2 april vindt in het auditorium F0.015/0.017 de 14e editie van het symposium plaats. Tijdens het symposium van 2023 gaf Hans al een presentatie over de opkomst van ChatGPT als assistent voor rechercheurs. Met de recente ontwikkelingen ligt het voor de hand om het hele symposium dit jaar aan dit thema te wijden. Als de ontwikkelingen zich voortzetten zoals verwacht, zal ook in 2025 zeker aandacht worden besteed aan dit onderwerp. Op 2 april presenteren Hans en Jakub samen met andere professionals over de huidige ontwikkelingen rondom het gebruik van AI in digitaal forensisch onderzoek.

Hoe los je een misdaad op met ChatGPT?

ChatGPT als assistent voor rechercheurs

Is het gebruik van AI wel veilig?

Hoe kan ChatGPT precies helpen?

Betrokkenheid van de hogeschool

Symposium op 2 april