StuntyAI: de Dorpsdisco

Terwijl de wereld steeds meer om data vraagt, lijken we ons oog te verliezen als het gaat om klein, lokaal en bijzonder. Hoog tijd voor AI-streekproducten met hyper-lokale data. Welkom in StuntyAI, de dorpsdisco uit Epe!

Een ode aan de vergane glorie van failliete dorpsdisco’s

Hoe kunnen we ons thuisvoelen in een wereld die steeds generieker aanvoelt? Terwijl techbedrijven vooral bezig zijn met het ontwikkelen van steeds grotere taalmodellen, wijzen experts erop dat we juist baat hebben bij kleinere modellen. Deze zijn namelijk makkelijker te trainen en bevatten data van hogere kwaliteit. Dus. vergeet monsterlijke modellen zoals GPT-4 en feest mee in onze AI-dorpsdisco.

Volgens AI-expert Jennifer Prendki kunnen AI-ontwikkelaars veel leren van natuurkundigen. Vanuit de filosofie: hoe eenvoudiger, hoe eleganter, werken zij er hard aan om hun modellen zoveel mogelijk te vereenvoudigen. Dit in tegenstelling tot het AI-veld, waar ontwikkelaars zodra een model slecht werkt, het alleen maar groter en ingewikkelder maken. Hoe meer data en parameters hoe beter, is de heersende gedachtegang. Maar dat staat nu op losse schroeven.
StarryAI maakte deze generieke, Amerikaanse beelden van dit van de prompt: “Photo of three teenagers on a saturday night at disco "De Stunt" in Epe, the Netherlands in 2003.”

Hoe kunnen we opnieuw betekenis creëren in een AI-gemedieerde wereld die steeds generieker aanvoelt? Om deze vraag te beantwoorden lieten we ons inspireren door streekproducten.

De Europese Unie beschermt meer dan 1000 streekproducten zoals goudse kaas en feta. Op deze manier probeert de EU de uniekheid en kwaliteit van een specifiek product te waarborgen, en de afzetmarkt van ambachtelijke, lokale producenten te beschermen. Het roept bij ons de vraag op: wat als we dit ook met AI gaan doen?

Discotheek De Stunt in 2005. Foto van Gert van den Esschert, Epernet.
Optreden van Yes-R, op zaterdag 10 februari 2007. Foto van Maurice Schalker.

Geblondeerde stekeltjes en Passoa jus

Het idee ontstond om zelf een hyperlokale AI-beeldgenerator te bouwen die beelden kon maken die misschien niet perfect en gelikt zijn, maar ons meer raken op een emotionele laag. Beelden die ons een sense of place geven. En waar vind je dat anders dan in de lokale dorpsdisco? Vandaag de dag misschien failliet, maar een bron van lokale data.

Na enig speurwerk kwamen we bij Maurice Schalker, voormalig fotograaf van Discotheek de Stunt uit Epe. In de gloriedagen liep hij tussen de menigte om de gezelligste kiekjes te schieten. Zijn database van 26.104 foto’s, geschoten tussen 2002-2007, vormt de basis voor onze AI-beeldgenerator. Brace youself: Een nostalgische mix van geblondeerde stekeltjes, azuurblauwe spaghettibandjes en Passoa jus. Maar ook een lang filterproces tussen kotsende tieners, en tongende kalverliefdes.

Van discotheek de Stunt naar StuntyAI

05:16

Tongfoto’s, waarin het ene gezicht bijna versmelt met het andere, maken het moeilijk om een AI te leren wat een gezicht is

Voor onze StuntAI gebruikte AI-ontwikkelaar Bas Maat een zogeheten generative adversarial network (GAN). Dat bestaat in feite uit twee algoritmes: de generator en de discriminator. De generator genereert beelden om de discriminator te ‘foppen’. De discriminator krijgt elke keer een foto van Maurice te zien én een door de generator gemaakt beeld. De discriminator moet dan aanduiden welk beeld ‘goed’ is en welke ‘fout’. In het begin van dit trainingsproces ‘weet’ de generator nog niks over wat een goede afbeelding is, maar door de feedback van de discriminator leert de generator steeds meer over wat een goede afbeelding is.

Dat is de theorie. Maar voor Bas was het ontwikkelen van deze AI meer dan alleen maar even deze foto’s voeren aan de GAN, en wachten tot je ineens goede beelden hebt. In zo’n proces gaat in de praktijk namelijk van alles mis, bijvoorbeeld door mode collapse.Bij mode collapse heeft de generator een specifiek ding gevonden waarmee de discriminator te foppen is, waarna de generator nog meer van diezelfde dingen gaat genereren.

Een voorbeeld van ‘mode collapse’. Hier zie je dat de AI alleen nog maar dezelfde elementen herhaalt: dat oranje en telkens hetzelfde soort gezicht.
De eerste tekenen van de typische Stunt foto: 2-5 mensen tegen een donkere achtergrond

Amorfe vleesklonten

In de set foto’s zie je een groot verschil tussen de eerdere en de latere periode. Bij de latere foto’s zie je dat er veel verschillende events en optredens werden georganiseerd, bijvoorbeeld van Yes-R, Kelly van Big Brother en zelfs van erotische danseressen. Maurice: “De eigenaar, Henk Huiskamp, probeerde in die tijd echt van alles om bezoekers te trekken. Het mocht niet baten.”

De grote variatie in de dataset bleek wel een struikelblok. De eerste versie van de AI genereerde uiteindelijk vooral amorfe vleesklonten, niet echt gezichten. Bas besloot daarop een tweede versie van de AI te maken, met een kleinere en minder gevarieerde set foto’s. “Daarna ben ik door de overgebleven fotoset gegaan, en heb ik er nog zo’n 2000 foto’s handmatig uitgehaald. Ik wilde alleen de ‘klassieke’ Stunt-foto’s overhouden. Daar staan 2 tot 5 mensen op, poserend naar de camera, en ze staan niet te ver van de camera af.” De incidentele kots-op-straat-foto ging er dus uit, een paar overzichtsfoto’s van een volle dansvloer en ook een hoop foto’s van tongende tieners. Die tongfoto’s, waarin het ene gezicht soms bijna versmelt met het andere, maken het moeilijk om een AI te leren wat een gezicht is.

Het resultaat mag er zijn. Bijna 20 jaar na dato is dorpsdisco de Stunt weer herrezen. Ditmaal in een AI-beeldgenerator, dat wel. Met de hulp van technologie, maar vooral door de menselijke blik en regie.

Beelden die onze StuntyAI heeft gegenereerd