Innsikt.onsagers.no

Trening av AI bryter opphavsretten, men det finnes unntak

Skrevet av Herman Vestrum Danielsen | 22. November, 2023

Trening av kunstig intelligens (AI) innebærer prosesser som bryter med opphavsretten. Disse prosessene er helt nødvendige for at den kunstige intelligensen skal lære. Flere opphavsrettsorganisasjoner ligger nå i strid med store AI-aktører. Det finnes imidlertid unntak som kan gjøre AI-treningen lovlig. 

Omfattende rettsprosesser i gang om AI og opphavsrett i USA og Storbritannia 

Både i USA og i Storbritannia har opphavsrettsorganisasjoner og kunstnere anlagt søksmål mot selskaper som OpenAI, Stability AI, DeviantArt og Midjourney.   

Stability AI-løsningen Stable Diffusion bruker for eksempel kopier av millioner av bilder i treningen av den kunstige intelligensen, og disse bildene er beskyttet av opphavsrett. Amerikanere vil muligens kunne hevde at slik trening representerer «fair use», men dette er ikke avklart enda, og det finnes ikke noe «fair use»-begrep i norsk eller europeisk opphavsrettlovgivning. 

"Art is deeply personal, and AI had just erased the humanity from it by reducing my life's work to an algorithm", skrev kunstneren Sarah Andersen i en debattartikkel i New York Times nylig. 

Kunstnere og forfattere brukt til trening av AI 

I høst tok flere forfattere ut søksmål mot OpenAI, som står bak den meste kjente AI- tjenesten, ChatGPT.  

Ikke bare enkeltstående kunstnere og forfattere, men også store selskaper som Getty Images tar nå del i søksmål på bakgrunn av AI. Kjente skuespillere frykter nå at stemmene deres er tatt i bruk ulovlig.  

For mange opphavere kommer det som en overraskelse at deres verker er brukt til å trene AI. Ifølge The Atlantic, inneholder datasettet «Books3» 183 000 bøker, hovedsakelig kopiert uten tillatelse. Dette har fått norske forfattere til å reagere. Både Jo Nesbø, Åsne Seierstad og Vigdis Hjort er å finne ved hjelp av søkemotoren som The Atlantic har laget. 

Andre kan også sjekke om deres åndsverk er blitt brukt i trening av AI ved å bruke søkemotoren haveibeentrained.com. Gjennom denne tjenesten kan opphavere også reservere seg eller sitt verk fra å delta i slik trening. 

Noen unntak i lovverket som angår AI og opphavsrett 

Etter vår mening vil datafangst, datasettskapelse og trening av AI i utgangspunktet krenke opphavernes rettigheter. Det er fordi det krenker deres enerett til eksemplarframstilling, altså å lage kopier av et verk. Denne kopieringen er en essensiell del av prosessene. 

Kort sagt foregår prosessene i dag stort sett ved å såkalt skrape innhold fra internett, lage store sett av data fra dette, og trene en AI-robot ved hjelp av innholdet. Vi går nærmere inn på de tekniske sidene av dette i den nedlastbare veilederen <AI og opphavsrett.>  

Det er primært åndsverkloven som regulerer rettighetene til åndsverk i Norge. Spørsmålet er om det kan finnes unntak i loven som kan berettige de beskrevne AI-prosessene.  

Det er fire unntaksbestemmelser å finne i åndsverkloven §4. For at det skal være lov å kopiere et verk i denne sammenhengen, må alle disse fire kravene være oppfylt: 

1) kopieringen må være tilfeldig eller forbigående  

2) den må utgjøre en integrert og vesentlig del av en teknologisk prosess  

3) verkene må være lovlig tilgjengelige  

4) den midlertidige fremstillingen kan ikke ha noen selvstendig økonomisk verdi 

Merk at dette gjelder norsk og europeisk lovgivning. Det er ikke oss gitt å forutsi utfallet av de amerikanske søksmålene, ikke minst på grunn av den nevnte fair use-rettstradisjonen i USA. Det er også viktig å understreke at eventuelle lovforbud rammer selve AI-treningen. Det er ingenting som tilsier at enkeltpersoners bruk av for eksempel ChatGPT skal bli gjenstand for noen rettslig forfølgelse. 

EU-direktiv om AI og opphavsrett på vei 

På et EU-rettslig nivå er det imidlertid vedtatt et direktiv om opphavsrett i det digitale indre markedet (DSM-direktivet).  

Dette direktivet har blitt implementert i flere medlemsstater, inkludert vårt naboland Danmark. Norge skal i kraft av EØS-avtalen som utgangspunkt implementere regelverket, men det har ennå ikke blitt gjort.  

Det skal sendes ut et høringsnotat i løpet av 2023. Dette høringsnotatet skal danne grunnlaget for en proposisjon til Stortinget, som til slutt vil føre til en implementering av bestemmelsene i direktivet. 

For at AI-trening skal være lovlig etter det kommende DSM-direktivet, kreves det at verket som brukes til trening må:  

  • være lovlig tilgjengelig 
  • formålet med kopieringen av verket må være tekst-og datautvinning. 
  • verket må ikke være underlagt en restriksjon 

Ideelle rettigheter 

Vårt utgangspunkt er altså at AI-prosessene gjør inngrep i opphavernes eneretter, men at det finnes unntak, nevnt som fire punkter i åndsverkloven ovenfor. Nå det gjelder de ideelle rettighetene, finnes det ikke noe unntak. Disse må overholdes. 

Ettersom dette er en av flere mulige utfordringer forbundet med dagens teknikk for trening av generative modeller (AI) vil det være et godt råd å sikre at man har samtykke fra opphaveren til det enkelte verk som anvendes til treningen av maskinlæringsalgoritmen.  

Dette kan også gjøres gjennom generelle avtalelisenser som vil gi tilgang til store mengder data som lovlig kan anvendes til treningen av algoritmen. Dette vil gi rett til å foreta de midlertidige kopiene som er nødvendige for treningen uten at det er behov for å anvende et unntak.