Belgische primeur: Computer schrijft artikel voor IT-vakblad

Belgische primeur: Computer schrijft artikel voor IT-vakblad

Gentse scale-up ML6 bewijst dat technologie perspectieven biedt zonder nood aan zware investeringen

Gent, 27 oktober 2020 – Wie door het laatste nummer van het Belgisch IT-magazine Data News bladert, houdt ongetwijfeld halt bij een artikel over de kracht van natural language processing. Het stuk is namelijk geschreven door een AI-model van de Gentse scale-up ML6 en onderstreept zo het potentieel dat artificiële intelligentie op vlak van tekstgeneratie heeft, ook in het Nederlands. Moeten journalisten en copywriters vrezen voor hun job? “Zeker niet. Tekstgenerators zullen nooit kunnen tippen aan het creatief en intuïtief menselijk denken. Wel wordt de technologie een steeds betere ondersteuning voor dagelijks schrijfwerk.”

De kracht van artificiële intelligentie wordt steeds groter. Ook op vlak van tekstgeneratie- en interpretatie opent AI steeds meer deuren. De evolutie van natural language processing krijgt hoe langer hoe meer momentum. Het Amerikaanse OpenAI heeft met generatieve pre-trained transformer modellen het pad geëffend. “Elk nieuw model betekende een enorme sprong voorwaarts, met meer rekenkracht en meer parameters. Parameters zijn als het ware de variabelen in het model. Hoe meer parameters, hoe meer het algoritme kan voorspellen en berekenen. Waar GPT2 al een stevige 1,5 miljard parameters telde, kent GPT3 er inmiddels niet minder dan 175 miljard“, vertelt Thomas Dehaene, machine learning engineer bij ML6.

De technologie heeft een punt bereikt waarop het steeds moeilijker wordt om te onderscheiden wat door een mens en wat door een machine geschreven is. Een GPT3-model weet zo een groot deel van de lezers te overtuigen dat de tekst van de hand van een persoon is. In het Engels weliswaar. “Engels is dé wereldtaal. Engelstalige webdata als bronmateriaal om de modellen te trainen zijn er in overvloed. In het Nederlands is daar nog een weg af te leggen. GPT3 is nog niet mogelijk. Het model is er, de rekenkracht ook, maar er is nog onvoldoende bruikbare Nederlandstalige webdata afkomstig van fora, nieuwssites, recepten, Wikipedia, blogs...”, legt Thomas Dehaene uit.

Meer doen met minder

Toch wil ML6 de kracht van natural language processing openstellen voor de rest van de wereld. Een groot datamodel trainen vergt naast enorm veel data en rekenkracht ook investeringen tot tienduizenden euro's. Kleinere bedrijven in landen met een voertaal die globaal minder vertegenwoordigd is, komen hier dus niet aan toe. ML6 wil aantonen dat het mogelijk is om goede resultaten te boeken zonder te zware financiële inspanningen. Dat doet het met het artikel in Data News, gegenereerd door een Engels GPT2-model dat gefinetuned werd naar het Nederlands.

Klanten en opensourcecommunity

Deze stap voorwaarts op vlak van NLP en het model van ML6 bieden verschillende perspectieven. Enerzijds wil de scale-up de technologie open source beschikbaar stellen om zo de NLP- en taalcommunity vooruit te helpen. Anderzijds zal ML6 de technologie kunnen inzetten in zijn eigen dienstverlening, in eerste instantie voor Nederlandstalige projecten maar binnenkort ook voor klanten in Frankrijk en Duitsland.

Nicolas Deruytter, oprichter en CEO van ML6: “Het feit dat deze modellen getraind zijn in taalanalyse betekent ook dat ze kunnen ingezet worden voor concrete use cases zoals bijvoorbeeld sentimentanalyse, tekstclassificatie of vertalingen. We hopen dat we op die manier opnieuw een extra meerwaarde kunnen bieden aan onze klanten.”

Creatief en intuïtief denken

Moeten journalisten, copywriters en vertalers nu beginnen vrezen voor hun vak? “Zeker niet. Tekstgenerators zullen nooit kunnen tippen aan het creatief, intuïtief en conceptueel menselijk denken. Creatieve beroepen zijn dus zeker niet in gevaar. Deze tools kunnen echter wel een rol spelen in hun dagelijkse taken maar dan eerder als ondersteuning. Taken die cognitief niet uitdagend zijn, kunnen geautomatiseerd worden, denk maar aan spellingschecks of het maken van samenvattingen”, aldus Nicolas Deruytter.

Kristof Van der Stadt, hoofdredacteur van Data News, voegt daaraan toe: “En of we op de redactie nu bevreesd zijn dat AI onze jobs gaat afnemen? Niet bepaald, als je het bekijkt vanuit de manier waarop onze artikelen nu tot stand komen. Wij doen onze research, nemen interviews af, zoeken een invalshoek en laten dan de puzzel in elkaar vallen tot een hopelijk vlot leesbaar artikel met correcte feiten en onderbouwde argumenten. AI werkt louter lineair en spuwt puzzelstukjes uit die passen op de voorgaande. Want dat is waar de AI op getraind is. Dat is wat hij goed kan en steeds beter kan naarmate hij meer traint. Aan de andere kant zie ik zo'n doorontwikkelde AI-tool wel nog uitgroeien tot een potentieel hulpmiddel voor journalisten. Iets wat hen misschien kan helpen om bruggetjes te leggen of om associaties te maken, en zo misschien een writer's block op te lossen.”

De AI-tool die teksten genereert zelf uitproberen kan via https://gpt2.ml6.eu/.

Nicolas Deruytter, CEO ML6 — © Jonas Lampens
Nicolas Deruytter, CEO ML6 — © Jonas Lampens
Kristof Van der Stadt
Kristof Van der Stadt Hoofdredacteur, Data News

 

Over Evoke

Scoren in de pers boost sales en Evoke helpt bedrijven hierbij. Samen met de klant halen we nieuws uit hun onderneming om dit onder de aandacht van de media te brengen. In de vorm van een persbericht, klantengetuigenis of opiniestuk, of via een interview of persconferentie, verstrekken we het nieuws duidelijk en gebruiksklaar aan de juiste journalist(en). Zo leest of leert het brede publiek in een geloofwaardig kader over onze klanten in de krant, op de radio of op televisie.

Evoke
Witte Patersstraat 4
1040 Brussel