Hoe CNOC kennis maakt met AI en ML.

Bij CNOC hebben we nog geen projecten waarin AI of ML wordt toegepast, maar vroeg of laat gaat dat wel gebeuren. Zo hebben we al eens gedacht aan een applicatie die facturen automatisch verwerkt. Dat idee moesten we laten varen omdat er nog teveel haken en ogen aan zaten. Vandaar dat we blij zijn met de ervaring die Joost opdoet bij Prime Vision. Op papier lijkt zo’n zelflerend systeem ideaal, maar het moet wel werken!

Hoe CNOC kennis maakt met AI en ML.

Bij CNOC hebben we nog geen projecten waarin AI of ML wordt toegepast, maar vroeg of laat gaat dat wel gebeuren. Zo hebben we al eens gedacht aan een applicatie die facturen automatisch verwerkt. Dat idee moesten we laten varen omdat er nog teveel haken en ogen aan zaten. Vandaar dat we blij zijn met de ervaring die Joost opdoet bij Prime Vision. Op papier lijkt zo’n zelflerend systeem ideaal, maar het moet wel werken!

Waar hebben we het eigenlijk over?

Bij AI en ML gaat het om het ontwikkelen van zelflerende algoritmes die zelfstandig patronen leren herkennen en interpreteren. Als de computer maar vaak genoeg plaatjes van een poes te zien krijgt, dan kan het die ook op nieuwe foto’s en video’s herkennen.

Techniek in de kinderschoenen

Op dit moment worden dit soort toepassingen voornamelijk nog gebruikt in leuke, handige apps als snapchat. Dan maakt het ook niet uit of het systeem je kat een keer niet herkent. Voor grootschalige, commerciële systemen zoals bij postverwerking gaat die vlieger niet op. Daar spelen aspecten als nauwkeurigheid en performance een grote rol.

Een trage leerling

Het probleem bij het ontwikkelen van zelflerende algoritmes is, dat ze duizenden voorbeelden nodig hebben voordat ze voldoende kennis hebben opgebouwd om een object te herkennen. Dingen die weinig voorkomen, zullen ze ook niet snel herkennen. Dat maakt het moeilijk om het systeem te leren goed met uitzonderingen om te gaan.

Kleine afwijkingen, groot verschil

Sommige poststukken zijn bijvoorbeeld voorzien van een speciaal etiket om aan te geven dat het om een gevaarlijke stof gaat. Dat soort etiketten zie je niet vaak voorbij komen, maar het is wel belangrijk dat ze herkend en goed geïnterpreteerd worden. Het maakt namelijk nogal wat uit of het om een chemische of radio-actieve stof gaat.

Too tricky to copy

Natuurlijk kun je dit soort situaties ook nabootsen met eigengemaakte testdata, maar dat is erg tricky. Je kunt namelijk van tevoren niet bepalen welke conclusies het algoritme trekt. Ga je adresgegevens photoshoppen, dan bestaat de kans dat het systeem concludeert dat alle gephotoshopte afbeeldingen adressen zijn, ook als het etiketten zijn.

CNOC is voorbereid!

Dit soort dingen kun je vooraf niet bedenken, je loopt er pas tegenaan als je met ML aan de gang gaat. Vandaar dat we heel blij zijn dat Joost meeloopt bij Prime Vision. Dan weten we alvast wat de valkuilen zijn als we bij CNOC ons eerste zelflerende algoritme gaan ontwikkelen!