Hva er greia med maskinlæring?

Det siste halve året har det vært stort oppstyr rundt maskinlæring. Teknologien har vært tilgjengelig siden 70-tallet. Den mye yngre fetteren Big Data jubler: Endelig!

fugletrekk danner mønster på himmelen
Store mengder data
kan sammenlignes, analyseres og gi verdifull informasjon

Maskinlæring har vært i bruk og undervist i siden 70-tallet. Det slo ikke helt an tidligere fordi treffsikkerheten ikke var høy nok. To bruksområder hvor det likevel har vært brukt, er i spam-filtrering og ved symptomanalyse for å si hva som feiler deg. 

Hvorfor er det blitt populært nå?

Maskinlæring er en måte å detektere statistiske sammenhenger. Skal du finne sammenhenger, trenger du statistikk, og statistikk krever data. Dersom du vil ha høy treffsikkerhet trenger du mye data. Veldig mye data! Og da dukker den forrige hypen opp av eska: Big Data. Det ene gir ikke verdi uten det andre. Så når maskinlæring nå har fått sin renesanse, kan vi i stor grad takke Big Data for det.

Nå har vi teknologi som gjør oss i stand til å samle inn og analysere store mengder med data. I tillegg har det blitt gjort mye arbeid for å gjøre teknologien mer tilgjengelig. Nå finnes det gode verktøy, både som skytjeneste og Open Source-produkter. De er enkle å ta i bruk slik at den tekniske terskelen for å starte opp prosjekter er blitt lavere. Veien til å prøve ut teknologien har blitt kort, og mange ønsker å teste den ut. Mange store selskaper er godt i gang. Google, Apple, Microsoft, Amazon og IBM er noen av dem. Ja, og så Tesla med sine selvkjørende biler.

Bruksområder

Maskinlæring kan øke lønnsomheten og effektiviteten. Her er forslag til noen bruksområder.

  • Oppgavestøtte: Få se lignende saker, hjelp til å vurdere risiko og automatiske forslag til utfyllinger.

  • Varsling: Få varsel om avvik dersom det oppstår unormal aktivitet basert på modell for normal oppførsel.

  • Kategorisering: Innkommende saker blir automatisk sendt til rett person eller registrert på rett sted.

Du trenger i hovedsak å ha disse to tingene på plass for å starte opp: 
1. Relevante data
2. En forretningsmodell som kan nyttegjøre seg resultatet. 

Fallgruver

Det er viktig å ta i bruk maskinlæring på rett sted og til å løse rett type oppgaver. Å ha tilgang til riktig type data for det du ønsker å løse er viktig. Du vet hva de sier: "Du kan ikke sammenligne epler og pærer!"

Analyse og integrasjon tar tid. Selve implementeringen av modellen er enkel. Å gjøre de ulike dataene fra ulike datakilder sammenlignbare krever mye arbeid. Noe så enkelt som et klokkeslett kan skrives på mange måter. Ved å gjøre manuelle analyser og transformere data til korrekte formater, vaske og standardisere kan data bli sammenlignbare og kjøres gjennom maskinlæringsalgoritmen. Ut i andre enden kommer det informasjon som går rett inn i forretningsmodellen og gir verdi. Om det er et potensiale for å hente ut en gevinst ved å ta i bruk maskinlæring er det viktig at forretningsmodellen er tilpasset og gjør det mulig. 

Kantega er i gang

I dag har vi to prosjekter hvor maskinlæring er tatt i bruk. I det ene prosjektet ser vi om vi kan forutsi når neste inspeksjon bør utføres basert på utfallet av tidligere inspeksjoner. I det andre prosjektet bruker vi data fra ulike kilder for å gi bedre prismodeller.

Er maskinlæring nytt for dere anbefaler vi å gjennomføre en Proof of Consept (POC) først. Velg et område som ikke er kritisk eller som går i parallell med en kritisk prosess. Når vi har dannet oss et bilde av hvordan dere kan få utbytte av dataene dere sitter på, gjennomfører vi en workhshop med fokus på innovasjon. Sammen finner vi en god strategi dersom det er tydelig at maskinlæring vil gi dere verdi.

Ta kontakt

Ønsker du å høre mer om hvordan vi jobber, lufte ideer til bruksområde eller hva vi kan få til sammen, er det bare å ta kontakt.

Atle Prange, senior systemutvikler - Trondheim:  atle.prange@kantega.no  

Hans Ove Ringstad, avdelingsleder - Oslo:  hans.ove.ringstad@kantega.no