Kuinka koneoppimisohjelmat “oppivat”?

Tässä artikkelissa tarkastellaan kahta koneoppimismenetelmää (ML), Naive Bayes -luokittelijaa ja hermoverkkoja, ja demystifioidaan niiden toiminta.

Kaikilla hypeillä, jotka ympäröivät itse ajavia autoja ja videopelejä peittäviä AI-robotteja, on syytä askel taaksepäin ja muistuttaa itseämme siitä, kuinka koneoppimisohjelmat todella oppivat. Tässä artikkelissa tarkastellaan kahta koneoppimismenetelmää (ML) - roskapostisuodattimia ja hermoverkkoja - ja demystifioidaan niiden toiminta.

Ja jos et ole varma, mitä koneoppiminen on, lue keinoälyn, koneoppimisen ja syvän oppimisen erotuksesta.

Yksinkertainen esimerkki: Naiivi Bayes -luokitin

Yksi yleinen koneoppimisalgoritmi on Naive Bayes -luokitin, jota käytetään roskapostien suodattamiseen. Se pitää viestit, kuten ”Nigerian prinssi tarvitsee rahallista apua!”, Postilaatikossasi. Joten miten se toimii?

Aina kun napsautat Merkitse roskapostiksi -painiketta, päivität jättiläismäisen tietokannan roskapostinäytteistä. Tietojen avulla tietokoneohjelma voi kerätä tilastotietoja eri sanoista tai ilmauksista. Voi esimerkiksi huomata, että 25% roskapostista sisältää lauseen "miesten lisälaite" tai että 30% sisältää ilmauksen "nopea raha nyt".

Näillä numeroilla Naive Bayes -luokittelijalla on nyt kaikki tarvittavat tiedot saapuvien sähköpostien merkitsemiseksi joko laillisiksi tai roskapostiksi. Kun saat uuden viestin, algoritmi etsii kaikkien sen sanojen tilastotietoja. Sitten se yhdistää nämä tilastot jonkin verran matematiikkaa (erityisesti todennäköisyystieto, nimeltään Bayesin sääntö) luokitellaksesi sähköpostin roskapostiksi. Se siitä!

Tietenkin, meillä on kiilto numeroiden murskaamisesta, joka menee tähän algoritmiin, mutta tämän ML-ohjelman todellinen “oppiminen” on melko yksinkertainen. Se vain päivittää sanoja / lauseita koskevia tilastotietoja (esim. 40% sähköposteista, joiden lauseke on ”Nigerian prinssi”, on roskapostia). Tämän ohjelman toiminnassa ei ole mitään mystistä.

Roskapostinsuodatuksen valitettava sivuvaikutus

Monimutkainen esimerkki: Neuroverkot

ML-algoritmi, jonka suosio kasvaa, on hermoverkot. Viime vuoden heinäkuussa Google ilmoitti käyttävänsä hermoverkkoja vähentämään datakeskuksensa jäähdytyskustannuksiaan mahtavilla 40 prosentilla. Kustannusten leikkaamiseksi he tarvitsivat tavan ennustaa, kuinka niiden PUE (virrankäytön tehokkuus) muuttuu suhteessa muuttujiin, kuten palvelimen kuormitus, vesipumppujen lukumäärä, jäähdytystornien lukumäärä ja muut datakeskuksen ominaisuudet.

Google käyttää myös koneoppimista pysäköintivaikeuksien ennustamiseen, ja nämä ovat vain kaksi monista koneoppimissovelluksista. Tällainen laskenta on liian monimutkaista, jotta insinööri voi muotoilla käsin, joten he käyttivät hermoverkkoa.

Googlen hermoverkot ovat monimutkaisia, mutta sinun tarvitsee vain tietää, että se sisältää parametreja, jotka päivitetään, kun syötät tietoja. ”Data” tarkoittaa datakeskuksen esimerkissä PUE-tasoja, palvelimen kuormitusta, # vesipumppuja jne. Eri ajankohtina. Näiden parametrien parantuessa hermoverkon kyky laskea tarkasti PUE paranee. Lopputulos on ohjelma, joka voi kertoa sinulle, mitä ihmisen insinööri ei voinut - kuinka heidän energiatehokkuutensa muuttuu heidän tietokeskuksen jäähdytyskonfiguraationsa perusteella.

Google käytti tätä algoritmia saavuttaakseen hämmästyttävän 40%: n laskun kustannuksissa. Yhteenvetona voidaan todeta, että Googlen hermoverkko “oppi” ennustamaan PUE: n datakeskuksen kokoonpanon perusteella. Mutta muista, että tämä ”oppiminen” ei ollut mitään salaperäistä. Se oli vain säätämällä parametreja - toisin sanoen todellisia lukuja - heidän hermossaan, jotta PUE-arviot olisivat tarkempia.

Haluatko kaikki viimeisimmät edistysaskeleet ja tekniset uutiset lähettää suoraan postilaatikkoosi?

Alun perin julkaistu osoitteessa www.leverege.com