Tekninen katsaus siihen, kuinka rikolliset käyttävät AI: tä

Koneoppiminen on yksi mielenkiintoisimmista uusista ominaisuuksista, joita nykyään käytetään tekniikassa. Se on kuitenkin epäilemättä myös kiistanalainen. Tällä hetkellä tämä kiista ei oikeastaan ​​johdu siitä mahdollisuudesta, että erittäin älykkäät robotit dramaattisesti valtaisivat ihmiskunnan; sen sijaan, että rikolliset voivat käyttää tällaista tehokasta tekniikkaa yhtä negatiivisesti, kuin hyvää tarkoitusta tekevät voivat käyttää sitä positiivisesti. Tässä kappaleessa haluaisin tutkia pimeää puolta: kuinka rikolliset käyttävät AI: tä laittomasti.

Ennen kuin tietokoneilla oli kyky ratkaista heuristisia ongelmia, monet turvajärjestelmät suunniteltiin periaatteella, että tämä ei muutu. Ajatusta siitä, että tietokone voisi arvata salasanan, lukea graafisen captcha-muodon tai oppia kuinka todellinen liikenne käyttäytyy, ei yksinkertaisesti ajateltu. Nyt meitä ympäröi turvallisuus, jonka AI on syrjäyttänyt.

Captchas ja kuvan luokittelu

Järjestelmän on monta, monta kertaa vahvistettava, että käyttäjä on todella ihminen. Tämä johtuu siitä, että kaikkia tietokoneen ihmisille tarjoamia toimintoja voidaan hyödyntää tai simuloida myös tietokoneohjelmalla. Jos yrität kirjautua Facebookiin enemmän kuin kolme kertaa, huomaat, että Facebook pyytää vahvistamaan, että olet ihminen, etkä tietokoneohjelma, joka yrittää syöttää miljoonia salasanoja sekunnissa. Tapa, jolla Facebook ja monet palvelut tekevät tämän, tapahtuu captcha-menetelmällä:

Vuosien ajan nämä onnistuneesti erottivat ohjelmat ihmisistä, kunnes AI tuli mukaan. Nyt voidaan käyttää perus- konvoluutiohermoverkkoja, joissa käytetään valtavaa captcha-kuvien tietojoukkoa. Jokaisella captchalla on määritetty tavoite, ja koulutuksensa jälkeen convnetin, he voivat harkita ehdotettuja captchasia tulevaisuudessa. Tämä on enemmän triviaali esimerkki, jossa hermoverkkojen perusperiaatteet ovat kaikki tarvittavat. Nyt kun captchas voidaan ohittaa, raa'at joukkohyökkäykset ovat paljon mahdollisempia. Olet ehkä törmännyt “valitse kaikki väylää sisältävät kuvat” -tyyppiseen captcha-tyyppiseen captchaan, joka on yhtä helppo AI: n ohittaa. Me kaikki tiedämme, kuinka suuri esineiden havaitseminen on - Google, vaikka se integroitui heidän hakukoneeseensa erittäin tärkeänä ja onnistuneena ominaisuutena.

Generatiivisen kilpailevan verkon salasanat

Harvoilla meistä on salasanoja, jotka näyttävät tältä: 5f2 # V0 ”P? Oz3

Useimmilla meistä on salasanoja, jotka näyttävät tältä: Kronenbourg1664

Ja muilla meillä on jopa salasanat, jotka näyttävät tältä: salasana

Ensimmäisen esimerkini seuraajat ovat edelleen niin turvassa, että ihminen tai GTX 1080 GPU arvaa salasanansa. Kaikki muut ovat kuitenkin haavoittuvia. Joten miten nämä salasanat voidaan arvata? Yksinkertaisesti, voisimme käyttää sanakirjaa ja soveltaa jokaista sanaa salasanan syöttämiseen. Saatamme onnistua hyvin pienellä prosenttimäärällä yrityksiämme - niiden ihmisten takia, jotka seuraavat viimeistä esimerkkiäni. Jos olet yksi niistä ihmisistä, luotan siihen, että vaihdat salasanasi tämän artikkelin loppuun mennessä.

Katsotaanpa nyt nykyaikaisempaa ja jopa surkeampaa lähestymistapaa (tietysti käyttämällä AI: tä). Sanakirjan sijasta hermoverkkoja käytetään tuottamaan valtava luettelo todennäköisistä salasanoista. Tätä luetteloa käytetään todennuslomakkeeseen. Otettu PassGAN: Syvän oppimisen lähestymistapa salasanan arvaamiseen, miten tämä luettelo voidaan tuottaa:

Jos tunnet hermoverkot (mikä minun on mainittava, on melko tärkeä muutamille seuraaville kappaleille), se voi silti näyttää epätavalliselta. Sen sijaan, että vain ennustettaisiin tuotetta syötteen perusteella, opimme tiedoista ja opetamme sitten generaattoria tuottamaan useita muita esimerkkejä. Tätä kutsutaan generatiiviseksi kilpailevaksi verkostoksi, jossa käytetään kahta hermoverkkoa; yksi erottaa oikeat ja väärät tulot, ja sitten se, joka oppii tästä tuottamaan uuden oikean datan satunnaisen kohinan kautta.

Ensinnäkin käytämme olemassa olevaa tietojoukkoa, joka sisältää oikeita ihmisen salasanoja, ehkä historiallisesta salasanavuodosta, joka on sittemmin asetettu saataville. Nämä osoittavat yhdessä, millaiset ihmisen salasanat näyttävät (muutama iso kirjain, päivämäärä, satunnaisluku, nimi jne.).

Toiseksi käytämme kohinageneraattoria (G), joka (aluksi) tuottaa satunnaista dataa. Nämä kaksi mahdollista tuloa (vääriä ja oikeita salasanoja) ovat tuloja hermoverkkoon (tai erottelijaan D). Kohteet on suunniteltu yksinkertaisiksi binaarilähdöiksi. Tämä tarkoittaa, että harjoittelun aikana hermoverkolle kerrotaan, onko syötetty salasana väärennetty vai oikea. Jokaisella syötöllä eteenpäin tuotettua lähtöarvoa verrataan sitten tavoitearvoon (totuus) ja siirretään sitten takaisin painoarvojen säätämiseksi virhemarginaalin perusteella. Tämä myös vaikuttaa generaattoriin, koska sen satunnainen tuloääni alkaa optimoida lähempänä salasanan ulostuloja.

Kun generaattori on vaihdettu, kaikki verkkoon lisätyt kohinat johtavat jonoihin, jotka näyttävät salasanoilta. Joten jos jätämme sen toimimaan muutamaksi tunniksi, voisimme koota suuren määrän älykkäästi koottuja salasanoja.

phishing

Tietokalastelu on erittäin yleinen hakkerointimuoto. Oletko koskaan saanut sähköpostia, joka ei näytä aivan oikealta, mutta väittää olevansa pankkisi, puhelinpalvelusi tai sosiaalisen median alusta? Jokainen aloittelija-ohjelmoija, joka tuntee vähän HTML: tä yhdistettynä vain ripaukseen taustakoodia, kuten PHP, voi vetää tämän pois. Se tarkoittaa sähköpostin lähettämistä, joka on visuaalisesti suunniteltu näyttämään esimerkiksi Facebookista ja käyttämään samanlaista virallista kieltä. Se väittää, että sinun on päivitettävä, tarkastettava tai muutettava jotain, ja pyydä kirjautumistietosi tehdäksesi niin. Mitä kirjoitat, se lähetetään rikollisen palvelimelle. Joka tapauksessa, miten AI tulee tähän?

Koneoppiminen voi parantaa tietojenkalastelua indeksoimalla minkä tahansa alustan, oppimalla kuinka ne näyttävät ja kommunikoivat kielen, ja tuottavat sitten massaviestejä vääriä sähköposteja tiettyjen havaintojen perusteella, jotka lähetetään automaattisesti suuressa mittakaavassa. Tämä ei kuitenkaan ole ainoa tapa. Hakkerit voivat myös käyttää samoja aikaisemmin kuvattuja periaatteita salasanojen arvaamiseen, sähköpostiosoitteiden arvaamiseen. Miljoonia sähköpostiosoitteita voidaan tuottaa, mikä lisää mahdollisuuksia löytää teknisesti epäluuloisia ihmisiä.

Monissa sähköpostipalveluissa, nimittäin Gmailissa, on edistykselliset järjestelmät, joilla tunnistetaan tietojenkalastelusähköpostiviestit. Koneoppimuksella voidaan kuitenkin luoda sähköposteja, joita nämä järjestelmät eivät havaitse. Koulutusjoukko olisi kokoelma sähköposteja, joista osa epäonnistui saavuttamaan käyttäjää tietojenkalastelun havaitsemisen takia, ja toiset menestyivät. hermoverkko voi oppia, kuinka tietojenkalastelu havaitaan, ymmärtämällä, mitkä ovat kiinni ja mitkä eivät. Jatkossa sähköposteja voidaan luoda sääntöihin perustuen, joita tietojen kalastelun tunnistus ei kata, katso täältä viite.

johtopäätös

Ensinnäkin nämä ovat vain kolme tapausta. Huolestuttavaa, että muilla alueilla on paljon enemmän, kuten vilpillinen mainonta, väärennetyn liikenteen simulointi ja paljon muuta. Haluan kuitenkin ajatella, että AI: n käyttö oikeudellisessa maailmassa on paljon suurempi kuin rikollinen maailma. Ironista kyllä, AI: tä käytetään rikollisen toiminnan havaitsemiseen monilla hämmästyttävillä tavoilla kadunvalvonnasta aina verkkopetoksiin. Lopuksi vaihda salasanasi, jos generatiivinen kilpaileva verkosto voi arvata sen; älä seuraa sinulle lähetettyjä linkkejä, ellet ole vielä tarkistanut lähettäjän tunnistetietoja. ja lopuksi, älä käytä mitään näistä tekniikoista itse lain rikkomiseen!

- - - - - - - - - - - - - - - - - -

Lue lisää datatieteiden artikkeleita OpenDataScience.com-sivustosta, mukaan lukien oppaat ja oppaat aloittelijasta edistyneelle tasolle! Tilaa viikoittainen uutiskirje täältä ja saat viimeisimmät uutiset joka torstai.