12 asiaa, jotka haluaisin tuntevani ennen tietojenkäsittelyyn aloittamista

Olen ollut datatieteilijä hieman yli kolme vuotta. Minulta kysytään opiskelijoilta alaa koskevia neuvoja, joten tässä on muutamia ajatuksiani. Ensinnäkin luetteloin muutamia asioita, jotka haluaisin, että minut tunnetaan tultuaan kentälle, ja toiseksi, tavallisia neuvojani opiskelijoille, jotka haluavat tulla tietojen tutkijoiksi valmistumisen jälkeen.

Mitä toivon tuntevani tietojen tiedestä

Niin monia työkaluja, joista huolehtia, niin harvoja käytätkin

'Data Science' on epämääräinen termi, joten kohtele sitä vastaavasti

Tietotiede voi kattaa käytännöllisesti katsoen minkä tahansa kvantitatiivisen työn. Kaksi tietotieteilijää eri yrityksissä tai jopa samassa yrityksessä voisivat tehdä täysin erilaisia ​​töitä. Kenttä on vähitellen murtunut erityisempiin nimikkeisiin, kuten tietoinsinööri, data-analyytikko, koneoppimisinsinööri ja niin edelleen. Tämä erikoistumisprosessi kiihtyy varmasti tulevaisuudessa. Siksi, kun puhut tietojenkäsittelystä tai hakemisesta työpaikkoihin, yritä selvittää, mikä tietotekniikan erityinen määritelmä on kyseisessä tilanteessa, ja varmista, että se vastaa sinun omaasi. Erityisesti on hyödyllistä selvittää, mitkä tulokset ovat tietyssä tietotekniikan roolissa. Tarvitseeko sinun kirjoittaa koodi, joka elää tuotantojärjestelmässä? Tarvitseeko sinun luoda dataputkistoja? Aiotko tuottaa analyysejä offline-tiedoista, ja jos on, millaisia ​​analyysejä? Selvittää, mistä suorituksista olet vastuussa, on usein parempi kuin lukea todellisia tehtävänkuvauksia, koska työkuvaukset yleensä kirjoitetaan houkuttelemaan laajaa joukko ehdokkaita rooliin sen sijaan, että oikeasti selvittäisivät, mitä työ aiheuttaa.

Imposter-oireyhtymä on normaali osa työtä

Jokaisella tietojen tutkijalla on huijausoireyhtymä. Olen huomannut, että merkityksellinen osa työtä navigoi siinä. On vain asioita, joita et tiedä. Kuten edellä mainittiin, kenttä on huonosti määritelty, joten on uskomattoman suuri määrä aiheita, jotka voisivat kuulua tietotekniikan määritelmään. Jos luet blogeja tai Quoraa, se tuntuu siltä, ​​että sinun on oltava maailmanluokan jokaisella tietotekniikan taito: Stanford PhD -tilastisti, Google-kalibrointiinsinööri ja McKinsey-luokan yritysasiantuntija, kaikki käärittynä yhteen. Todellisuus on, että kukaan ei ole täydellinen kaikessa. Vaikka olisit taikuuttakin täydellisesti kaikissa taitoissa, käytät vain osaa näistä taidoista jokaisessa projektissa ja menetät harjoituksen sellaisten kanssa, joita et käyttänyt. Ainoa mitä sinun on tehtävä ollakseen hyvä tietoteknikko on löytää tapa käyttää tietoa hyödylliseksi. Tätä varten on paljon erilaisia ​​tapoja. On hienoa tuntea huijari-oireyhtymä ajoittain. Tiedät vain, että se on normaalia, äläkä anna sen kaataa sinua. Yritä sen sijaan omaksua tilanteet, joissa sinulla on jotain uutta opittavaa, mielenkiintoisina kasvumahdollisuuksina ja muista pitää tämä tunne mielessä seuraavan kerran, kun kohtaat jonkun muun, joka ei tiedä jotain mitä teet.

Sinun ei koskaan tarvitse tietää kaikkia työkaluja

Hadoop, Spark, lanka, Julia, Kafka, ilmavirta, leikkaus, punainen siirto, pesää, TensorFlow, Kubernetes ... on olemassa näennäisesti loputonta määrää tietotekniikkaa koodaavia kieliä, kehyksiä ja työkaluja. Kun et ole aiemmin työskennellyt tietojenkäsittelytehtävissä, tuntuu, että sinun on tiedettävä ne kaikki ollakseen todellinen tietoteknikko. Joka kerta, kun kuulin jonkun mainittavan työkalun, jota en tiennyt keskustelussa, tapana harhautua hiljaa sisäisesti ja tehdä henkisen muistiinpanon löytääkseni Coursera-luokan aiheesta, jonka voisin huijata, stat. Onneksi voit turvallisesti sivuuttaa 99% tiedontieteellisistä työkaluista. Lopulta yritykselläsi on omat työkalut. Jokaisessa yrityksessä on hyvä käyttää näitä työkaluja ja olla täysin avuton useimmista muista. Lisäksi mikään hyvä yritys ei välitä, jos olet käyttänyt heidän erityisiä työkalusarjojaan aiemmin. Ellet jätä todella erikoistunutta roolia, he odottavat sinun oppivan heidän pino työssään. Sinun tarvitsee vain tietää tarpeeksi siirtääksesi haastattelu. Valitse pieni työkalusarja, joka sopii sinulle. Nauti heistä ja älä huolehdi siitä, että haaroitut liian paljon, kunnes olet töissä.

Opi kuitenkin perustyökalut hyvin

Sinun ei tarvitse tietää kaikkia työkaluja, mutta sinun on syytä syventää päivittäin käyttämiäsi perustyökaluja. Et koskaan pidä valitettavasti minkään yrityksen käyttämäsi SQL-murran tylsien osien oppimista, kuten kuinka kirjoittaa optimoitu kysely. Jos käytät R: tä, opi ggplot2: n ja dplyr: n hyvät puolet. Jos käytät Pythonia, yritä todella ymmärtää pandoja, tuimaisia ​​ja sipulia. Teeskentelin tuntevani gitin kuukausia, mutta sitouduin aina git-solmuihin. Lopuksi hajotin ja luin suuren työkalun opetusohjelman. Sitten tunsin itseni voittamattomaksi. Jos huomaat käyttävän jotain säännöllisesti, lue vain sen käyttöohjeet.

Olet asiantuntija verkkotunnuksessa, ei vain menetelmissä

Tietotekniikka syntyi kompromissina tutkimuksen tieteen ja liike-elämän analyytikoiden välillä. Ensin mainitut käyttivät tehokkaita menetelmiä, mutta vaikuttivat vain epäsuorasti liiketoimintapäätöksiin, kun taas jälkimmäiset vaikuttivat suoraan yrityksen omistajiin, mutta käyttivät rajoitettua työkalua tehdäkseen niin. Tietotieteilijät tekevät suurimman vaikutuksen, kun ne yhdistävät molemmat osapuolet toisiinsa sekoittaen syvän verkkotunnuksen tiedon oikeisiin tilastollisiin ja teknisiin työkaluihin parempien päätösten tai hyödyllisten tietotuotteiden tekemiseksi.

Kokemukseni mukaan suurin osa data-tutkijoista nojaa liian pitkälle tutkijan suuntaan eikä riittävän kaukana liike-elämän analyytikon polulle. He rakastavat kuvitteellisten tekniikoiden käyttämistä, mutta he eivät ole investoineet alaansa oppimiseen. He käyvät koneoppimiskonferensseissa, mutta harvemmin osallistuvat konferensseihin esimerkiksi markkinoinnista tai riskistä. Monet tiedemiehet eivät edes tajua, että heillä on verkkotunnus. Jokainen joukkue, jolla on kertynyt tietoa siitä, mikä toimii ja jolla ei ole verkkotunnustietoa, ja voit oppia siitä liikekumppaneiltasi tai puhumalla samankaltaisten ryhmien kanssa muissa yrityksissä. Verkkotunnuksesi tunteminen on puoli taistelua, joten sijoita aikaa sinne, aivan kuten teet kovien taitojesi vuoksi.

Tärkein taito on kriittinen ajattelu

Suuri osa kaikista tietotöitä koskevista tehtävistä on sen määrittäminen, mikä on tärkeää ja mikä ei. Voit tehdä täydellisen analyysin, mutta jos käy ilmi, että ratkaisit väärän ongelman tai jos käsityksesi ei ole käyttökelpoinen, sillä ei ole väliä. Kannattaa aktiivisesti viettää aikaa pohtiaksesi työsi laajempaa kontekstia. Mitkä ovat joukkueesi tärkeimmät haasteet ja miksi? Onko nykyinen etenemissuunnitelmasi paras tapa auttaa ryhmääsi vai pitäisikö sinun siirtää suunnitelmaa? Vastaukset näihin kysymyksiin voivat muuttua ajan myötä, joten on tärkeää tarkistaa säännöllisesti. Olen nähnyt paljon tietotekijöitä marssimassa tietä liian kauan yksinkertaisesti inertin takia.

Mitä tehdä opiskelijana tullaksesi tietotieteilijäksi

Ota asiaankuuluvat luokat - ei vain teknisiä luokkia

Tietysti tilastot ja tietotekniikan tunnit ovat hyödyllisiä työssä. Monista luokista voi kuitenkin olla apua. Kaikki, mikä saa harjoitella kriittistä ajattelua ja esittämään kirjallisia väitteitä, kuten filosofia, historia tai englanti, voi olla hyödyllinen, koska se on paljon mitä teet informaatiotieteessä. Yhteiskuntatieteiden aiheet, kuten taloustiede tai kvantitatiivinen psykologia, voivat olla hyviä kokemuksen saamiseksi syy-johtopäätöksistä. Luokka, johon ajattelen usein, on ottama vakuuttava puhumiskurssi, jota käytän säännöllisesti työssäni. Ota kohtuullinen osuus teknisistä luokista, mutta opiskele laajasti ja seuraa kiinnostuksen kohteitasi. Strategiani oli aina mennä suurten professorien kanssa suurten opetusohjelmien yli. Suosittelen sitä edelleen jokaiselle korkeakouluopiskelijalle, tietotekniikkaa vai ei.

Harjoittele viestintää - kirjallista, visuaalista ja suullista

Viestintätaidot ovat villinä tärkeitä ja kroonisesti aliarvioituja datatieteessä. Vaikutustasi voi olla vain yhtä hyvä kuin viestintätaitosi, koska joudut vakuuttamaan muita tekemään päätöksiä tai auttamaan analyysiisi perustuvien tuotteiden rakentamisessa. Siksi useiden erittäin teknisten tietojen tutkijoiden ura on epäsuorasti rajoitettu, koska he eivät osaa kirjoittaa tai puhua selvästi. Harjoittelu - kaikissa kolmessa muodossa, kirjallinen, visuaalinen ja suullinen - tekee todellisen eron. Ota kursseja, joissa on paljon kirjoitusta, varsinkin jos sinusta tuntuu, että olet heikko kirjailija tai englanti ei ole ensimmäinen kieli. Monilla kampuksilla on kirjoituskeskuksia, joiden avulla saat palautetta. Se on resurssi, jota voit hyödyntää, kun sinulla on.

Työskentele oikeiden tietoongelmien kanssa

Kaggle on hyvä mallinnuksen oppimiseen. Kagglen kanssa vaikein osa on kuitenkin jo tehty sinulle: kerätä, puhdistaa ja määritellä ratkaistava ongelma kyseisillä tiedoilla. Paras tapa valmistautua tietotekijän työhön on käyttää todellista tietoa vastaamaan oikeisiin kysymyksiin. Syy on yksinkertainen: se on lähin, jonka voit päästä varsinaiseen työhön ilman, että sitä todella olisi. Löydä jotain kiinnostavaa ja hanki omat tietosi. Tietojen kaapiminen Internetistä on paljon helpompaa kuin useimmat aloittelijat ymmärtävät sellaisilla paketeilla kuten BeautifulSoup, Scrapy ja rvest. Wikipedia ja Reddit ovat hyviä kohteita, jos tarvitset inspiraatiota, mutta paras valinta on jotain, jonka olet todella innostunut tutkimasta. Kysy sitten joitain kiinnostavia kysymyksiä ja katso kuinka hyvin pystyt vastaamaan niihin. Puhdista tiedot, tee joitain kuvaajia ja malleja ja kirjoita päätelmäsi jonnekin julkisesti. Alku on hidasta, mutta se johtuu siitä, että opit. Jos mahdollista, yritä ratkaista todelliset todellisen maailman ongelmat yhteisösi ihmisille, kuten tehdä tilastotöitä koulun urheilujoukkueelle tai tehdä kyselyanalyysejä koulun sanomalehdelle saadaksesi harjoittelua myös sidosryhmien johdon kanssa.

Julkaise työsi ja saat palautetta mahdollisuuksien mukaan

Ainoa tapa päästä parempaan mihinkään on saada palautetta. Tietotyö ei ole poikkeus. Nykyään on niin helppoa lähettää muistikirjoja Githubiin tai henkilökohtaisille verkkosivustoille. Jos kirjoitat aiheesta, josta ystäväsi kiinnostavat, voit oppia paljon siitä, kuinka he vastaavat. Mikä oli mielenkiintoista esityksessäsi? Mikä oli epäselvää? Pystyitkö suostuttelemaan heidät pääväitteeseesi? Oliko heidän tylsistynyt lukeminen, eivätkä he päässeet loppuun? Tärkeää on, että asetat koodisi saataville ja yritä saada koodiarviointeja muilta oppilailta, jotta voit tehdä toisistasi parempia. Jos käytät tekniikkaa valitsemastasi luokasta, voit jopa näyttää professorille tekemäsi asiat ja saada asiantuntijapalautetta samalla kun osoitat aloitetta. Ja kuka tietää, jos jokin analyyseistäsi tulee virukselliseksi Internetissä, saatat jopa saada työtä siitä!

Siirry tapahtumiin - hakatonit, konferenssit, kokoukset

Sikäli kuin maantieteellinen ja budjetti sallii, yritä olla vuorovaikutuksessa ulkopuolisen tietotekniikan maailman kanssa opiskelijan ollessa. Se antaa sinulle paremman käsityksen kentän todellisuuksista ja antaa etumatkan verkottumiselle. Useimmissa suurimmissa kaupungeissa on tietotekniikkatapaamisia ja hakatoneja, ja kokemukseni mukaan suurin osa ihmisistä on erittäin ystävällisiä opiskelijoille. Konferensseille on yleensä dramaattisesti alennettu lippu opiskelijoille. Ystävien kanssa käyminen voi myös olla hauskaa kenttämatkaa yhdessä!

Ole joustava kentälle kirjoittamisen suhteen

Tietotiede on kilpaileva ala. Teknologiayrityksiä on rajoitetusti, joilla on suuria tietotiedemerkkiä, ja taistelu kesäharjoitteluistaan ​​ja lähtötason roolistaan ​​on kovaa. Kun sinulla on jopa pieni määrä todellista tietojenkäsittelytieteen työkokemusta, on kuitenkin paljon helpompaa saada toinen työ kentältä. Tietotieteilijöillä, joilla on muutaman vuoden turvavyö, jopa tunnetuilta yrityksiltä, ​​on usein pieniä vaikeuksia palkata huipputekniikan yrityksiin. Jos siis haluat olla tietotekijä ja et saa tarjousta heti lepakkolta yhdeltä kuuluisalta yritykseltä, harkitse työnhaun laajentamista. Siellä on paljon yrityksiä, joilla on mielenkiintoisia ongelmia ratkaistavana.

Kiitos lukemisesta! Haluaisin kuulla ajatuksesi - yllä olevan keräyspalautteen perusteella! - joten jätä kommentti alla.