Sådan konstrueres en datavidenskabsportefølje fra Scratch

Kilde: http://blog.whooosreading.org
Jeg har lyst til, at dette er meget meta, fordi jeg skriver om, hvordan man konstruerer en portefølje på min portefølje ...

Hej læsere!

Velkommen tilbage, jeg håber, at du efter at have læst gennem nogle af mine casestudier har indset et par ting af, hvad jeg prøver at gøre her:

A. Vis mit arbejde og mine python / analytiske evner
B. Vis min rejse med læring af python / analytiske evner!

Fuld offentliggørelse, før jeg starter denne artikel: Jeg er ganske ny inden for datavidenskabsfeltet. Faktisk indebærer mit job i øjeblikket ikke meget datavidenskab, men mere grundlæggende analyse og rapportering. Når det er sagt, vil jeg inden for de næste 5 år fuldt ud kaste mig ud i datavidenskaben som en karriere og ind i den akademiske verden.

Når det er sagt - i løbet af denne "prep" -tid vil jeg sikre, at mine evner, når jeg lærer dem, bliver praktiseret. De siger, at praksis er perfekt, og jeg behøver ikke at fortælle dig, at de ikke tager fejl! For at komme videre på dette felt og alle andre ting, er det eneste, der sikrer, at du går fra begyndere til mellemled til ekspert gennem praksis, praksis, praksis. Og husk at ikke blive modløs, fordi:

Hver ekspert var engang en begynder - Helen Hayes

I mit tilfælde vil jeg føle, at det arbejde, jeg laver, handler om noget. Et eller andet mål, som jeg prøver at nå, eller noget, som jeg kan vise, da det er det, der motiverer mig. Selvom det muligvis ikke motiverer enhver ny dataforsker, efter at have talt med brancheeksperter (dvs. konsulenter og folk med ph.d.er inden for dette felt, dvs. supersmarte mennesker), har et stykke rådgivning altid været almindeligt: ​​Lav en portefølje. Vis dit arbejde et sted, fordi du aldrig ved, hvem der læser det, og måske ønsker at nå ud til dig.

Min akademiske baggrund - Opbygning af basen

Jeg ved måske ikke meget om at konstruere et hus eller nogen form for bygning, men jeg ved, at det er meget vigtigt at omfatte området og bygge en base, inden jeg begynder et byggeprojekt. Det var hvad jeg gjorde med min uddannelse. Jeg er uddannet med en bachelor i biologi og psykologi. Du undrer dig måske - det har intet at gøre med datavidenskab, hvordan er det nyttigt? Det er det virkelig. At få den første grad af graduering har hjulpet mig med at opbygge stærke kritiske tænkningsevner, undersøge færdigheder og vigtigst af alt et drivkraft for at holde mig til og elske videnskab. Jeg har også været i stand til at udvikle en kærlighed til sundhedsydelser og folkesundhed og har som mål at være en folkesundhedsadvokat.

Efter at have fået min bacheloruddannelse, tilmeldte jeg mig og gennemgår i øjeblikket et kandidateksamen i Data Science. Det er her husets eksoskelet bygges. Jeg lærer Python, statistik, konstruerer modeller for maskinlæring, og hvordan jeg håndterer enhver og alle slags data.

Derfor, hvis du i øjeblikket gennemgår en lavere grad eller post-sekundær eksamensbevis og føler, "mand, dette er nytteløst, jeg kan gøre så meget mere med mit liv". Lyt ikke til hvad sociale medier eller sociale medier "berømtheder" siger mine venner, en uddannelse er vigtig! Vi bygger færdigheder, som vi ikke engang ved, at vi havde, før de er sat i anvendelse (mest sandsynligt på dit arbejdssted eller i din karriere).

Oprettelse af porteføljen - Dit værktøjskit

  1. Medium og / eller andre blogplatforme

Dette sted begynder at føles mere og mere som hjemme. Da jeg oprindeligt besluttede at oprette en portefølje, tænkte jeg på at oprette min egen hjemmeside på en platform som WordPress eller Squarespace. Mens disse platforme er fantastiske at være vært for din egen portefølje, ønskede jeg et sted, hvor jeg ville få en vis synlighed, og et temmelig godt taggingssystem for at nå ud til større målgrupper. Heldigvis har Medium som vi ved disse muligheder (og det er også gratis). Først sørgede jeg for, at datavidenskab og -analyse er noget, der blev talt om og skrevet om på dette websted - jeg blev åbenbart ikke skuffet.

Da min profil blev oprettet, begyndte jeg at sende mine vellykkede opgaver, som jeg havde udført i min certifikatklasse. Langsomt håber jeg, at denne blog vil være vært for en god del af interessante casestudier for folk at læse såvel som artikler som denne. Artikler, der kan hjælpe og intriger folk, når de navigerer efter dette karrierevalg.

Den eneste ulempe, jeg finder med Medium, er, at jeg ikke har fundet en mere effektiv måde at importere mine Jupyter Notebooks til Medium for at placere min kode. Posting kode fra en IDE er ude af spørgsmål! I øjeblikket snip jeg bare markeringen og lægger det ind i artiklen som et billede. Selvom jeg er sikker på, at der er en bedre måde at sende JN'erne på - jeg er bare nødt til at finde det (og når jeg gør det - vil jeg være sikker på at skrive et indlæg om det).

Andre blogplatforme, du kan bruge: ovennævnte Wordpress og Squarespace, Tumblr (jeg har ikke udforsket DS på Tumblr, men det har også blogging evner og en stor brugerbase), for enhver webudvikler kan du naturligvis… opbygge din egen.

2. Kaggle

Kaggle var et af de første websteder, der virkelig fik mig til Data Science. Hvis du virkelig vil fremvise dit dygtighedssæt og få folk til at ære dig for at arbejde, er det værktøj, du kan bruge, Kaggle.

At deltage i konkurrencer (og naturligvis vinde), skabe kerner fra datasæt og bidrage til diskussioner kan få nogen virkelig set. For virkelig at sætte dit arbejde i spidsen, synes jeg Kaggle er et must-have i dit online værktøjssæt.

At opbygge din Kaggle-profil kan være noget, du lægger på dit CV, og arbejdsgivere kan bare dobbelt kontrollere dine evner ved at søge på dit navn. De kan se, hvor mange konkurrencer du har deltaget i, hvilke typer modeller, du har bygget, eller analyser, du måske har foretaget med de tilgængelige datasæt.

En anden grund til at bruge Kaggle er selve samfundet. Jeg fandt, at Kaggle var ret bedømmelsesfri og modtagelig for nye elever. Du kan stille spørgsmål og få alle fra studerende til eksperter give dig et gennemtænkt og alvorligt svar. Hvis du har brug for mere praksis, kan du gå til Kaggle Learn-sektionen og gennemgå maskinlæring, SQL, eller hvis du gerne vil vove dig ind i R-programmeringsområdet, kan du også gøre det. Det er et fantastisk værktøj / websted, og jeg opfordrer ærligt til dem, der endnu ikke har prøvet det.

3. Github

Oh Github - Jeg tror, ​​Github er KODESIDEN. Du vil sikre dig, at du mindst har noget derinde. Selvom ... i det mindste for mig personligt..Det er også et af de mest forvirrende sider! Jeg synes ærligt, at der skal være et separat modul i ethvert datavidenskab eller kodningskursus, der beskæftiger sig med, hvordan man poster på Github. På grund af, at Github er den primære kilde, som næsten alle mennesker inden for datalogi, datavidenskab osv. Bruger til at dele deres arbejde, synes jeg det burde være nødvendigt for nye elever at blive virkelig fortrolige med det. Når det er sagt, er jeg næsten 98% sikker på, at der er tutorials til Github tilgængelig på YouTube (jeg er i tvivl med de 2%).

Jeg har ikke offentliggjort for meget på dette websted, men så snart jeg finder ud af, hvordan det fungerer, ved jeg med det faktum, at jeg vil bruge det. Måske er du lidt usikker på Kaggle, måske at udstationering på Medium eller oprette din egen blog ikke er din kop te - men i det mindste burde Github være en del af din portefølje. Brancheeksperter eller personer, der ansætter til Data Scientists-stillinger, tjekker ofte Github for at se, hvem der poster, hvad og hvor nøjagtig din kode og modeller er. Github er som hammeren i din værktøjskasse - du skal have den!

4. Twitter / sociale medier

Endelig tror jeg, at en af ​​de mest populære sociale mediesider for datavidenskabsmænd er Twitter. Der er selvfølgelig Facebook (men som datavidenskabsmand, vil du virkelig bruge FB, efter det er uheldigt?), Og LinkedIn også. LinkedIn er et fantastisk sted at dele dine artikler og indsigt til mennesker, der muligvis er fremtidige arbejdsgivere, eller læse artikler for at udvide din egen viden.

Hvis du vil sende dine indsigter, måske artikler, du har skrevet, eller læse op om, hvad der er det nyeste og bedste inden for denne branche, tror jeg, at Twitter er stedet for dig. Det er en fantastisk måde at komme i kontakt med og følge eksperter på deres felt, som ofte har deres egne blogs, som du kan læse, og datavidenskabets publikum er stort nok til at du kan nå ud til ganske mange mennesker. Så tweet væk! Del din indsigt i 280 tegn eller mindre.

Konstruktionen

Men du vil opbygge din datavidenskabsportefølje er op til dig. Måske vil du integrere alle de 4 værktøjer, måske overhovedet ingen! Jeg tror, ​​det vigtige er at øve. Data Science, analytics, koding - disse er alle som at lære et instrument. Jo mere du øver, desto bedre bliver du og mestrer dit håndværk, og der er aldrig et øjeblik, hvor du ikke lærer. Uanset om du er en junioranalytiker eller en administrerende direktør - praksis er alt. Hvis folk kan se dit arbejde undervejs og give ros eller feedback, bringer det bare dig så meget tættere på den "ekspert" titel!

Jeg håber, at disse tip hjalp dig - lad mig vide, om der er andre værktøjer, du bruger til at opbygge din datavidenskabsportefølje. Det er det for nu, indstil til flere artikler, casestudier og tutorials. Tak for at have læst!

Glad bygning :)