Duomenų mokslas

„Python Seaborn“ pamoka

„Python Seaborn“ pamoka
Šioje „Python Seaborn“ bibliotekos pamokoje mes apžvelgsime įvairius šios duomenų vizualizavimo bibliotekos aspektus, kuriuos galime naudoti kartu su „Python“, kad sugeneruotume gražius ir intuityvius grafikus, kurie galėtų vizualizuoti duomenis tokia forma, kokios įmonė nori iš platformos. Kad ši pamoka būtų baigta, apimsime šiuos skyrius:

Tai atrodo daug ką aprėpti. Pradėkime dabar.

Kas yra Python Seaborn biblioteka?

„Seaborn“ biblioteka yra „Python“ paketas, kuris leidžia mums kurti infografijas remiantis statistiniais duomenimis. Kadangi jis pagamintas ant matplotlibo, taip jis yra savaime suderinamas su juo. Be to, jis palaiko „NumPy“ ir „Pandas“ duomenų struktūrą, kad braižymą būtų galima atlikti tiesiogiai iš tų kolekcijų.

Sudėtingų duomenų vizualizavimas yra vienas svarbiausių dalykų, kuriais rūpinasi Seabornas. Jei palygintume „Matplotlib“ su „Seaborn“, „Seaborn“ gali lengvai padaryti tuos dalykus, kuriuos sunku pasiekti naudojant „Matplotlib“. Tačiau svarbu tai pažymėti „Seaborn“ nėra „Matplotlib“ alternatyva, bet jo papildymas. Šios pamokos metu naudosime „Matplotlib“ funkcijas ir kodo fragmentuose. Jūs pasirinksite dirbti su „Seaborn“ šiais atvejais:

Prieš pradėdami atkreipkite dėmesį, kad šiai pamokai naudojame virtualią aplinką, kurią atlikome naudodami šią komandą:

pitonas -m virtualenv jūrinis
šaltinis jūrinis / šiukšliadėžė / aktyvuoti

Kai virtuali aplinka bus aktyvi, „virtualioje aplinkoje“ galėsime įdiegti „Seaborn“ biblioteką, kad būtų galima vykdyti toliau sukurtus pavyzdžius:

pip įdiegti gimusį

Taip pat galite naudoti „Anaconda“, kad paleistumėte šiuos pavyzdžius, o tai yra paprasčiau. Jei norite jį įdiegti savo kompiuteryje, peržiūrėkite pamoką, kurioje aprašyta „Kaip įdiegti„ Anaconda Python “į„ Ubuntu 18 “.04 LTS “ir pasidalykite savo atsiliepimais. Dabar pereikime prie įvairių tipų siužetų, kuriuos galima sukurti naudojant „Python Seaborn“.

Naudojant „Pokemon“ duomenų rinkinį

Norėdami išlaikyti šią pamoką praktiškai, naudosime „Pokemon“ duomenų rinkinį, kurį galima atsisiųsti iš „Kaggle“. Norėdami importuoti šį duomenų rinkinį į savo programą, naudosime „Pandas“ biblioteką. Čia yra visi importai, kuriuos atliekame pagal savo programą:

importuoti pandas kaip pd
iš matplotlib importo pyplot as plt
importuoti jūros gimusius kaip sns

Dabar mes galime importuoti duomenų rinkinį į savo programą ir parodyti kai kuriuos pavyzdinius duomenis su „Pandas“ kaip:

df = pd.read_csv ('Pokemonas.csv ', index_col = 0)
df.galva()

Atminkite, kad norint paleisti pirmiau pateiktą kodo fragmentą, CSV duomenų rinkinys turėtų būti tame pačiame kataloge kaip ir pati programa. Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį (Anaconda Jupyter užrašų knygelėje):

Linijinės regresijos kreivės braižymas

Vienas geriausių dalykų „Seaborn“ yra jo teikiamos intelektualios braižymo funkcijos, kurios ne tik vizualizuoja mums teikiamą duomenų rinkinį, bet ir aplink jį kuria regresijos modelius. Pavyzdžiui, galima sukonstruoti tiesinį regresijos grafiką su viena kodo eilute. Štai kaip tai padaryti:

sns.lmplot (x = „Ataka“, y = „Gynyba“, duomenys = df)

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Pirmiau pateiktame kodo fragmente pastebėjome keletą svarbių dalykų:

Nebijokite, jei manėte, kad mes negalime turėti siužeto be tos regresijos tiesės. Mes galime ! Išbandykime naują kodo fragmentą, panašų į paskutinį:

sns.lmplot (x = 'Ataka', y = 'Gynyba', duomenys = df, fit_reg = Klaidinga)

Šį kartą regresijos linijos savo siužete nepamatysime:

Dabar tai yra daug aiškiau (jei mums nereikia tiesinės regresijos tiesės). Bet tai dar ne viskas. Seaborn leidžia mums padaryti šį siužetą kitokį ir tai mes darysime.

Dėžės sklypų statyba

Vienas iš didžiausių „Seaborn“ bruožų yra tai, kaip jis lengvai priima „Pandas Dataframes“ struktūrą duomenims braižyti. Mes galime tiesiog perduoti duomenų kadrą „Seaborn“ bibliotekai, kad ji galėtų iš jos sukonstruoti langelį:

sns.„boxplot“ (duomenys = df)

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Mes galime pašalinti pirmąjį viso skaitymo rodiklį, nes tai atrodo šiek tiek nepatogu, kai iš tikrųjų čia planuojame atskirus stulpelius:

statistika_df = df.kritimas (['Iš viso'], ašis = 1)
# Naujas grafikas naudojant statistiką_df
sns.„boxplot“ (duomenys = statistika_df)

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Spiečio sklypas su Seabornu

Mes galime sukurti intuityvų dizaino „Swarm“ siužetą su „Seaborn“. Mes vėl naudosime duomenų bazę iš „Pandas“, kurią įkėlėme anksčiau, bet šį kartą mes paskambinsime „Matplotlib“ parodos funkcija, kad parodytume savo sukurtą siužetą. Štai kodo fragmentas:

sns.set_context („popierius“)
sns.„swarmplot“ (x = „Ataka“, y = „Gynyba“, duomenys = df)
plt.Rodyti()

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Naudodamiesi „Seaborn“ kontekstu, mes leidžiame „Seaborn“ pridėti asmeninį prisilietimą ir sklandų siužeto dizainą. Šį siužetą galima dar labiau pritaikyti pasirinktiniu šrifto dydžiu, naudojamu siužeto etiketėms, kad būtų lengviau skaityti. Norėdami tai padaryti, mes perduosime daugiau parametrų funkcijai „set_context“, kuri veikia taip pat, kaip ir jie. Pavyzdžiui, norėdami pakeisti etikečių šrifto dydį, naudosime šriftą.dydžio parametras. Štai kodo fragmentas, skirtas modifikuoti:

sns.set_context ("popierius", font_scale = 3, rc = "šriftas.dydis ": 8", kirviai.etiketės dydis ": 5)
sns.„swarmplot“ (x = „Ataka“, y = „Gynyba“, duomenys = df)
plt.Rodyti()

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Etiketės šrifto dydis buvo pakeistas pagal mūsų pateiktus parametrus ir su šriftu susietą vertę.dydžio parametras. Vienas dalykas, kurį „Seaborn“ išmano, yra tai, kad siužetas būtų labai intuityvus praktiniam naudojimui, o tai reiškia, kad „Seaborn“ yra ne tik praktinis „Python“ paketas, bet iš tikrųjų tai, ką galime naudoti diegdami produkciją.

Pavadinimo pridėjimas prie siužetų

Pavadinimus lengva pridėti prie mūsų siužetų. Mums tiesiog reikia laikytis paprastos „Axes“ lygio funkcijų naudojimo procedūros, kai mes tai vadinsime set_title () veikia taip, kaip parodome kodo fragmente čia:

sns.set_context ("popierius", font_scale = 3, rc = "šriftas.dydis ": 8", kirviai.etiketės dydis ": 5)
my_plot = sns.„swarmplot“ (x = „Ataka“, y = „Gynyba“, duomenys = df)
my_plot.set_title ("LH spiečiaus planas")
plt.Rodyti()

Vykdydami pirmiau pateiktą kodo fragmentą, pamatysime šį išvestį:

Tokiu būdu mes galime pridėti daug daugiau informacijos apie savo siužetus.

Seaborn vs Matplotlib

Žvelgdami į šios pamokos pavyzdžius galime nustatyti, kad Matplotlib ir Seaborn negalima tiesiogiai palyginti, tačiau jie gali būti vertinami kaip vienas kitą papildantys. Viena iš savybių, kuriomis „Seaborn“ žengia vienu žingsniu į priekį, yra tai, kaip „Seaborn“ gali statistiškai vizualizuoti duomenis.

Norėdami kuo geriau išnaudoti „Seaborn“ parametrus, labai rekomenduojame peržiūrėti „Seaborn“ dokumentus ir sužinoti, kokius parametrus naudoti, kad jūsų sklypas būtų kuo artimesnis verslo poreikiams.

Išvada

Šioje pamokoje mes apžvelgėme įvairius šios duomenų vizualizavimo bibliotekos aspektus, kuriuos galime naudoti kartu su „Python“, kad sukurtume gražius ir intuityvius grafikus, kurie galėtų vizualizuoti duomenis tokia forma, kokios nori verslas iš platformos. „Seaborm“ yra viena iš svarbiausių vizualizavimo bibliotekų, kai kalbama apie duomenų inžineriją ir duomenų pateikimą daugeliu vaizdinių formų, be abejo, įgūdžių, kuriuos turime turėti savo dirže, nes tai leidžia kurti tiesinės regresijos modelius.

Prašome pasidalinti savo atsiliepimais apie pamoką „Twitter“ su @sbmaggarwal ir @LinuxHint.

Populiariausi „Oculus App Lab“ žaidimai
Jei esate „Oculus“ laisvų rankų įrangos savininkas, turite žinoti, kaip krauti iš šono. Šoninis įkėlimas yra ne parduotuvėje esančio turinio įdiegimas...
10 geriausių žaidimų, kuriuos reikia žaisti naudojant „Ubuntu“
„Windows“ platforma buvo viena iš dominuojančių žaidimų platformų dėl didžiulio procento žaidimų, kurie šiandien kuriami natūraliai palaikant „Windows...
5 geriausi „Arcade“ žaidimai, skirti „Linux“
Šiais laikais kompiuteriai yra rimta mašina, naudojama žaidimams. Jei negalėsite gauti naujo aukšto rezultato, žinosite, ką noriu pasakyti. Šiame įraš...