pandos

Kaip naudoti „Boxplot“ Python

Kaip naudoti „Boxplot“ Python
Dėžutės grafikas naudojamas apibendrinti duomenų rinkinius, naudojant langelio ir ūsų grafiko metodą. Ši funkcija padeda vartotojams tinkamai suprasti duomenų suvestinę. Dėžutės brėžiniai gali būti labai naudingi, kai norime sužinoti, kaip duomenys platinami ir skleidžiami. Duomenims braižyti dėžės schemoje naudojami trijų tipų kvartiliai. Šios vertės apima vidutines, didžiausias, mažiausias, viršutinės kvartilės ir apatinės kvartilės statistines vertes. Dėžutės diagrama apibendrina šiuos duomenis 25tūkst, 50tūkst, ir 75tūkst procentilių. Šioje pamokoje bus parodyta, kaip sukurti langelių diagramas pagal pateiktą duomenų rinkinį naudojant pandos ir jūrinis „Python“ bibliotekos.

Būtina sąlyga

Jei esate naujas „Python“ vartotojas, pirmiausia turėsite nustatyti aplinką, kad būtų rodoma dėžutės siužeto išvestis. Kodo vykdymui galite naudoti bet kurį „Python“ vertėją. Šioje pamokoje aš naudosiu spyderis3 vykdyti kodą. Jei neįdiegėte pandos ir jūrinis bibliotekos anksčiau, tada turėtumėte paleisti šią komandą iš terminalo, kad įdiegtumėte šias bibliotekas:

$ pip3 įdiekite pandas jūrines

Dėžutės su pandomis

The dėžutė () metodas pandos naudojama generuoti langelio diagramos figūras pagal duomenų rėmą. Šiame metode yra daug argumentų; kai kurie iš šių argumentų naudojami toliau pateiktuose pavyzdžiuose. Šioje mokymo programos dalyje bus du pavyzdžiai, kurie parodys, kaip sukurti langelių siužetus pandos. Norėdami generuoti langelio schemą, galite naudoti atsitiktinai sugeneruotus duomenis „NumPy“ bibliotekoje arba CSV failo duomenis pandos.

1 pavyzdys: langelių diagramos, pagrįstos atsitiktinėmis reikšmėmis

Žemiau pateikto pavyzdžio langelių schemos buvo sukurtos naudojant NumPy ir pandos. „NumPy“ biblioteka scenarijuje naudojama kuriant duomenų rėmelio objektą, generuojant dviejų matmenų atsitiktinių reikšmių masyvą, kuriame yra 5 eilutės ir 5 stulpeliai. Duomenų rėmo turinys bus atspausdintas naudojant vadovas() metodas. Toliau dėžutė () metodas naudojamas langelių brėžiniams su mėlyna spalva, 10 šrifto dydžiu ir 30 laipsnių pasukimo kampu generuoti, rodant stulpelių vertes.

#!/ usr / bin / env python3
# Importuoti pandų biblioteką
importuoti pandas kaip pd
# Importuokite „NumPy“ biblioteką, kad sukurtumėte atsitiktinius masyvo skaičius
importuoti numerį kaip np
"
Generuoti duomenų rinkinį pagal atsitiktinai sukurtą „NumPy“ masyvą
ir penkių stulpelių vertės
"
duomenų rėmelis = pd.„DataFrame“ (np.atsitiktinis.randn (5,5), stulpeliai = ['2016', '2017', '2018',
(2019 m., 2020 m.)])
 
# Atspausdinkite duomenų kadro reikšmes
spausdinti (duomenų kadras.galva())
# Rodykite langelio diagramą pagal duomenų kadro reikšmes
duomenų rėmelis.„boxplot“ (tinklelis = 'klaidingas', spalva = 'mėlynas', šrifto dydis = 10, puvimas = 30)

Rezultatas

Ši išvestis pasirodys atlikus kodą.

2 pavyzdys: langelių diagramos, pagrįstos CSV duomenimis

Toliau pateikto pavyzdžio langelių diagramos buvo sugeneruotos iš CSV duomenų. Sukurkite CSV failą pavadinimu bankas.csv naudojant šiuos duomenis.

bankas.csv

SL, Client_Name, Account_Type, Lytis, Likutis
1, Maria Hernandez, taupanti, moteris, 120000 m
2, Mary Smith, dabartinė, moteris, 40000
3, Davidas Smithas, dabartinis, vyras, 379000
4, Maria Rodriguez, taupanti, moteris, 56000
5, Mark Lee, taupymas, vyras, 93500
6, Jonathanas Bingas, dabartinis, vyras, 5900 m
7, Daniel Williams, Saving, 2300 metų vyras
8, Mike'as Brownas, dabartinis, vyras, 124888
9, Paulas Smithas, dabartinis, vyras, 59450
10, Maria Lopez, taupanti, moteris, 487600

Šiame scenarijuje matplotlib biblioteka buvo naudojama nustatyti langelio grafiko figūros dydį ir rodyti išvesties eilutę. Visi įrašai bankas.csv failas buvo įkeltas naudojant read_csv () metodas pandos. Pirmieji 8 duomenų rėmelio įrašai buvo atspausdinti naudojant galva() metodas. The dėžutė () metodas buvo naudojamas šiame sakinyje, norint nupiešti langelio grafiko figūrą naudojant raudoną spalvą pagalPaskyros tipas' su stulpeliu pavadinimu „Balansas."

#!/ usr / bin / env python3
# Importuokite pandas, kad sukurtumėte dėžutės sklypą
importuoti pandas kaip pd
# Importuokite „matplotlib“, kad nustatytumėte langelio sklypo paveikslo dydį
importuoti matplotlib.pyplotas kaip plt
# Importuokite „get_ipython“, kad formatuotumėte išvesties eilutę
iš „IPython“ importuokite „get_ipython“
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nustatykite figūros dydį
plt.rcParams ['pav.figsize '] = (8,4)
# Įkelkite duomenų rinkinį iš CSV failo
df = pd.read_csv ("bankas.csv ")
# Atspausdinkite pirmąsias 8 įkeltų duomenų eilutes
spausdinti (df.galva (8))
# Rodyti langelio diagramas pagal naudojamą parametrą
df.boxplot (pagal = 'Account_Type', tinklelis = 'True', stulpelis = ['Balance'], spalva = 'raudona')

Rezultatas

Ši išvestis pasirodys atlikus kodą.

Dėžutės sklypai su jūros gimusiais

Kita „Python“ biblioteka, paprastai naudojama dėžučių brėžiniams piešti, yra biblioteka jūrinis.  Viena iš svarbių šios bibliotekos savybių yra ta, kad joje yra daugybė įmontuotų pavyzdinių duomenų rinkinių, skirtų išbandyti įvairias užduotis. Kituose dviejuose pavyzdžiuose bus aptartas dviejų skirtingų pavyzdinių duomenų rinkinių naudojimas brėžiant langelių grafikus naudojant jūrinis biblioteka.

3 pavyzdys: langelio diagramos pagal x parametrą

Šiame pavyzdyje naudojamas pavyzdinis duomenų rinkinys, pavadintas „deimantai “ nuo jūrinis biblioteka, kad sugeneruotų dėžės sklypą. Čia tinklelio stilius apibrėžiamas naudojant set_style () metodas. The load_dataset () metodas naudojamas įkeliant duomenisdeimantai “ duomenų rinkinys. Pirmieji penki įrašai spausdinami iš duomenų rinkinio ir dėžutė () metodas naudojamas brėžti langelio diagramą remiantis stulpeliu, pavadintu 'gylis,'su mėlyna spalva.

# Importuokite jūrinę biblioteką, kad sukurtumėte dėžutės sklypą
importuoti jūros gimusius kaip sns
# Importuokite „matplotlib“, kad nustatytumėte langelio sklypo paveikslo dydį
importuoti matplotlib.pyplotas kaip plt
# Importuokite „get_ipython“, kad išvesties formatas būtų tiesioginis
iš „IPython“ importuoti get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Nustatykite tinklelio stilių
sns.set_style („whitegrid“)
# Nustatykite figūros dydį
plt.rcParams ['pav.figsize '] = (8,4)
# Įkelkite pavyzdinį duomenų rinkinį
deimantų_duomenų rinkinys = sns.load_dataset ('deimantai')
# Rodyti pirmuosius 5 duomenų rinkinio įrašus
spausdinti (deimantų_duomenų rinkinys.galva())
# Nubrėžkite langelio brėžinius
sns.boxplot (x = diamond_dataset ['depth'], color = 'blue')

Rezultatas

Ši išvestis pasirodys atlikus kodą.

4 pavyzdys: langelių diagramos pagal x ir y parametrus

Šiame pavyzdyje naudojamas duomenų rinkinio pavadinimas „skrydžiai'nupiešti dėžutės siužetą. Čia tiek x, tiek y parametrai dėžutė () metodas yra naudojami piešti paveikslą. Kiti teiginiai yra panašūs į ankstesnį pavyzdį.

# Importuokite jūrinę biblioteką, kad sukurtumėte dėžutės sklypą
importuoti jūros gimusius kaip sns
# Importuokite „matplotlib“, kad nustatytumėte langelio sklypo paveikslo dydį
importuoti matplotlib.pyplotas kaip plt
# Importuokite „get_ipython“, kad išvesties formatas būtų tiesioginis
iš „IPython“ importuokite „get_ipython“
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Nustatykite tinklelio stilių
sns.set_style („darkgrid“)
# Nustatykite figūros dydį
plt.rcParams ['pav.figsize '] = (12,4)
 
# Įkelkite pavyzdinį duomenų rinkinį
skrydžio_duomenų rinkinys = sns.load_dataset ('skrydžiai')
# Rodyti pirmuosius 5 duomenų rinkinio įrašus
spausdinti (skrydžio_duomenų rinkinys.galva())
 
# Nubrėžkite langelio brėžinius
sns.boxplot (x = 'mėnuo', y = 'keleiviai', duomenys = skrydžio_duomenų rinkinys, spalva = 'mėlyna')

Rezultatas

Ši išvestis pasirodys atlikus kodą.

Išvada

Dirbdami su dideliu duomenų kiekiu, galite apibendrinti duomenis naudodami diagramą, pvz., Langelio diagramą. Šioje pamokoje buvo panaudoti keli pavyzdžiai, parodantys, kaip generuoti langelių schemas su dviem „Python“ bibliotekomis.

Atvirojo kodo komercinių žaidimų variklių uostai
Nemokami atvirojo kodo ir įvairių platformų žaidimų varikliai gali būti naudojami žaidžiant senus ir kai kuriuos gana naujus žaidimų pavadinimus. Šiam...
Geriausi „Linux“ komandinės eilutės žaidimai
Komandų eilutė yra ne tik jūsų didžiausias sąjungininkas naudojant „Linux“, bet ir pramogų šaltinis, nes ją galite naudoti norėdami žaisti daug įdomių...
Geriausios „Linux“ skirtos „Gamepad“ žemėlapių sudarymo programos
Jei jums patinka žaisti žaidimus „Linux“ su žaidimų pultu, o ne įprasta klaviatūra ir pelės įvesties sistema, yra keletas jums naudingų programų. Daug...