ML ir AI

20 geriausių „R“ mašininio mokymosi paketų, kuriuos reikia patikrinti dabar

20 geriausių „R“ mašininio mokymosi paketų, kuriuos reikia patikrinti dabar

Beveik visi pradedantys duomenų mokslininkai ir mašininio mokymosi kūrėjai painiojasi dėl programavimo kalbos pasirinkimo. Jie visada klausia, kuri programavimo kalba bus geriausia jų mašininio mokymosi ir duomenų mokslo projektui. Arba eisime pagal pitoną, R arba „MatLab“. Na, programavimo kalbos pasirinkimas priklauso nuo kūrėjų pageidavimų ir sistemos reikalavimų. Be kitų programavimo kalbų, R yra viena iš potencialiausių ir puikiausių programavimo kalbų, turinti kelis R mašininio mokymosi paketus tiek ML, tiek AI, tiek duomenų mokslo projektams.

Dėl to galima lengvai ir efektyviai plėtoti savo projektą naudojant šiuos „R“ mašininio mokymosi paketus. Remiantis Kaggle apklausa, R yra viena populiariausių atvirojo kodo mašininio mokymosi kalbų.

Geriausi R mašininio mokymosi paketai


R yra atviro kodo kalba, kad žmonės galėtų prisidėti iš bet kurios pasaulio vietos. Kode galite naudoti juodą dėžę, kurią parašė kažkas kitas. R, ši juoda dėžė vadinama paketu. Paketas yra ne kas kita, kaip iš anksto užrašytas kodas, kurį kiekvienas gali pakartotinai naudoti. Žemiau mes pristatome 20 geriausių R mašininio mokymosi paketų.

1. CARET


CARET paketas susijęs su klasifikavimo ir regresijos treniruotėmis. Šio CARET paketo užduotis yra integruoti modelio mokymą ir numatymą. Tai vienas geriausių mašininio mokymosi ir duomenų mokslo R paketų.

Parametrų galima ieškoti integruojant kelias funkcijas, kad būtų galima apskaičiuoti bendrą tam tikro modelio našumą naudojant šio paketo tinklelio paieškos metodą. Sėkmingai baigus visus bandymus, tinklelio paieška pagaliau suranda geriausius derinius.

Įdiegus šį paketą, kūrėjas gali paleisti vardus (getModelInfo ()) norėdamas pamatyti 217 galimas funkcijas, kurias galima paleisti tik per vieną funkciją. Kuriant nuspėjamąjį modelį, CARET paketas naudoja traukinio () funkciją. Šios funkcijos sintaksė:

traukinys (formulė, duomenys, metodas)

Dokumentacija

2. randomForest


„RandomForest“ yra vienas populiariausių mašininio mokymosi R paketų. Šis R mašininio mokymosi paketas gali būti naudojamas sprendžiant regresijos ir klasifikavimo užduotis. Be to, jis gali būti naudojamas trūkstamų vertybių ir neįprastų dalykų mokymui.

Šis mašininio mokymo paketas su R paprastai naudojamas keliems sprendimų medžių skaičiams generuoti. Iš esmės imami atsitiktiniai mėginiai. Tada stebėjimų duomenys pateikiami sprendimų medyje. Pagaliau bendras rezultatas, gaunamas iš sprendimų medžio, yra galutinis rezultatas. Šios funkcijos sintaksė:

randomForest (formulė =, duomenys =)

Dokumentacija

3. e1071


Šis „e1071“ yra vienas iš dažniausiai naudojamų „R“ paketų mašininiam mokymuisi. Naudodamas šį paketą, kūrėjas gali įdiegti palaikomųjų vektorių mašinas (SVM), trumpiausio kelio skaičiavimą, maišų grupavimą, „Naive Bayes“ klasifikatorių, trumpalaikę „Fourier“ transformaciją, neryškų grupavimą ir kt.

Pavyzdžiui, IRIS duomenims SVM sintaksė yra:

svm (Rūšis ~ taurėlapis.Ilgis + taurelė.Plotis, duomenys = rainelė)

Dokumentacija

4. Rpart


„Rpart“ reiškia rekursinį skaidymo ir regresijos mokymą. Šis mašininiam mokymuisi skirtas R paketas gali atlikti tiek užduotis: klasifikaciją ir regresiją. Jis veikia dviem etapais. Išvestis modeliuoja dvejetainį medį. Funkcija „plot“ () naudojama brėžti išvesties rezultatą. Taip pat yra alternatyvi funkcija „prp ()“, kuri yra lankstesnė ir galingesnė už pagrindinę „plot“ () funkciją.

Funkcija rpart () naudojama nustatyti ryšį tarp nepriklausomų ir priklausomų kintamųjų. Sintaksė yra:

rpart (formulė, duomenys =, metodas =, kontrolė =)

kur formulė yra nepriklausomų ir priklausomų kintamųjų derinys, duomenys yra duomenų rinkinio pavadinimas, metodas yra tikslas ir valdymas yra jūsų sistemos reikalavimas.

Dokumentacija

5. „KernLab“


Jei norite plėtoti savo projektą, pagrįstą branduolio mašininio mokymosi algoritmais, galite naudoti šį R paketą mašininiam mokymuisi. Šis paketas naudojamas SVM, branduolio funkcijų analizei, reitingavimo algoritmui, taškinių produktų primityvams, Gauso procesui ir daugeliui kitų. „KernLab“ yra plačiai naudojama įgyvendinant SVM.

Yra įvairių branduolio funkcijų. Čia paminėtos kai kurios branduolio funkcijos: polidotas (daugianario branduolio funkcija), tanhdot (hiperbolinio tangento branduolio funkcija), laplacedot (laplaciano branduolio funkcija) ir kt. Šios funkcijos naudojamos modelio atpažinimo problemoms atlikti. Tačiau vartotojai gali naudoti savo branduolio funkcijas, o ne iš anksto nustatytas branduolio funkcijas.

Dokumentacija

6. nnet


Jei norite sukurti savo mašininio mokymosi programą naudodami dirbtinį neuroninį tinklą (ANN), šis „nnet“ paketas gali jums padėti. Tai vienas populiariausių ir lengviausių neuroninių tinklų paketų. Bet tai yra apribojimas, ty vienas mazgų sluoksnis.

Šio paketo sintaksė yra tokia:

nnet (formulė, duomenys, dydis)

Dokumentacija

7. dplyr


Vienas iš plačiausiai naudojamų R duomenų paketų. Be to, jis suteikia keletą lengvai naudojamų, greitų ir nuoseklių manipuliavimo duomenimis funkcijų. Hadley Wickhamas rašo šį duomenų programavimo paketą r. Šį paketą sudaro veiksmažodžių rinkinys, t.e., mutuoti (), pasirinkti (), filtruoti (), apibendrinti () ir sutvarkyti ().

Norėdami įdiegti šį paketą, turite parašyti šį kodą:

diegti.pakuotės („dplyr“)

Norėdami atsisiųsti šį paketą, turite parašyti šią sintaksę:

biblioteka (dplyr)

Dokumentacija

8. ggplot2


Dar vienas iš elegantiškiausių ir estetiškiausių grafikos karkaso R paketų duomenų mokslui yra „ggplot2“. Tai grafikos kūrimo sistema, pagrįsta grafikos gramatika. Šio duomenų mokslo paketo diegimo sintaksė yra:

diegti.paketai („ggplot2“)

Dokumentacija

9. „Wordcloud“


Kai vieną vaizdą sudaro tūkstančiai žodžių, jis vadinamas „Wordcloud“. Iš esmės tai yra teksto duomenų vizualizacija. Šis mašininio mokymosi paketas naudojant R yra naudojamas žodžių atvaizdavimui sukurti, o kūrėjas gali pritaikyti „Wordcloud“ pagal savo pageidavimus, pavyzdžiui, išdėstyti žodžius atsitiktinai ar to paties dažnio žodžius kartu arba aukšto dažnio žodžius centre ir kt.

R mašinų mokymosi kalboje „Wordcloud“ sukurti galima dviem bibliotekoms: „Wordcloud“ ir „Worldcloud2“. Čia mes parodysime „WordCloud2“ sintaksę. Norėdami įdiegti „WordCloud2“, turite parašyti:

1. reikalauti (devtools)
2. install_github („lchiffon / wordcloud2“)

Arba galite jį naudoti tiesiogiai:

biblioteka (wordcloud2)

Dokumentacija

10. tvarkingas


Kitas plačiai naudojamas duomenų paketas r yra „tidyr“. Šio duomenų programavimo r tikslas yra sutvarkyti duomenis. Tvarkingai kintamasis dedamas į stulpelį, stebėjimas dedamas į eilutę, o vertė yra langelyje. Šiame pakete aprašomas standartinis duomenų rūšiavimo būdas.

Norėdami įdiegti, galite naudoti šį kodo fragmentą:

diegti.pakuotės („tidyr“)

Norėdami įkelti, kodas yra:

biblioteka (tidyr)

Dokumentacija

11. blizgantis


R paketas „Shiny“ yra viena iš duomenų mokslo žiniatinklio programų sistemų. Tai padeda be jokių pastangų kurti žiniatinklio programas iš „R“. Kūrėjas gali įdiegti programinę įrangą kiekvienoje kliento sistemoje, arba kabina priglobia tinklalapį. Be to, kūrėjas gali sukurti informacijos suvestines arba įterpti jas į „R Markdown“ dokumentus.

Be to, „Shiny“ programas galima išplėsti įvairiomis scenarijų kalbomis, pvz., HTML valdikliais, CSS temomis ir „JavaScript“ veiksmais. Žodžiu, galime pasakyti, kad šis paketas yra R skaičiavimo galios ir šiuolaikinio žiniatinklio interaktyvumo derinys.

Dokumentacija

12. tm


Nereikia nė sakyti, kad šiais laikais teksto gavyba yra nauja mašininio mokymosi programa. Šis „R machine“ mokymosi paketas suteikia pagrindą teksto gavybos užduotims spręsti. Teksto gavybos programoje, t.e., nuotaikų analizė ar naujienų klasifikavimas, kūrėjas atlieka įvairius varginančius darbus, pavyzdžiui, pašalina nepageidaujamus ir nesusijusius žodžius, skyrybos ženklus, sustabdymo žodžius ir dar daug daugiau.

Tm pakete yra keletas lanksčių funkcijų, kad jūsų darbas būtų lengvas, pvz., „RemoveNumbers“): pašalinti numerius iš pateikto teksto dokumento, weightTfIdf (): terminui „Dažnis“ ir „Atvirkštinis dokumento dažnis“, tm_reduce (): norint sujungti transformacijas, pašalintiPunctuation () į pašalinti skyrybos ženklus iš pateikto teksto dokumento ir daug daugiau.

Dokumentacija

13. PELIŲ paketas


Mašininio mokymosi paketas su R, MICE reiškia daugialypį įvedimą per grandines. Beveik visą laiką projekto kūrėjas susiduria su bendra mašininio mokymosi duomenų rinkinio problema, kurios trūksta. Šis paketas gali būti naudojamas trūkstamoms reikšmėms apskaičiuoti naudojant kelis metodus.

Šiame pakete yra kelios funkcijos, tokios kaip trūkstamų duomenų modelių tikrinimas, priskirtų reikšmių kokybės diagnozavimas, užbaigtų duomenų rinkinių analizavimas, priskirtų duomenų saugojimas ir eksportavimas įvairiais formatais ir daug daugiau.

Dokumentacija

14. igrafas


Tinklo analizės paketas „igraph“ yra vienas iš galingiausių duomenų mokslo R paketų. Tai galingų, efektyvių, lengvai naudojamų ir nešiojamų tinklo analizės įrankių rinkinys. Be to, šis paketas yra atviro kodo ir nemokamas. Be to, igraphn gali būti užprogramuotas Python, C / C ++ ir Mathematica.

Šis paketas turi keletą funkcijų generuoti atsitiktinius ir įprastus grafikus, grafiko vizualizavimą ir kt. Be to, naudodami šį R paketą galite dirbti su dideliu grafiku. Yra keli reikalavimai naudoti šį paketą: norint naudoti „Linux“, reikalingas C ir C ++ kompiliatorius.

Šio duomenų programavimo R programinio paketo diegimas yra:

diegti.pakuotės („igraph“)

Norėdami pakrauti šį paketą, turite parašyti:

biblioteka (igraph)

Dokumentacija

15. ROCR


R duomenų paketas ROCR naudojamas vizualizuoti balų klasifikatorių našumą. Šis paketas yra lankstus ir patogus naudoti. Reikia tik trijų komandų ir numatytųjų neprivalomų parametrų reikšmių. Šis paketas naudojamas kuriant ribines parametrines 2D našumo kreives. Šiame pakete yra keletas funkcijų, tokių kaip „prediction“ (), kurios naudojamos numatant objektus, „performance“ („performance“ objektai) ir kt.

Dokumentacija

16. „DataExplorer“


Paketas „DataExplorer“ yra vienas plačiausiai naudojamų R duomenų paketų. Tarp daugelio duomenų mokslo uždavinių viena iš jų yra tiriamoji duomenų analizė (EDA). Atlikdamas tiriamąją duomenų analizę, duomenų analitikas turi daugiau dėmesio skirti duomenims. Tai nėra lengva užduotis patikrinti ar tvarkyti duomenis rankiniu būdu arba naudoti prastą kodavimą. Reikia duomenų analizės automatizavimo.

Šis duomenų mokslų paketas suteikia automatizuotą duomenų tyrimą. Šis paketas naudojamas nuskaityti ir analizuoti kiekvieną kintamąjį bei juos vizualizuoti. Tai naudinga, kai duomenų rinkinys yra didelis. Taigi duomenų analizė gali efektyviai ir be vargo išgauti paslėptas duomenų žinias.

Paketą galima įdiegti iš CRAN tiesiogiai naudojant žemiau esantį kodą:

diegti.paketai („DataExplorer“)

Norėdami įkelti šį R paketą, turite parašyti:

biblioteka („DataExplorer“)

Dokumentacija

17. mlr


Vienas iš neįtikėtiniausių „R machine learning“ paketų yra „mlr“ paketas. Šis paketas yra kelių mašininio mokymosi užduočių šifravimas. Tai reiškia, kad galite atlikti kelias užduotis naudodami tik vieną paketą ir jums nereikia naudoti trijų paketų atliekant tris skirtingas užduotis.

„Mlr“ paketas yra daugelio klasifikavimo ir regresijos metodų sąsaja. Šie metodai apima mašinoje nuskaitomus parametrų aprašymus, grupavimą, bendrą pakartotinį mėginių ėmimą, filtravimą, funkcijų išskyrimą ir daugelį kitų. Be to, galima atlikti lygiagrečias operacijas.

Norėdami įdiegti, turite naudoti šį kodą:

diegti.pakuotės („mlr“)

Norėdami įkelti šį paketą:

biblioteka (mlr)

Dokumentacija

18. arules


Paketas „arules“ (Kalnakasybos asociacijos taisyklės ir Dažni elementai) yra plačiai naudojamas „R“ mašinų mokymosi paketas. Naudojant šį paketą galima atlikti keletą operacijų. Operacijos yra duomenų ir modelių atvaizdavimas ir operacijų analizė bei manipuliavimas duomenimis. Taip pat yra „Apriori“ ir „Eclat“ asociacijos kasybos algoritmų C diegimai.

Dokumentacija

19. mboost


Kitas R mašininis duomenų mokslo paketas yra „mboost“. Šis modeliu pagrįstas paketų paketas turi funkcinį gradiento nusileidimo algoritmą, skirtą optimizuoti bendras rizikos funkcijas, naudojant regresijos medžius arba komponentų mažiausių kvadratų įvertinimus. Be to, jis pateikia sąveikos modelį potencialiai didelių matmenų duomenims.

Dokumentacija

20. vakarėlis


Kitas mašininio mokymosi su R paketas yra šalis. Šis skaičiavimo įrankių rinkinys naudojamas rekursiniam skaidymui. Pagrindinė šio mašininio mokymosi paketo funkcija arba pagrindas yra ctree (). Tai yra plačiai naudojama funkcija, sumažinanti treniruočių laiką ir šališkumą.

Ctree () sintaksė yra:

 ctree (formulė, duomenys)

Dokumentacija

Baigiančios mintys


R yra tokia žymi programavimo kalba, kuri naudoja statistinius metodus ir grafikus duomenims tirti. Nereikia nė sakyti, kad šioje kalboje yra keli R mašininio mokymosi paketų skaičiai, neįtikėtinas „RStudio“ įrankis ir lengvai suprantama sintaksė, skirta kurti pažangius mašininio mokymosi projektus. R ml pakuotėje yra keletas numatytųjų verčių. Prieš taikydami jį savo programoje, turite išsamiai žinoti apie įvairias galimybes. Naudodamasis šiais mašininio mokymosi paketais, kiekvienas gali sukurti efektyvų mašininio mokymosi ar duomenų mokslo modelį. Galiausiai, R yra atviro kodo kalba ir jos paketai nuolat auga.

Jei turite kokių nors pasiūlymų ar klausimų, palikite komentarą mūsų komentarų skyriuje. Taip pat galite pasidalinti šiuo straipsniu su draugais ir šeima per socialinę žiniasklaidą.

Įdiekite naujausią „Dolecin Emulator“, skirtą „Gamecube“ ir „Wii“, sistemoje „Linux“
„Delfinų emuliatorius“ leidžia žaisti pasirinktus „Gamecube“ ir „Wii“ žaidimus „Linux“ asmeniniuose kompiuteriuose (PC). „Dolphin Emulator“ yra laisv...
Kaip naudoti „GameConqueror Cheat Engine“ sistemoje „Linux“
Straipsnyje pateikiamas „GameConqueror“ apgaulės variklio naudojimo „Linux“ vadove. Daugelis žaidėjų, žaidžiančių sistemoje „Windows“, dažnai naudoja ...
Geriausi „Linux“ žaidimų konsolių emuliatoriai
Šiame straipsnyje bus išvardyta populiari žaidimų konsolių emuliavimo programinė įranga, skirta „Linux“. „Emuliacija“ yra programinės įrangos suderina...