Duomenų mokslas

10 geriausių „Python“ mašininio mokymosi bibliotekų

10 geriausių „Python“ mašininio mokymosi bibliotekų

Ką norite sukurti? Svarbus klausimas!

Jūs atėjote čia naudoti mašininio mokymosi (ML) . Ar gerai apgalvojote, už ką? Pasirinkę mašininio mokymosi biblioteką, turite pradėti nuo to, kaip ketinate ją naudoti. Net jei jus domina tik mokymasis, turėtumėte apsvarstyti, kur naudojamas mašininis mokymasis ir kuris yra arčiausiai jūsų pagrindinio susidomėjimo. Taip pat turėtumėte apsvarstyti, ar norite sutelkti dėmesį į tai, kad kažkas vyktų jūsų vietinėje mašinoje, ar norite išplėsti savo kompiuterį daugelyje serverių.

Pradžioje pradėkite nuo to, kad kažkas veiktų.

Kur naudojamas mašininis mokymasis

Galite rasti daug projektų, kuriuose naudojama ML, iš tikrųjų tiek daug, kad kiekviena kategorija būtų puslapių. Trumpa versija yra „visur“, tai nėra tiesa, bet reikia pradėti stebėtis. Akivaizdžiausi yra rekomendacijų varikliai, vaizdų atpažinimas ir šlamšto aptikimas. Kadangi jau programuojate „Python“, jus taip pat domins „The Kite“ kodo užbaigimo programinė įranga. Tai yra Kiti naudojimo būdai nustatyti klaidas, atsirandančias dėl duomenų įvedimo rankiniu būdu, medicininės diagnostikos ir priežiūros pagrindinėse gamyklose ir kitose pramonės šakose

Bibliotekos trumpai:

  1. Scikit-mokykis, Iš scikito; Rutina ir bibliotekos ant „NumPy“, „SciPy“ ir „Matplotlib“. Ši biblioteka tiesiogiai remiasi matematikos bibliotekų, kurių gimtoji kalba yra „Python“, rutina. „Scikit-learn“ įdiegiate naudodami įprastą „Python“ paketų tvarkyklę. „Scikit-learn“ yra mažas ir nepalaiko GPU skaičiavimų, tai gali padėti jums, bet tai yra sąmoningas pasirinkimas. Šis paketas yra mažesnis ir jį lengviau pradėti naudoti. Jis vis dar veikia gana gerai didesniame kontekste, nors norint sukurti milžinišką skaičiavimų grupę, jums reikia kitų paketų.
  2. Scikit-vaizdas Ypatinga vaizdams! „Scikit-image“ turi algoritmus vaizdų analizei ir manipuliavimui. Jį galite naudoti sugadintiems vaizdams taisyti, taip pat manipuliuoti spalva ir kitais atributais. Pagrindinė šio paketo idėja yra padaryti visus vaizdus prieinamus „NumPy“, kad galėtumėte atlikti su jais veiksmus kaip „ndarrays“. Tokiu būdu jūs turite vaizdus kaip duomenis algoritmams paleisti.
  3. Šogunas: C ++ bazė su aiškiomis API sąsajomis su Python, Java, Scala ir kt. Daug, galbūt dauguma algoritmų, kuriuos galima eksperimentuoti. Šis yra parašytas C ++, siekiant efektyvumo, taip pat yra būdas tai išbandyti debesyje. „Shogun“ naudoja SWIG sąsajai su daugeliu programavimo kalbų, įskaitant „Python“. Shogun apima daugumą algoritmų ir yra plačiai naudojamas akademiniame pasaulyje. Pakete yra įrankių dėžutė, kurią galite rasti adresu https: // www.shogun-toolbox.org.
  4. „Spark MLlib“: Daugiausia skirta „Java“, bet yra prieinama per „NumPy Library“, skirtą „Python“ kūrėjams. „Spark MLlib“ sukūrė „Apache“ komanda, todėl ji skirta paskirstytoms kompiuterinėms aplinkoms ir turi būti valdoma kartu su meistru ir darbuotojais. Tai galite padaryti autonominiu režimu, tačiau tikroji „Spark“ galia yra galimybė paskirstyti darbus daugeliui mašinų. Išplatintas „Spark“ pobūdis daro jį populiarų daugelyje didelių kompanijų, tokių kaip IBM, „Amazon“ ir „Netflix“. Pagrindinis tikslas yra išgauti „Big Data“, ty visus tuos džiūvėsėlius, kuriuos paliekate naršydami ir apsipirkdami internete. Jei norite dirbti su mašininiu mokymusi, „Spark MLlib“ yra gera vieta pradėti. Joje palaikomi algoritmai yra paskirstyti visame diapazone. Jei pradedate hobio projektą, tai gali būti ne pati geriausia idėja.
  5. H2O: Skirtas verslo procesams, todėl palaiko rekomendacijų ir sukčiavimo prevencijos prognozes. Verslas, H20.ai tikslas - surasti ir išanalizuoti paskirstytų failų sistemų duomenų rinkinius. Jį galite paleisti daugumoje įprastų operacinių sistemų, tačiau pagrindinis tikslas yra palaikyti debesų sistemas. Ji apima daugumą statistinių algoritmų, todėl gali būti naudojama daugumai projektų.
  6. Mahoutas: Sukurta paskirstytiems mašininio mokymosi algoritmams. Tai yra „Apache“ dalis dėl paskirstyto skaičiavimų pobūdžio. Mahouto idėja yra ta, kad matematikai įgyvendintų savo algoritmus. Tai netinka pradedantiesiems, jei jūs tik mokotės, geriau naudokite ką nors kita. Tai pasakius, „Mahout“ gali prisijungti prie daugybės galinių pusių, taigi, kai ką nors sukursite, pažiūrėkite, ar norite naudoti „Mahout“ savo priekinėje dalyje.
  7. „Cloudera Oryx“: Daugiausia naudojamas mašininiam mokymuisi naudojant duomenis realiuoju laiku. „Oryx 2“ yra architektūra, kuri visą darbą sukuria sistemai, galinčiai reaguoti į realaus laiko duomenis. Sluoksniai taip pat veikia skirtingais laiko intervalais, naudojant paketinį sluoksnį, kuris sukuria pagrindinį modelį, ir greičio sluoksnį, kuris modifikuoja modelį, kai gaunami nauji duomenys. „Oryx“ yra pastatytas ant „Apache Spark“ ir sukuria visą architektūrą, įgyvendinančią visas programos dalis.
  8. Theano: „Theano“ yra „Python“ bibliotekos, integruotos su „NumPy“. Tai yra arčiausiai „Python“, kurį galite gauti. Kai naudojate „Theano“, patariama įdiegti „gcc“. To priežastis yra ta, kad „Theano“ gali surinkti jūsų kodą į tinkamiausią kodą. Nors „Python“ yra puikus, kai kuriais atvejais C yra greitesnis. Taigi „Theano“ gali konvertuoti į C ir sukompiliuoti, kad jūsų programa veiktų greičiau. Pasirinktinai galite pridėti GPU palaikymą.
  9. Tensorflow: Pavadinimo tenzorius rodo matematinį tenzorą. Toks tenzoras turi „n“ vietas matricoje, tačiau tenzoras yra daugialypė masyvas. „TensorFlow“ turi algoritmus atlikti „Tensors“ skaičiavimus, taigi ir pavadinimą, galite juos paskambinti iš „Python“. Jis sukurtas C ir C ++, bet turi „Python“ sąsają. Tai palengvina naudojimą ir greitą važiavimą. „Tensorflow“ gali veikti procesoriuje, GPU arba paskirstyti per tinklus. Tai pasiekiama vykdymo varikliu, kuris veikia kaip sluoksnis tarp jūsų kodo ir procesoriaus.
  10. Matplotlib: Kai sugalvosite problemą, kurią galėsite išspręsti naudodami mašininį mokymąsi, greičiausiai norėsite vizualizuoti savo rezultatus. Čia patenka matplotlibas. Jis sukurtas rodyti bet kokių matematinių grafikų reikšmes ir yra labai naudojamas akademiniame pasaulyje.

IŠVADA

Šis straipsnis suteikė jums idėją apie tai, ką galima programuoti mašininiame mokymesi. Norėdami gauti aiškų vaizdą apie tai, ko jums reikia, turite pradėti nuo kelių programų ir pamatyti, kaip jie veikia. Kol nežinote, kaip viskas gali būti padaryta, galite rasti geriausią sprendimą kitam savo projektui.

Kaip naudoti „GameConqueror Cheat Engine“ sistemoje „Linux“
Straipsnyje pateikiamas „GameConqueror“ apgaulės variklio naudojimo „Linux“ vadove. Daugelis žaidėjų, žaidžiančių sistemoje „Windows“, dažnai naudoja ...
Geriausi „Linux“ žaidimų konsolių emuliatoriai
Šiame straipsnyje bus išvardyta populiari žaidimų konsolių emuliavimo programinė įranga, skirta „Linux“. „Emuliacija“ yra programinės įrangos suderina...
Geriausi „Linux“ žaidimų distristai 2021 m
„Linux“ operacinė sistema nuėjo ilgą kelią nuo originalios, paprastos, serverio išvaizdos. Ši OS pastaraisiais metais nepaprastai patobulėjo ir dabar ...