Наука за данните

Топ 10 библиотеки за машинно обучение за Python

Топ 10 библиотеки за машинно обучение за Python

Какво искате да създадете? Важният въпрос!

Дошли сте тук, за да използвате машинно обучение (ML) . Обмисляли ли сте внимателно за какво? Когато избирате библиотека за машинно обучение, трябва да започнете с начина, по който ще я използвате. Дори ако просто се интересувате от обучение, трябва да помислите къде се използва машинното обучение и кое е най-близо до вашия основен интерес. Също така трябва да помислите дали искате да се съсредоточите върху това, че нещо се случва на вашата локална машина или ако се интересувате от разпространението на изчисленията си на много сървъри.

В началото започнете, като накарате нещо да работи.

Къде се използва машинно обучение

Можете да намерите много проекти, които използват ML, всъщност толкова много, че всяка категория има страници. Кратката версия е „навсякъде“, това не е вярно, но човек започва да се чуди. Очевидните са механизмите за препоръки, разпознаването на изображения и откриването на спам. Тъй като вече програмирате в Python, ще се интересувате и от софтуера за завършване на кода на Kite. Това е. Други приложения са за откриване на грешки от ръчно въвеждане на данни, медицинска диагностика и поддръжка за големи фабрики и други индустрии

Накратко библиотеките:

  1. Scikit-learn, От scikit; Рутинни програми и библиотеки върху NumPy, SciPy и Matplotlib. Тази библиотека разчита директно на подпрограми в математическите библиотеки, родни на Python. Инсталирате scikit-learn с вашия обикновен мениджър на пакети на Python. Scikit-learn е малък и не поддържа изчисления на GPU, това може да ви постави, но това е съзнателен избор. Този пакет е по-малък и по-лесен за започване. Все още работи доста добре в по-голям контекст, макар че за да направите гигантски клъстер за изчисления, имате нужда от други пакети.
  2. Scikit-образ Специално за изображения! Scikit-image има алгоритми за анализ и манипулация на изображения. Можете да го използвате за възстановяване на повредени изображения, както и за манипулиране на цвят и други атрибути на изображението. Основната идея на този пакет е да направи всички изображения достъпни за NumPy, така че да можете да правите операции с тях като ndarrays. По този начин изображенията са на разположение като данни за стартиране на всякакви алгоритми.
  3. Шогун: C ++ база с ясни API интерфейси към Python, Java, Scala и др. Много, може би повечето алгоритми, налични за експериментиране. Този е написан на C ++ за ефективност, има и начин да го изпробвате в облака. Shogun използва SWIG за интерфейс с много езици за програмиране, включително Python. Шогун обхваща повечето алгоритми и се използва широко в академичния свят. Пакетът има кутия с инструменти, достъпна на https: // www.shogun-toolbox.орг.
  4. Spark MLlib: Основно е за Java, но е достъпен чрез NumPy Library за разработчици на Python. Spark MLlib е разработен от екипа на Apache, така че е насочен към разпределени изчислителни среди и трябва да се изпълнява с майстор и работници. Можете да направите това в самостоятелен режим, но истинската сила на Spark е способността да разпределяте заданията на много машини. Разпределената природа на Spark го прави популярен сред много големи компании, като IBM, Amazon и Netflix. Основната цел е да се копаят „Големи данни“, което означава всички онези галета, които оставяте, когато сърфирате и пазарувате онлайн. Ако искате да работите с машинно обучение, Spark MLlib е добро място да започнете. Алгоритмите, които поддържа, са разпределени в целия диапазон. Ако започвате хоби проект, това може да не е най-добрата идея.
  5. H2O: Насочен е към бизнес процеси, така че поддържа прогнози за препоръки и предотвратяване на измами. Бизнесът, H20.ai има за цел да намери и анализира набори от данни от разпределени файлови системи. Можете да го стартирате на повечето конвенционални операционни системи, но основната цел е да поддържа базирани на облак системи. Той включва повечето статистически алгоритми, така че може да се използва за повечето проекти.
  6. Mahout: Създаден е за разпределени алгоритми за машинно обучение. Той е част от Apache поради разпределения характер на изчисленията. Идеята зад Mahout е математиците да прилагат свои собствени алгоритми. Това не е за начинаещи, ако просто се учиш, по-добре използвай нещо друго. След като каза това, Mahout може да се свърже с много back-end, така че когато сте създали нещо, погледнете дали искате да използвате Mahout за вашия интерфейс.
  7. Клоудера Орикс: Използва се главно за машинно обучение на данни в реално време. Oryx 2 е архитектура, която наслоява цялата работа за създаване на система, която може да реагира на данни в реално време. Слоевете също работят в различни времеви рамки, с групов слой, който изгражда основния модел, и слой със скорост, който модифицира модела с навлизането на нови данни. Oryx е изграден върху Apache Spark и създава цяла архитектура, която реализира всички части на приложение.
  8. Теано: Theano е библиотека на Python, която е интегрирана с NumPy. Това е най-близкото до Python, което можете да получите. Когато използвате Theano, съветваме ви да инсталирате gcc. Причината за това е, че Theano може да компилира вашия код във възможно най-подходящия код. Докато Python е страхотен, в някои случаи C е по-бърз. Така че Theano може да конвертира в C и да компилира, като програмата ви работи по-бързо. По желание можете да добавите поддръжка на GPU.
  9. Tensorflow: Тензорът в името сочи към математически тензор. Такъв тензор има 'n' места в матрица, но тензорът е многоизмерен масив. TensorFlow има алгоритми за извършване на изчисления за тензори, откъдето идва и името, можете да ги извикате от Python. Вграден е в C и C ++, но има преден край за Python. Това го прави лесен за използване и бърза работа. Tensorflow може да работи на процесор, графичен процесор или разпределен по мрежи, това се постига чрез механизъм за изпълнение, който действа като слой между вашия код и процесора.
  10. Matplotlib: Когато излезете с проблем, който можете да разрешите с машинно обучение, най-вероятно ще искате да визуализирате резултатите си. Тук идва matplotlib. Той е проектиран да показва стойности на всякакви математически графики и е широко използван в академичния свят.

ЗАКЛЮЧЕНИЕ

Тази статия ви дава представа за това, което е достъпно за програмиране в машинното обучение. За да получите ясна представа за това, от което се нуждаете, трябва да започнете, като направите няколко програми и да видите как работят. Докато не разберете как могат да се направят нещата, не можете да намерите идеалното решение за следващия си проект.

WinMouse ви позволява да персонализирате и подобрите движението на показалеца на мишката на компютър с Windows
Ако искате да подобрите функциите по подразбиране на показалеца на мишката, използвайте безплатна програма WinMouse. Той добавя още функции, за да ви ...
Бутонът на левия бутон на мишката не работи в Windows 10
Ако използвате специална мишка с вашия лаптоп или настолен компютър, но бутонът на левия бутон на мишката не работи на Windows 10/8/7 по някаква причи...
Курсорът скача или се движи произволно, докато пишете в Windows 10
Ако установите, че курсорът на вашата мишка скача или се движи самостоятелно, автоматично, произволно, докато пишете в лаптоп или компютър на Windows,...