панди

Как да използвам Boxplot в Python

Как да използвам Boxplot в Python
Графичен график се използва за обобщаване на набори от данни, като се използва методът на графичен графичен интерфейс. Тази функция помага на потребителите да разберат правилно обобщението на данните. Графичните полета могат да бъдат много полезни, когато искаме да знаем как се разпространяват и разпространяват данните. За графика на данните се използват три вида квартили в графата. Тези стойности включват средните, максималните, минималните, горните и долните статистически стойности. Графичен график обобщава тези данни в 25ти, 50ти, и 75ти процентили. Този урок ще ви покаже как да създавате графики на полета въз основа на даден набор от данни с помощта на панди и морски роден библиотеки на Python.

Предпоставка

Ако сте нов потребител на Python, първо ще трябва да настроите средата, за да показва изхода на полето. Можете да използвате всеки интерпретатор на Python за изпълнение на кода. В този урок ще използвам spyder3 за изпълнение на кода. Ако не сте инсталирали панди и морски роден библиотеки преди, тогава трябва да изпълните следната команда от терминала, за да инсталирате тези библиотеки:

$ pip3 инсталира pandas seaborn

Кутия парцели с панди

The boxplot () метод на панди се използва за генериране на фигури на графики на полета въз основа на рамката с данни. Този метод съдържа много аргументи; някои от тези аргументи са използвани в примерите по-долу. Тази част от урока ще включва два примера, които ще ви покажат как да създавате полета за полета в панди. Можете да използвате произволно генерирани данни в библиотеката NumPy или данните от CSV файл, за да генерирате кутия в панди.

Пример 1: Графични графики въз основа на случайни стойности

Графичните полета в следващия пример са генерирани с помощта на NumPy и панди. Библиотеката NumPy се използва в скрипта за създаване на обект на рамка с данни чрез генериране на двуизмерен масив от произволни стойности, които съдържат 5 реда и 5 колони. Съдържанието на рамката за данни ще бъде отпечатано с помощта на главата() метод. След това, boxplot () метод се използва за генериране на графични полета със син цвят, размер на шрифта 10 и 30-градусов ъгъл на завъртане за показване на стойностите на колоната.

#!/ usr / bin / env python3
# Импортиране на библиотека за панди
импортирайте панди като pd
# Импортирайте библиотека NumPy, за да създадете произволни числа за масива
импортиране на numpy като np
"
Генерирайте набор от данни въз основа на произволно създаден масив NumPy
и пет колони стойности
"
dataframe = pd.DataFrame (np.случайни.randn (5,5), колони = ['2016', '2017', '2018',
„2019“, „2020“])
 
# Отпечатайте стойностите на dataframe
печат (рамка с данни.глава())
# Показване на графиката на полето въз основа на стойностите на рамката с данни
рамка за данни.boxplot (grid = 'false', color = 'blue', fontsize = 10, rot = 30)

Изход

След изпълнението на кода ще се появи следният изход.

Пример 2: Графични графики въз основа на CSV данни

Графичните полета в следващия пример са генерирани от CSV данни. Създайте CSV файл с име банка.csv като се използват следните данни.

банка.csv

SL, Client_Name, Account_Type, Gender, Balance
1, Мария Ернандес, спестяване, жена, 120000
2, Мери Смит, ток, жена, 40000
3, Дейвид Смит, Current, Мъж, 379000
4, Мария Родригес, спасяване, жена, 56000
5, Марк Лий, Спестяване, Мъж, 93500
6, Джонатан Бинг, Current, Мъж, 5900
7, Даниел Уилямс, Спестяване, Мъж, 2300
8, Mike Brown, Current, Мъж, 124888
9, Пол Смит, Current, Мъж, 59450
10, Мария Лопес, спестяване, жена, 487600

В следващия скрипт matplotlib библиотеката беше използвана за задаване на размера на фигурата на кутията и за показване на изхода вграден. Всички записи на Банката.csv файла бяха заредени с помощта на read_csv () метод на панди. След това първите 8 записа на рамката с данни бяха отпечатани с помощта на глава() метод. The boxplot () метод е използван в следващото изявление за изчертаване на фигурата на полето с помощта на червен цвят въз основа на 'Тип на профила' с колоната с име „Баланс.'

#!/ usr / bin / env python3
# Импортирайте панди за генериране на кутия
импортирайте панди като pd
# Импортирайте matplotlib, за да настроите размера на фигурата на кутията
импортиране на matplotlib.pyplot като plt
# Импортирайте get_ipython за форматиране на изхода вграден
от импортиране на IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Настройте размера на фигурата
plt.rcParams ['фигура.размери '] = (8,4)
# Заредете набора от данни от CSV файл
df = pd.read_csv ("банка.csv ")
# Отпечатайте първите 8 реда от заредените данни
печат (df.глава (8))
# Показване на графиките на полетата въз основа на използвания параметър
df.boxplot (от = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')

Изход

След изпълнението на кода ще се появи следният изход.

Кутия парцели с морски родени

Друга библиотека на Python, която често се използва за изчертаване на графични полета, е библиотеката морски роден.  Една от важните характеристики на тази библиотека е, че тя има много вградени примерни набори от данни за тестване на различни задачи. Следващите два примера ще обхващат използването на два различни примерни набора от данни за изчертаване на графики на полетата с помощта на морски роден библиотека.

Пример 3: Графични полета въз основа на параметър x

Следващият пример използва примерен набор от данни, наречен 'диаманти, от морският роден библиотека за генериране на полето. Тук стилът на мрежата се дефинира с помощта на set_style () метод. The load_dataset () метод се използва за зареждане на данните на 'диаманти набор от данни. Първите пет записа се отпечатват от набора от данни и boxplot () След това методът се използва за изчертаване на графиката на полето въз основа на колоната, наречена 'дълбочина,'със син цвят.

# Импортирайте библиотека с морско рождение, за да генерирате кутия
внос seaborn като sns
# Импортирайте matplotlib, за да настроите размера на фигурата на кутията
импортиране на matplotlib.pyplot като plt
# Импортирайте get_ipython за форматиране на изхода вграден
от импортиране на IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Настройте стила на мрежата
sns.set_style ("whitegrid")
# Настройте размера на фигурата
plt.rcParams ['фигура.размери '] = (8,4)
# Заредете примерния набор от данни
diamond_dataset = sns.load_dataset ('диаманти')
# Показване на първите 5 записа от набора от данни
печат (diamond_dataset.глава())
# Начертайте фигурата на графиките на кутията
sns.boxplot (x = diamond_dataset ['дълбочина'], цвят = 'син')

Изход

След изпълнението на кода ще се появи следният изход.

Пример 4: Графични графики въз основа на параметрите x и y

Следващият пример използва примерния набор от данни с име 'полети', за да нарисувате кутията. Тук и параметрите x и y на кутията () метод се използват за изчертаване на фигурата. Останалите твърдения са подобни на предишния пример.

# Импортирайте библиотека с морско рождение, за да генерирате кутия
внос seaborn като sns
# Импортирайте matplotlib, за да настроите размера на фигурата на кутията
импортиране на matplotlib.pyplot като plt
# Импортирайте get_ipython за форматиране на изхода вграден
от импортиране на IPython get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Настройте стила на мрежата
sns.set_style ("darkgrid")
# Настройте размера на фигурата
plt.rcParams ['фигура.размери '] = (12,4)
 
# Заредете примерния набор от данни
flight_dataset = sns.load_dataset ('полети')
# Показване на първите 5 записа от набора от данни
print (flight_dataset.глава())
 
# Начертайте фигурата на графиките на кутията
sns.boxplot (x = 'месец', y = 'пътници', данни = полет_данни, цвят = 'син')

Изход

След изпълнението на кода ще се появи следният изход.

Заключение

Когато работите с голямо количество данни, може да искате да обобщите данните, като използвате диаграма, като например кутия. Този урок използва няколко примера, за да ви покаже как да генерирате графични полета с две библиотеки на Python.

Безплатни и игри с отворен код за разработване на Linux игри
Тази статия ще обхване списък с безплатни двигатели за игри с отворен код, които могат да се използват за разработване на 2D и 3D игри на Linux. Същес...
Урок Сянка на Tomb Raider за Linux
Shadow of the Tomb Raider е дванадесетото допълнение към поредицата Tomb Raider - франчайз за екшън-приключенска игра, създаден от Eidos Montreal. Игр...
Как да увеличите FPS в Linux?
FPS означава Кадри в секунда. Задачата на FPS е да измерва честотата на кадрите при възпроизвеждане на видео или игрални изпълнения. С прости думи бро...