Тракасти графикон & амп; Хистограм у Р (са примером)

Преглед садржаја:

Anonim

Тракасти графикон је одличан начин за приказ категоријских променљивих у к оси. Ова врста графикона означава два аспекта у оси и.

  1. Прва броји број појава између група.
  2. Други приказује збирну статистику (мин, мак, просек итд.) Променљиве у оси и.

Користићете мтцарс скуп података са следећим променљивим:

  • цилиндар: број цилиндра у аутомобилу. Нумеричка променљива
  • ам: Тип преноса. 0 за аутоматско и 1 за ручно. Нумеричка променљива
  • мпг: миља по галону. Нумеричка променљива

У овом упутству ћете научити

  • Како створити тракасти графикон
  • Промените боју шипки
  • Промените интензитет
  • Боја по групама
  • Додајте групу у траке
  • Тракасти графикон у процентима
  • Раме уз бочне шипке
  • Хистограм

Како створити тракасти графикон

Да бисте креирали графикон у Р-у, можете користити библиотеку ггплот која креира графиконе спремне за објављивање. Основна синтакса ове библиотеке је:

ggplot(data, mapping = aes()) +geometric objectarguments:data: dataset used to plot the graphmapping: Control the x and y-axisgeometric object: The type of plot you want to show. The most common objects are:- Point: `geom_point()`- Bar: `geom_bar()`- Line: `geom_line()`- Histogram: `geom_histogram()`

У овом водичу вас занима геометријски објекат геом_бар () који креира тракасти графикон.

Тракасти графикон: бројање

Ваш први графикон приказује фреквенцију цилиндра са геом_бар (). Код у наставку је најосновнија синтакса.

library(ggplot2)# Most basic bar chartggplot(mtcars, aes(x = factor(cyl))) +geom_bar()

Објашњење кода

  • Скуп података мтцарс просљеђујете ггплот.
  • Унутар аргумента аес () додајете к-осу као променљиву фактора (цил)
  • Знак + значи да желите да Р настави да чита код. Код чини читљивијим тако што га разбија.
  • Користите геом_бар () за геометријски објекат.

Излаз:

Напомена : проверите да ли сте променљиве претворили у фактор, иначе Р променљиве третира као нумеричке. Погледајте пример испод.

Прилагодите графикон

За прилагођавање графа могу се проследити четири аргумента:

- `stat`: Control the type of formatting. By default, `bin` to plot a count in the y-axis. For continuous value, pass `stat = "identity"`- `alpha`: Control density of the color- `fill`: Change the color of the bar- `size`: Control the size the bar

Промените боју шипки

Можете да промените боју шипки. Имајте на уму да су све шипке сличне.

# Change the color of the barsggplot(mtcars, aes(x = factor(cyl))) +geom_bar(fill = "coral") +theme_classic()

Објашњење кода

  • Боје трака су контролисане мапирањем аес () унутар геометријског објекта (тј. Не у ггплот ()). Можете променити боју помоћу аргумената за попуњавање. Овде бирате боју корала.

Излаз:

Можете користити овај код:

grDevices::colors() 

да бисте видели све боје доступне у Р. Постоји око 650 боја.

Промените интензитет

Можете повећати или смањити интензитет боје трака

# Change intensityggplot(mtcars,aes(factor(cyl))) +geom_bar(fill = "coral",alpha = 0.5) +theme_classic()

Објашњење кода

  • Да бисте повећали / смањили интензитет траке, можете променити вредност алфа. Велика алфа повећава интензитет, а ниска алфа смањује интензитет. алфа се креће од 0 до 1. Ако је 1, тада је боја иста као и палета. Ако је 0, боја је бела. Бирате алфа = 0,1.

Излаз:

Боја по групама

Можете да промените боје трака, што значи једну различиту боју за сваку групу. На пример, варијабла цилиндар има три нивоа, а затим можете графички приказати тракасти графикон у три боје.

# Color by groupggplot(mtcars, aes(factor(cyl),fill = factor(cyl))) +geom_bar()

Објашњење кода

  • Аргумент филл унутар аес () омогућава промену боје траке. Боју мењате подешавањем променљиве филл = к-акис. У вашем примеру, променљива к-осе је цил; пуњење = фактор (цил.)

Излаз:

Додајте групу у траке

Ос и можете даље поделити на основу другог нивоа фактора. На пример, можете да избројите број аутоматског и ручног мењача на основу типа цилиндра.

Наставићете како следи:

  • Корак 1: Креирајте оквир података помоћу скупа података мтцарс
  • Корак 2: Означите променљиву ам аутоматским за аутоматски мењач и ман за ручни мењач. Претворите ам и цил као фактор тако да не требате користити фактор () у функцији ггплот ().
  • Корак 3: Нацртајте тракасти графикон да бисте избројали број преноса по цилиндру
library(dplyr)# Step 1data <- mtcars % > %#Step 2mutate(am = factor(am, labels = c("auto", "man")),cyl = factor(cyl))

Спремите скуп података, можете исцртати графикон;

# Корак 3

ggplot(data, aes(x = cyl, fill = am)) +geom_bar() +theme_classic()

Објашњење кода

  • Ггпплот () садржи податке о скупу података и аес ().
  • У аес () укључујете променљиву к-оса и која је променљива потребна за попуњавање траке (тј. Ам)
  • геом_бар (): Направите тракасти графикон

Излаз:

Мапирање ће испунити траку са две боје, по једном за сваки ниво. Једноставно је променити групу избором других променљивих фактора у скупу података.

Тракасти графикон у процентима

Траку можете да визуализујете у процентима уместо у сировом броју.

# Тракасти графикон у процентима

ggplot(data, aes(x = cyl, fill = am)) +geom_bar(position = "fill") +theme_classic()

Објашњење кода

  • Користите поситион = "филл" у аргументу геом_бар () да бисте креирали графику са процентом у и оси.

Излаз:

Раме уз бочне шипке

Лако је уцртати тракасти графикон са променљивом групе упоредо.

# Bar chart side by sideggplot(data, aes(x = cyl, fill = am)) +geom_bar(position = position_dodge()) +theme_classic()

Објашњење кода

  • поситион = поситион_додге (): Експлицитно говори како распоредити шипке

Излаз:

Хистограм

У другом делу водича за тракасти графикон можете представити групу променљивих са вредностима на и оси.

Ваш циљ је да направите графикон са просечном километражом по галону за сваку врсту цилиндра. Да бисте нацртали информативни графикон, следите ове кораке:

  • Корак 1: Направите нову променљиву са просечном миљом по галону по цилиндру
  • Корак 2: Креирајте основни хистограм
  • Корак 3: Промените оријентацију
  • Корак 4: Промените боју
  • Корак 5: Промените величину
  • Корак 6: Додајте ознаке на графикон

Корак 1) Направите нову променљиву

Креирате оквир података назван дата_хистограм који једноставно враћа просечне километре по галону према броју цилиндара у аутомобилу. Ову нову променљиву зовете меан_мпг, а средњу вредност заокружујете са два децимала.

# Корак 1

data_histogram <- mtcars % > %mutate(cyl = factor(cyl)) % > %group_by(cyl) % > %summarize(mean_mpg = round(mean(mpg), 2))

Корак 2) Направите основни хистограм

Можете да нацртате хистограм. Није спреман за комуникацију да би се испоручио клијенту, али даје нам интуицију о тренду.

ggplot(data_histogram, aes(x = cyl, y = mean_mpg)) +geom_bar(stat = "identity")

Објашњење кода

  • Аес () сада има две променљиве. Варијабла цилиндра односи се на к осу, а меан_мпг је осе и.
  • Треба да проследите аргумент стат = "идентити" да бисте променљиву у оси и означили као нумеричку вредност. геом_бар користи стат = "бин" као подразумевану вредност.

Излаз:

Корак 3) Промените оријентацију

Оријентацију графикона мењате из вертикалне у хоризонталну.

ggplot(data_histogram, aes(x = cyl, y = mean_mpg)) +geom_bar(stat = "identity") +coord_flip()

Објашњење кода

  • Можете да контролишете оријентацију графикона помоћуордорд_флип ().

Излаз:

Корак 4) Промените боју

Можете разликовати боје трака према нивоу фактора променљиве к-осе.

ggplot(data_histogram, aes(x = cyl, y = mean_mpg, fill = cyl)) +geom_bar(stat = "identity") +coord_flip() +theme_classic()

Објашњење кода

  • Графикон можете уцртати по групама помоћу мапирања филл = цил. Р аутоматски брине о бојама на основу нивоа променљиве цилиндра

Излаз:

Корак 5) Промените величину

Да би графикон изгледао лепше, смањите ширину траке.

graph <- ggplot(data_histogram, aes(x = cyl, y = mean_mpg, fill = cyl)) +geom_bar(stat = "identity",width = 0.5) +coord_flip() +theme_classic()

Објашњење кода

  • Аргумент видтх унутар геом_бар () контролише величину траке. Већа вредност повећава ширину.
  • Напомена, граф чувате у променљивом графикону. То чините јер следећи корак неће променити код променљивог графа. Побољшава читљивост кода.

Излаз:

Корак 6) Додајте ознаке на графикон

Последњи корак састоји се у додавању вредности променљиве меан_мпг у ознаку.

graph +geom_text(aes(label = mean_mpg),hjust = 1.5,color = "white",size = 3) +theme_classic()

Објашњење кода

  • Функција геом_тект () корисна је за контролу естетике текста.
    • лабел =: Додајте ознаку унутар трака
    • меан_мпг: Користите променљиву меан_мпг за ознаку
  • хјуст контролише локацију налепнице. Вредности затворене на 1 приказују ознаку на врху траке, а веће вредности доводе ознаку на дно. Ако је оријентација графика вертикална, промените хјуст у вјуст.
  • цолор = "вхите": Промените боју текста. Овде користите белу боју.
  • величина = 3: Подесите величину текста.

Излаз:

Резиме

Тракасти графикон је користан када је к оса категоричка променљива. Ос и може бити бројање или збирна статистика. Табела у наставку резимира како управљати тракасти графикон помоћу ггплот2:

објективан

код

Цоунт

ggplot(df, eas(x= factor(x1)) + geom_bar()

Броји различитим бојама испуне

ggplot(df, eas(x= factor(x1), fill = factor(x1))) + geom_bar()

Броји са групама, сложено

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar(position=position_dodge())

Рачунајте са групама, раме уз раме

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar()

Бројање са групама, сложено у%

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar(position=position_dodge())

Вредности

ggplot(df, eas(x= factor(x1)+ y = x2) + geom_bar(stat="identity")