Шта је Матрица збуњености?
Матрица забуне је техника мерења перформанси за класификацију машинског учења. То је врста табеле која вам помаже да сазнате перформансе класификационог модела на скупу тест података за које су познате праве вредности. Сам израз матрица забуне је врло једноставан, али с њим повезана терминологија може бити мало збуњујућа. Овде је дато једноставно објашњење ове технике.
У овом упутству ћете научити,
- Шта је матрица конфузије?
- Четири исхода матрице забуне
- Пример матрице збрке:
- Како израчунати збуњујућу матрицу
- Остали важни услови који користе матрицу збрке
- Зашто вам је потребна матрица конфузије?
Четири исхода матрице забуне
Матрица забуне визуализује тачност класификатора поређењем стварних и предвиђених класа. Бинарна збуњујућа матрица састоји се од квадрата:

- ТП: Тачно позитивно: Предвиђене вредности су тачно предвиђене као стварне позитивне
- ФП: Предвиђене вредности су погрешно предвиделе стварну позитиву. тј. негативне вредности предвиђене као позитивне
- ФН: Лажно негативно: Позитивне вредности предвиђене као негативне
- ТН: Тачно негативно: Предвиђене вредности су тачно предвиђене као стварне негативне
Тест тачности можете израчунати из матрице забуне:
Пример матрице забуне:
Цонфусион Матрик је корисна метода машинског учења која вам омогућава мерење кривине опозива, прецизности, тачности и АУЦ-РОЦ. Испод је наведен пример познавања појмова Тачно позитивно, Тачно негативно, Лажно негативно и Тачно негативно.
Тачно позитивно:
Предвиђали сте позитивно и испало је да је то истина. На пример, предвидели сте да ће Француска победити на светском купу и победила је.
Тачно негативно:
Кад сте предвидели негативно, и то је истина. Предвиђали сте да Енглеска неће победити, а изгубила је.
Лажно позитиван:
Ваше предвиђање је позитивно и нетачно.
Предвиђали сте да ће Енглеска победити, али је изгубила.
Лажно негативно:
Ваше предвиђање је негативно, а резултат је и нетачно.
Предвиђали сте да Француска неће победити, али је победила.
Имајте на уму да предвиђене вредности описујемо као тачне или нетачне или позитивне и негативне.
Како израчунати збуњујућу матрицу
Овде је описан корак по корак за израчунавање матрице забуне у рударству података
- Корак 1) Прво треба да тестирате скуп података са очекиваним вредностима исхода.
- Корак 2) Предвидите све редове у скупу података за тестирање.
- Корак 3) Израчунајте очекивана предвиђања и исходе:
- Укупан број тачних предвиђања за сваки разред.
- Укупан број нетачних предвиђања сваке класе.
Након тога, ови бројеви се организују према доле датим методама:
- Сваки ред матрице повезује се са предвиђеном класом.
- Свака колона матрице одговара стварној класи.
- У табелу се уноси укупан број тачних и нетачних класификација.
- Збир тачних предвиђања за класу улази у предвиђени ступац и очекивани ред за вредност те класе.
- Збир нетачних предвиђања за класу иде у очекивани ред за ту вредност класе и предвиђени ступац за ту одређену вредност класе.
Остали важни услови који користе матрицу збрке
- Позитивна предиктивна вредност (ПВВ): Ово је веома близу прецизности. Једна значајна разлика између два термина је та што ПВВ узима у обзир преваленцију. У ситуацији када су часови савршено уравнотежени, позитивна предиктивна вредност је иста као и прецизност.
- Нулл Еррор Рате: Овај термин се користи да би се дефинисало колико пута би ваше предвиђање било погрешно ако можете предвидети већинску класу. Можете га сматрати основном метриком за упоређивање вашег класификатора.
- Ф Оцена: Ф1 оцена је пондерисана просечна оцена истинског позитивног (опозив) и прецизности.
- Роц крива: Роц крива показује истинске позитивне стопе у односу на лажно позитивне стопе на различитим тачкама резања. Такође показује компромис између осетљивости (опозив и специфичност или истинска негативна стопа).
- Прецизност: метрика прецизности показује тачност позитивне класе. Он мери колико је вероватно да је предвиђање позитивне класе тачно.
Максимална оцена је 1 када класификатор савршено класификује све позитивне вредности. Прецизност сама по себи није од велике помоћи јер игнорише негативну класу. Метрика је обично упарена са метриком опозива. Опозив се назива и осетљивост или истинска позитивна стопа.
- Осетљивост : Осетљивост израчунава однос тачно откривених позитивних класа. Ова метрика показује колико је добар модел препознавање позитивне класе.
Зашто вам је потребна матрица конфузије?
Ево предности / користи употребе матрице забуне.
- Показује како је било који модел класификације збуњен када прави предвиђања.
- Матрица забуне не само да вам даје увид у грешке које врши ваш класификатор, већ и у врсте грешака које се праве.
- Ова анализа вам помаже да превазиђете ограничење употребе саме тачности класификације.
- Свака колона матрице забуне представља инстанце те предвиђене класе.
- Сваки ред матрице збуњености представља инстанце стварне класе.
- Пружа увид не само у грешке које класификатор прави већ и у грешке које се праве.