Надзирано машинско учење: шта је, алгоритми, пример

Преглед садржаја:

Anonim

Шта је надзирано машинско учење?

У учењу под надзором, ви тренирате машину користећи податке који су добро „означени “. То значи да су неки подаци већ означени тачним одговором. Може се упоредити са учењем које се одвија у присуству супервизора или наставника.

Надгледани алгоритам учења учи из означених података о обуци, помаже вам да предвидите исходе за непредвиђене податке.

За успешну изградњу, скалирање и примену тачних надзираних модела машинског учења потребно је време и техничка стручност тима високо квалификованих научника за податке. Штавише, научник података мора поново изградити моделе како би осигурао да дати увиди остану тачни док се подаци не промене.

У овом упутству ћете научити:

  • Шта је надзирано машинско учење?
  • Како функционише надзирано учење
  • Врсте алгоритама надзираног машинског учења
  • Технике машинског учења под надзором и без надзора
  • Изазови у надгледаном машинском учењу
  • Предности учења под надзором:
  • Мане супервизованог учења
  • Најбоље праксе за учење под надзором

Како функционише надзирано учење

На пример, желите да обучите машину како би вам помогао да предвидите колико ће вам требати да се возите кући са радног места. Овде започињете са стварањем скупа означених података. Ови подаци укључују

  • Временски услови
  • Доба дана
  • Празници

Сви ови детаљи су ваши уноси. Резултат је време потребно за повратак кући тог одређеног дана.

Инстинктивно знате да ће вам, ако напољу пада киша, требати више времена да се возите кући. Али машини су потребни подаци и статистика.

Погледајмо сада како можете развити надгледани модел учења из овог примера који ће помоћи кориснику да одреди време путовања на посао. Прва ствар коју требате да направите је сет за обуку. Овај сет тренинга садржи укупно време путовања до путовања и одговарајуће факторе као што су време, време итд. На основу овог комплета тренинга, ваша машина ће можда видети да постоји директна веза између количине кише и времена које ћете требати за повратак кући.

Дакле, утврђује да што више пада киша, то ћете дуже возити до свог дома. Такође може видети везу између времена када напустите посао и времена које ћете провести на путу.

Што сте ближе 18 сати, треба вам више времена да се вратите кући. Ваша машина може пронаћи неке везе са вашим означеним подацима.

Ово је почетак вашег модела података. Почиње да утиче на то како киша утиче на начин вожње. Такође почиње да се примећује да више људи путује у одређено доба дана.

Врсте алгоритама надзираног машинског учења

Регресија:

Техника регресије предвиђа једну излазну вредност користећи податке обуке.

Пример : Помоћу регресије можете предвидети цену куће на основу података са тренинга. Улазне променљиве биће локалитет, величина куће итд.

Предности : Излази увек имају пробабилистичку интерпретацију, а алгоритам се може регулисати како би се избегло прекомерно прилагођавање.

Слабости : Логистичка регресија може бити лоша када постоје вишеструке или нелинеарне границе одлучивања. Ова метода није флексибилна, па не захвата сложеније односе.

Логистичка регресија:

Метода логистичке регресије коришћена за процену дискретних вредности на основу датог скупа независних променљивих. Помаже вам да предвидите вероватноћу појаве догађаја прилагођавањем података логит функцији. Стога је позната и као логистичка регресија. Док предвиђа вероватноћу, његова излазна вредност се креће између 0 и 1.

Ево неколико врста регресионих алгоритама

Класификација:

Класификација значи груписање резултата унутар класе. Ако алгоритам покушава унос означити у две различите класе, то се назива бинарна класификација. Избор између више од две класе назива се класификација више класа.

Пример : Утврђивање да ли ће неко бити неплатиша зајма или не.

Предности : Стабло класификације има врло добре резултате у пракси

Слабости : Неограничена појединачна стабла склона су прекомерној опреми.

Ево неколико врста класификационих алгоритама

Наивни Баиесови класификатори

Наивни бајесовски модел (НБН) лако је направити и веома је користан за велике скупове података. Ова метода је састављена од директних ацикличних графикона са једним родитељем и неколико деце. Претпоставља независност међу подређеним чворовима одвојеним од родитеља.

Стабла одлучивања

Стабла одлука класификују инстанце сортирањем на основу вредности обележја. У овој методи, сваки режим је својство инстанце. Требало би га класификовати, а свака грана представља вредност коју чвор може да преузме. То је широко коришћена техника за класификацију. У овој методи класификација је стабло које је познато као стабло одлучивања.

Помаже вам да процените стварне вредности (трошак куповине аутомобила, број позива, укупна месечна продаја итд.).

Суппорт Вецтор Мацхине

Машина за векторски ослонац (СВМ) је врста алгоритма учења развијеног 1990. Ова метода се заснива на резултатима статистичке теорије учења коју је увео Вап Ник.

СВМ машине су такође уско повезане са функцијама језгра, што је централни концепт за већину задатака учења. Оквир језгра и СВМ користе се у разним пољима. Укључује проналажење мултимедијалних информација, биоинформатику и препознавање образаца.

Технике машинског учења под надзором и без надзора

На основу Надгледана техника машинског учења Техника машинског учења без надзора
Унос података Алгоритми се обучавају користећи означене податке. Алгоритми се користе против података који нису означени
Рачунарска сложеност Учење под надзором је једноставнија метода. Учење без надзора је рачунски сложено
Тачност Изузетно тачан и поуздан метод. Мање тачна и поуздана метода.

Изазови у надгледаном машинском учењу

Ево изазова са којима се суочава надзирано машинско учење:

  • Ирелевантна карактеристика уноса која садрже садашње податке о обуци може дати нетачне резултате
  • Припрема и обрада података је увек изазов.
  • Прецизност пати када је немогуће, мало вероватно, а као подаци о тренингу унесене су непотпуне вредности
  • Ако дотични стручњак није доступан, онда је други приступ „груба сила“. То значи да треба да мислите да су праве карактеристике (улазне променљиве) за обуку машине. Може бити нетачно.

Предности учења под надзором:

  • Учење под надзором вам омогућава прикупљање података или стварање резултата из претходног искуства
  • Помаже вам да оптимизујете критеријуме учинка користећи искуство
  • Надзирано машинско учење помаже вам да решите разне врсте стварних рачунарских проблема.

Мане супервизованог учења

  • Граница одлуке може бити претренирана ако ваш сет обуке који нема примере које желите да имате на часу
  • Треба да одаберете пуно добрих примера из сваке класе док тренирате класификатор.
  • Класификација великих података може бити прави изазов.
  • Обуци за учење под надзором потребно је пуно рачунарског времена.

Најбоље праксе за учење под надзором

  • Пре него што урадите било шта друго, морате да одлучите који ће се подаци користити као сет обуке
  • Треба да одлучите о структури научене функције и алгоритму учења.
  • Скупите одговарајуће излазе или од људских стручњака или од мерења

Резиме

  • У учењу под надзором, ви тренирате машину користећи податке који су добро „означени“.
  • Желите да обучите машину која вам помаже да предвидите колико ће вам требати да се одвезете кући са радног места пример је надзора под надзором
  • Регресија и класификација су две врсте надзираних техника машинског учења.
  • Учење под надзором је једноставнија метода, док је учење без надзора сложена метода.
  • Највећи изазов у ​​учењу под надзором је тај што небитна карактеристика уноса која садржи податке о обуци може дати нетачне резултате.
  • Главна предност надзора под надзором је у томе што вам омогућава прикупљање података или стварање резултата из претходног искуства.
  • Недостатак овог модела је тај што би граница одлуке могла бити преоптерећена ако ваш сет тренинга нема примере које желите да имате на часу.
  • Као најбоља пракса надгледања учења, прво треба да одлучите коју врсту података треба користити као сет обуке.