Надгледано против ненадгледаног учења: кључне разлике

Преглед садржаја:

Anonim

Шта је надзирано машинско учење?

У учењу под надзором, ви тренирате машину користећи податке који су добро „означени “. То значи да су неки подаци већ означени тачним одговором. Може се упоредити са учењем које се одвија у присуству супервизора или наставника.

Надгледани алгоритам учења учи из означених података о обуци, помаже вам да предвидите исходе за непредвиђене податке. За успешну изградњу, скалирање и примену тачног надзираног машинског учења Модел науке о подацима захтева време и техничку стручност тима високо квалификованих научника за податке. Штавише, научник података мора поново изградити моделе како би осигурао да дати увиди остану тачни док се подаци не промене.

У овом упутству ћете научити

  • Шта је надзирано машинско учење?
  • Шта је учење без надзора?
  • Зашто супервизирано учење?
  • Зашто учење без надзора?
  • Како функционише надгледано учење?
  • Како функционише учење без надзора?
  • Врсте техника надзираног машинског учења
  • Врсте техника без машинског учења
  • Надгледано против ненадгледаног учења

Шта је учење без надзора?

Учење без надзора је техника машинског учења, где не треба да надгледате модел. Уместо тога, морате да дозволите моделу да ради самостално како би открио информације. Углавном се бави необележеним подацима.

Алгоритми учења без надзора омогућавају вам обављање сложенијих задатака обраде у поређењу са надзором учења. Иако ненадгледано учење може бити непредвидљивије у поређењу са другим методама дубоког учења и ојачавања.

Зашто супервизирано учење?

  • Учење под надзором вам омогућава прикупљање података или стварање резултата из претходног искуства.
  • Помаже вам да оптимизујете критеријуме учинка користећи искуство
  • Надзирано машинско учење помаже вам да решите разне врсте стварних рачунарских проблема.

Зашто учење без надзора?

Ево главних разлога за коришћење учења без надзора:

  • Машинско учење без надзора проналази све врсте непознатих образаца у подацима.
  • Методе без надзора помажу вам да пронађете функције које могу бити корисне за категоризацију.
  • Одржава се у реалном времену, тако да се сви улазни подаци анализирају и означавају у присуству ученика.
  • Лакше је добити необележене податке са рачунара него етикетиране податке који захтевају ручну интервенцију.

Како функционише надгледано учење?

На пример, желите да обучите машину како би вам помогао да предвидите колико ће вам требати да се возите кући са радног места. Овде започињете са стварањем скупа означених података. Ови подаци укључују

  • Временски услови
  • Доба дана
  • Празници

Сви ови детаљи су ваши уноси. Резултат је време потребно за повратак кући тог одређеног дана.

Инстинктивно знате да ће вам, ако напољу пада киша, требати више времена да се возите кући. Али машини су потребни подаци и статистика.

Погледајмо сада како можете развити надгледани модел учења из овог примера који ће помоћи кориснику да одреди време путовања на посао. Прво што требате да направите је скуп података о тренингу. Овај сет тренинга садржи укупно време путовања до путовања и одговарајуће факторе као што су време, време итд. На основу овог комплета тренинга, ваша машина ће можда видети да постоји директна веза између количине кише и времена које ћете требати за повратак кући.

Дакле, утврђује да што више пада киша, то ћете дуже возити до свог дома. Такође може видети везу између времена када напустите посао и времена које ћете провести на путу.

Што сте ближе 18:00, то вам треба дуже времена да стигнете кући. Ваша машина може пронаћи неке везе са вашим означеним подацима.

Ово је почетак вашег модела података. Почиње да утиче на то како киша утиче на начин вожње. Такође почиње да се примећује да више људи путује у одређено доба дана.

Како функционише учење без надзора?

Узмимо случај бебе и њеног породичног пса.

Она зна и идентификује овог пса. Неколико недеља касније породични пријатељ доводи пса и покушава да се игра са бебом.

Беба није раније видела овог пса. Али препознаје многе особине (2 уши, очи, ходање на 4 ноге) попут њеног кућног љубимца. Она идентификује нову животињу попут пса. Ово је учење без надзора, где вас не уче, али учите на основу података (у овом случају података о псу.) Да је ово било под надзором, породични пријатељ рекао би беби да је то пас.

Врсте техника надзираног машинског учења

Регресија:

Техника регресије предвиђа једну излазну вредност користећи податке обуке.

Пример: Помоћу регресије можете предвидети цену куће на основу података са тренинга. Улазне променљиве биће локалитет, величина куће итд.

Класификација:

Класификација значи груписање резултата унутар класе. Ако алгоритам покушава унос означити у две различите класе, то се назива бинарна класификација. Избор између више од две класе назива се класификација више класа.

Пример : Утврђивање да ли ће неко бити неплатиша зајма или не.

Предности : Излази увек имају пробабилистичку интерпретацију, а алгоритам се може регулисати како би се избегло прекомерно прилагођавање.

Слабости : Логистичка регресија може бити лоша када постоје вишеструке или нелинеарне границе одлучивања. Ова метода није флексибилна, па не захвата сложеније односе.

Врсте техника без машинског учења

Проблеми учења без надзора подељени су даље у проблеме кластера и удруживања.

Груписање

Груписање је важан концепт када је у питању учење без надзора. Углавном се бави проналажењем структуре или обрасца у збирци некатегорисаних података. Алгоритми кластеровања обрадиће ваше податке и пронаћи природне кластере (групе) ако они постоје у подацима. Такође можете да измените колико кластера ваши алгоритми треба да идентификују. Омогућава вам подешавање грануларности ових група.

Удружење

Правила придруживања омогућавају вам успостављање повезивања међу објектима података у великим базама података. Ова техника без надзора односи се на откривање узбудљивих односа између променљивих у великим базама података. На пример, људи који купују нови дом највероватније купују нови намештај.

Остали примери:

  • Подгрупа пацијената са раком груписана према мерењима њихове експресије гена
  • Групе купаца на основу историје прегледања и куповине
  • Филмска група према оцени коју су дали гледаоци филмова

Надгледано против ненадгледаног учења

Параметри Надгледана техника машинског учења Техника машинског учења без надзора
Процес У надгледаном моделу учења даће се улазне и излазне променљиве. У моделу учења без надзора, даће се само улазни подаци
Унос података Алгоритми се обучавају користећи означене податке. Алгоритми се користе против података који нису означени
Коришћени алгоритми Подржавају векторске машине, неуронску мрежу, линеарну и логистичку регресију, случајне шуме и стабла класификације. Ненадгледани алгоритми се могу поделити у различите категорије: попут алгоритама кластера, К-средства, хијерархијско кластерирање итд.
Рачунарска сложеност Учење под надзором је једноставнија метода. Учење без надзора је рачунски сложено
Употреба података Модел учења под надзором користи податке о обуци да би научио везу између улаза и резултата. Учење без надзора не користи излазне податке.
Тачност резултата Изузетно тачан и поуздан метод. Мање тачна и поуздана метода.
Учење у реалном времену Метода учења се одвија ван мреже. Метода учења одвија се у реалном времену.
Број часова Број часова је познат. Број часова није познат.
Главни недостатак Класификација великих података може бити прави изазов у ​​учењу под надзором. Не можете добити прецизне информације у вези са сортирањем података, а излаз као подаци који се користе у учењу без надзора је означен и непознат.

Резиме

  • У учењу под надзором, ви тренирате машину користећи податке који су добро „означени“.
  • Учење без надзора је техника машинског учења, где не треба да надгледате модел.
  • Учење под надзором вам омогућава прикупљање података или стварање резултата из претходног искуства.
  • Машинско учење без надзора помаже вам да пронађете све врсте непознатих образаца у подацима.
  • На пример, моћи ћете да одредите време потребно за повратак на основу временских услова, доба дана и празника.
  • На пример, беба може да идентификује друге псе на основу претходног учења под надзором.
  • Регресија и класификација су две врсте надзираних техника машинског учења.
  • Груписање и удруживање су две врсте учења без надзора.
  • У надгледаном моделу учења даће се улазне и излазне променљиве, док ће код ненадгледаног модела учења бити дати само улазни подаци