felügyelt tanulás

Képzés egy tanár (angol felügyelt tanulás.) - az egyik módszer a gépi tanulás. amelynek során a vizsgálandó rendszer képzett erő segítségével példákat „inger-válasz”. A szempontból kibernetika. Ez egyfajta kibernetikus kísérletek. A bemenet és a referencia-kimenet (inger-válasz) létezhet bizonyos függőséget, de nem lehet tudni. Csak egy véges halmaza korábbi ismert - gőz „inger-válasz”, amely az úgynevezett képzési minta. Az ezen adatok alapján köteles helyreállítani a kapcsolatot (egy modellt a kapcsolat inger-válasz, amely alkalmas a vetítés), azaz konstrukció egy olyan algoritmus, amely képes bármilyen tárgy, így egy meglehetősen pontos választ. Az intézkedés a pontosság, a válaszok, valamint a képzési példa. Meg lehet beadni a funkcionális minőség.







Az elv a beállítás a kísérletben

felügyelt tanulás

felügyelt tanulás

Ez a kísérlet egy konkrét esetben a kísérlet kibernetikus visszajelzést. Készítmény a kísérlet jelenlétére utal egy kísérleti rendszert, egy eljárás a képzési és vizsgálati rendszer vagy módszer teljesítményének mérésére.

A kísérleti rendszer viszont áll a vizsgálat (használt) rendszer, a tér ingerek származó külső környezet, és megerősítése irányítási rendszer (belső vezérlő paraméterek). Erősítésként egy automatikus szabályozó berendezés irányítási rendszert fel lehet használni (pl termosztát), vagy emberi operátor (tanító) képes reagálni a reakció vizsgált rendszer és a környezeti ingerek alkalmazásával különleges szabályok megerősítése megváltoztatásával a rendszer állapotát memória.







Két lehetőség van: (1) ha a reakciót a vizsgálandó rendszer nem változik az a környezet állapotának, és (2) ha a reakció rendszer megváltoztatja a környezeti ingerekre. Ezek a diagramok azt jelzik, alapvető hasonlóság általános formája a biológiai rendszer az idegrendszer.

Típusa a tanulási problémák a tanár

Beviteli módok

típusú válaszok

  • Ha a szám a lehetséges válaszok végtelen (a válaszok valós számok vagy vektorok), beszélt azokról a problémákról, regresszió és közelítése;
  • Ha a szám a lehetséges válaszok természetesen beszélt azokról a problémákról, osztályozás és alakfelismerés;
  • Ha a válasz jellemzi a jövőbeli viselkedését a folyamat vagy jelenség, beszélni előrejelzési problémák.

Degenerált formái megerősítése vezérlőrendszerek ( „Teachers”)

  • erősítő rendszer kontroll a reakció (R - vezérelt rendszer) - az jellemzi, hogy az információs csatorna a külső környezettől, hogy a vasalás rendszere nem működik. Ez a rendszer, annak ellenére, hogy a jelenléte egy ellenőrzési rendszer, utal, hogy a spontán tanulást. mivel a rendszer a vizsgálat alatt képzett off-line, befolyása alatt csak a kimeneti jel függetlenül a „korrektség”. Ezzel a módszerrel a tanulás kezelni a memória állapotának változását nem igényel semmilyen külső információk;
  • erősítő rendszer számára felett inger (S - vezérelt rendszer) - az jellemzi, hogy az információs csatorna a vizsgálati rendszer a erősítő rendszer nem működik. Annak ellenére, hogy a nem-funkcionális csatornakimenetek a vizsgálandó rendszer arra utal, hogy a tanulás a tanár, mint ebben az esetben, az erősítő rendszer (tanár) teszi a rendszer alatt a vizsgált reakció szerint egy bizonyos szabályt, de nem vették figyelembe a jelenléte valódi reakció a vizsgálati rendszer.

Ez a megkülönböztetés lehetővé teszi a mélyebb pillantást a különbségeket a különböző tanulási módok, ahogy a vonal között tanítás és a tanulás a tanár nélkül a tanár vékonyabb. Ezen túlmenően, az ilyen különbségtétel lehet mutatni bizonyos korlátozások S és R neurális hálózatok - a kezelt rendszerek (lásd perceptron konvergencia tétel.).




Kapcsolódó cikkek