Az optimalitás elve és a Bellman-egyenlet

Minden lépésben a vezérlést úgy választják ki, hogy az összes optimális kontrollal együtt minden további lépésben a legjobb általános hatékonysági pontszámot eredményezze. Ie A menedzsmentet az irányítás optimálissága alapján kell választani, nem csak egy adott lépésben. Ez az elv a DP modell jellemzőin alapul. Ezen elv alapján Bellman visszatérési formuláit megfogalmazták. Ezen képletek alkalmazása az inverz vagy közvetlen Bellman-rendszer alapján lehetséges. Mindkét esetben a k-lépés hatékonyságának mutatója. Minden egyes lépésnél az optimális vezérlést a különböző lehetséges ellenőrzések közül választjuk ki.

Bellman visszatérési rendszere.

A fordított sémával az optimalizálás az utolsó lépéstől az első lépésig történő visszafordulás eredményeképpen következik be. Először meghatározzuk az optimális kontrollstratégiát az n-edik lépésben, majd az utolsó két lépésben, majd az utolsó három lépésben és így tovább. az első lépésig.

n-edik lépés. a rendszer állapota, az államtól függően. - az n-edik lépés vezérlése, - az n-edik lépés célfüggvénye.

Az n-edik lépés hatékonyságának optimális mutatója. amely megegyezik a rendszer minden lehetséges állapotának összes lehetséges szabályozásának összes korábbi lépése hatékonyságának teljes exponensével.

Így az utolsó lépésről az elsőre történő lépés során a célfüggvény optimális értéke határozható meg. Az optimális kontrollstratégia megtalálásához, azaz meghatározza a probléma megoldását. A lépések egész sorát csak az elejétől a végéig kell átvezetni.

Az első lépésben a feltételesen optimális szabályozást választjuk optimális vezérlésnek. hatékonysági mutató jellemzi. Ismert és. a második lépés az irányítás stb.

A döntési folyamatot egy rendszer formájában lehet bemutatni:

A Bellman közvetlen rendszere

Közvetlen rendszer esetén a megoldáskeresési folyamatot az első lépésről az utolsóra vezetjük. Először határozza meg az optimális vezérlési stratégiát az első lépésben, majd az első két lépésben, majd az első három lépésben, és így tovább. az utolsó lépésig.

Ebben a lépésben a rendszer állapota. előző állapot. - a vezérlőkészlet az első lépésben. Az első lépés hatékonyságának mutatója.

Az elsőtől az utolsóig terjedő összes lépés áthaladásának eredményeképpen meghatároztuk az objektumfunkció optimális értékét, amely az n-edik lépés optimális hatékonysági indexéhez hasonlít. Az optimális kontrollstratégia megtalálásához, azaz meghatározza a probléma megoldását. szükség van a lépések teljes sorozata - az utolsótól az elsőig.

Az optimális stratégiát a következőképpen lehet bemutatni:

A DP módszer alkalmazásának általános rendszere

1. Válassza ki, hogyan lehet az ellenőrzési folyamatot lépésekre osztani.

2. Határozza meg az állapot paramétereket és a kontrollváltozókat minden lépésben.

3. Az állami egyenleteket leírják.

4. A célfunkció be van adva.

5. A k-fázisban feltételes maximális (minima) és feltételes optimális szabályozást vezetünk be (a Bellman-inverz rendszer esetében) (a közvetlen Bellman-rendszer alatt).

6. A kiválasztott Bellman-rendszer alapegyenleteit leírják.

7. A Bellman-egyenleteket egymás után megoldják, és két függvénysorozatot kapunk: és.

8. A feltételes optimalizálás elvégzése után meghatározzák a feladat optimális megoldását.

A vállalkozások közötti pénzeszközök felosztásának feladata

A források elosztása a vállalatok között dinamikus programozás feladata.

Legyen olyan összeg, amelyet egy vagy több vállalkozásba kell befektetni annak érdekében, hogy a befektetésből a lehető legnagyobb nyereség érhető el. Feltételezhető, hogy a vizsgált vállalkozások mindegyike befektetésként, részben vagy egészben befektethető, vagy semmi nem fektethető be a vállalkozásba, ha a beruházás nem hatékony. Minden vállalkozás esetében meg kell határozni a befektetési hatékonyság indexét, amelyet a PL-probléma termelési tervezéssel kapcsolatos megoldásának eredményeként határoznak meg.

A matematikai modell minden típusú vállalkozás esetében a következő formában van:

Célfunkció korlátok között:

A modellben a következő jelölés szerepel:

- a k-es vállalkozás j-es típusú árának ára;

- az i-es típusú erőforrás vásárlásának optimális mennyisége a k-es vállalkozásnál;

- az i. típusú forrás erőforrása a k-es vállalkozásnál;

- optimális gyártási terv a j-es termékhez a k-es vállalkozásnál;

- az i. típusú erőforrás fogyasztásának mértéke a j-es termék k termeléséhez a k-es vállalkozásban;

- a k-es vállalkozás i. típusú erőforrásának piaci ára;

- a k. vállalkozásnak juttatott pénzügyi források összege;

- a k-es vállalkozás j-típusú termékeinek minimális mennyisége;

- a k-es vállalkozás j-típusú termékének maximális piaci kapacitása.

Ennek a problémának a megoldása eredményeképpen a vállalkozás munkájából származó többletbevétel összegét kapjuk meg, ami a befektetések és nyereségek felosztásakor a nyereség különbsége, ha nem történik beruházás.

A lineáris programozás módszerével számolva az egyes vállalkozások teljesítménymutatóit a beérkezett pénzügyi források összegétől függően később felhasználják a dinamikus programozási módszereket alkalmazó vállalatok közötti optimális pénzalapok eloszlására.

1. az egyes vállalkozások kiegészítő jövedelme nem függ a más vállalkozásokba történő befektetés összegétől;

2. az egyes vállalkozások kiegészítő jövedelmét ugyanazon egységekben fejezik ki;

3. A kiegészítő jövedelem összege megegyezik az egyes vállalkozások által kapott kiegészítő jövedelem összegével.

A beruházás optimális eszközeinek meghatározásához a következő lépésekre van szükség:

1. a kiosztott pénzeszközök változásának időszaka elemi szegmensekre van osztva;

2. a kiosztott pénzeszközök adott értékeire vonatkozóan meghatározzák a hatékonysági mutatókat minden vállalkozás számára;

3. Az elmaradott (közvetlen) sémát használva Bellman egyenleteit használjuk;

4. A fordított (közvetlen) sorozatban, az elkülönített források optimális értékeiből kiindulva.

Egy példa. A következő évre 4 ipari vállalkozás tevékenységét tervezik. Meg kell osztani a korlátozott Q erőforrás 400 egységét közöttük, és minden egyes vállalkozásnál további jövedelem fi (x) kap az x allokált összegek függvényében. Az erőforrások elosztása 80 egység pontossággal történik. Szükséges meghatározni a vállalatok közötti optimális pénzeszközök elosztását, biztosítva a vállalkozások maximális hatékonyságát.

Az elkülönített források függvényében kapott kiegészítő jövedelem összegét az 1. táblázat tartalmazza.

Az elkülönített források mennyisége, x

A vállalkozás további jövedelme a felosztott pénzeszközök összegétől függően, fi (x)

Tekintsük az inverz Bellman-rendszert.

Bellman fordított rendszere szerint az utolsó negyedik (n) vállalkozás számára feltételesen optimális tőkebefektetések meghatározásával kezdjük. Ehhez megtaláljuk az egyes x értékeket. amely 0, 80, 160, 240, 320, 400 értéket vesz.

A negyedik vállalkozás hatékonyságának mutatója, amely egyenlő a teljes hatékonysági mutatóval, minden lépésben meghatározásra kerül.

Megállapítottuk - a 3 és 4 vállalkozás tevékenységének hatékonyságát mutató teljes mutató.

Kiszámítjuk a 2, 3 és 4 vállalkozás tevékenységének hatékonyságának kombinált indexét.

Kombinált mutató a 4 vállalkozás tevékenységének hatékonyságáról.

Az elkülönített források mennyisége, x

A vállalkozások teljesítménymutatói az elkülönített források nagyságától függően, Z i (x)

Az optimális kontrollstratégia megtalálásához figyelembe kell venni a lépések egész sorát az utolsótól az elsőig.

A vállalatok közötti pénzeszközök elosztásának problémájának megoldása eredményeképpen 4 vállalat tevékenységének maximális hatékonyságát biztosította, ami 203 cu. Az első és a második vállalkozásnak nem kell forrásokat felosztania, 3 vállalkozásnak 240 forrásegységet kell elosztania, a 4. - 160 db.

Az i. Vállalkozás kibocsátásának növelése, fi (x)

A vállalatoknak juttatott források egy része, millió rubel, x

Az i. Vállalkozás kibocsátásának növelése, fi (x)

A vállalatoknak juttatott források egy része, millió rubel, x

Az i. Vállalkozás kibocsátásának növelése, fi (x)

A vállalkozásoknak juttatott források egy része, millió rubel, xi

Az i. Vállalkozás kibocsátásának növelése, fi (x)

A vállalkozásoknak juttatott források egy része, millió rubel, xi

Kapcsolódó cikkek