Principiul optimalității și ecuația Bellman

La fiecare pas, controlul este ales astfel încât, împreună cu toate controalele optime, la toate etapele ulterioare să conducă la cel mai bun scor general de eficiență. Ie Managementul ar trebui să fie ales pe baza optimalității managementului în general și nu numai într-o anumită etapă. Acest principiu se bazează pe caracteristicile modelului DP. Pe baza acestui principiu, formulele de recurență ale lui Bellman au fost formulate. Aplicarea acestor formule este posibilă pe baza schemei Bellman inverse sau directe. În ambele cazuri este un indicator al eficienței etapei k. La fiecare pas, controlul optim este selectat dintr-o varietate de controale posibile.

Schema de returnare a lui Bellman.

Cu schema inversă, optimizarea are loc ca urmare a mișcării inverse de la ultimul pas la primul pas. În primul rând, determinăm strategia optimă de control la pasul n, apoi în ultimii doi pași, apoi în ultimii trei pași și așa mai departe. până la primul pas.

pasul n-a. starea sistemului, în funcție de stat. - controlul asupra pasului n, - funcția țintă a pasului n.

Indicatorul optim al eficacității etapei n. egală cu exponentul total al eficienței tuturor etapelor anterioare pe setul tuturor controalelor posibile ale tuturor stărilor posibile ale sistemului.

Astfel, ca urmare a trecerii tuturor treptelor de la ultimul la primul, se determină valoarea optimă a funcției obiective. Pentru a găsi strategia optimă de control, adică determină soluția problemei. Este necesar să treceți întreaga secvență de pași, numai de la început până la sfârșit.

În prima etapă, controlul optim condițional găsit este selectat ca control optim. caracterizat printr-un indicator al eficienței. Știind și. al doilea pas este managementul, etc.

Procesul decizional poate fi prezentat sub forma unei scheme:

Schema directă a lui Bellman

Cu o schemă directă, procesul de căutare a soluției se efectuează în direcția de la primul pas la cel din urmă. Mai întâi, determinați strategia optimă de control în primul pas, apoi pe primii doi pași, apoi pe primii trei pași și așa mai departe. până la ultima etapă.

La acest pas, starea sistemului este. starea anterioară. - set de comenzi în primul pas. Indicatorul eficienței primului pas.

Ca urmare a trecerii tuturor etapelor de la primul la ultimul, valoarea optimă a funcției obiectiv este determinată, care este echivalată cu indicele de eficiență optim al etapei n. Pentru a găsi strategia optimă de control, adică determină soluția problemei. este necesar să treceți întreaga secvență de pași - de la ultimul la primul.

Căutarea strategiei optime poate fi prezentată sub forma unei scheme:

Schema generală de aplicare a metodei DP

1. Alegeți cum să împărțiți procesul de control în pași.

2. Definiți parametrii de stare și variabilele de control la fiecare pas.

3. Ecuațiile de stat sunt scrise.

4. Se introduce funcția țintă.

5. Se introduc maximele condiționate (minima) și controlul condițional optimal la pasul k: (în cazul schemei inverse Bellman), (sub schema Bellman directă).

6. Ecuațiile de bază ale schemei Bellman selectate sunt scrise.

7. Ecuațiile Bellman sunt rezolvate succesiv și sunt obținute două secvențe de funcții: și.

8. După efectuarea optimizării condiționale, se determină soluția optimă a sarcinii și.

Sarcina de a aloca fonduri între întreprinderi

Sarcina alocării resurselor între întreprinderi este o sarcină de programare dinamică.

Să fie o sumă de bani care trebuie investită într-una sau mai multe întreprinderi pentru a obține profitul maxim din investiții. Se presupune că fiecare dintre întreprinderile luate în considerare poate fi investită ca o sumă totală de investiții, fie parțial, fie nimic nu poate fi investit în întreprindere dacă investiția în acesta nu este eficientă. Pentru fiecare întreprindere trebuie să se calculeze un indice al eficienței investiției, care este determinat ca rezultat al soluționării problemei PL privind planificarea producției.

Modelul matematic pentru fiecare tip de întreprindere are forma:

Funcția țintă în conformitate cu constrângerile:

Următoarea notație este utilizată în model:

- prețul pentru tipul de produs J pentru întreprinderea k;

- suma optimă de cumpărare a resurselor de tip i de către întreprinderea k;

- nivelul stocului celui de-al i-lea tip de resursă la întreprinderea k;

- planul optim de producție pentru produsul j de la întreprinderea k;

- rata de consum a resurselor de tip i pentru producția produsului j în cadrul întreprinderii k;

- prețul de piață al celui de-al doilea tip de resursă pentru întreprinderea k;

- suma resurselor financiare alocate întreprinderii a cincea;

- volumul minim de comenzi pentru tipul de produse J de la întreprinderea k;

- capacitatea maximă a pieței pentru tipul j de produse pentru întreprinderea k.

Ca rezultat al rezolvării acestei probleme, va fi obținut venitul suplimentar din activitatea întreprinderii, care este diferența dintre profiturile din momentul alocării investițiilor și a profiturilor, dacă nu se realizează investiții.

Calculate prin metode de programare liniară, indicatorii de performanță ai fiecărei întreprinderi, în funcție de suma resurselor financiare primite, sunt utilizați ulterior pentru a găsi distribuția optimă a fondurilor între întreprinderi folosind metode de programare dinamică.

1. venitul suplimentar al fiecărei întreprinderi nu depinde de valoarea investiției în alte întreprinderi;

2. venitul suplimentar al fiecărei întreprinderi este exprimat în aceleași unități;

3. Venitul total suplimentar este egal cu suma veniturilor suplimentare primite de fiecare întreprindere.

Pentru a determina mijloacele optime de investiție, este necesar să treceți prin următoarele etape:

1. intervalul de schimbare a fondurilor alocate este împărțit în segmente elementare;

2. pentru valorile date ale fondurilor alocate se stabilesc indicatorii de eficiență pentru toate întreprinderile;

3. Utilizând schema inversă (directă), sunt utilizate ecuațiile Bellman;

4. În secvența inversă (directă), pornind de la valorile optime ale fondurilor alocate.

Un exemplu. Se planifică activitatea a 4 întreprinderi industriale pentru anul următor. Este necesar să distribui între ele 400 de unități ale resursei limitate Q. Fiecare întreprindere i primește un venit suplimentar fi (x) în funcție de suma fondurilor alocate x. Distribuția resurselor se face cu o precizie de 80 de unități. Este necesar să se determine distribuția optimă a fondurilor între întreprinderi, asigurând eficiența maximă a tuturor întreprinderilor.

Valoarea veniturilor suplimentare primite, în funcție de resursele alocate, x este prezentată în Tabelul 1.

Volumul resurselor alocate, x

Venitul suplimentar al întreprinderii, în funcție de volumul fondurilor alocate, fi (x)

Luați în considerare schema inversă Bellman.

Conform schemei inverse a lui Bellman, începem cu definirea investițiilor capitale optimale condiționate alocate pentru ultima întreprindere a patra (n). Pentru aceasta, găsim valorile pentru fiecare x. care ia valorile 0, 80, 160, 240, 320, 400.

Indicatorul eficienței celei de-a patra întreprinderi, egal cu indicele de eficiență totală în toate etapele, este definit ca.

Găsim - un indicator total al eficacității activităților a 3 și 4 întreprinderi.

Vom calcula indicele combinat al eficienței activității a 2, 3 și 4 întreprinderi.

Indicator combinat al eficacității activităților a 4 întreprinderi.

Volumul resurselor alocate, x

Indicatorii de performanță ai întreprinderilor în funcție de volumul fondurilor alocate, Z i (x)

Pentru a găsi strategia optimă de control, este necesar să se ia în considerare întreaga secvență de pași de la ultimul la primul.

Ca rezultat al soluționării problemei de distribuție a fondurilor între întreprinderi, am primit acest lucru pentru a asigura eficiența maximă a activității a 4 întreprinderi, egală cu 203 cu. Prima și a doua întreprindere nu ar trebui să aloce resurse, 3 întreprinderi ar trebui să aloce 240 de unități din resursă, 4 - 160 de unități.

Creșterea producției întreprinderii i, fi (x)

O parte din fondurile alocate întreprinderilor, milioane de ruble, x

Creșterea producției întreprinderii i, fi (x)

O parte din fondurile alocate întreprinderilor, milioane de ruble, x

Creșterea producției întreprinderii i, fi (x)

O parte din fondurile alocate întreprinderilor, milioane de ruble, xi

Creșterea producției întreprinderii i, fi (x)

O parte din fondurile alocate întreprinderilor, milioane de ruble, xi

Articole similare

Pagina anterioară

Pagina următoare

Principiul optimalității și ecuația Bellman

Articole similare

Trimiteți-le prietenilor: