Главная
Статьи





08.11.2022


08.11.2022


08.11.2022


07.11.2022


07.11.2022






Условный экстремум

20.10.2022

Условный экстремум — максимальное или минимальное значение, которое функция, определённая на множестве G {displaystyle G} и принимающая вещественные значения, достигает в предположении, что значения некоторых других функций с той же областью определения подчинены определённым ограничительным условиям (если такие дополнительные условия отсутствуют, то говорят о безусловном экстремуме).

В частности, множество G {displaystyle G} может быть подмножеством арифметического векторного пространства R n , {displaystyle mathbb {R} ^{n},} а упомянутые ограничительные условия, в свою очередь, могут быть заданы в виде равенств или неравенств. Ниже рассматриваются классическая задача на условный экстремум, в которой все условия заданы в виде равенств, а также задача Лагранжа — одна из классических задач вариационного исчисления.

Постановка классической задачи на условный экстремум

Пусть G ⊂ R n {displaystyle {Gsubset mathbb {R} ^{n}}} — открытое множество, и на нём заданы функции y i = f i ( x → ) , i = 1 , 2 , … , m . {displaystyle y_{i}=f_{i}({vec {x}}),;i=1,2,dots ,m.} Пусть E = { x → ∈ G : f i ( x → ) = 0 ∀ i = 1 , 2 , … , m } . {displaystyle E=lbrace ,{vec {x}}in G:,f_{i}({vec {x}})=0;;forall ,i=1,2,dots ,m, brace .}

Уравнения

( ∗ ) f i ( x → ) = 0 {displaystyle (*)qquad f_{i}({vec {x}})=0}

называют уравнениями связей (терминология заимствована из механики).

Пусть на G {displaystyle G} определена также функция y = f 0 ( x → ) . {displaystyle y=f_{0}({vec {x}}).} Точка x → 0 ∈ E {displaystyle {vec {x}}_{0}in E} называется точкой условного экстремума данной функции относительно уравнений связей ( ∗ ) , {displaystyle (*),} если она является точкой обычного (безусловного) экстремума функции f 0 {displaystyle f_{0}} на множестве E {displaystyle E} (модификация определения экстремума сводится к тому, что в нём вместо окрестностей в G {displaystyle G} , то есть U G ( x → 0 ) {displaystyle U_{G}({vec {x}}_{0})} , рассматриваются окрестности в E {displaystyle E} , то есть U E ( x → 0 ) = U G ( x → 0 ) ⋂ E {displaystyle U_{E}({vec {x}}_{0})=U_{G}({vec {x}}_{0})igcap E} ).

Метод множителей Лагранжа для решения задачи условного экстремума

Теорема

Предположим, что все фигурирующие в постановке классической задачи на условный экстремум функции непрерывно дифференцируемы, и пусть x → 0 {displaystyle {vec {x}}_{0}} — точка условного экстремума функции f 0 {displaystyle f_{0}} при выполнении уравнений связей ( ∗ ) . {displaystyle (*).} Тогда в этой точке градиенты ∇ f i , i = 0 , 1 , … , m {displaystyle abla f_{i},,i=0,1,dots ,m} являются линейно зависимыми, т. e. ∃ λ i , i = 0 , 1 , … , m : ∑ i = 0 m | λ i | ≠ 0 , {displaystyle exists ,lambda _{i},,i=0,1,dots ,m,colon ;sum _{i=0}^{m}|lambda _{i}| eq 0,} но ∑ i = 0 m λ i ∇ f i = 0 {displaystyle sum _{i=0}^{m}lambda _{i} abla f_{i}=0} .

Числа λ i , i = 0 , 1 , … , m {displaystyle lambda _{i},,i=0,1,dots ,m} называются множителями Лагранжа и определены с точностью до умножения на произвольную ненулевую константу. Наибольший интерес представляет случай, когда λ 0 ≠ 0 {displaystyle lambda _{0} eq 0} (тогда, умножив все λ i {displaystyle lambda _{i}} на подходящую ненулевую константу, можно сделать множитель λ 0 {displaystyle lambda _{0}} равным 1 {displaystyle 1} и, таким образом, вообще исключить его из рассмотрения). В такой ситуации вместо только что сформулированной теоремы пользуются следующим следствием из неё.

Следствие

Если x → 0 {displaystyle {vec {x}}_{0}} — точка условного экстремума функции f 0 {displaystyle f_{0}} относительно уравнений связей ( ∗ ) , {displaystyle (*),} и в ней градиенты ∇ f i , i = 1 , … , m {displaystyle abla f_{i},i=1,dots ,m} линейно независимы, то ∃ λ 1 , … , λ m {displaystyle exists ,lambda _{1},dots ,lambda _{m}} такие, что в данной точке ∇ f 0 + λ 1 ∇ f 1 + ⋯ + λ m ∇ f m = 0. {displaystyle abla f_{0}+lambda _{1} abla f_{1}+dots +lambda _{m} abla f_{m}=0.} В координатном виде это векторное равенство эквивалентно выполнению равенств

( ∗ ∗ ) ∂ f 0 ∂ x i ( x → 0 ) + λ 1 ∂ f 1 ∂ x i ( x → 0 ) + ⋯ + λ m ∂ f m ∂ x i ( x → 0 ) = 0 , {displaystyle (**)qquad {frac {partial f_{0}}{partial x_{i}}}({vec {x}}_{0})+lambda _{1}{frac {partial f_{1}}{partial x_{i}}}({vec {x}}_{0})+dots +lambda _{m}{frac {partial f_{m}}{partial x_{i}}}({vec {x}}_{0})=0,,}

где i = 1 , … , n {displaystyle i=1,dots ,n} .

Равенствам ( ∗ ∗ ) {displaystyle (**)} можно дать следующую интерпретацию. Предположим, что для чисел λ 1 , … , λ m {displaystyle lambda _{1},dots ,lambda _{m}} данные равенства выполняются, и объединим их в столбец λ → 0 . {displaystyle {vec {lambda }}_{0}.} Составим функцию Лагранжа:

L ( x → ; f → , λ → ) = f 0 ( x → ) + ∑ i = 1 m λ i f i ( x → ) , {displaystyle L({vec {x}};{vec {f}},{vec {lambda }})=f_{0}({vec {x}})+sum _{i=1}^{m}lambda _{i},f_{i}({vec {x}}),,}

где λ 1 , … , λ m {displaystyle lambda _{1},dots ,lambda _{m}} — уже произвольные числа. Тогда при λ → = λ → 0 {displaystyle {vec {lambda }}={vec {lambda }}_{0}} точка x → 0 {displaystyle {vec {x}}_{0}} является стационарной точкой функции Лагранжа, а равенства ( ∗ ∗ ) {displaystyle (**)} могут быть записаны в виде

∂ L ∂ x 1 = ∂ L ∂ x 2 = … = ∂ L ∂ x n = 0 ; {displaystyle {frac {partial L}{partial x_{1}}},=,{frac {partial L}{partial x_{2}}},=,dots ,=,{frac {partial L}{partial x_{n}}},=,0,;}

эти соотношения и являются условиями стационарности точки x → 0 . {displaystyle {vec {x}}_{0}.} Добавляя к ним уравнения связей ( ∗ ) , {displaystyle (*),} получаем n + m {displaystyle n+m} уравнений относительно n + m {displaystyle n+m} неизвестных x 1 , … , x n , λ 1 , … , λ m {displaystyle x_{1},dots ,x_{n},lambda _{1},dots ,lambda _{m}} .

Пример. Найдём стороны прямоугольника максимальной площади, вписанного в окружность x 2 + y 2 = r 2 . {displaystyle x^{2}+y^{2}=r^{2}.} Здесь n = 2 , {displaystyle n=2,} m = 1 , {displaystyle m=1,} f 0 ( x , y ) = 4 x y , {displaystyle f_{0}(x,y)=4xy,} f 1 ( x , y ) = x 2 + y 2 − r 2 . {displaystyle f_{1}(x,y)=x^{2}+y^{2}-r^{2}.} Составив функцию Лагранжа

L ( x , y ) = 4 x y + λ ( x 2 + y 2 − r 2 ) {displaystyle L(x,y),=,4xy+lambda (x^{2}+y^{2}-r^{2})}

и записав условия её стационарности в точке условного экстремума

∂ L ∂ x ≡ 4 y + 2 λ x = 0 , ∂ L ∂ y ≡ 4 x + 2 λ y = 0 , {displaystyle {frac {partial L}{partial x}}equiv 4y+2lambda x,=,0,,qquad {frac {partial L}{partial y}}equiv 4x+2lambda y,=,0,,}

находим: λ = − 2 {displaystyle lambda =-2} и x = y = r / 2 {displaystyle x=y=r/{sqrt {2}}} (прямоугольник максимальной площади оказался квадратом).

Достаточное условие условного экстремума

Если равенства ( ∗ ∗ ) {displaystyle (**)} при λ → = λ → 0 {displaystyle {vec {lambda }}={vec {lambda }}_{0}} выполнены и при этом (дополнительно предполагается, что в точке x → 0 {displaystyle {vec {x}}_{0}} все фигурирующие в постановке классической задачи на условный экстремум функции двукратно непрерывно дифференцируемы) d 2 L {displaystyle { m {d}}^{2}L} представляет собой отрицательно (положительно) определённую квадратичную форму переменных d x 1 , … , d x n , {displaystyle { m {d}}x_{1},dots ,{ m {d}}x_{n},} то x → 0 {displaystyle {vec {x}}_{0}} является точкой строгого условного максимума функции f 0 {displaystyle f_{0}} (строгого условного минимума для положительно определенной формы). Если же рассматриваемая квадратичная форма не является знакоопределённой, тогда условного экстремума нет.

Задача Лагранжа

Данная задача относится к вариационному исчислению и является одним из возможных обобщений классической задачи на условный экстремум. В задаче Лагранжа требуется найти непрерывно дифференцируемую функцию x → = x → ( t ) , {displaystyle {vec {x}}={vec {x}}(t),} заданную на отрезке [ t 0 , t 1 ] {displaystyle [t_{0},t_{1}]} и доставляющую экстремум (максимум или минимум) функционалу

J = ∫ t 0 t 1 F ( t , x → ( t ) , x → ˙ ( t ) ) d t {displaystyle J;=;int limits _{t_{0}}^{t_{1}}F,(t,{vec {x}}(t),{dot {vec {x}}}(t)),,{ m {d}}t}

(точкой обозначена операция дифференцирования по t {displaystyle t} ) при фиксированных граничных условиях x → ( t 0 ) = x → 0 , {displaystyle {vec {x}}(t_{0})={vec {x}}_{0},} x → ( t 1 ) = x → 1 {displaystyle {vec {x}}(t_{1})={vec {x}}_{1}} и выполнении уравнений связей

f i ( t , x → ( t ) , x → ˙ ( t ) ) = 0 , {displaystyle f_{i},(t,{vec {x}}(t),{dot {vec {x}}}(t)),=,0,,}

где i = 1 , 2 , … , m {displaystyle i=1,2,dots ,m} .

В данной задаче также применим метод множителей Лагранжа. Предполагая уравнения связей независимыми, вводят в рассмотрение m {displaystyle m} неизвестных функций λ 1 ( t ) , … , λ m ( t ) {displaystyle lambda _{1}(t),dots ,lambda _{m}(t)} и сводят исходную задачу к задаче безусловной оптимизации, заменяя подынтегральную функцию функцией

Φ = F ( t , x → ( t ) , x → ˙ ( t ) ) + ∑ i = 1 m λ i ( t ) f i ( t , x → ( t ) , x → ˙ ( t ) ) ; {displaystyle Phi ,=,F,(t,{vec {x}}(t),{dot {vec {x}}}(t)),+,sum _{i=1}^{m}lambda _{i}(t),f_{i},(t,{vec {x}}(t),{dot {vec {x}}}(t)),;}

в качестве аналога равенств ( ∗ ∗ ) {displaystyle (**)} (т. e. в роли необходимых условий экстремума) теперь выступают уравнения Эйлера — Лагранжа, имеющие в рассматриваемом случае вид

d d t ∂ Φ ∂ x ˙ k − ∂ Φ ∂ x k = 0 , {displaystyle {frac { m {d}}{{ m {d}}t}}{frac {partial Phi }{partial {dot {x}}_{k}}}-{frac {partial Phi }{partial x_{k}}},=,0,,}

где k = 1 , 2 , … , n . {displaystyle k=1,2,dots ,n.} Из этих n {displaystyle n} обыкновенных дифференциальных уравнений, дополненных уравнениями связей, находят (с учётом имеющихся граничных условий) n + m {displaystyle n+m} неизвестных функций x 1 ( t ) , … , x n ( t ) , λ 1 ( t ) , … , λ m ( t ) {displaystyle x_{1}(t),dots ,x_{n}(t),lambda _{1}(t),dots ,lambda _{m}(t)} .