O nierówności Hermite’a-Hadamarda

Gdyby chcieć mówić o funkcjach wypukłych i ich nawet podstawowych własnościach, można by robić to niemal bez końca, a przynajmniej w semestralnym wykładzie monograficznym. Założę więc, że pojęcie funkcji wypukłej jest Czytelnikom znane. Ale – jak to powiedział mistrz Aleksander – znacie, to posłuchajcie. Otóż funkcję $f:\I\to\RR$ (gdzie $\I\subset\RR$ jest przedziałem) nazywamy wypukłą, jeśli nierówność
\[
f\bigl(tx+(1-t)y\bigr)\xle tf(x)+(1-t)f(y)\tag{1}\label{wyp}
\]zachodzi dla wszystkich $x,y\in\I$ i dla wszystkich $t\in[0,1]$. W szczególności funkcja wypukła spełnia nierówność Jensena
\[
f\Bigl(\frac{x+y}{2}\Bigr)\xle\frac{f(x)+f(y)}{2}\,.\tag{2}\label{J}
\]dla wszystkich $x,y\in\I$. Istotnie, w nierówności \eqref{wyp} wystarczy przyjąć $t=\dfrac{1}{2}$.

Wymieniona w tytule artykułu nierówność nie należy do nowych, pochodzi z roku 1893 i ma ciekawą historię, którą dziś przemilczę. Niech $f:\I\to\RR$ będzie funkcją wypukłą i niech $x,y\in\I$. Wtedy zachodzi nierówność Hermite’a-Hadamarda:
\[
f\Bigl(\frac{x+y}{2}\Bigr)\xle\frac{1}{y-x}\int\limits_x^y f(u)\,\dd u\xle\frac{f(x)+f(y)}{2}\,.\tag{3}\label{HH}
\]Znów przemilczam fakt, że funkcje wypukłe są całkowalne w sensie Riemanna.

Dowodów tej nierówności jest wiele. Zasadniczym celem dzisiejszego wpisu jest zaprezentowanie jednego z nich: prostego, ale chyba mniej znanego. Ustalmy więc $t\in[0,1]$. Oznaczmy $a=tx+(1-t)y$ oraz $b=(1-t)x+ty$. Wobec nierówności Jensena \eqref{J} mamy
\[
f\Bigl(\frac{a+b}{2}\Bigr)\xle\frac{f(a)+f(b)}{2}\,.
\]Zauważmy, że $\dfrac{a+b}{2}=\dfrac{x+y}{2}$, więc
\[
f\Bigl(\frac{x+y}{2}\Bigr)\xle\frac{f\bigl(tx+(1-t)y\bigr)+f\bigl((1-t)x+ty\bigr)}{2}\,.
\]Na mocy nierówności \eqref{wyp} zastosowanej do obu składników licznika prawej strony z osobna, ta właśnie prawa strona nie przekracza wyrażenia $\dfrac{f(x)+f(y)}{2}.$ Dochodzimy więc do nierówności
\[
f\Bigl(\frac{x+y}{2}\Bigr)\xle\frac{f\bigl(tx+(1-t)y\bigr)+f\bigl((1-t)x+ty\bigr)}{2}\xle\frac{f(x)+f(y)}{2}\,,
\]
którą teraz wystarczy scałkować względem $t$ w przedziale $[0,1]$. Całkując przez podstawienie mamy bowiem
\[
\int\limits_0^1 f\bigl(tx+(1-t)y\bigr)\,\dd t=\int\limits_0^1 f\bigl((1-t)x+ty\bigr)\,\dd t=\frac{1}{y-x}\int\limits_x^y f(u)\,\dd u\,.
\]Nierówność Hermite’a–Hadamarda \eqref{HH} jest więc udowodniona.

Mnożąc obie strony nierówności \eqref{HH} przez $y-x$ otrzymujemy
\[
(y-x)\,f\Bigl(\frac{x+y}{2}\Bigr)\xle\int\limits_x^y f(u)\,\dd u\xle\frac{y-x}{2}\bigl(f(x)+f(y)\bigr)\,,
\]co można zinterpretować w ten sposób, że przybliżenie całki funkcji wypukłej metodą prostokątów nie przekracza tej całki, która z kolei nie przekracza przybliżenia metodą trapezów. Okazuje się, że można powiedzieć znacznie więcej. Wykażemy, że przybliżenie metodą prostokątów jest dokładniejsze (a przynajmniej nie gorsze) od przybliżenia metodą trapezów. W tym celu zastosujemy drugą z nierówności \eqref{HH} najpierw w przedziale $\Bigl[x,\dfrac{x+y}{2}\Bigr]$, a potem w przedziale $\Bigl[\dfrac{x+y}{2},y\Bigr].$ Dostajemy więc
\begin{align*}
\frac{2}{y-x}\int\limits_x^{\frac{x+y}{2}}f(u)\,\dd u&\xle \frac{f(x)+f\bigl(\tfrac{x+y}{2}\bigr)}{2}\,,\\[2ex]
\frac{2}{y-x}\int\limits_{\frac{x+y}{2}}^yf(u)\,\dd u&\xle \frac{f\bigl(\tfrac{x+y}{2}\bigr)+f(y)}{2}\,.
\end{align*}Obie powyższe nierówności dodajemy teraz stronami i po lekkim przegrupowaniu dochodzimy do nierówności
\[
0\xle\frac{1}{y-x}\int\limits_x^y f(u)\,\dd u-f\Bigl(\frac{x+y}{2}\Bigr)\xle\frac{f(x)+f(y)}{2}-\frac{1}{y-x}\int\limits_x^y f(u)\,\dd u\,,
\]którą chcieliśmy wykazać, bo właśnie ona mówi o anonsowanej jakości przybliżeń całki funkcji wypukłej metodami prostokątów i trapezów.

Kończąc powiem, że przystępując do pisania tego artykułu nie sądziłem, że będzie on znacznie dłuższy niż inne na blogu. A omawiana sprawa jest dość prosta i podstawowa w teorii funkcji wypukłych. Oczywiście cały wyłożony dziś materiał jest dobrze znany specjalistom (i nie tylko) i należy do kanonu wiedzy w zakresie analizy wypukłej. Widać więc, czemu tak wiele rzeczy przemilczałem. Może jeszcze do nich wrócę…

Dodaj komentarz