ChunPom’s diary

数学、物理、機械学習に関する話題。あと院試、資格、大学入試まで。

ルジャンドル変換を高校数学で理解する

 ルジャンドル変換(Legendre変換)は,熱力学における特性関数の解析や,最適化問題における双対問題など,様々な分野で現れる重要な理論である。本稿では高校数学のみを用いてルジャンドル変換の導出を図る。

 ルジャンドル変換は平たく言えば,凸関数{\displaystyle y=f(x)}における接線の{\displaystyle y}切片を求める理論である。ここで凸関数は{\displaystyle y=x^2}のように下に凸な関数の総称である。

 具体的には接線の傾きを{\displaystyle t}としたときの切片{\displaystyle C}を,{\displaystyle t}の関数{\displaystyle C(t)}として求めるものである。高校数学では,「接線はまず接点の{\displaystyle x}座標を{\displaystyle x_0}おけ!」というのがスローガンであろう。そういう意味では,傾きを変数で置くところから始まるルジャンドル変換は多少とっつきにくいかもしれない。なので,「接線はまず接点の{\displaystyle x}座標を{\displaystyle x_0}おけ!」という高校数学のセオリーにのっとってルジャンドル変換を導出してみよう。

このとき,接線の方程式は{\displaystyle y=f'(x_0)(x-x_0)+f(x_0)}と書けるから,{\displaystyle y=tx+C(t)}と比較することで,

{\displaystyle \ \ (1)\ t=f'(x_0)}

{\displaystyle \ \ (2)\ C(t)=f(x_0)-x_0 f'(x_0)}

を得る。これらの式から{\displaystyle x_0}を消去すれば{\displaystyle C(t)}を求めることができそうだが,式(1)は{\displaystyle f(x)}が与えられていないと陽に解くことができない...そこで,{\displaystyle x_0}を別の方法で求めてみよう。{\displaystyle f(x)}は凸関数であるから,任意の接線はこれより下に来る。すなわち{\displaystyle f(x)-(tx+C(t))\geq 0}である。特に,接するとき等号が成り立つので,

{\displaystyle \ \ (3)\ x_0=argmin_x\{f(x)-tx-C(t)\}=argmin_x\{f(x)-tx\}}

となる。ここで{\displaystyle argmin_x}は最小値を与える{\displaystyle x}座標を示す。{\displaystyle C(t)}{\displaystyle x}に依らないため,(3)の第二式が得られる。式(1),(2)より{\displaystyle C(t)=f(x_0)-t x_0 =(f(x)-tx)_{x=x_0}}となるが,式(3)の結果から{\displaystyle f(x)-tx}{\displaystyle x=x_0}で最小となるため,

{\displaystyle \ \ (4)\ C(t)=\min_x\{f(x)-tx\}}

を得る。こうして,接点の座標{\displaystyle x_0}を用いずに傾き{\displaystyle t}のみを用いて,切片の表式を表すことができた。式(4)がルジャンドル変換である。