jyanjayakaの日記

はやめのリリース、しょっちゅうリリース

波動方程式のより原理的な導出

波動の本質的性質は任意の点における変位はその点に無限小近接する点の変位から誘起されるという点である。この本質的性質だけから波動方程式を導きたい。弦や膜といった具体的な現象から導くのは、あまりにその例へ依存してしまうから避けたい。

 

誘起されるということを力が働くと考える。(この「力」はニュートン力学における力よりも広い概念である。)この力は変位の時間変化を生み出すが、それは一階か二階か、あるいはより高階の微分のどれに影響するだろうか?

 

1階の時間微分に影響すると仮定しよう。すると波動は存在できない。これはバネの例を考えれば良い。実際、もしもバネにつながれた質点の変位が

mv=-kx

と表現される場合、その質点は往復運動をすることなく、バネの自然長に速度を落としながら近づいて、そこにたどり着いた時に静止するだけである。

 

したがって力は1階の時間微分には影響しない。

故に2階以上ということになるが、2階で十分である。

ma=-kx

であれば、質点は往復運動する。力が二回微分に作用するということが、ある意味で「時差」を生むことで、質点に往復運動する余裕を与えるのである。

 

したがって波動方程式

\dfrac {\partial ^{2}f}{\partial t^{2}}=k \times (変位を誘起する力)

という形式に「なるべき」である。(3階以上の時間微分に力が影響することもないとは言えないし、その場合どうなるか考えるのはなかなかおもしろそうである。)

 

変位を誘起する力というのは、最初に述べたとおり、その点に無限小近接する点における変位から生じる。より正確に言えば、その点における変位と無限小近接する点における変位との差によって、変位は誘起される。実際、もし二点における変位が等しいのであれば、そこには伝わるべきものは何もないのである。

従って変位を誘起する力(の一つ)は

\dfrac {\partial f}{\partial x}

によって与えられる。

 

ここで忘れてはいけないのは、力はその点に無限小近接する6点からそれぞれ生じるという点である。(空間をdx,dy,dzで無限小立方体に分割すると、一つの立方体は接する6個の立方体から力を受ける。)

 

この6つの力はx,y,z軸に沿って2つ1組にすると数式的に扱いやすくなる。実際そうするとx,y,z軸に沿う「変位の変化率の変化率」が実質的な効果として現れていると考えられる。要はx軸方向の右との変位差と左との変位差を考え、その差(つまり「差の差」)がx軸方向からの寄与として現れる。これは要するに変位の加速度である。従って無限小近接する全ての点からの寄与を考慮するならば、変位を誘起する力(のx方向からの寄与)は

\dfrac {\partial ^{2}f}{\partial x^{2}}

によって与えられるべきである。

x,y,z軸方向からの寄与はただ単純にこれらを足して

(変位を誘起する力) = \dfrac {\partial ^{2}f}{\partial x^{2}}+\dfrac {\partial ^{2}f}{\partial y^{2}}+\dfrac {\partial ^{2}f}{\partial z^{2}}

で与えられる。(方向によって比例定数が異なると考えてもいい。ただそれは波動に関して本質的ではない。)

なので結局

\dfrac {\partial ^{2}f}{\partial t^{2}} = k \left( \dfrac {\partial ^{2}f}{\partial x^{2}}+\dfrac {\partial ^{2}f}{\partial y^{2}}+\dfrac {\partial ^{2}f}{\partial z^{2}}\right)

これが「変位伝達現象」つまり波動の時間発展を記述する局所的法則であるということになる。

 

ここでやったのは変位とその伝達に関して我々が持つ自然な直感を当てはめて波動方程式を導出するということであり、何か特殊な設定を行えば、その「自然な直感」に当てはまらない例を作ることはできるだろう。例えば膜を特殊な素材で作れば、変位を誘起する力が変位差の二乗で表されるようなことになるかもしれない。

電磁気学を我流でやろうとするとどうなるか

電磁場を定める法則はニュートン方程式にならってみれば、

\dfrac {\partial  \overrightarrow {E}}{\partial t}=

という形式だろうか? あるいはより忠実に二回微分

\dfrac {\partial ^2 \overrightarrow {E}}{\partial t^2}=

であろうか。

 

しかし実際にはそうはならなかった。

それはこれらの物理量(あえて名付けるなら「電場速度」や「電場加速度」だろうか?)が我々が把握しやすいものではなかったからであろう。

ここで述べたように、物理法則はそもそもどんな物理量に注目するかが非常に重要なのである。

物理法則の法則

物理法則はある物理量に関してその性質を述べるものである。従って我々はまず物理法則によってその性質が記述されるべき物理量を定義していなくてはならない。これは当たり前のことなのだが、十分考察しておくに足るものである。

 

ニュートンが始めた力学は、物体の質量、加速度、そして物体に働く力という物理量(ここに時間を加えても良い。)を主人公とする。そしてこれら三つの物理量の間にはF=maという等式が成立すると述べている。

 

もちろんこの等式それ自身も重要だが、そもそも力学というものを研究する時m, a, Fといった物理量を主人公としようと定めたことは無視できない重要性がある。それは我々の思考のフレームワークを規定しているのであり、一度フレームワークを定めてしまえば、問題はm, a, Fの間の関係式を探れという具体的でとっつきやすい問題への変形してしまう。

 

解析力学がもたらしたパラダイム

解析力学運動方程式という微分方程式をどうやったら簡単に解けるか*1を極限まで追求する学問である。物理の問題では適切な座標系を選ぶことによって変数変換を行い、それによって運動方程式をより簡単なものへ変えるという方法論が知られている。

では与えられた力学系についてどんな座標変換を考えれば良いか、それを見つける万能の処方箋はないだろうか?

我々が物理的考察によって何とか探していた座標変換は、実は方程式の数学的構造から見れば実に必然的に見えて来るものなのである。そこで運動方程式の数学的構造を分析することになる。したがってどうしても議論は数学寄りになるし、物理的な考察というものの出番もなくなりがちである。

 

ラグランジアンLは力学系の時間発展に関する全ての情報を持つ。Lは一般に多変数関数であるから、これは力学系を一つの多変数関数で記述することを意味する。このように「系をある一つの(多変数)関数で代表させる」というのが解析力学がもたらしたパラダイムである。ちなみに量子力学ではハミルトニアンという作用素Hに量子系を代表させる。解析力学パラダイムはしっかりと受け継がれているのである。

 

Lが持つ情報とは何か。Lは関数、つまり写像である。したがってLが持つ全情報とはLの引数とLの値との対応関係に他ならない。もっとも直接的にLの情報を表現する方法は、集合Gを

G=\left\{ \left( q_{1},\ldots ,q_{n},L \right) \right\}

と定義するものである。これは空間内のある曲面とみることができる。(ようは関数Lのグラフ。)

Lが具体的な式で与えられていれば、それがLの全ての情報を表している。なぜなら引数の値を与えれば、その数式に従ってLの値が求まるからである。数式がLの情報を持っているというのはこの意味においてである。

 

各々の組みq_{1},\ldots ,q_{n}に対してどんな数Lが対応するか。それを規定するのがLであり、関数Lの全情報はそこにある。

 

さて問題はLからどうやって力学系の時間発展の情報を取り出すかということである。それがまさしくラグランジュ方程式に他ならない。ラグランジュ方程式は関数Lのq_{1},\ldots ,q_{n}に対する依存性の情報を確かに利用している。実際ラグランジュ方程式

\dfrac {d}{dt}\left( \dfrac {\partial L}{\partial \dot {q}}\right) -\dfrac {\partial L}{\partial q}=0

であり

\dfrac {\partial L}{\partial \dot {q}}

\dfrac {\partial L}{\partial q}

はLの変数q_{1},\ldots ,q_{n}に対する依存性を表現している部分と言える。つまりLの偏導関数としてLの引数依存性についての情報を抽出しているのである。

 

力学系の時間発展は変数q_{1},\ldots ,q_{n}の時間発展に他ならない。知りたいのはその時間発展を規定する法則であった。ラグランジュ方程式は時間tについての関数の組みq_{1},\ldots ,q_{n}ラグランジアンLによって代表される力学系の時間発展を表現するのであれば、それらはラグランジュ方程式を満たすということを表している。これは静的な表現であるが、動的に言えばラグランジュ方程式の各qに関数を代入して式が成立するということだ。

 

ラグランジュ方程式の面白い点は、それが座標変換によって形式が変わらないということである。

座標変換によって新しい座標系に移ると、当然力学系を記述する変数の組みも変化する。従ってラグランジアンも変化する。なぜか。力学系がある瞬間にある状態Aであったとする。座標系XではそれをXという変数値で表現し、座標系YではYで表す。ラグランジアンの値は系の状態Aに対して定まるのであるから、座標系Xにおけるラグランジアンは数の組みXに対してLという値を対応させる。一方で座標系YにおけるラグランジアンはYに対して同じLを対応させる。一般にXとYは異なる。(でなければ座標系X,Yは実は同じ座標系であったというオチになる!)であるから二つの座標系におけるラグランジアンLもそれぞれ異なる関数ということになる。

こうして導入する座標系によってラグランジアンは変わるのであるが、時間発展の情報は常にラグランジュ方程式によって取り出せるというのである!

これは一体なぜなのか?

もちろん、計算すればそうなるとか、そういうことが成り立つようにラグランジアンを定めたのだという「説明」をすることは可能である。しかし、知りたいのはそういうLが存在する理由である。

「座標系に依存せず・・・」

といえば、これは幾何学ではないか。あるいは多様体だ。

物理学では常に座標系の存在がバックグラウンドとして仮定されているが、実は座標系というのは物理法則を記述する上で絶対に必要という訳ではない。実際洗練された数学を知っているならば、そこでは座標系の存在を仮定しない形式で物事を議論する方法がある。

Lは本来力学系の状態そのものに対して数を対応させる写像である。*2関数ではない。関数は数に対して数を対応させるものだ。力学系の「状態」は座標系を導入することで数の組みとして表現可能であるとしても、それそのものは数ではなく、何かある実体である。

座標系を導入することによってLは(多変数)関数というある意味で扱いやすい対象となる訳だが、そこで失われたものは大きい。我々は常に座標系の存在を前提とせねばならず、座標系は物理法則に関係のない人間が勝手に定めた恣意的な存在であるがゆえに、それが足枷になってしまう。物理法則は本来座標系に依存しない形式で表現されるべきなのだ。これは一般相対性理論でも出て来る話であるが、何も重力を持ち出さなくても、これは当然言えることなのだ。一般相対性理論が物理を幾何学的に表現していったのはそう思えば不思議ではない。なぜなら座標系不変な性質というのは幾何学的対象=多様体が持つものであるから。

こうして物理を座標系に依存しない形式で記述したいという欲求が生まれる。しかしそれを実際に実現するためには洗練された数学的道具(多様体etc...)が必要であるため、深くは立ち入れない。*3

実のところ、座標系に依存しない形式に近い方法論はある。それが変分原理である。変分原理は相空間における力学系の状態遷移を表す曲線上でラグランジアン積分した作用は最小化(数学的厳密性が好きなら停留点)されよという哲学を持つ。

 

座標変換は変数変換を引き起こすが、変数変換は一般に座標変換ではない。座標変換はあくまで座標の変換である。一方で、方程式を純粋に数学的に眺めてみた時、変数変換を座標変換に制限する必要性はない。物理的に「座標変換」という意味を付与できない変数変換であっても、数学的にはなんら問題なく考察の範疇に含めることができる。これが数学的思考の利点である。

このような方向に議論を進めてゆくと、ハミルトニアンに到達する。

*1:微分方程式が解けることを可積分と言ったりする。

*2:量子力学におけるオブザーバブルは、量子系の状態ベクトル空間上の線形写像である。議論が似ているのは気のせいだろうか?

*3:多分シンプレクティック幾何学はここら辺の議論をもっと数学的に理論化して進めていったものではないのだろうか・・・。

ルジャンドル変換の必要性とは

参考サイト

ルジャンドル変換とはなにか(動画バージョン)

ルジャンドル変換とは何か(Legendre transformation)

ルジャンドル変換とは? – now♯

 

ある力学系の時間発展はラグランジアンLによって特徴付けられる。つまり力学系の全ての情報はLに含まれていると言える。もう少し正確に言おう。そもそもLとは何かというと、それは関数であり、関数とは変数と変数の対応関係であった。であるから系を記述する変数の組とラグランジアンの値Lとの対応関係が力学系の全ての情報を含んでいるのである。重要なのは変数と変数の対応関係それ自身である。

 

解析力学の目的は変数変換によって複雑な運動方程式を解くことである。しかし変数変換によって一般に関数が表す対応関係は変化する。それは当然で変数xと変数yとの対応関係y=y(x)と、x=x(u)である変数uと変数yとの対応関係y=y(x(u))とは異なるのは明らかだろう。(例えばxとuが同じ値であっても、一般に対応するyの値は異なる。これはx-yとu-yの対応関係が異なることをはっきりと表している。)

 

ラグランジアンの変数を単純に変換すると、Lが持っていた情報は変化してしまう。そこで変数変換を行った時、新しい変数の組に対して新しい関数Hを上手い方法で定義する必要が出てくる。つまりLが持っていた対応関係の情報と全く同一の情報(=変数依存性)をHが持つようにするのである。この「上手い」変数変換(より正確に言うと、変数の変換に伴う関数の変換)がルジャンドル変換と呼ばれているものに他ならない。

 

ルジャンドル変換がなぜ情報を保つのかは、幾何学的に考察すると分かりやすい。

 

ある幾何学的対象(曲線や曲面)を別々の見方をしていると解釈出来るからだ。LもHも同じ図形Xを再現できる。*1幾何学的対象はア・プリオリに与えられていると考え、座標系を導入することによって変数間の対応関係が規定される。つまりLもHも同じ幾何学的対象から、単に座標系の入れ方が異なるだけで生み出されているということだ。逆にLやHが与えられていれば図形Xを復元できるのだから、LもHもXが持つのと同じ情報量を持つと言える。

 

認識すべき重要な点は、変数を変換すると、関数も変換しなければならないということだ。

 

物理学でしばしば用いられる変数の変換がある。それに対する関数の変換がルジャンドル変換である。なぜこの変換が解析力学で重宝されるのかというと、それはこの変換によって得られるHについての正準方程式が、ラグランジアンLを用いたラグランジュ方程式よりも理論的に扱いやすいからであろう。(同じ情報量を持っているのに、視点によって問題が扱いやすくなる・・・これが変数変換の利点である!)

*1:これは座標幾何学の考え方であり、方程式から図形が、図形から方程式が生み出されるという考え方である。それはつまりLとHが同じ情報量を持つことを意味する。

第二ディリクレ原理について

参考文献

www.kyoritsu-pub.co.jp

 

リーマン幾何学について考えている時に、どうも色々しっくりこない時に見つけた良書。

 

「第二ディリクレ原理」とは、

 

「計算を概念的思考で置き換える」

 

こと。ごちゃごちゃ計算した後に「これが結論です」というのではなく、上手い概念を見つけ、それらを論理的に操作することで、極力計算をすることなく同じ結論に到達することを目指す。その方がより物事の真理を理解したと言えるのではないだろうか。

特殊相対性理論で重力が扱えない簡単な理由

参考文献

www.amazon.co.jp

 

アインシュタイン本人が自身の理論について説明している。しかもなんとそれが分かりやすい。アインシュタインの思考過程も垣間見ることが出来る。

物理的、直感的イメージを優先しているのが良く分かる。思考実験を巧みに用いて、物理現象の本質に迫っていく過程は、何か推理小説を読んでいるような感覚さえ覚える。

優れた理論物理学者は思考実験が上手いというのはどこかで聞いた話だが、それが実感できる。

優れた思考実験は、素朴でありながら、そこに物理理論の本質が詰め込まれているという、かなり欲張りなものである。そういう例を探してくることは、ものすごく難しい。

 

本題。

特殊相対性理論光速度不変を原理の一つとして採用している。

 

重力場が存在するとこの原理が破綻する。

 

これが特殊相対性理論で重力を扱えない理由である。ものすごく単純。

なぜ重力場が存在すると光速度が不変でなくなるのかというと、それは重力場の存在によって光の進路が湾曲することから分かる。光の進路が湾曲することは、光の速度(=運動の向き+速さ)が場所場所によって変化せざるを得ないことを意味するのだ。

 

光が空間を直進することは特殊相対論において非常に重要である。それはローレンツ変換を導く際の基本的要素であったから。もし光が場所によって(つまり重力場の存在する領域では)進行方向を変えるようなことがあると、もはやローレンツ変換を使うわけにはゆかなくなる。

 

重力場が存在する領域内においては、二つの慣性系の間の座標変換はもはやローレンツ変換ではなくなる。