/
Author: Feynman R.P. Leighton R.B. Sands M.
Tags: fizyka nauki przyrodnicze termodynamika elektrodynamika mechanika ośrodków ciągłych
ISBN: 83-01-13488-7
Year: 2001
Text
n.P. fEYNMAH, I.g.I[I[HION, M.SAHDS
Feynmana
wykłady z fizyki
Elektrodynamika
Fizyka ośrodków ciągłych
irewziCH
Konferencja Teorie relatywistyczne i grawitacja, Warszawa 1962
I.P.FEYNN1N, R.B.LEISHTON, M.SUNOS
Feynmana
wykłady z fizyki
TOM 2.2
Elektrodynamika
Fizyka ośrodków ciągłych
Wydanie trzecie
Warszawa 2001
Wydawnictwo Naukowe PWN
Dane oryginału
• Itichard P. Feynman, Robert B. Leighton, Matthew Sands
The Feynman Lectures on Physics, vol.2
Copyright © 1964, Califomia Institute of Technology
Ali rights reserved
Commemorative issue published by arrangement with the original publisher,
Addison Wesley Longman, a Pearson Education Company
Przekład z języka angielskiego
Andrzej Lenda (rozdziały 22-41)
Stanisław Bażański (rozdział 42)
Zofia Białynicka-Birula (zadania)
Redakcja naukowa
Stanisław Bażański
Projekt okładki i stron tytułowych
Joanna Sobierąj
Copyright © for the Polish edition
By Państwowe Wydawnictwo Naukowe
Warszawa 1968
Copyright © for the Polish edition
by Wydawnictwo Naukowe PWN SA
Warszawa 2001
Wydawnictwo Naukowe PWN SA
ul. Miodowa 10,00-251 Warszawa
tek: 69 54 321, e-mail: pwn@pwn.com.pl
www.pwn.com.pl
ISBN 83-01-13484-4 t.1-3
ISBN 83-01-13488-7 t.2.2
spis rzeczy
Rozdział 22. Obwody prądu zmiennego............................................ 9
22-1. Oporności pozorne................................................ 9
22-2. Generatory...................................................... 15
22-3. Sieć elementów doskonałych; prawa Kirchhoffa.................... 19
22-4. Obwody zastępcze................................................ 25
22-5. Energia......................................................... 26
22-6. Obwód łańcuchowy................................................ 28
22-7. Filtry.......................................................... 31
22-8. Inne elementy obwodu............................................ 36
Rozdział 23. Rezonatory wnękowe............................................... 40
23-1. Rzeczywiste elementy obwodu..................................... 40
23-2. Kondensator przy wielkich częstościach.......................... 42
23-3. Wnęka rezonansowa............................................... 48
23-4. Typy drgań w rezonatorach wnękowych............................. 53
23-5. Wnęki a obwody rezonansowe...................................... 56
Rozdział 24. Falowody ........................................................ 59
24-1. Linia przesyłowa................................................ 59
24-2. Falowód prostokątny............................................. 63
24-3. Częstość graniczna.............................................. 67
24-4. Prędkość fal prowadzonych....................................... 68
1 24-5. Obserwacja fal prowadzonych....................................... 69
24-6. Montaż falowodów................................................ 71
24-7. Typy drgań w falowodzie......................................... 73
24-8. Inny sposób patrzenia na fale prowadzone........................ 74
6
SPIS RZECZY
Rozdział 25. Elektrodynamika w zapisie relatywistycznym.......................... 79
25-1. Czterowektory..................................................... 79
25-2. Iloczyn skalamy................................................... 82
25-3. Gradient czterowymiarowy.......................................... 86
25-4. Elektrodynamika w zapisie czterowymiarowym........................ 90
25-5. Czteropotencjał poruszającego się ładunku......................... 91
25-6. Niezmienniczość równań elektrodynamiki............................ 92
Rozdział 26. Lorentzowskie transformacje pól..................................... 95
26-1. Czteropotencjał poruszającego się ładunku......................... 95
26-2. Pola ładunku punktowego poruszającego się ze stałą prędkością . 98
26-3. Relatywistyczna transformacja pól................................ 102
26-4. Równania ruchu w zapisie relatywistycznym........................ 110
Rozdział 27. Energia i pęd pola................................................. 115
27-1. Lokalna zasada zachowania........................................ 115
27-2. Zasada zachowania energii i elektromagnetyzm.................... 117
27-3. Gęstość energii i strumień energii w polu elektromagnetycznym . . 119
27-4. Niejednoznaczność w energii pola................................ 122
27-5. Przykłady strumienia energii..................................... 123
27-6. Pęd pola......................................................... 127
Rozdzia ł 28. Masa elektromagnetyczna........................................... 132
28-1, Energia pola dla ładunku punktowego.............................. 132
28-2. Pęd pola poruszającego się ładunku............................... 134
28-3. Masa elektromagnetyczna.......................................... 135
t 28-4. Siła, z jaką elektron działa sam na siebie.............................. 137
, 28-5. Próby zmodyfikowania teorii Maxwella.............................. 140
28-6. Pole sił jądrowych............................................... 148
RopAriał 29. Ruch ładunków w polach elektrycznych i magnetycznych............... 151
29-1. Ruch w jednorodnym polu elektrycznym lub w jednorodnym polu ma-
gnetycznym ....................................................... 151
29-2. Analiza pędu.................................................... 152
29-3. Soczewka elektrostatyczna........................................ 154
• 29-4. Soczewka magnetyczna.............................................. 155
29-5. Mikroskop elektronowy............................................ 156
29-6. Pola prowadzące w akceleratorze.................................. 157
, 29-7. Ogniskowanie metodą zmiennego gradientu........................... 160
29-8. Ruch w skrzyżowanych polach elektrycznych i magnetycznych . . 163
Rozdział 30. Wewnętrzna geometria kryształów.................................... 164
30-1. Wewnętrzna geometria kryształów................................... 164
30-2. Wiązania chemiczne w kryształach.................................. 167
30-3. Wzrost kryształów................................................. 168
304. Sieci krystaliczne................................................. 168
30-5. Symetria w dwóch wymiarach........................................ 170
30-6. Symetrie w trzech wymiarach....................................... 174
30-7. Wytrzymałość metali............................................... 176
30-8. Dyslokacje i wzrost kryształów.................................... 178
30-9. Model kryształu Bragga i Nye’a.................................... 179
SPIS RZECZY
1
Rozdział 31. Tensory.................................................... 186
31-1. Tensor polaryzowalności dielektrycznej....................... 186.
31-2. Przekształcanie składowych tensora.......................... 189
31-3. Elipsoida energii........................................... 190
31-4. Inne przykłady tensorów; tensor bezwładności................ 194
31-5. Iloczyn wektorowy........................................... 196
31-6. Tensor naprężeń............................................. 197
31-7. Tensory wyższego rzędu...................................... 202
31-8. Czterotensor pędu elektromagnetycznego...................... 203
Rozdział 32. Współczynnik załamania substancji gęstych.................... 206
32-1. Polaryzacja metali.......................................... 206
32-2. Równania Maxwella dla dielektryka........................... 209
32-3. Fale w dielektryku.......................................... 212
32-4. Zespolony współczynnik załamania............................ 216
32-5. Współczynnik załamania mieszaniny........................... 217
32-6. Fale w metalach............................................. 219
32-7. Przybliżenia małej i wielkiej częstości; głębokość naskórkowa i częstość
plazmowa........................................................ 221
Rozdział 33. Odbicie od powierzchni ......................................... 226
33-1. Odbicie i załamanie światła ................................ 226
33-2. Fale w substancjach gęstych ................................ 227
33-3. Warunki graniczne .......................................... 231
33-4. Fale odbite ' załamane ..................................... 236
33-5. Odbicie od metali.............................................. 241
33-6. Całkowite odbicie wewnętrzne .................................. 242
Rozdział 34. Magnetyzm materii............................................... 246
34-1. Diamagnetyzm i paramagnetyzm .................................. 246
34-2. Momenty magnetyczne i moment pędu ............................. 249
34-3. Precesja atomowych momentów magnetycznych ..................... 251
34-4. Diamagnetyzm .................................................. 252
34-5. Twierdzenie Larmora .......................................... 254
34-6. Fizyka klasyczna nie daje ani diamagnetyzmu, ani paramagnetyzmu 256
34-7. Moment pędu w mechanice kwantowej ............................. 258
34-8. Energia magnetyczna atomów .................................... 261
Rozdział 35. Paramagnetyzm i rezonans magnetyczny ............ 264
35-1. Skwantowane stany magnetyczne ................................. 264
35-2. Doświadczenie Sterna-Gerlacha.................................. 266
35-3. Metoda wiązek molekularnych Rabiego ........................... 268
35-4. Paramagnetyzm elementu objętości substancji ................... 272
35-5. Oziębienie przez rozmagnesowanie adiabatyczne ................. 277
35-6. Magnetyczny rezonans jądrowy................................... 278
Rozdział 36. Ferromagnetyzm ................................................. 282
36-1. Prądy namagnesowania .......................................... 282
36-2. Pole H......................................................... 289
36-3. Krzywa namagnesowania.......................................... 291
36-4. Ihdukcyjność cewki z rdzeniem żelaznym ........................ 294
36-5. Elektromagnesy ................................................ 296
36-6. Namagnesowanie spontaniczne ................................... 299
8
SPIS RZECZY
Roadriał 37. Substancje magnetyczne ............................................ 306
37-1. Istota ferromagnetyzmu ........................................... 306
37-2. Własności termodynamiczne ........................................ 312
37-3. Krzywa histerezy ................................................. 314
37-4. Materiały ferromagnetyczne ....................................... 321
37-5. Nadzwyczajne materiały magnetyczne ............................... 324
Rozdział 38. Sprężystość ....................................................... 328
38-1. Prawo Hooke’a .................................................... 328
38-2. Odkształcenia jednorodne ......................................... 331
38-3. Skracanie pręta; fale ścinania.................................... 336
38-4. Ugięcie belki .................................................... 340
38-5. Wyboczenie........................................................ 344
Rozdział 39. Ośrodki sprężyste................................................ 347
39-1. Tensor odkształceń ............................................. 347
39-2. Tensoj sprężystości ............................................ 351
39-3. Ruchy w ciele sprężystym....................................... 354
39-4. Zachowanie się niespręźyste ...................................... 359
39-5. Obliczanie stałych sprężystości .................................. 362
Rozdział 40. Przepływ „suchej wody"............................................. 368
40-1. Hydrostatyka ................................................... 368
40-2. Równania ruchu ................................................... 370
. r 40-3. Przepływ ustalony — twierdzenie Bemoulliego .......................... 375
404. Krążenie .......................................................... 381
40-5. Linie wiru ..................................................... 383
Rozdział 41. Przepływ „mokrej wody" .......................................... 387
41-1. Lepkość .......................................................... 387
41-2. Przepływ lepki ................................................... 391
41-3. Liczba Reynoldsa.................................................. 393
41-4. Opływ walca kołowego.............................................. 396
41-5. Granica lepkości zerowej.......................................... 400
41-6. „Przepływ wstęgowy” .............................................. 401
42. Przestrzenie zakrzywione . . .................................... 405
42-1. Przykłady dwuwymiarowych przestrzeni zakrzywionych ............... 405
42-2. Krzywizna w przestrzeni trójwymiarowej ........................... 413
42-3. Nasza przestrzeń jest zakrzywiona ................................ 415
42-4. Geometria czasoprzestrzeni........................................ 417
42-5. Grawitacja i zasada równoważności................................. 418
42-6. Rytm zegarów w polu grawitacyjnym................................. 419
42-7. Krzywizna czasoprzestrzeni........................................ 424
42-8. Ruch w czasoprzestrzeni zakrzywionej.............................. 425
42-9. Einsteinowska teoria ciążenia..................................... 428
Zadania ........................................................................ 431
Skorowidz ................................................................... 448
Z obwody prqdu zmiennego
- i
«<• ,<
22-1. Oporności pozorne**
Większość naszych wysiłków w tym cyklu wykładów zmierzała do otrzymania pełnych
równań Maxwella. W dwóch poprzednich rozdziałach*** rozważaliśmy konsekwencje
wynikające z tych równań. Przekonaliśmy się, że równania te opisują zarówno wszystkie
zjawiska statyczne, o których mówiliśmy wcześniej, jak i zjawiska związane z falami elek-
tromagnetycznymi i światłem, którymi to zjawiskami dość szczegółowo zajmowaliśmy
się w tomie I. Równania Maxwella opisują bądź jeden, bądź drugi rodzaj zjawisk, w za-
leżności od tego czy obliczamy pola w pobliżu ładunków i prądów, czy też od nich da-
leko. Niewiele interesującego można powiedzieć o obszarze pośrednim; żadne specjalne
zjawiska tam nie występują.
W elektromagnetyzmie pozostaje jednakże do rozważenia jeszcze kilka zagadnień,
którymi chcemy się zająć. Chcemy rozważyć zagadnienie: teoria względności a równania
Maxwella — co się stanie, gdy spojrzeć na równania Maxwella w odniesieniu do poru-
szających się układów współrzędnych. Jest także problem zasady zachowania energii
dla układów elektromagnetycznych. Następnie pozostaje do rozważenia obszerne zagad-
nienie elektromagnetycznych właściwości materii; dotąd — z wyjątkiem badania właści-
wości dielektryków — zajmowaliśmy się tylko polem elektromagnetycznym w pustej
Przestrzeni (próżni). A chociaż w tomie I (cz. 2) omówiliśmy dość szczegółowo zagadnie-
nia związane z promieniowaniem świetlnym, pozostaje kilka spraw, do których chcie-
libyśmy jeszcze raz powrócić z punktu widzenia równań pola.
W szczególności chcemy jeszcze raz zająć się zagadnieniem współczynnika załamania,
——.------_
*’Poróvvnaj t. I, cz. 1, rozdz. 22 (Algebra), rozdz. 23 (Rezonans) i rozdz. 25 (Układy liniowe', przegląd).
**’ Chodzi o rozdz. 20 i 21, które w przekładzie polskim znalazły się w 1 cz. tomu II (Przyp. red.
wyd. polskiego).
10
22. OBWODY PRĄDU ZMIENNEGO
zwłaszcza dla substancji gęstych. Pozostają jeszcze wreszcie do rozpatrzenia zjawiska do-
tyczące fal zamkniętych w ograniczonym obszarze przestrzeni. O zjawiskach tych wspo-
mnieliśmy już pokrótce, gdy omawialiśmy fale dźwiękowe. Równania Maxwella także
prowadzą, między innymi, do rozwiązań, które odpowiadają ograniczonym falom pola
elektrycznego i pola magnetycznego. Zagadnienie to ma ważne aspekty techniczne i zaj-
miemy się nim w następnych rozdziałach. Aby dojść do niego, zaczniemy od omówienia
właściwości obwodów elektrycznych dla małych częstości. Pozwoli nam to potem porów-
nać sytuacje, do których mają zastosowanie prawie statyczne przybliżenia równań Max-
wella, z sytuacjami, w których dominują efekty wielkich częstości.
Tak więc zstępujemy z niebotycznych i dostępnych tylko dla wtajemniczonych wyżyn
problemów przedstawionych w kilku poprzednich rozdziałach i zabieramy się do rozwa-
żenia stosunkowo dość banalnego zagadnienia obwodów elektrycznych. Zobaczymy
jednak, że nawet tak przyziemne zagadnienie, rozpatrywane z dostateczną wnikliwością,
może kryć w sobie sporo skomplikowanych problemów.
Pewne właściwości obwodów elektrycznych omówiliśmy już w rodź. 23 i 25 tomu I
(cz. 1). Teraz zajmiemy się niektórymi z nich ponownie, ale już bardziej szczegółowo.
Tak jak i poprzednio, będziemy rozważali tylko układy liniowe oraz napięcia i prądy,
które zmieniają się sinusoidalnie; można więc przedstawić wszystkie napięcia i prądy
za pomocą liczb zespolonych, używając zapisu w postaci funkcji wykładniczej, przedsta-
wionego w rozdz. 22 tomu I (cz. 1). Tak więc zmienne w czasie napięcie R(t) można za-
pisać jako
V(t) = Veim,> (22.1)
gdzie V jest liczbą zespoloną, niezależną od t. Rozumie się tu oczywiście, że faktyczne,
zmienne w czasie napięcie K(t) dane jest przez rzeczywistą część funkcji zespolonej, wy-
stępującej po prawej stronie tego równania.
Podobnie zakładamy, że wszystkie nasze zależne od czasu wielkości będą się zmieniać
sinusoidalnie z tą samą częstością co. Piszemy więc
/ = 7e'“’' (prąd),
• S —Seimt (siła elektromotoryczna),
E — ~Ec'a,t (pole elektryczne),
(22.2)
i tak dalej.
W większości wypadków będziemy podawać równania na V, I, ć>,... (a nie na
V, I,S,...), pamiętając jednak, że wielkości te zależą od czasu, tak jak to podano we
wzorach (22.2).
W naszych poprzednich rozważaniach o obwodach zakładaliśmy, że są nam znane
takie pojęcia jak: indukcyjność, pojemność i oporność. Teraz chcemy się zastanowić
nieco dokładniej nad tym, co należy rozumieć przez te idealne elementy obwodu. Zacznie-
my od indukcyjności*1.
ł) Zarówno w języku polskim, jak i w angielskim istnieją w tym przypadku pewne niekonsekwencje
w używanej terminologii. I tak, wydawałoby się, że poprawnie należy stosować takie terminy, jak „indukcyj-
22-1. OPORNOŚCI POZORNE
11
Indukcyjność powstaje przez nawinięcie wielu zwo-
jów drutu w kształcie cewki i wyprowadzenie obu
końców drutu do zacisków znajdujących się w pew-
nej odległości od cewki, tak jak pokazano to na
rys. 22.1. Zakładamy, że pole magnetyczne wytwo-
rzone przez prądy w cewce znajduje się praktycznie
tylko w jej bezpośrednim sąsiedztwie i nie oddziaływa
z innymi elementami obwodu. Zwykłe uzyskuje się to
nadając cewce kształt torusa lub ograniczając pole
magnetyczne przez nawinięcie cewki na odpowied-
nim rdzeniu żelaznym albo też przez umieszczenie
cewki w odpowiedniej osłonie metalowej, jak to po-
kazano schematycznie na rys. 22.1. W każdym razie za-
kładamy, że pole magnetyczne w obszarze zewnętrznym,
22.1. Cewka indukcyjna
w pobliżu zacisków a i b, można pominąć. Założymy także, że możemy pominąć
opór drutu i ładunek elektryczny pojawiający się na powierzchni drutu w związku z pow-
stawaniem pól elektrycznych.
Jeśli spełnione zostaną wszystkie założenia, otrzymamy to, co nazywamy „indukcyj-
nością” doskonałą. (Później powrócimy jeszcze do opisu indukcyjności rzeczywistej.)
Twierdzimy, że w przypadku indukcyjności doskonałej napięcie pomiędzy zaciskami
jest równe L(dljdt). Zobaczmy, dlaczego tak jest. Gdy przez indukcyjność płynie prąd,
wewnątrz cewki (indukcyjności) powstaje pole magnetyczne o natężeniu proporcjonal-
nym do tego prądu. Jeżeli prąd będzie się zmieniać w czasie, pole magnetyczne również
będzie się zmieniać. Mówiąc ogólnie, rotacja z pola E równa jest — d^idt, czyli — ina-
czej — całka krzywoliniowa z pola E wzdłuż dowolnej krzywej zamkniętej równa jest
strumieniowi wektora B przez powierzchnię ograniczoną tą krzywą. Przypuśćmy teraz,
że nasza krzywa wygląda następująco: zaczyna się przy zacisku a i biegnie wzdłuż zwo-
jów (pozostając zawsze wewnątrz drutu) do zacisku b; następnie powraca od zacisku b
do zacisku a poprzez pustą przestrzeń na zewnątrz cewki. Całkę krzywoliniową z pola E
wzdłuż takiej krzywej zamkniętej można zapisać jako sumę dwóch całek:
b a
|E-ds= J E • ds + f E-ds. (22.3)
a b
przez cewkę na zewnątrz
Jak się przekonaliśmy poprzednio, wewnątrz przewodnika doskonałego nie mogą istnieć
pola elektryczne. (Najmniejsze nawet pola prowadziłyby do powstania nieskończenie
wielkich prądów.) Wynika stąd, że całka wzdłuż drogi od a do b poprzez cewkę równa
n°sć”, „pojemność” do określania pojęć (własności obiektów), a terminy „cewka indukcyjna”, „konden-
sator” — do „nazywania” tych właśnie obiektów (elementów obwodu). Sam jednak autor twierdzi, że
w tym przypadku lepiej używać terminów, które mimo że stosowane nie zawsze poprawnie, zdobyły sobie
Pełne prawo obywatelstwa. Dlatego mówimy „indukcyjność”, rozumiejąc pod tym zarówno cewkę induk-
cyjną, jak i jej oporność indukcyjną L. Z drugiej strony, nikt nie używa terminu „oporność pojemnościowa”,
Pozostając przy zwykłej „pojemności”. (Przyp. tłum.)
12
22. OBWODY PRĄDU ZMIENNEGO
jest zeru. Całkowity wkład do całki z pola E pochodzi od krzywej łączącej zaciski a i b
na zewnątrz cewki. Ponieważ założyliśmy, że na zewnątrz osłony nie ma pola magnetycz-
nego, ta część całki nie zależy od wyboru drogi całkowania i możemy określić potencjały
obu zacisków. Różnica ich stanowi to, co nazywamy „różnicą potencjałów” albo po
prostu — napięciem V. Mamy więc
a
V= - jE-ds = -fE-ds.
b
Całka krzywoliniową wzdłuż krzywej zamkniętej określa to, co poprzednio nazwa-
liśmy siłą elektromotoryczną, i jest oczywiście równa szybkości zmian strumienia magne-
tycznego w cewce. Poprzednio przekonaliśmy się, że ta siła elektromotoryczna równa
jest szybkości zmian prądu, wziętej ze znakiem minus. Mamy więc
gdzie L jest indukcyjnością cewki. Ponieważ dljdt = icol, mamy
V = icoLI.
(22.4)
Sposób, w jaki opisaliśmy indukcyjność doskonałą, ilustruje ogólną metodę podejścia
do zagadnienia doskonałych elementów obwodu, nazywanych zwykle elementami „sku-
pionymi”. Własności elementu są w pełni opisane przez wartości prądów i napięć, któ-
re pojawiają się na zaciskach. Przez poczynienie odpowiednich założeń upraszczających
możliwe jest pominięcie złożonej natury pól powstających wewnątrz danego obiektu.
To, co się dzieje wewnątrz obiektu, jest całkowicie oddzielone od tego, co się dzieje na
zewnątrz.
Dla każdego elementu obwodu możemy znaleźć związek typu (22.4), w którym na-
pięcie jest proporcjonalne do prądu, przy czym stała proporcjonalności jest na ogół
liczbą zespoloną. Ten zespolony współczynnik proporcjonalności nazywamy opornością
pozorną i oznaczamy zwykle symbolem Z. Jest on przeważnie funkcją częstości co. Tak
więc dla dowolnego elementu skupionego może-
my napisać
V V
~ = j = Z. (22.5)
Dla indukcyjności mamy
Z (indukcyjna) = ZL — icoL. (22.6)
Jako następny doskonały element obwodu roz-
patrzmy teraz kondensator. Kondensator składa
się z pary przewodzących płytek, z których wypro-
wadzono dwa druty w postaci końcówek. Płytki
mogą mieć zupełnie dowolny kształt i często prze-
dziela się je jakimś dielektrykiem. Schemat takiego
kondensatora widzimy na rys. 22.2. I w tym wy-
22-l. OPORNOŚCI POZORNE
13
padku poczynimy kilka założeń upraszczających. Zakładamy, że płytki i druty są prze-
wodnikami doskonałymi. Zakładamy też, że izolator pomiędzy płytkami jest doskonały,
tak że ładunek elektryczny nie może przepłynąć przez niego z jednej płytki na drugą.
Następnie zakładamy, że płytki są blisko siebie, ale daleko od innych przewodników,
tak że wszystkie linie sił pola, wychodzące z jednej płytki, kończą się na drugiej. Wówczas
ładunki na obu płytkach są zawsze równe i mają przeciwny znak, przy czym ładunki na
płytkach są znacznie większe od ładunków na powierzchni przewodów doprowadzają-
cych. Załóżmy jeszcze, że w pobliżu kondensatora nie ma żadnych pól magnetycznych.
Rozważmy teraz całkę krzywoliniową z pola E wzdłuż krzywej zamkniętej, która
zaczyna się przy zacisku a, biegnie wzdłuż drutu do górnej płytki kondensatora, prze-
skakuje odstęp pomiędzy płytkami, przebiega od dolnej płytki wzdłuż drutu do zacisku b
i powraca do zacisku a poprzez przestrzeń na zewnątrz kondensatora. Ponieważ nie ma
pola magnetycznego, całka krzywoliniowa z pola E wdłuż takiej krzywej zamkniętej
jest równa zeru. Całkę tę możemy rozbić na sumę trzech całek:
jE-Js = f E-ds+ f E-ds+ f E-ds. (22.7)
wzdłuż pomiędzy na
drutów płytkami zewnątrz
Całka z pola E wzdłuż drutów jest równa zeru, ponieważ wewnątrz przewodników do-
skonałych nie ma pól elektrycznych. Całka z pola E od zacisku b do a na zewnątrz kon-
densatora jest równa różnicy potencjałów na zaciskach, wziętej ze znakiem minus. Po-
nieważ założyliśmy, że obie płytki są w jakiś sposób izolowane od otoczenia, całkowity
ładunek na nich musi być równy zeru; jeśli na górnej płytce jest ładunek Q, to na dolnej
jest równy mu co do wielkości, ale o przeciwnym znaku ładunek — Q. Przekonaliśmy się
uprzednio, że jeżeli dwa przewodniki mają równe, ale o przeciwnym znaku ładunki Q
i —Q, różnica potencjałów pomiędzy nimi wynosi Q/C, gdzie C nazywamy pojemnością
obu przewodników. Z równania (22.7) wynika, że różnica potencjałów pomiędzy za-
ciskami a i b jest równa różnicy potencjałów pomiędzy płytkami. Mamy więc
TZ
f » y = —,
C
Prąd elektryczny I, dopływający do kondensatora przez zacisk a (i opuszczający go przez
zacisk b), równy jest szybkości zmian ładunku elektrycznego na płytkach: dQjdt. Pod-
stawiając dV[dt jako iw V możemy wyrazić zależność pomiędzy prądem a napięciem dla
kondensatora w następujący sposób:
I
ia>V = —,
C
czyli
r=——. (22.8)
iwC
Oporność pozorna Z kondensatora jest więc równa
Z (pojemnościowa) = Zc = ——. (22.9)
> ia>C
14
22. OBWODY PRĄDU ZMIENNEGO
22.4. Dosfcomto cfanenty sfcnpicme obwodu
(bierne) . ,f . . , -
a) b) c) d)
Trzecim elementem obwodu, którym chce-
my się zająć, jest opór omowy. Jednakże
ponieważ nie rozważaliśmy dotąd elektrycz-
nych właściwości materiałów rzeczywistych,
nie jesteśmy jeszcze przygotowani do dysku-
sji nad tym, co się dzieje wewnątrz rzeczy-
wistego przewodnika. Będziemy musieli po
prostu zgodnie z doświadczeniem przyjąć,
że w materiałach rzeczywistych mogą istnieć
pola elektryczne, że te pola elektryczne po-
wodują przepływ ładunku elektrycznego, to
znaczy pojawienie się prądu, i że prąd ten
jest proporcjonalny do całki z pola elektrycz-
nego, wziętej od jednego końca przewodnika
do drugiego. Możemy wówczas wyobrazić
sobie idealny opornik, zbudowany tak jak
pokazuje rys. 22.3. Dwa druty, o których
zakładamy, że są przewodnikami doskonały-
mi, łączą zaciski a i b z dwoma końcami szta-
bki z materiału oporowego. Przeprowadza-
jąc rozumowanie analogiczne jak w przypad-
ku cewki i kondensatora przekonujemy się,
że różnica potencjałów pomiędzy zaciskami
a i b jest równa całce krzywoliniowej z ze-
wnętrznego pola elektrycznego, co z kolei
jest równe całce krzywoliniowej z pola elek-
trycznego, przenikającego przez naszą sztab-
kę. Wynika stąd, że prąd I przepływający
przez opornik jest proporcjonalny do napię-
cia na zaciskach V:
V
1=—,
R
gdzie R nazywamy oporem. Zobaczymy później, że zależność pomiędzy prądem a napię-
ciem dla materiałów rzeczywistych jest tylko w przybliżeniu liniowa. Przekonamy się
także, że ta przybliżona proporcjonalność okaże się niezależna od częstości zmian prą-
du i napięcia tylko w przypadku częstości niezbyt wielkich. Tak więc dla prądów zmien-
nych napięcie na końcach opornika jest zgodne w fazie z prądem, co oznacza, że oporność
pozorna jest liczbą rzeczywistą.
Z (oporowa) — ZR = R.
(22.10)
Wyniki naszych rozważań dotyczące trzech skupionych elementów obwodu przed-
ttawia rys. 22.4. Na tym rysunku, jak i na rysunkach poprzednich, zaznaczyliśmy napię-
22-1- OPORNOŚCI POZORNE
15
cie za pomocą strzałki skierowanej od jednego zacisku do drugiego. Jeżeli napięcie jest
dodatnie”, to znaczy jeżeli zacisk a ma wyższy potencjał niż zacisk b, strzałka wskazu-
je kierunek dodatniego „spadku napięcia”.
Chociaż mówimy o prądach zmiennych, możemy oczywiście uwzględnić specjalny
przypadek obwodów prądu stałego, przechodząc w naszych wzorach do granicy czę-
stości a> dążącej do zera. Dla częstości równej zeru, tzn. dla prądu stałego, oporność po-
zorna indukcyjności dąży do zera; pomiędzy końcówkami następuje zwarcie. Dla prądu
stałego oporność pozorna kondensatora dąży do nieskończoności; kondensator staje
się przerwą w obwodzie. Ponieważ oporność omowa nie zależy od częstości, jedynym
elementem obwodu prądu stałego jest opór omowy.
W opisywanych dotychczas elementach obwodu napięcie i prąd były nawzajem pro-
porcjonalne. Jeżeli znikało jedno, to znikało i drugie. Zwykle rozumujemy tak: przyło-
żone napięcie jest „odpowiedzialne” za prąd lub prąd „powoduje” powstanie napięcia
na zaciskach; tak więc w pewnym sensie elementy „reagują” na „przyłożone” warunki
zewnętrzne. Z tego powodu te elementy nazywamy elementami biernymi. Można im
przeciwstawić elementy czynne, takie jak generatory, będące źródłami zmiennych prądów
lub napięć w obwodzie. Elementami tymi zajmiemy się w paragrafie następnym.
u ’ 1
22-2. Generatory ' * 1 ’ * ’'
I ' < ' V i
Chcemy teraz pomówić o czynnym elemencie obwodu — takim, który jest źródłem
prądów i napięć w obwodzie — mianowicie o generatorze.
Przypuśćmy, że podobnie jak w wypadku indukcyjności mamy cewkę, ale o bardzo
małej liczbie zwojów, tak że możemy pominąć pole magnetyczne płynącego przez nią
prądu. Jednakże cewka ta jest umieszczona w zmiennym polu magnetycznym, na przy-
kład takim, jakie można wytworzyć za pomo-
cą obracającego się magnesu, jak to pokazano
schematycznie na rys. 22.5. (Przekonaliśmy się
wcześniej, że takie zmienne pole magnetyczne
można wytworzyć również przez odpowiedni
układ cewek z prądami zmiennymi.) Znowu
musimy dokonać kilku upraszczających zało-
żeń. Będą to takie same założenia, jakie zro-
biliśmy, gdy była mowa o indukcyjności.
W szczególności zakładamy, że zmienne pole
magnetyczne jest ograniczone do skończonego
obszaru w pobliżu cewki i że nie ma go na
zewnątrz generatora, w przestrzeni pomiędzy
zaciskami.
Przeprowadzając analogiczne rozumowanie
Jak w wypadku indukcyjności, rozważamy
całkę krzywoliniową z pola E wzdłuż zamknię-
22.5. Generator składający się z zamoco-
wanej cewki i obracającego się pola
magnetycznego
16
22. OBWODY PRĄDU ZMIENNEGO
tej pętli, która zaczyna się przy zacisku a, przebiega przez cewkę do zacisku b i powraca
do punktu początkowego poprzez przestrzeń dzielącą oba zaciski. I tym razem dochodzi-
my do wniosku, że różnica potencjałów pomiędzy zaciskami jest równa całce krzywo-
liniowej wzdłuż pętli:
r=-jE-rfs.
Ta całka krzywoliniowa jest równa sile elektromotorycznej w obwodzie, tak więc różni-
ca potencjałów pomiędzy zaciskami generatora jest równa szybkości zmian strumienia
magnetycznego przenikającego cewkę:
d
V = —fi (strumienia). (22.11)
W przypadku generatora doskonałego zakładamy, że strumień magnetyczny przenika-
jący cewkę jest określony przez warunki zewnętrzne, takie jak prędkość kątowa obrotu
pola magnetycznego, i że nie wpływają nań prądy przepływające przez generator. Tak
więc generator — a przynajmniej rozważany przez
nas generator doskonały — nie jest opornością. Róż-
nica potencjałów pomiędzy zaciskami jest okrę-
cę ślona poprzez dowolnie zadaną siłę elektromo-
toryczną &(t). Taki doskonały generator przed-
, | h | V stawiamy za pomocą symbolu pokazanego na
ki J 1 rys. 22.6. Mała strzałka pokazuje kierunek siły
.,< > 1 / elektromotorycznej, w wypadku kiedy jest ona
, b O , dodatnia. Dodatnia siła elektromotoryczna w gene-
ratorze z rys. 22.6 wytwarza napięcie V — S, przy
22.6. Symbol oznaczający generator czym potencjał zacisku a jest wyższy niż potencjał
doskonały zacisku b.
22.7. Generator składający się z cewki obracającej się w stałym polu magnetycznym
22-2. GENERATORY
17
Można zbudować generator w inny sposób. Generator taki będzie się różnił od ge-
neratora opisanego powyżej, jeżeli chodzi o konstrukcję wewnętrzną, ale będzie iden-
tyczny z punktu widzenia tego, co się dzieje na zewnątrz, poza zaciskami. Przypuśćmy,
że mamy cewkę z drutu, która obraca się w stałym polu magnetycznym, tak jak pokazano
to na rys. 22.7. Istnienie pola magnetycznego zaznaczono schematycznie na rysunku
przez umieszczenie sztabki magnesu; można by ją oczywiście zastąpić innym źródłem
stałego pola magnetycznego, np. dodatkową cewką z prądem stałym. Jak pokazano na
rysunku, połączenia cewki z otoczeniem zrealizowano za pomocą kontaktów ślizgowych.
I tym razem interesuje nas różnica potencjałów pojawiająca się pomiędzy zaciskami a i b,
która jest oczywiście równa całce z pola elektrycznego, od zacisku a do zacisku b, wzdłuż
drogi leżącej na zewnątrz generatora.
Tym razem w układzie z rys. 22.7 nie ma zmiennych pól magnetycznych; na pozór
mogłoby się więc wydawać dziwne, w jaki sposób na zaciskach generatora w ogóle może
się pojawić napięcie. Istotnie, wewnątrz generatora nie ma żadnych pól elektrycznych.
Jak zwykle, w przypadku naszych elementów doskonałych zakładamy, że przewody
wewnątrz generatora są zrobione z materiału doskonale przewodzącego, a jak mówi-
liśmy już wiele razy, pole elektryczne wewnątrz doskonałego przewodnika jest równe
zeru. Ale okazuje się, że to twierdzenie jest fałszywe w przypadku, gdy przewodnik po-
rusza się w polu magnetycznym. Prawdziwe jest natomiast twierdzenie, że całkowita
siła działająca na każdy ładunek wewnątrz przewodnika doskonałego musi być równa
zeru. W przeciwnym bowiem wypadku następowałby nieskończenie wielki przepływ ła-
dunków swobodnych. Tak więc jest zawsze prawdą, że suma pola elektrycznego E i ilo-
czynu wektorowego prędkości przewodnika przez pole magnetyczne B, która jest całko-
witą siłą działającą na ładunek, musi być wewnątrz przewodnika równa zeru:
F = E+VXB = 0 (wewnątrz Przewodnika^
\ doskonałego ) ’ v '
gdzie v jest prędkością przewodnika. Nasze poprzednie twierdzenie, mówiące, że wewnątrz
przewodnika doskonałego nie istnieje pole elektryczne, pozostaje prawdziwe, jeżeli pręd-
kość przewodnika, v, jest równa zeru; w innych wypadkach poprawne twierdzenie jest
dane w postaci równania (22.12).
Powracając do naszego generatora (rys. 22.7) widzimy teraz, że całka krzywoliniowa
z pola elektrycznego E, od zacisku a do zacisku b, wzięta wzdłuż drogi „prowadzącej”
wewnątrz generatora, musi być równa (ze znakiem minus) całce krzywoliniowej z vxB
wziętej wzdłuż tej samej drogi:
J E-u's=— J (vxB)-Js. (22.13)
a a
wewnątrz wewnątrz
r ... przewodnika przewodnika
Nadal pozostaje jednak prawdą, że całka krzywoliniowa z pola E wzdłuż pętli zamknię-
tej, której część stanowi powrót z b do a na zewnątrz generatora, musi być równa zeru,
Ponieważ nie ma zmiennych pól magnetycznych. Tak więc nasza pierwsza całka w równa-
2 Wykia<jy z fizyki
18
22 OBWODY PRĄDU ZMIENNEGO
niu (22.13) jest także równa V, napięciu pomię-
dzy zaciskami. Okazuje się, że całka po prawej
stronie równania (22.13) określa po prostu szyb-
kość zmian strumienia przenikającego cewkę. Szyb-
kość ta, jak wynika z reguły strumienia, równa
jest sile elektromotorycznej w cewce. A więc zno-
wu różnica potencjałów pomiędzy zaciskami jest
równa sile elektromotorycznej w obwodzie, zgod-
nie z równaniem (22.11). Tak więc, czy mamy gene-
rator, w którym pole magnetyczne zmienia się wo-
kół nieruchomej cewki, czy też generator, w któ-
rym cewka porusza się w stałym polu magnetycz-
nym, ich „efektywne” właściwości są takie same.
Pomiędzy zaciskami powstaje napięcie V, które
nie zależy od prądu w obwodzie, a zależy jedynie
od dowolnie określonych warunków wewnątrz generatora. Ponieważ staramy się zro-
zumieć działanie generatorów z punktu widzenia równań Maxwella, możemy się również
zainteresować zwykłym ogniwem chemicznym, takim np. jak bateryjka latarki. Jest
to również generator, tzn. źródło napięcia, chociaż występuje jedynie w obwodach
prądu stałego. Najprostszy schemat ogniwa pokazano na rys. 22.8. Widzimy tu dwie
metalowe płytki zanurzone w roztworze jakiejś substancji chemicznej. Przypuśćmy, że
roztwór ten zawiera jony dodatnie i ujemne oraz że jedne z nich, powiedzmy jony uje-
mne, są o wiele cięższe od jonów naładowanych przeciwnie, tak że prędkość ich ruchu
w roztworze, zachodzącego wskutek dyfuzji, jest dużo mniejsza od prędkości jonów
dodatnich. Przypuśćmy dalej, że udało się nam w jakiś sposób uzyskać różne stężenie
roztworu w poszczególnych partiach cieczy, tak że liczba jonów obu znaków jest dużo
większa w pobliżu np. dolnej płytki niż w okolicach płytki górnej. Z powodu swej znacz-
nej ruchliwości jony dodatnie będą przechodzić szybciej do obszarów o niższym stężeniu,
tak że na górnej płytce wytworzy się nadwyżka ładunku dodatniego. Płytka górna
będzie więc naładowana dodatnio, a dolna uzyska pewien wypadkowy ładunek
ujemny.
W wyniku dyfuzji coraz to nowych jonów w kierunku górnej płytki potencjał jej bę-
dzie wzrastać do momentu, w którym siła działająca na jony ze strony wytworzonego
pomiędzy płytkami pola elektrycznego dokładnie skompensuje różnicę ich ruchliwości.
Tak więc po krótkim czasie pomiędzy płytkami ogniwa wytworzy się różnica potencja-
łów, charakterystyczna dla parametrów wewnętrznych danego ogniwa.
Przeprowadzając rozumowanie identyczne, jakie przeprowadziliśmy w przypadku
kondensatora, przekonamy się, że różnica potencjałów pomiędzy zaciskami a i b jest
równa całce krzywoliniowej z pola elektrycznego, istniejącego pomiędzy płytkami w sy-
tuacji, gdy nie ma już wypadkowej dyfuzji jonów. Oczywiście, pomiędzy takim ogniwem
chemicznym a kondensatorem istnieje zasadnicza różnica. Jeśli zewrzemy na chwilę
zaciski kondensatora, ulegnie on rozładowaniu, po czym nie wystąpi już różnica napięć
pomiędzy zaciskami, W wypadku ogniwa chemicznego możemy pobierać z jego zacisków
22-2
generatory
19
prąd w sposób ciągły, co nie powoduje zmiany siły elektromotorycznej, dopóki oczy-
wiście składniki chemiczne ogniwa nie zostaną zużyte. Okazuje się, że w rzeczywistym
ogniwie napięcie pomiędzy końcówkami maleje ze wzrostem pobieranego prądu. Pozo-
stając jednak w kręgu naszych abstrakcyjnych rozważań możemy sobie wyobrazić ogni-
wo doskonałe, w którym napięcie pomiędzy zaciskami jest niezależne od prądu. Rze-
czywiste ogniwo można wówczas rozpatrywać jak ogniwo doskonałe, połączone szere-
gowo z pewną opornością.
'*'1 J “ < / J * V ł
22-3. Sieć elementów doskonałych; prawa Kirchhoffa
Z poprzedniego paragrafu przekonaliśmy się, że opis doskonałego elementu obwodu,
oparty na analizie zjawisk zachodzących na zewnątrz elementu, jest całkiem prosty. Po-
między prądem a napięciem istnieje zależność liniowa. Ale to, co dzieje się wewnątrz ele-
mentu, jest wielce skomplikowane, a dokładny opis tych zjawisk w świetle równań Maxwella
napotyka poważne trudności. Wyobraźmy sobie próbę dokładnego opisu pól elektrycz-
nych i magnetycznych wewnątrz radioodbiornika, który zawiera setki oporników, kon-
densatorów i cewek indukcyjnych. Analiza takiego układu przy pomocy równań Maxwella
jest zadaniem ponad siły. Ale poczyniwszy wiele upraszczających założeń opisanych
w §22-2 i wyrażając podstawowe cechy rzeczywistych elementów obwodu w języku ide-
alizacji będziemy mogli dokonać analizy obwodu elektrycznego w stosunkowo prosty
sposób. Pokażemy teraz, jak to można zrobić.
Przypuśćmy, że mamy obwód zawierający ge-
nerator i kilka połączonych oporności pozornych,
jak na rys. 22.9. Zgodnie z naszymi upraszczają-
cymi założeniami w otoczeniu poszczególnych ele-
mentów obwodu nie ma pola magnetycznego. Stąd
całka krzywoliniowa z pola E wzdłuż krzywej,
która nie przechodzi przez żaden z elementów,
równa jest zeru. Rozważmy więc krzywą JT, ozna-
czoną na rys. 22.9 linią przerywaną, łączącą po-
szczególne punkty obwodu. Całka krzywoliniowa
z pola E, wzięta wzdłuż tej krzywej, składa się
z kilku całek; każda z nich jest całką krzywoli-
niową wzdłuż krzywej łączącej zaciski danego
dementu obwodu. Taką całkę krzywoliniową
określiliśmy jako spadek napięcia na elemencie
obwodu. A więc pełna całka krzywoliniowa jest
r°wna po prostu sumie spadków napięć na wszy-
stkich elementach obwodu:
jE-t/s = Vvn.
22.9. Suma spadków napięć wzdłuż
każdego zamkniętego obwodu jest
równa zeru
e
20
22. OBWODY PRĄDU ZMIENNEGO
Ponieważ całka krzywoliniowa jest równa zeru, wynika stąd, że suma różnic potencjałów
jest równa zeru wzdłuż każdej pełnej pętli sieci:
2* F„ = 0. (22.14)
. . i wzdłuż każdej
pętli
Rezultat ten wynika z jednego z równań Maxwella, mówiącego, że w obszarze, gdzie
nie ma pól magnetycznych, całka krzywoliniowa z pola E wzdłuż każdej zamkniętej pętli
jest równa zeru.
Przypuśćmy, że rozważamy teraz obwód taki jak na rys. 22.10. Linia pozioma łącząca
zaciski a, b, c i d wskazuje, że wszystkie te zaciski są złączone razem lub też połączone
drutami o oporze możliwym do pominięcia. W każdym razie oznacza to, że zaciski a,
b, ci d mają wszystkie ten sam potencjał, podobnie jak i zaciski e,f, g, h mają jeden wspól-
ny potencjał. Wówczas spadek napięcia, V, na każdym z czterech elementów jest taki
sam.
Jedno z naszych upraszczających założeń mówiło, że ładunki elektryczne zbierające
się na wyjściu oporności pozornych można pominąć. Z kolei zakładamy, że ładunki
elektryczne na przewodach łączących oporności pozorne można również pominąć. Wów-
czas z zasady zachowania ładunku wynika, że każdy ładunek opuszczający jeden element
obwodu musi natychmiast dopływać do innego elementu obwodu lub, co na to samo wy-
chodzi, żądamy, aby algebraiczna suma prądów dopływających do danego rozgałęzienia
była równa zeru. Przez rozgałęzienie rozumiemy dowolny układ zacisków, takich jak
a, b, c i d, które są połączone. Taki układ połączonych zacisków zwykle nazywamy „wę-
złem”. Z zasady zachowania ładunku wynika wówczas; że dla obwodu takiego jak na
rys. 22.10
Zi-Z2-Z3-Z4 = 0. ' (22.15)
Suma prądów dopływających do węzła złożonego z czterech zacisków e,/, g i h musi być
także równa zeru:
—Zi+Zj-j-Zj+Zł = 0. (22.16)
Jest to oczywiście takie samo równanie, jak równanie (22.15). Te dwa równania
są zależne. Ogólne prawo mówi, że suma prądów w każdym węźle musi być rów-
na zeru:
w węźle
Nasz poprzedni wniosek mówiący, że suma spadków napięć jest równa zeru
wokół każdej zamkniętej pętli, musi mieć zastosowanie do każdej pętli, jaką możemy
wyodrębnić z danej sieci. Również nasz wniosek, że suma prądów w węźle jest rów-
na zeru, musi być prawdziwy dla każdego węda. Te dwa równania są znane jako prawa
Kirchhoffa. Przy pomocy tych dwóch praw można znaleźć prądy i napięcia w dowo-
lnej sieci.
22-3. SIEĆ ELEMENTÓW DOSKONAŁYCH; PRAWA KIRCHHOFFA
21
przypuśćmy, że rozważamy bardziej złożony obwód (rys. 22.11). Jak znaleźć prądy
i napięta w tym obwodzie? Możemy to zrobić w taki oto bezpośredni sposób. Rozważa-
my oddzielnie każdą z czterech pomocniczych zamkniętych pętli znajdujących się w obwo-
dzie. (Jedna taka pętla zaczyna się na przykład przy zacisku a, przechodzi poprzez za-
ciski b i e do zacisku d i stamtąd powraca do zacisku a.) Dla każdej z tych pętli wypisu-
jemy równanie pierwszego prawa Kirchhoffa mówiące, że suma napięć wokół każdej
pętli jest równa zeru. Musimy pamiętać, że spadek napięcia liczymy jako dodatni, gdy
posuwamy się zgodnie z kierunkiem prądu, a jako ujemny, jeżeli posuwamy się wzdłuż
elementu w kierunku przeciwnym niż prąd; musimy też pamiętać, że spadek napięcia na
generatorze, jeżeli posuwamy się zgodnie z kierunkiem jego siły elektromotorycznej,
jest równy tej SEM ze znakiem ujemnym. Tak więc rozważając małą pętlę zaczynającą
się i kończącą przy zacisku a otrzymujemy
=0.
Stosując to samo prawo do pozostałych pętli
otrzymamy jeszcze trzy dalsze równania tego sa-
mego typu.
Następnie musimy napisać równanie prądu
dla każdego węzła obwodu. Sumując na przy-
kład prądy w węźle przy zacisku b otrzymamy
równanie:
Z1-Z3-/2 = 0.
Podobnie dla węzła e otrzymamy równanie
prądu:
Ą—Zł+Ą Z5 = 0,
Dla rozpatrywanego obwodu otrzymamy pięć ta-
kich równań prądu. Okazuje się jednak, że dowo-
lne z tych równań można wyprowadzić z pozosta-
łych czterech, tak że są tylko cztery niezależne
równania prądu. Mamy zatem układ ośmiu nie-
zależnych równań liniowych: cztery równania
na napięcie i cztery równania na prąd. Rozwiązu-
jąc te osiem równań otrzymamy osiem szukanych
Prądów. Jeżeli już znamy prądy, to nasz obwód
Jest całkowicie określony. Spadek napięcia na każ-
dym elemencie określa iloczyn prądu przez dany
element i jego oporności pozornej (lub w wypadku
gdy element jest źródłem napięcia, spadek napięcia
na nim jest już znany).
22.10. Suma prądów w każdym węźle
jest równa zeru
22.11. Opis obwodu przy pomocy
praw Kirchhoffa
22
22. OBWODY PRĄDU ZMIENNEGO
22.12. Obwód, który można opisać przy
pomocy metody połączeń szeregowych
i równoległych
Widzieliśmy, że wypisując równania prądu
otrzymaliśmy jedno równanie, które jest zależne
od pozostałych. Ogólnie biorąc, może się zdą-
żyć, że wypiszemy również zbyt wiele równań
napięcia. Tak na przykład w obwodzie z rys. 22.11
oprócz rozważanych przez nas czterech małych
pętli istnieje spora liczba innych pętli, dla których
moglibyśmy napisać równanie dla napięć. A więc
dla pętli abcfeda lub dla innej pętli — abcfehgda.
Widać, że jest wiele takich pętli. Analizując ob-
wód złożony bardzo łatwo można otrzymać zbyt
dużo równań. Istnieją reguły, które określają
procedurę prowadzącą do otrzymania najmniej-
szej liczby równań, ale zwykle przy odrobinie
zastanowienia się możemy dostrzec, jak otrzy-
mać właściwą liczbę równań o najprostszej po-
staci. Poza tym wypisanie jednego lub dwóch
dodatkowych równań nie przynosi żadnej szko-
dy. Nie doprowadzą one do niewłaściwych wy-
ników, a najwyżej narażą nas na trochę nie-
potrzebnych rachunków.
Dobrą ilustracją tej metody są poniższe dwa
elementarne przykłady. Przypuśćmy, że mamy
obwód składający się z dwóch elementów mają-
cych oporności pozorne ZŁ i Z2. Łączymy je
szeregowo (rys. 22.12a) i przykładamy napięcie 8.
Co się stanie? Otóż jeśli Z jest prądem płynącym
przez oporność Z2, to spadek napięcia na ZŁ
wyniesie Kx = IZV, a spadek napięcia na Z2
będzie równy V2 — IZ2 Mamy tu tylko jedną
pętlę. Stosując do niej prawo Kirchhoffa
(22.14) widzimy, że
K2 + P2-<? = 0,
czyli
<r= rx+r2 = (z1+z2)z. .
Oznacza to, że napięcie przyłożone do całego
obwodu można zapisać jako S = IZS, gdzie Zs
jest opornością zastępczą całego obwodu, równą
sumie oporności pozornych obu jego elementów:
z, - Zx+Z2.
(22.18)
22-3. SIEĆ ELEMENTÓW DOSKONAŁYCH; PRAWA KIRCHHOFFA 23
Często spotyka się również inne połączenie dwóch elementów o opornościach pozornych
2 i Z2, zwane połączeniem równoległym (rys. 22.12b). W obwodzie tym występują dwa
węzły (/ i 2) i trzy pętle F2: &-Z2- I\.ZX-Z2-Z^). Z prawa Kirchhoffa
(22.14) otrzymujemy dwa niezależne równania dla spadków napięć:
pętla I\: V\ — 2 = 0;
pętla r2: V2— 2 = 0; ' -
a z prawa Kirchhoffa (22.17) jedno równanie dla prądów:
węzeł 1: /-Ą—/2=0.
Podstawiając do pierwszych dwóch równań V\ = ItZr i V2 = I2Z2 eliminujemy z po-
wyższych trzech równań prądy Ą i I2 i otrzymujemy
(1/Z1)+(1/Z2) ’
Związek ten oznacza, że napięcie na zaciskach ogniwa 2 można wyrazić w postaci 2 =
= IZR za pomocą prądu I płynącego przez ogniwo i zastępczej oporności pozornej
1 ZtZ2
z„ -----------= —(22.19)
R (1/Z1)+(1/Z2) Z,+Z2 V
Bardziej skomplikowany obwód można często analizować stosując kolejno powyższe
wzory dla połączeń równoległych i szeregowych kilku oporności pozornych. W ten spo-
sób można na przykład analizować obwód z rys. 22.12c. Najpierw można zastąpić rów-
nolegle połączone oporności pozorne Z4 i Z5 ich pozorną opornością zastępczą, podobnie
jak i oporności pozorne Z6 i Z7. Następnie możemy dodać do siebie oporność pozorną
Z2 i pozorną oporność wypadkową równolegle połączonych oporności pozornych Z6
i Z7, korzystając z reguły dodawania oporności połączonych szeregowo. Postępując w ten
sposób można zredukować cały obwód do generatora połączonego szeregowo z jedną
opornością pozorną Z. Prąd płynący przez generator jest wówczas równy po prostu
ó/Z. Następnie powtarzając wstecz całą operację można znaleźć prądy w każdej z opor-
ności pozornych.
22.13. Obwód, którego nie można opisać przy pomocy metody połączeń szeregowych i równoległych
24
22. OBWODY PRĄDU ZMIENNEGO
Istnieją jednakże całkiem nieskomplikowane
obwody, do których ta metoda opisu nie ma
zastosowania, jak na przykład obwód z rys. 22.13.
Aby zanalizować taki obwód, musimy wypisać
równania prądu i napięcia, wynikające z praw
Kirchhoffa. Zróbmy to. Mamy tylko jedno rów-
nanie prądu:
Ą-HĄ-Hs — 0,
z którego natychmiast wynika, że
22.14. Mostek ~ (A+Zz)-
Aby uprościć nasze rachunki, skorzystajmy od
razu z powyższego wyniku wypisując równania
napięć. Dla tego obwodu są dwa niezależne
równania napięć; mianowicie
— & — 0
oraz
^2— —ĄZ2 = 0.
Mamy więc dwa równania i dwa szukane prądy.
Obliczając z tych równań Ą i I2 otrzymujemy
22.15. Każdy dwuzaciskowy obwód
złożony z elementów biernych jest
równoważny zastępczej oporności po-
zornej
(22.20)
(22.21)
b)
Z2S2—(Z2-irZ2)^1
1 = Zt(Z2+Z3)+Z2Z3
oraz
r ZtS2-\-Z2Sx
i. r- t ~ «
Z1(Z2+Z3)+Z2Z3
Suma tych dwóch prądów określa nam prąd I3.
Inny przykład obwodu, którego nie można za-
nalizować przy pomocy reguł na szeregowe i rów-
noległe łączenie oporności pozornych, pokazano
na rys. 22.14. Taki obwód nazywamy „mostkiem”;
występuje on często w przyrządach służących do
pomiaru oporności pozornych. W wypadku takiego
układu interesuje nas zwykle odpowiedź na nastę-
pujące pytanie: Jakie zależności muszą panować
pomiędzy poszczególnymi opornościami pozorny-
mi, aby przez oporność pozorną Z3 nie płynął
prąd? Znalezienie odpowiedzi na to pytanie pozo-
stawiamy czytelnikowi.
22-4. OBWODY ZASTĘPCZE
25
22-4. Obwody zastępcze
przypuśćmy, że do obwodu zawierającego skomplikowane połączenia oporności po-
zornych podłączymy generator o sile elektromotorycznej S, jak pokazano schematycz-
nie na rys. 22.15a. Wszystkie równania, które otrzymujemy z praw Kirchhoffa, są liniowe,
tak że gdy obliczymy z nich prąd / przepływający przez generator, przekonamy się, iż
prąd ten jest proporcjonalny do siły elektromotorycznej S. Możemy to zapisać w posta-
ci zależności
S
Z*
gdzie Zef jest teraz pewną liczbą zespoloną, funkcją algebraiczną wszystkich elementów
obwodu. (Jeżeli poza wspomnianym generatorem obwód nie zawiera innych generato-
rów, to w powyższym wzorze nie ma dodatkowego członu, niezależnego od siły elektromo-
torycznej.) Ale równanie to jest identyczne z równaniem, jakie napisalibyśmy dla obwodu
z rys. 22.15b. Dopóki interesujemy się tylko tym, co dzieje
się po lewej stronie dwóch zacisków a i b, oba obwody
z rys. 22.15 są równoważne. Możemy więc wypowiedzieć
ogólne twierdzenie, że dowolną sieć o dwóch zaciskach, skła-
dającą się z elementów biernych, można zastąpić pojedynczą
opornością pozorną Zef, co nie zmieni prądów i napięć
w pozostałej części obwodu. Twierdzenie to jest oczywiście
dalszym wnioskiem wypływającym z praw Kirchhoffa,
a przede wszystkim z liniowości równań Maxwella.
Powyższą metodę można uogólnić dla obwodu, który
prócz oporności pozornych zawiera również generatory.
Przypuśćmy, że rozpatrujemy taki obwód „z punktu widze-
nia” jednej z oporności pozornych, którą oznaczamy Zn,
jak na rys. 22.16. Jeżeli rozwiązalibyśmy równanie dla ca-
łego obwodu, okazałoby się, że napięcie Vn pomiędzy za-
ciskami a i b jest liniową funkcją I, co możemy za-
pisać jako
V. =
(22.22)
gdzie wielkości A i B zależą od generatorów i od oporności
Pozornych w części obwodu na lewo od zacisków. Tak na
Przykład dla obwodu z rys. 22.13 znajdujemy = ItZi.
Można to zapisać [korzystając z równania (22.20)]
w Postaci zależności
-Z2Z3 It. (22.23)
Z2+Z3 V
Pełne
rozwiązanie otrzymamy zestawiając teraz to równa-
22.16. Każdy dwuzaciskowy
obwód można zastąpić ge-
neratorem połączonym sze-
regowo z opornością pozor-
ną
a)
b)
26
22. OBWODY PRĄDU ZMIENNEGO
nie z równaniem dla oporności pozornej Z1; a mianowicie z V\ = I1Z1 lub w wypadku
ogólnym — zestawiając równanie (22.22) z równaniem
V =J7
Jeżeli teraz rozważymy przypadek, w którym oporność pozorna Zn jest przyłączona
do prostego obwodu, składającego się z połączonych szeregowo generatora i oporności,
jak na rys. 22.15b, to równaniem będącym odpowiednikiem równania (22.22) jest rów-
nanie
Vn = ^ef-4Zef,
które jest identyczne z równaniem (22.22), jeżeli podstawimy Se! — A i Zef = B. Tak
więc, jeżeli interesuje nas tylko to, co dzieje się na prawo od zacisków a i b, dowolny obwód
z rys. 22.16 można zawsze zastąpić równoważnym mu szeregowym połączeniem genera-
tora z opornością pozorną.
22-5. Energia
• . । 1.,
Widzieliśmy, że aby przez oporność indukcyjną przepływał prąd I, musi zostać do-
starczona z obwodu zewnętrznego energia U = %LI2. Kiedy prąd opada z powrotem
do zera, energia ta zostaje zwrócona obwodowi zewnętrznemu. W wypadku doskonałej
oporności indukcyjnej nie zachodzi więc zjawisko straty energii. Gdy przez oporność
indukcyjną przepływa prąd zmienny, energia jest ciągle wymieniana pomiędzy tą opor-
nością a resztą obwodu, ale średnia szybkość, z jaką energia jest dostarczana obwodowi,
równa jest zeru. Mówimy, że oporność indukcyjna jest elementem nie rozpraszającym;
energia elektryczna nie jest rozpraszana, czyli — innymi słowy — nie jest „tracona”
w takim elemencie obwodu.
Podobnie, energia kondensatora U = \CV2 zostaje w czasie jego rozładowywania
zwrócona do obwodu zewnętrznego. Kiedy kondensator znajduje się w obwodzie prądu
zmiennego, energia do niego dopływa i od niego odpływa, ale wypadkowy strumień ener-
gii w każdym okresie jest równy zeru. Doskonały kondensator jest więc także elementem
nie rozpraszającym.
Wiemy, że siła elektromotoryczna jest źródłem energii. Gdy prąd I płynie zgodnie
z kierunkiem siły elektromotorycznej, energia jest dostarczana do obwodu zewnętrznego
z szybkością dUjdt = SI. Jeżeli zaś prąd — pochodzący od innego generatora w obwo-
dzie — będzie przepływać w kierunku przeciwnym do kierunku siły elektromotorycznej,
SEM będzie pochłaniać energię też z szybkością SI; teraz jednak ponieważ I jest ujemne,
dUjdt będzie również ujemne.
Jeżeli generator połączony jest z opornikiem R, prąd przepływający przez opornik
jest równy I = S/R. Energia dostarczana przez generator z szybkością I jest zatem
przez opornik pochłaniania. Ta część energii elektrycznej obwodu zmienia się w opor-
niku w energię cieplną i jest z obwodu tracona. Mówimy wtedy, że energia elektryczna
jest w oporniku rozpraszana. Przy tym jest ona tam rozpraszana z szybkością równą
dU/dt = RI2.
22-5. ENERGIA
27
Średnia strata energii w obwodzie prądu zmiennego na
oporniku jest równa średniej z RI2 dla jednego okresu,
ponieważ I = Źe'“' — co w rzeczywistości oznacza, że I
zmienia się jak coscot — średnia z I2 dla jednego okresu jest
równa |Z|2/2, maksymalny bowiem prąd jest równy |Z|,
średnia z cos2wt wynosi |.
Co możemy powiedzieć o stratach energii w wypadku,
gdy generator jest połączony z dowolną opornością pozorną
2? (Przez „stratę” rozumiemy oczywiście przemianę energii
elektrycznej w energię cieplną.) Dowolną oporność pozorną
Z można zapisać w postaci sumy jej części rzeczywistej
i części urojonej, tzn.
Z = R+iX,
22.17. Każda oporność po-
zorna jest równoważna po-
łączeniu szeregowemu czy-
stego oporu i czystej opor-
ności urojonej
(22.24)
gdzie R i X są liczbami rzeczywistymi.
Z punktu widzenia obwodów zastępczych można powiedzieć, że każda oporność po-
zorna jest równoważna szeregowemu połączeniu oporu i czysto urojonej oporności po-
zornej*1, jak to pokazano na rys. 22.17.
Przekonaliśmy się poprzednio, że oporność pozorna obwodu zawierającego tylko
elementy L i C jest liczbą czysto urojoną. Ponieważ średnia strata energii w każdym z ele-
mentów L i C jest równa zeru, dla czystej oporności urojonej składającej się z elementów
L i C nie mamy straty energii. Powyższy wniosek, jak łatwo stwierdzić, musi być ogólnie
słuszny, tzn. dla dowolnej oporności urojonej.
Jeżeli generator o sile elektromotorycznej jest połączony z opornością pozorną
z rys. 22.17, siła elektromotoryczna musi być związana z prądem płynącym z generatora
równaniem:
= I(R+iX). (22.25)
Aby znaleźć średnią szybkość, z jaką energia jest dostarczana, potrzebna nam jest średnia
z iloczynu SI. Musimy teraz być ostrożni. W wypadku takich iloczynów istotnymi dla
nas wielkościami są wielkości rzeczywiste S(f) i I(i). (Części rzeczywiste funkcji zespo-
lonych mogą służyć do opisu wielkości fizycznych tylko w wypadku, gdy odpowiednie
równania będą równaniami liniowymi; tymczasem teraz rozważamy iloczyny, które z pew-
nością nie są liniowymi).
Przypuśćmy, że wybraliśmy tak początek liczenia czasu t, że amplituda I jest liczbą
rzeczywistą, równą powiedzmy Zo; wówczas faktyczna zmiana prądu I w czasie będzie
równa
Z=Z0coscor,
*1 W literaturze, zwłaszcza technicznej, opór rzeczywisty często nazywa się rezystancją, a oporność
dojoną — reaktancją. (Przyp. tłum.)
28
22. OBWODY PRĄDU ZMIENNEGO
a SEM z równania (22.25) będzie częścią rzeczywistą wielkości Ioe,‘“‘(R+iX), czyli
= I0R cos tor—I0X sin tor. (22.26)
Te dwa człony w równaniu (22.26) odpowiadają spadkom napięcia na elementach
R i X (rys. 22.17). Widzimy, że spadek napięcia na oporze jest zgodny w fazie z prądem,
podczas gdy spadek napięcia na czysto urojonej części oporności jest z prądem w fazie
przeciwny.
Średnia strata energii z generatora, (Py^, jest całką z iloczynu SI po jednym okre-
sie zmian, podzieloną przez okres T; innymi słowy
1 T T T
(Pyic = — J* Sldt =~ J" I%R cos2 (ot dt—— J" IqX coscot sincot dt.
0 0 o
Pierwsza całka po prawej stronie równania równa jest \IqR, a druga całka — zeru.
Tak więc średnia strata energii na oporności pozornej Z = RĄ-iX zależy tylko od rzeczy-
wistej części Z i równa jest loRfl, co jest zgodne z naszym poprzednim wynikiem doty-
czącym strat energii na oporniku. Na urojonej części nie ma zaś żadnych strat energii.
22-6. Obwód łańcuchowy
f
Chcielibyśmy teraz rozważyć interesujący obwód, który można opisać posługując
się metodami połączeń szeregowych i równoległych. Przypuśćmy, że zaczniemy od obwo-
du z rys. 22.18a. Widać natychmiast, że oporność pozorna pomiędzy zaciskami a i b
jest po prostu równa Zj-J-Zj. Weźmy teraz nieco bardziej skomplikowany obwód, taki
jak na rys. 22.18b. Moglibyśmy przeprowadzić jego analizę za pomocą praw Kirchhoffa,
ale możemy to uczynić równie łatwo posługując się metodą połączeń szeregowych i równo-
22.18. Zastępcza oporność pozorna obwodu łańcuchowego
22-6. OBWÓD ŁAŃCUCHOWY
29
a)
22 19. Zastępcza oporność pozorna nieskończonego obwodu łańcuchowego
1
ległych. Dwie oporności pozorne w części prawej obwodu możemy zastąpić jedną opor-
nością pozorną Z3 = Zt+Z2, tak jak to pokazano na części c) rysunku. Następnie po-
łączone równolegle oporności pozorne Z2 i Z3 można zastąpić równoważną im opornością
pozorną Z4 — jak pokazano na części d) rysunku. W końcu oporności pozorne Zr
i Z4 są równoważne jednej oporności pozornej Z5 — część e) rysunku.
Moglibyśmy teraz zadać sobie zabawne pytanie: Co się stanie, jeśli do obwodu z rys.
22.18b będziemy dodawać bez końca podobne mu ogniwa, co zaznaczono na rys. 22.19a
linią przerywaną? Czy możemy rozwiązać taki nieskończony układ? No cóż, nie jest
to takie trudne. Przede wszystkim, zauważmy, że taki nieskończony układ się nie zmieni,
jeśli na jego „przedzie” dodamy jeszcze jedno ogniwo. No tak, jeżeli do nieskończonego
obwodu dodamy jeszcze jedno ogniwo, to otrzymamy taki sam nieskończony obwód.
Oznaczamy oporność pozorną pomiędzy zaciskami a i b nieskończonego obwodu przez
Zo; wówczas oporność pozorna całej reszty, na prawo od zacisków c i d jest także równa
Zo. Stąd zaś wynika, że dopóki interesuje nas tylko to, co się dzieje na samym przedzie,
możemy wyobrazić sobie obwód taki, jak na rys. 22.19b. Składając równolegle oporności
Z2 i Zo i dodając ich oporność zastępczą do Zt — zgodnie z regułą dodawania połączeń
szeregowych — możemy bezpośrednio określić oporność pozorną całej takiej kombi-
nacji:
Ale oporność ta jest także równa Zo, mamy więc równanie
Z2Z0
Z0 = Zt+—
Z2+Zo
Obliczając z niego Zo otrzymujemy
Z _______________
Zo= ^-+l/(Z?/4)+Z1Z2. . (22.27)
Znaleźliśmy więc oporność pozorną nieskończonego łańcucha złożonego z powtarzają-
cych się szeregowych i równoległych połączeń oporności pozornych. Oporność pozorną
o nazywamy charaktet ystyczną opornością pozorną takiego nieskończonego obwodu.
30
22. OBWODY PRĄDU ZMIENNEGO
Rozważmy teraz specjalny przypadek, w którym elementami połączonymi szeregowo
są indukcyjności L, a elementami bocznikującymi — pojemności C, jak pokazano to na
rys. 22.20a. Oporność pozorną takiego nieskończonego obwodu znajdziemy podstawia-
jąc Z = ia>L i Z2 = 1/koC. Zauważmy, że pierwszy człon, Zt/2, w równaniu (22.27)
jest równy połowie oporności pozornej pierwszego elementu. Będzie więc rzeczą bardziej
naturalną, a przynajmniej trochę prostszą, jeżeli narysujemy nasz nieskończony obwód
tak, jak na rys. 22.20b. Rozważając ten nieskończony obwód w punkcie a' przekonamy
się, że charakterystyczna oporność pozorna
Zo = V'(L/C)-(«>2L2/4). (22.28)
Istnieją teraz dwa interesujące przypadki w zależności od częstości co. Jeżeli co2 jest
mniejsze od ĄfLC, to drugi człon pod pierwiastkiem będzie mniejszy od pierwszego i opor-
ność pozorna Zo będzie liczbą rzeczywistą. Przeciwnie, jeżeli co2 jest większe od ^jLC,
oporność Zo będzie liczbą czysto urojoną, co możemy zapisać w postaci
Zo = i7(c»2L2/4)-(£/C).
Powiedzieliśmy poprzednio, że obwód zawierający tylko urojone oporności pozorne,
takie jak indukcyjność i pojemność, będzie miał czysto urojoną zastępczą oporność po-
zorną. W jaki więc sposób dla obwodu, który obecnie rozważamy, a który zawiera tylko
elementy L i C, oporność pozorna może być czystym oporem dla częstości mniejszych
od ^4/LC. Dla większych zaś częstości oporność pozorna jest czysto urojona, zgodnie
z naszym poprzednim twierdzeniem. Dla częstości mniejszych oporność jest więc czy-
stym oporem i będzie wobec tego pochłaniać energię. Ale w jaki sposób obwód składają-
cy się tylko z indukcyjności i pojemności może w sposób ciągły pobierać energię, tak jak
to się dzieje w wypadku oporu? Odpowiedź-. Ponieważ mamy nieskończoną liczbę pozor-
nych oporności indukcyjnych i pojemnościowych, podłączone do obwodu źródło energii
będzie najpierw dostarczało energii do pierwszej indukcyjności i pojemności, potem ko-
lejno do drugiej, do trzeciej i do następnej. W obwodzie tego typu energia będzie z gene-
ratora pobierana w sposób ciągły i ze stałą szybkością i będzie ciągle przepływać do obwo-
du, gdzie zostaje zmagazynowana w ko-
lejnych opornościach indukcyjnych i poje-
mnościowych.
Powyższe rozważania nasuwają cieka-
wą myśl o sytuacji panującej w obwodzie.
Moglibyśmy się spodziewać, że jeśli pod-
łączymy źródło do przedniej części obwo-
du, to efekty źródła będą się przemie-
szczać w głąb obwodu, aż do jego krań-
ca w nieskończoności. Przenoszenie fal
wzdłuż obwodu jest zjawiskiem bardzo
podobnym do promieniowania anteny,
która pobiera energię ze źródła zasilania;
możemy tu jednak oczekiwać wystą-
22.20. Łańcuch L-C narysowany dwoma
równoważnymi sposobami
a L L Ł —nnop—
a) = = C = =c = =C Ltd.
b dLń '2\
b)b ’ = c = = C 5 =C ifd.
22.6 OBWÓD ŁAŃCUCHOWY
31
pienia takiej propagacji tylko w wypadku, gdy oporność pozorna będzie rzeczywista, co
zachodzi dla częstości co mniejszych od ^4/LC. Natomiast w wypadku, gdy oporność
pozorna jest czysto urojona, co zachodzi dla częstości co większych od ^4/LC, wystą-
pienia propagacji tego typu oczekiwać nie możemy.
22-7. Filtry
Z poprzedniego paragrafu dowiedzieliśmy się, że nieskończony obwód łańcuchowy
(rys. 22.20) pochłania energię w sposób ciągły, jeżeli jest „sterowany” częstością mniejszą
od pewnej krytycznej częstości ^4/LC, którą nazwiemy częstością graniczną co0. Posta-
wiliśmy hipotezę, że efekt ten można wytłumaczyć ciągłym transportem energii w głąb
obwodu. Z drugiej strony, dla wielkich częstości pochłanianie energii w sposób ciągły
nie zachodzi. Powinniśmy się więc wtedy spodziewać, że prądy nie „przenikną” daleko
w głąb obwodu. Zobaczmy, czy nasze hipotezy są słuszne.
Przypuśćmy, że początek obwodu łańcuchowego połączyliśmy z jakimś generatorem
prądu zmiennego i pytamy, jakie jest napięcie, powiedzmy, w 754-tym ogniwie łańcucha.
Ponieważ obwód jest nieskończony, zmiana napięcia pomiędzy jednym jego ogniwem,
a następnym jest taka sama. Rozpatrzmy więc, co się dzieje, gdy przechodzimy 'od pew-
nego ogniwa, np. n-tego, do następnego. Zdefiniujemy prądy In i napięcia Vn, tak jak to
pokazano na rys. 22.2la.
Zależność napięcia Vn+1 od napięcia V„ znajdziemy pamiętając, że zawsze możemy
zastąpić resztę łańcucha po n-tym ogniwie jego charakterystyczną opornością pozorną Zo;
wówczas pozostaje nam tylko do zanalizowania taki obwód, jak na rys. 22.2Ib. Zauważ-
my po pierwsze, że dowolne napięcie V„, jako spadek napięcia na oporności Zo, musi
być równe InZ0. Po drugie, różnica pomiędzy napięciami Vn i Kn+l jest po prostu równa
Z, ' . , .
z.o
22.21. Szukanie stałej przenoszenia dla obwodu łańcuchowego
32
22. OBWODY PRĄDU ZMIENNEGO
Otrzymujemy więc stownek
* *'* Ki+l __ | 21 _ Zq~~'Z1 ’ ' !
Stosunek ten nazywamy współczynnikiem przenoszenia dla jednego ogniwa obwodu łań-
cuchowego; oznaczymy go symbolem a. Jest on oczywiście dla wszystkich ogniw taki
sam:
Napięcie na kpńcach j*-tego ogniwa wynosi więc
Vn = d'S. , (22.30)
Możemy więc teraz znaleźć napięcie na końcach 754-go ogniwa; jest ono po prostu
równe 754-tej potędze a, pomnożonej przez 8.
Przypuśćmy, że szukamy a dla obwodu łańcuchowego L-C z rys. 22.20a. Podstawia-
jąc Zo z równania (22.27) i Zt = ia>L otrzymujemy
, a = - 7 . (22.31)
' V(L[C)—((o2L2/4)+i(coLI2)
Jeżeli częstość sterująca jest mniejsza od częstości granicznej co0 = ^4ILC, pierwiastek
w tym wzorze jest liczbą rzeczywistą, a wartości bezwzględne liczb zespolonych w liczniku
- i mianowniku są sobie równe. Tak więc wartość bezwzględna a jest równa jedności;
możemy to zapisać w postaci
a =
co oznacza, że wartość bezwzględna napięcia jest taka sama w każdym ogniwie; jedynie
jego faza się zmienia. Zmiana fazy <5 jest w rzeczywistości liczbą ujemną i przedstawia
„opóźnienie” napięcia w trakcie jego przenoszenia się wzdłuż obwodu.
Dla częstości większych od częstości granicznej coo wygodniej jest podzielić licznik
i mianownik wyrażenia po prawej stronie równania (22.31) przez i, a następnie równanie
to przepisać w postaci
a = — .....-................ (22.32)
/(w2L2/4)-(L/Q-|-(wL/2)
Współczynnik przenoszenia a jest w tym wypadku liczbą rzeczy wistą, mniejszą od jedności.
Oznacza to, że napięcie w każdym ogniwie jest zawsze mniejsze od napięcia w ogniwie
poprzednim, przy czym stosunek tych napięć wynosi a. Dla wszystkich częstości większych
od co0 napięcie gwałtownie opada, w miarę jak posuwamy się w głąb obwodu. Wykres
bezwzględnej wartości a w funkcji częstości wygląda jak na rys. 22.22.
Widzimy, że zachowanie się a, tak dla częstości powyżej, jak i poniżej a)0, pozostaje
w zgodzie z naszą poprzednią interpretacją, z której wynikało, że obwód przenosi energię
dla a><a>0, a zatrzymuje ją dla co>co0- Mówimy, że obwód „przepuszcza” małe, a „od-
22-7. filtry
33
rzuca” lub „filtruje” wielkie częstości.
Każdy obwód skonstruowany tak, aby je-
go właściwości zmieniały się w znany
sposób z częstością, nazywamy „filtrem”.
Opisaliśmy tu „filtr dolnoprzepustowy”.
Można by się dziwić, po co te całe
rozważania o nieskończonym obwodzie,
który w rzeczywistości nigdy przecież nie
występuje. Rzecz w tym, że te same wła-
ściwości co obwód nieskończony ma ob-
wód skończony, jeżeli zakończymy go
opornością pozorną, równą charakterys-
tycznej oporności pozornej Zo. W prakty-
ce me da się jednak dokładnie odtworzyć
charakterystycznej oporności pozornej za
pomocą kilku prostych elementów, jak
elementy R, L i C. Ale da się to często zro-
bić z niezłym przybliżeniem dla danego
zakresu częstości. W ten sposób można
zbudować skończony obwód filtrujący,
którego własności są bardzo zbliżone
do własności obwodów nieskończonych.
Tak na przykład łańcuch L-C zachowuje'
się w sposób całkiem zbliżony do opisa-
nego powyżej, jeżeli jest zakończony
czystym oporem R = ^L/C.
Jeżeli w naszym obwodzie łańcucho-
wym L-C zamienimy miejscami elementy
L i C, otrzymamy obwód taki jak na
rys. 22.23a. Obwód ten jest filtrem prze-
puszczającym wielkie, a odrzucającym ma-
łe częstości. Można łatwo stwierdzić, co
S|? z takim obwodem dzieje, korzystając
z naszych poprzednich wyników. Zauwa-
żmy, że jeżeli zamieniamy element L na
i odwrotnie, to zmieniamy jednocześnie
każde ico na 1/zco. Tak więc to, co się
Przedtem „działo” dla co, będzie się teraz
ndziało” dla 1/co. W szczególności otrzy-
mamy nową zależność a od częstości,
korzystając z rys. 22.22 i zastępując zmie-
nną osi odciętych przez 1/co, tak jak zro-
biono to na rys. 22.23b.
3
— Wykłady z fizyki
22.22. Stała przenoszenia dla jednego ogniwa
łańcucha L-C
22.23. a. Filtr górnoprzepustowy. b. Stałą prze-
noszenia tego filtru jako funkcja l/o>
34
22. OBWODY PRĄDU ZMIENNEGO
v(t)n
2124. na wyjściu prostownika dwukierunkowego
i.
Opisane przez nas filtry dolno- i górnoprzepustowe mają szerokie zastosowanie tech-
niczne. Dolnoprzepustowy filtr L-C jest często używany jako filtr „wygładzający” w za-
silaczu prądu stałego. Jeżeli chcemy przetworzyć prąd zmienny na prąd stały, musimy
zacząć od prostownika, który pozwala prądowi płynąć tylko w jednym kierunku. Z pro-
stownika otrzymujemy ciąg impulsów, wyglądający jak wykres funkcji V(t) z rys. 22.24.
Kiepski to jednak prąd stały, ponieważ jego napięcie ciągle się zmienia. Przypuśćmy, że
chcielibyśmy dostać „czyściutki” prąd stały, taki jak z akumulatora. Możemy to osiągnąć
z dużą dokładnością, wstawiając filtr dolnoprzepustowy pomiędzy prostownik a obcią-
żenie.
Z rozdziału 50 tomu I (cz. 2) dowiedzieliśmy się, że funkcję czasu taką, jakiej wykres
widzimy na rys. 22.24, można przedstawić w postaci superpozycji stałego napięcia i fal
sinusoidalnych o coraz to większych częstościach, czyli w postaci szeregu Fouriera. Jeżeli
nasz filtr jest liniowy (co nastąpi, gdy jak założyliśmy, elementy £ i C nie będą się zmie-
niać z napięciami i prądami), to wówczas na jego wyjściu pojawia się superpozycja napięć
wyjściowych dla każdej ze składowych, które mieliśmy na wejściu. Jeżeli tak dobierzemy
częstość graniczną ct>o naszego filtru, że będzie ona dużo mniejsza od najmniejszej z częstości
występujących w funkcji K(t), to prąd stały (dla którego u> = 0) przejdzie przez filtr
gładko, ale amplituda pierwszej harmonicznej będzie już wyraźnie zmniejszona, a ampli-
tudy wyższych harmonicznych będą zmniejszone w jeszcze większym stopniu. Możemy
więc otrzymać na wyjściu napięcie tak gładkie, jak sobie tego życzymy, w zależności
jedynie od liczby użytych przez nas ogniw filtru.
Filtru gómoprzepustowego używamy, gdy chcemy się pozbyć pewnych małych czę-
stości. Tak na przykład we wzmacniaczu adapteru filtru gómoprzepustowego można
użyć do „oczyszczenia” muzyki z niskich tonów pochodzących od obrotu talerza adap-
teru.
Można również wykonać filtry „pasmowe”, które odrzucają częstości poniżej pewnej
częstości co1 oraz powyżej innej częstości u>2 (większej od roj), a przepuszczają częstości
leżące w przedziale pomiędzy i u>2 Można to zrobić prosto przez złożenie filtru górno-
przepustowego z filtrem dolnoprzepustowym, ale częściej używa się do tego celu obwo-
du łańcuchowego, w którym oporności Zj i Z2 są bardziej złożone — każda z nich jest
kombinacją elementów £ i C. Taki filtr pasmowy może mieć taką stałą przenoszenia,
jak na przykład ta, którą widzimy na rys. 22.25a. Znajduje on zastosowania na przykład
w rozdzielaniu sygnałów zajmujących tylko pewien przedział częstości, takich jak kanały
22-7. FILTRY
35
22.25. a. Filtr pasmowy, b. Prosty filtr rezonan-
sowy
głosonośne telefonicznego kabla wielkiej
częstości lub takich jak modulowane fale
nośne w radiotechnice.
W rozdziale 25 tomu I (cz. 1) widzie-
liśmy, że tego typu rozdzielenie można
również uzyskać korzystając z własności
selektywnych zwykłej krzywej rezonansu,
którą dla porównania pokazujemy na
rys. 22.25b. Filtr rezonansowy nie jest
jednak dla pewnych celów tak dobry jak
filtr pasmowy. Pamiętamy (tom I, cz. 2,
rozdz. 48), że gdy nośnik częstości wc jest
modulowany częstością „sygnału” a>s, to
pełny sygnał zawiera nie tylko częstość no-
śną, ale składa się również z pasm bocz-
nych częstości a>c+a>s i cdc—o)s. W wypad-
ku filtru rezonansowego te pasma boczne będą zawsze nieco osłabione, przy czym jak
widać z rysunku, osłabienie jest tym większe, im wyższa jest częstość sygnału. Mamy więc
do czynienia z kiepską „charakterystyką częstości”. Przez taki filtr nie będą więc prze-
chodzić wyższe tony muzyczne. Ale jeżeli użyjemy filtru pasmowego tak skonstruowane-
go, aby szerokość co2~ była co najmniej dwa razy większa od najwyższej częstości sy-
gnału, to charakterystyka częstości będzie „płaska” dla wszystkich potrzebnych nam syg-
nałów.
Chcielibyśmy jeszcze zrobić jedną uwagę dotyczącą filtru łańcuchowego; obwód łań-
cuchowy L-C, taki jak na rys. 22.20, stanowi także przybliżenie linii przesyłowej. Jeżeli
mamy długi przewodnik przebiegający równolegle względem drugiego przewodnika —
tak jak drut w kablu koncentrycznym lub drut zawieszony nad ziemią — to pomiędzy
oboma przewodnikami istnieje pewna pojemność, a także pewna indukcyjność pochodzą-
ca od istniejącego pomiędzy przewodnikami pola magnetycznego. Jeżeli wyobrazimy
sobie, że linia jest podzielona na małe odcinki J/, to każdy taki odcinek jest odpowied-
nikiem ogniwa łańcucha L-C, z szeregową pozorną opornością indukcyjną zl£ i bocz-
nikującą pozorną opornością pojemnościową JC. Możemy więc zastosować w przypad-
ku linii nasze wyniki dla filtru łańcuchowego. Jeżeli bowiem przejdziemy do granicy,
Przy dążącym do zera, otrzymamy dobry opis linii przesyłowej. Zauważmy, że dla co-
raz to mniejszych J/ zarówno J£, jak i JC maleją, ale w tym samym stosunku, tak że
'loraz Zf£/Jc pozostaje stały. Tak więc, przy przejściu do granicy w równaniu
(22.28) dla J£ i AC dążących do zera pozorna oporność charakterystyczna
Zo jest czystym oporem, którego wartość wynosi V AL/AC. Możemy również zapisać
fioraz AL/AC jako Lo/Co, gdzie £0 i Co są pozorną opornością indukcyjną i pojemnością
dla jednostki długości linii; mamy wówczas
o —
(22.33)
22. OBWODY PRĄDU ZMIENNEGO
36
Zauważmy także, że dla AL i AC dążących do zera częstość graniczna co0 = Ą[LC dąży
do nieskończoności. Tak więc w wypadku doskonałej linii przesyłowej częstość graniczna
nie istnieje.
22-8. Inne elementy obwodu
Zdefiniowaliśmy dotąd tylko doskonałe oporności pozorne obwodu — indukcyj-
ność, pojemność i opór — a także doskonały generator napięcia. Chcemy teraz pokazać,
że inne elementy obwodu, takie jak indukcyjności wzajemne, tranzystory, czy też lampy
elektronowe, można opisać przy pomocy tylko tych właśnie elementów podstawowych.
Przypuśćmy, że mamy dwie cewki i że część strumienia jednej z nich, celowo lub też nie,
przenika drugą cewkę, jak to pokazano na rys. 22.26a. Wówczas obie cewki będą miały
pewną indukcyjność wzajemną M, taką że zmiana prądu w jednej z cewek powoduje
powstanie napięcia w drugiej cewce. Czy możemy rozważyć taki efekt posługując się na-
szymi obwodami zastępczymi? Owszem, możemy to zrobić następująco. Wiemy, że siła
elektromotoryczna indukowana w każdej z dwóch oddziaływających cewek może być
zapisana jako suma dwóch sił elektromotorycznych:
dh
dt
„ dt2 dlr
dl2
(22.34)
Pierwszy człon po prawej stronie tych równań pochodzi od samoindukcji cewki, a drugi —
od jej indukcyjności wzajemnej względem drugiej cewki. Znak drugiego członu może
być plus lub minus, w zależności od sposobu, w jaki strumień jednej cewki przenika dru-
gą. Robiąc te same założenia upraszczające, których użyliśmy opisując indukcyjność
doskonałą, możemy powiedzieć, że różnica potencjałów na zaciskach każdej z cewek
22.26. Układ zastępczy indukcyjności wzajemnej
b)
22-8. INNE ELEMENTY OBWODU
37
jest równa sile elektromotorycznej w cewce. Wówczas oba równania (22.34) są iden-
tyczne z równaniami, jakie otrzymalibyśmy dla obwodu z rys. 22.26b, pod warunkiem
że siła elektromotoryczna w każdym z obu pokazanych obwodów zależy od prądu w prze-
ciwległym obwodzie, zgodnie ze związkami:
$ i — $2 = (22.35)
Tak więc nasze postępowanie w tym wypadku będzie polegać na przedstawieniu w nor-
malny sposób efektu samoindukcji oraz na zastąpieniu efektu indukcyjności wzajemnej
pomocniczym doskonałym generatorem napięcia. Oprócz tego musimy mieć oczywiście
równanie, które wiąże tę siłę elektromotoryczną z prądem w innych częściach obwodu;
ale dopóki równanie to jest liniowe, to dodajemy tylko do naszych równań obwodu kil-
ka równań liniowych, a wszystkie nasze poprzednie wnioski dotyczące obwodów zastęp-
czych pozostają w dalszym ciągu słuszne.
Oprócz indukcyjności wzajemnej mogą istnieć również pojemności wzajemne. Dotąd
mówiąc o kondensatorach wyobrażaliśmy sobie zawsze, że mamy do czynienia tylko
z dwoma.elektrodami. Ale w wielu sytuacjach, jak na przykład w lampie elektronowej,
takich elektrod, jedna obok drugiej, może być wiele. Jeżeli na jedną z takich elektrod
wprowadzimy ładunek elektryczny, jego pole elektryczne wytworzy ładunki indukcyjne
na pozostałych i będzie oddziaływało na potencjał elektrody pierwotnej. Jako przykład
rozważmy układ czterech płytek na rys. 22.27a. Przypuśćmy, że płytki te połączono z zew-
nętrznymi obwodami za pomocą drutów A, B, C i D. Dopóki interesują nas tylko efekty
elektrostatyczne, obwód zastępczy takiego układu elektrod wygląda jak na części b)
rysunku. Elektrostatyczne oddziaływanie każdej elektrody z pozostałymi jest równoważ-
ne istnieniu pewnej pojemności pomiędzy każdą parą elektrod.
Pomyślmy na koniec, jak powinniśmy przedstawić w obwodzie prądu zmiennego tak
skomplikowane urządzenia, jak tranzystory i lampy radiowe. Zaznaczmy od razu, że
tego typu urządzenia często pracują w taki sposób, że zależność pomiędzy prądami a na-
pięciami nie jest wcale liniowa. W takich wypadkach te nasze twierdzenia, które były
uwarunkowane liniowością równań, przestają być oczywiście prawdziwe. Z drugiej stro-
22.27. Układ zastępczy pojemności wzajemnej
38
22. OBWODY PRĄDU ZMIENNEGO
22.28. Układ aMWczy triody dla małych częstości
ny, w wielu zastosowaniach charakterystyki pracy są na tyle liniowe, że możemy uważać
tranzystory i lampy za urządzenia liniowe. Oznacza to, że prądy zmienne, dajmy na to
w anodzie lampy elektronowej, są liniowo zależne od napięć pojawiających się na innych
elektrodach, np. na siatce i katodzie. Gdy mamy tego rodzaju zależności liniowe, możemy
rozpatrywać dane urządzenie używając naszej metody obwodów równoważnych.
Nasz opis, tak jak w przypadku indukcyjności wzajemnej, będzie musiał zawierać
pomocnicze generatory napięcia, które opisują wpływ napięć i prądów w jednej części
urządzenia na napięcia i prądy w innej części. Tak na przykład obwód anodowy triody
można zwykle przedstawić jako szeregowe połączenie oporu z doskonałym generatorem
napięcia, którego aktywność jest wprost proporcjonalna do napięcia siatki. Układ za-
stępczy, jaki otrzymamy, wygląda tak jak na rys. 22.28 Podobnie obwód kolektora
w tranzystorze wygodnie jest przedstawić jako opór połączony szeregowo z doskonałym
generatorem napięcia, którego aktywność jest wprost proporcjonalna do prądu płyną-
cego z emitera do bazy. Układ zastępczy wygląda wówczas jak na rys. 22.29. Dopóki
równania, które opisują działanie przyrządu, są liniowe, możemy używać tego typu przed-
stawień dla lamp lub tranzystorów. Także wówczas, gdy są one włączone w obwód zło-
22.29. Układ zastępczy tranzystora dla małych częstości
*’ Pokazany układ zastępczy ma zastosowanie tylko dla małych częstości. Dla wielkich częstości
układ zastępczy staje się o wiele bardziej skomplikowany i zawiera różne „pasożytnicze” pojemności
i indukcyjności.
j2-8. INNE ELEMENTY OBWODU 39
żony, nasze ogólne wnioski, dotyczące równoważnych przedstawień dowolnych połączeń
elementów, pozostaną słuszne.
Obwody zawierające tranzystory i lampy elektronowe mają jedną zadziwiającą cechę,
różniącą je od obwodów złożonych tylko z samych oporności pozornych: część rzeczy-
wista zastępczej oporności pozornej Zef obwodu może stać się ujemna. Wiemy, że część
rzeczywista Zef odpowiada za straty energii. Zasadniczą więc cechą tranzystorów czy
lamp jest zdolność dostarczania energii do obwodu. (Oczywiście, nie „robią” one energii
z niczego; pobierają energię z obwodów prądu stałego zasilacza i zamieniają ją na ener-
gię prądu zmiennego.) Możemy więc mieć obwód z oporem ujemnym. Jeżeli teraz taki
obwód połączyć z opornością pozorną, której część rzeczywista, a więc opór, jest dodat-
nia, i tak ustalić warunki, aby suma tych dwóch części rzeczywistych była równa zeru,
to w powstałym obwodzie nie ma rozproszeń energii. Jeżeli więc nie ma strat energii,
to dowolne napięcie zmienne raz dostarczone obwodowi pozostanie w nim na zawsze.
Jest to podstawowa zasada działania oscylatora lub generatora sygnałów, który może
być użyty jako źródło napięcia zmiennego o dowolnie żądanej częstości.
rezonatory wnękowe
13-1. Rzeczywiste elementy obwodu
Każdy dowolny obwód składający się z doskonałych oporności pozornych i genera-
torów jest, jeżeli rozpatrywać go przy dowolnej parze zacisków, równoważny przy danej
częstości szeregowemu połączeniu generatora z pewną opornością pozorną Z.
Wynika to z faktu, że jeżeli przykładamy do zacisków napięcie V i rozwiązujemy
wszystkie równania, aby znaleźć prąd I, to musimy otrzymać pomiędzy prądem a napię-
ciem zależność liniową. Ponieważ wszystkie równania są liniowe, to równanie określa-
jące prąd I musi zależeć od napięcia V również tylko liniowo. Najogólniejszą zaś zależ-
ność liniową można wyrazić następująco:
/==1(K-^). (23.1)
W ogólnym przypadku zarówno oporność Z, jak i siła elektromotoryczna S, mogą za-
leżeć w jakiś skomplikowany sposób od częstości co. Równanie (23.1) jest jednak związ-
kiem, jaki otrzymaliśmy w wypadku, gdy poza zaciskami był tylko generator o sile elektro-
motorycznej połączony szeregowo z opornością pozorną Z(co).
Istnieje także problem odwrotny: Jeżeli mamy dowolne urządzenie elektromagnetycz-
ne o dwóch zaciskach i dokonujemy pomiaru zależności pomiędzy prądem I i napię-
ciem V, aby określić siłę elektromotoryczną £ i oporność pozorną Z jako funkcje częs-
tości, to czy można znaleźć taki układ naszych doskonałych elementów, który jest równo-
ważny wewnętrznej oporności pozornej Z? Okazuje się, że dla każdej mającej sens
fizyczny funkcji Z (co) można z dowolną dokładnością przybliżać sytuację obwodem zawie-
rającym skończony zbiór elementów doskonałych. Nie chcemy rozważać teraz zagadnie-
nia ogólnego, ale rozpatrzyć kilka szczególnych przypadków, posługując się argumenta-
mi czysto fizycznymi.
23-1. RZECZYWISTE ELEMENTY OBWODU
41
Jeżeli rozważamy opornik rzeczywisty, to wiemy,
że płynący przez niego prąd wytwarza pole magnety-
czne. Tak więc każdy rzeczywisty opornik powinien
jjjieć także pewną pozorną oporność indukcyjną.
Oprócz tego, gdy na końcach opornika istnieje róż-
nica potencjałów, muszą znajdować się tam ładunki,
aby wytworzyć niezbędne pola elektryczne. Ze zmianą
napięcia będzie następowała, proporcjonalna doń,
zmiana ładunków, a więc opornik będzie miał pewną
pozorną oporność pojemnościową. Można oczekiwać,
że układ zastępczy rzeczywistego opornika będzie wy-
glądał tak, jak na rys. 23.1. W prawidłowo skonst-
ruowanym oporniku tzw. „pasożytnicze” elementy
i c są małe, tak że dla danego przedziału często-
ści a>L jest znacznie mniejsze od R, a 1/coC jest zna-
cznie większe od R i dlatego też można je pominąć.
Jednak ze wzrostem częstości stają się one w końcu
istotne i opornik zaczyna wyglądać jak obwód
rezonansowy.
Rzeczywista indukcyjność nie jest także równa
wyidealizowanej indukcyjności, której oporność po-
23.1. Obwód zastępczy rzeczywi-
stego opornika
23.2. Obwód zastępczy rzeczywi-
stej cewki indukcyjnej przy ma-
łych częstościach
zorna wynosi i<oL. Prawdziwy zwój drutu będzie mieć
pewien opór, a więc przy małych częstościach cewka ।-----------------o j------------»
jest w rzeczywistości równoważna szeregowemu po- J . E
łączeniu indukcyjności i pewnego oporu, jak to poka- \ -
zano na rys. 23.2a. Ale przecież w prawdziwej cewce f
nie można rozdzielić oporu i indukcyjności — opór j E
jest rozłożony wzdłuż całego drutu, a więc jest „zmie- J < ,
szany” z indukcyjnością. Powinno się w takim razie j
użyć raczej obwodu takiego, jak na rys. 23.2b, e
który to obwód składa się z połączonych szeregowo \ S
elementów o małych R i L. Ale całkowita L____________________________o c____________<>
oporność pozorna takiego obwodu jest równa a) , bj
co jest równoważne prostszemu sche-
matowi z części a) rysunku.
Ze wzrostem częstości pogarsza się przybliżenie rzeczywistej cewki sumą indukcyj-
uosci i oporu. Ładunki, które muszą pojawić się na drutach, aby wytworzyć napięcia,
będą odgrywać ważną rolę. Wygląda to tak, jakby pomiędzy zwojami cewki były małe
kondensatory, jak to naszkicowano na rys. 23.3a. Można by próbować zastąpić rzeczy-
*1$tą cewkę obwodem takim, jak na rys. 23.3b. Dla małych częstości można go z powo-
eniem zastąpić prostszym obwodem z części c) rysunku (jest to znowu ten sam obwód
rez°nansowy, który był modelem opornika przy wielkich częstościach). Jednak dla
W1?kszych częstości lepszy jest bardziej złożony obwód z rys. 23.3b. W istocie, im dokład-
42
23. REZONATORY WNĘKOWE
a)
b) c)
23.3. Obwód zastępczy rzeczywistej
cewki indukcyjnej przy większych czę-
stościach
niej chcemy przedstawić faktyczną oporność po-
zorną rzeczywistej, fizycznej cewki, tym więcej do-
skonałych elementów musi zawierać jej sztuczny
model.
Przypatrzmy się nieco dokładniej temu, co się
dzieje w cewce rzeczywistej. Oporność pozorna in-
dukcyjności zmienia się jak co£, a więc dla ma-
łych częstości staje się równa zeru i indukcyjność
staje się wtedy „zwarciem”; pozostaje tylko opór
drutu. Gdy zwiększamy częstość, wielkość a>L
wkrótce staje się znacznie większa od wielkości R
i cewka zachowuje się bardzo podobnie do do-
skonałej indukcyjności. Jeżeli jednak w dalszym
ciągu zwiększać częstość, ważną rolę zaczną odgry-
wać pojemności. Ich oporność pozorna jest pro-
porcjonalna do l/(oC, a więc jest duża dla ma-
łych w. Dla dostatecznie małych częstości kon-
densator stanowi „przerwę” w obwodzie i w wy-
padku, gdy równolegle do niego jest podłączony
inny obwód, nie przewodzi prądu. Przy wielkich
natomiast częstościach prąd woli wpływać do poje-
mności pomiędzy zwojami niż do indukcyjności.
Tak więc prąd w cewce przeskakuje z jednego zwoju
do drugiego, a nie zadaje sobie trudu, aby kręcić się w kółko i tracić SEM. Chociaż więc
moglibyśmy sobie życzyć, aby prąd przepływał wzdłuż pętli, wybierze on łatwiejszą
drogę — drogę o najmniejszej oporności pozornej.
Gdyby zagadnienie to było przedmiotem powszechnego zainteresowania, to opisane
powyżej zjawisko nazwałoby się „barierą wielkich częstości” lub jakoś podobnie. Zja-
wiska tego typu zachodzą w różnych odległych nieraz dziedzinach. W aerodynamice,
na przykład, obiekty skonstruowane dla mniejszych prędkości nie działałyby, gdybyśmy
spróbowali nadać im prędkość większą od prędkości dźwięku. Nie oznacza to, że napo-
tykają one „barierę” nie do przebycia, lecz po prostu oznacza, że taki obiekt wymaga
innej konstrukcji. Tak więc cewka zaprojektowana przez nas jako „indukcyjność”, nie
będzie przy wielkich częstościach działać jak dobra indukcyjność, ale jak coś innego. Dla
wielkich częstości musimy skonstruować inną cewkę.
23-2. Kondensator przy wielkich częstościach
Chcemy teraz dokładnie omówić zachowanie się kondensatora — doskonałego, je*
żeli chodzi o jego geometrię — podczas wzrostu częstości i dokonać obserwacji tow»'
rzyszących temu zmian jego własności. (Wolimy rozważać kondensator niż cewkę in'
dukcyjną, ponieważ geometria pary płytek jest znacznie prostsza od geometrii cewki )
23-2. KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH 43
Rozważmy kondensator pokazany na rys. 23.4a, składający się z dwóch równoległych
kolistych płytek, połączonych parą drutów z zewnętrznym generatorem. Jeżeli ładujemy
kondensator prądem stałym, to na jednej płytce będzie się zbierać ładunek dodatni, a na
drugiej — ładunek ujemny; pomiędzy płytkami wytworzy się natomiast jednorodne pole
elektryczne.
Przypuśćmy teraz, że zamiast prądu stałego przyłożymy do płytek prąd zmienny o ma-
łej częstości. (Później będziemy w stanie dokładniej określić, co to jest „mała”, a co „wiel-
ka” częstość). Powiedzmy, że połączymy kondensator z generatorem małych częstości.
Gdy napięcie zmienia znak, z górnej płytki znika ładunek dodatni, a pojawia się na niej
ładunek ujemny. Podczas gdy to się dzieje, pole elektryczne znika, a następnie pojawia
się ze zwrotem przeciwnym. Zmiany pola elektrycznego podążają za przeskokami ła-
dunku tam i z powrotem. W każdej chwili pole elektryczne jest jednorodne, jak pokazano
na rys. 23.4b, jedynie na krawędziach płytek zachodzą od tego pewne odstępstwa, które
pominiemy. Wartość pola elektrycznego możemy zapisać jako
E = Eoemt, (23.2)
gdzie Eo jest pewną stałą.
Czy opis ten pozostanie słuszny przy wzroście częstości? Nie, ponieważ na skutek
ciągłych zmian kierunku pola przez każdą pętlę, taką jak na przykład I\ z rys. 23.4a,
przepływa strumień pola elektrycznego. A jak wiemy, zmienne pole elektryczne powo-
duje powstanie pola magnetycznego. Jedno z równań Maxwella mówi, że gdy istnieje,
tak jak w tym przypadku, zmienne pole elektryczne, to musi istnieć całka krzywolinio-
wa z pola magnetycznego. Ta całka z pola magnetycznego wzdłuż krzywej zamkniętej,
pomnożona przez c2, jest równa szybkości zmian w czasie strumienia elektrycznego po-
przez powierzchnię rozpiętą na tej krzywej (jeżeli nie ma żadnych prądów):
c2^*B-4Zs = — J E-ntfa. (23.3)
r wewnątrz V
23.4. Pole elektryczne i magnetyczne pomiędzy płytkami kondensatora
a)
b)
44
23. REZONATORY WNĘKOWE
Jakież jest więc natężenie tego pola magnetycznego? Nietrudno to obliczyć. Przypuśćmy,
że weźmiemy pętlę , która jest okręgiem o promieniu r. Z symetrii widać, że pole magne-
tyczne jest stałe wzdłuż takiego okręgu, tak jak to pokazano na rysunku. Wówczas całka
krzywoliniowa z pola B jest równa 2nrB. A ponieważ pole elektryczne jest jednorodne,
strumień pola elektrycznego jest po prostu równy E, pomnożonemu przez rrr2, czyli
przez powierzchnię koła:
d
c2B-2nr = —E-~r2. (23.4)
Pochodna E względem czasu jest dla naszego zmiennego pola równa po prostu i<oEtfiimt.
Znajdujemy więc, że w naszym kondensatorze wystąpi pole magnetyczne
IOJT
B=—Eoem'. > (23.5)
2c
Innymi słowy, pole magnetyczne także oscyluje, a jego natężenie jest proporcjonalne do r.
Jakież są tego konsekwencje? Gdy istnieje zmienne pole magnetyczne, będą także
indukowane pola elektryczne i kondensator zacznie działać podobnie nieco do cewki
indukcyjnej. Ze wzrostem częstości rośnie natężenie pola magnetycznego; jest ono pro-
porcjonalne do szybkości zmian pola E, a więc do częstości w. Oporność pozorna konden-
satora nie będzie już po prostu równa
Zwiększajmy w dalszym ciągu częstość i rozpatrzmy dokładniej, co się wówczas bę-
dzie działo. Mamy pole magnetyczne o zmiennym natężeniu. Ale wtedy pole elektryczne
nie może być jednorodne, tak jak to zakładaliśmy! Gdy istnieje zmienne pole magnetycz-
ne, musi — zgodnie z prawem Faradaya — istnieć także całka krzywoliniowa z pola
elektrycznego. Jeżeli więc istnieje znaczne pole magnetyczne, jak to się zaczyna dziać
przy wielkich częstościach, pole elektryczne nie może być takie samo w różnych odle-
głościach od środka. Pole elektryczne musi zmieniać się z r, tak aby całka krzywolinio-
wa z pola elektrycznego była równa zmiennemu strumieniowi pola magnetycznego.
Zobaczymy, czy potrafimy obliczyć poprawne pole elektryczne. Można to zrobić,
obliczając „poprawkę” do jednorodnego pola, którego istnienie pierwotnie założyliśmy
w przypadku małych częstości. Oznaczmy to jednorodne pole przez £) i przyjmijmy,
że jest ono w dalszym ciągu równe Eoeml; poprawne pole możemy wtedy zapisać jako
£' = £'1+£'2,
gdzie E2 jest poprawką pochodzącą od zmiennego pola magnetycznego. Pole na osi
kondensatora zapiszemy dla każdego w jako Eoe““‘ (określając w ten sposób Eo), a więc
na osj nie będziemy mieć poprawki; E2 = 0 dla r = 0.
Aby znaleźć pole E2, możemy skorzystać z całkowej postaci równania Faradaya:
f d
$Eds =--------(strumienia B).
J dt
r
Całki te będą łatwe do obliczenia, jeżeli weźmiemy je wzdłuż pokazanej na ryg. 23.4b
2j-2. KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH 45
krzywej r2, która przebiega w górę wzdłuż osi, następnie wzdłuż promienia górnej płytki
na odległość r od osi, opada pionowo do dolnej płytki i powraca do osi. Całka krzywo-
liniowa z pola £] wzdłuż tej krzywej jest oczywiście równa zeru; a więc jedyny przyczynek
do całki pochodzi od pola E2 i jest równy — E2(r)-h, gdzie h jest odległością pomiędzy
płytkami. (E przyjmiemy za dodatnie, jeżeli ma zwrot ku górze.) Całka ta jest równa
szybkości zmian strumienia B, który znajdujemy obliczając całkę po zakreślonej po-
wierzchni S wewnątrz pętli r2 na rys. 23.4b. Strumień przez pionowy pasek o szerokości
dr jest równy B(r)hdr, a więc całkowity strumień jest równy
hjB(r)dr.
Przyrównując — d/dt strumienia do całki krzywoliniowej z pola E2 mamy
3 r
E2(f) = - \ B(r)dr. (23.6)
Ot J
Zauważmy, że h znikło; pola nie zależą od odstępu pomiędzy płytkami.
Podstawiając B(r) z równania (23.5) otrzymamy
d iwr2 .
ot 4c2
Pochodna względem czasu „dprzuca” jeszcze jeden czynik im; otrzymujemy
a>2r2
E2(r) = -~—Eoeml. (23.7)
4c
Tak jak mogliśmy się tego spodziewać, indukowane pole działa w kierunku zmniejszenia
pierwotnego pola eletrycznego na większych odległościach od osi. Poprawione pole E =
= £'I+£2 jest zatem równe
„ /I (o2r2 \
E = El+E2 = l-__- )Eoe .
\ 4 c2 /
(23.8)
Pole elektryczne w kondensatorze
przestaje już być jednorodne; ma ono
kształt paraboliczny, jak to pokazuje
linia przerywana na rys. 23.5. Widzimy,
te nasz prosty kondensator staje się
nieco skomplikowany.
Moglibyśmy teraz korzystając z na-
szych wyników obliczyć oporność pozor-
n4 kondensatora przy wielkich często-
ściach. Znając pole elektryczne mogli-
byśmy obliczyć ładunki na płytkach
1 zbadać, w jaki sposób prąd płynący
23.5. Pole elektryczne pomiędzy płytkami kon-
densatora przy wielkiej częstofci (pominięto efek-
ty krawędziowe)
46
23. REZONATORY WNĘKOWE
przez kondensator zależy od częstości w. Ale w tej chwili ten problem nas nie interesuje.
Bardziej interesuje nas to, co się dzieje, jeśli w dalszym ciągu zwiększamy częstość — co się
dzieje dla jeszcze większych częstości. A więc nie skończyliśmy jeszcze naszych rachunków?
Nie, ponieważ „poprawiliśmy” pole elektryczne, co oznacza, że obliczone przez nas pole
magnetyczne przestaje być poprawne. Pole magnetyczne z równania (23.5) jest w przy-
bliżeniu poprawne, ale to jest tylko pierwsze przybliżenie; oznaczmy je więc przez jB i.
Powinniśmy wobec tego przepisać równanie (23.5) w postaci
icor
B^—^E^1. (23.9)
2c
Pamiętajmy, że to pole magnetyczne było wytworzone przez zmiany pola elektrycznego
Et. W takim razie poprawne pole magnetyczne będzie wytworzone przez pełne pole elek-
tryczne Et -f-E2. Jeżeli zapiszemy pole magnetyczne w postaci B — -f-B2, to drugi
człon będzie właśnie dodatkowym polem, wytworzonym przez strumień E2. Aby znaleźć
pole B2, możemy powtórzyć to samo rozumowanie, którego użyliśmy do znalezienia
pola Bi; całka krzywoliniowa z pola B2 wzdłuż krzywej fi jest równa szybkości zmian
strumienia E2 poprzez obszar ograniczony krzywą Pi. Otrzymamy więc znowu równanie
(23.4), w którym pole magnetyczne B zostało zastąpione polem B2, a pole elektryczne E
polem E2:
d
c2B2-2nr = — (strumienia E2 poprzez wnętrze Pi).
ot
Ponieważ pole E2 zmienia się z promieniem, aby otrzymać jego strumień, należy całko-
wać po kolistej powierzchni wewnątrz krzywej Pi. Przyjmując 2r.r dr za element powierzch-
ni, otrzymujemy całkę
J E2(r)'2r.rdr.
o
Tak więc znajdujemy B2(r):
1 d f
B2(r) = — — £2(r) r dr. (23.10)
rc2 ot J
Podstawiając E2 z równania (23.7) dostajemy do obliczenia całkę z r2dr, która oczywiście
jest równa r4/4. Nasza poprawka do pola magnetycznego ma więc postać:
B2(r) = --—-E^. (23.11)
16c4
Ale to wciąż jeszcze nie koniec! Jeżeli pole magnetyczne B nie jest takie, jak począt-
kowo sądziliśmy, to pole elektryczne E2 też jest obliczone błędnie. Musimy dodać na-
stępną poprawkę do pola E, pochodzącą od dodatkowego pola magnetycznego B2; oznacz-
my tę dodatkową poprawkę do pola elektrycznego przez E3. Jest ona związana z po*
lem magnetycznym w ten sam sposób, jak pole elektryczne E2 było związane z polem
magnetycznym B3. Możemy znowu skorzystać z równania (23.6) zmieniając tylko
ii
23-2 KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH
47
wskaźniki:
S C
E3(r) = -~ B2(r)dr. (23.12)
ot J
po podstawieniu naszego wyniku dla B2 [równanie (23.11)] nasza nowa poprawka do
pola wyniesie
<w4r4
£3(r) = +^rT^oe'“'. (23.13)
64 c4
Zapisując nasze dwukrotnie poprawiane pole elektryczne jako E = E1+E1-ł-E3 otrzy-
mujemy
[1 / cor \2 1 / a>r \4"|
l-4(— +—— — . . (23.14)
22\c / 22-42 \ c / J v
Wykres przedstawiający zmiany pola elektrycznego jako funkcję promienia przestaje
być już zwykłą parabolą z rys. 23.5; dla dużych jednak promieni leży on tylko nieco po-
wyżej krzywej (.Ei+fJ.
To jeszcze wciąż nie koniec. Nowe pole elektryczne wytwarza nową poprawkę do pola
magnetycznego, a to „świeżo” poprawione pole magnetyczne wytworzy dalszą poprawkę
do pola elektrycznego i tak bez końca. Mamy jednak wszystkie już potrzebne nam wzory.
Aby znaleźć pole B3, wystarczy skorzystać z równania (23.10), zmieniając wskaźniki
z 2 na 3.
Następną poprawką do pola elektrycznego jest
Ograniczając się do czterech wyrazów otrzymujemy następujące wyrażenie na pełne pole
elektryczne:
gdzie współczynniki liczbowe zapisaliśmy w taki sposób, że widać jasno, jak należy kon-
tynuować ten szereg.
Jako ostateczny wynik otrzymujemy, że pole elektryczne pomiędzy płytkami konden-
satora, dla dowolnej częstości, jest dane przez £oe'“' razy nieskończony szereg, który
zawiera tylko zmienną corje. Dla określenia nieskończonego szeregu pojawiającego się
w nawiasach równania (23.15) można zdefiniować specjalną funkcję, którą oznaczymy
7o(x):
_ . . . 1 lx\2 1 / x\4 1 I x\6
J0(x) = 1------I — I 4-----| — I-------1—I + ... (23.16)
(1 !)2 \2/ ' (2 !)2 \ 2/ (3!)2\2/
^asze rozwiązanie można wówczas zapisać jako Eoela>‘ razy ta funkcja, dla x = wrjc.
E = E^jA^\. (23.17)
48
23 REZONATORY WNĘKOWE
Naszą specjalną funkcję oznaczyliśmy symbolem Jq. Oczywiście, nie byliśmy pierw-
szymi, którzy zajęli się zagadnieniem drgań w walcu. Funkcja ta jest znana już od dawna
i zwykle ją się oznacza Jo. Spotyka się ją zawsze przy rozwiązywaniu zagadnień dotyczą-
cych fal o symetrii cylindrycznej. Funkcja Jo jest dla fal cylindrycznych tym, czym jest
funkcja cosinus dla fal rozchodzących się w jednym wymiarze. Jest to więc ważna funkcja,
wymyślona wiele lat temu. Później poczęto kojarzyć tę funkcję z matematykiem o nazwi-
sku Bessel. Wskaźnik zero oznacza, że Bessel wymyślił całe mnóstwo różnych funkcji
tego rodzaju, a ta jest właśnie pierwszą z nich.
Inne funkcje Bessela — , J2 itd. — mają związek z falami cylindrycznymi, których
natężenie zależy od kąta pomiędzy kierunkiem fali, a osią walca.
Całkowicie poprawione pole elektryczne pomiędzy płytkami naszego kolistego kon-
densatora, określone równaniem (23.17), jest przedstawione na wykresie rys. 23.5 linią
ciągłą. Dla niezbyt wielkich częstości nasze drugie przybliżenie okazuje się już całkiem
dobre. Trzecie przybliżenie jest jeszcze lepsze; w istocie jest ono tak dobre, że gdyby go
wykreślić, to nie moglibyśmy dostrzec żadnej różnicy pomiędzy takim wykresem, a wy-
kresem przedstawionym na rys. 23.5 linią ciągłą. W następnym jednak paragrafie zoba-
czymy, że dla otrzymania ścisłego opisu dla dużych promieni lub wielkich częstości po-
trzebny jest pełny szereg.
23-3. Wnęka rezonansowa*’
Chcemy teraz zobaczyć, co nam daje nasze rozwiązanie dla pola elektrycznego po-
między płytkami kondensatora, gdy przechodzimy ku coraz to większym częstościom.
Dla dużych a> parametr x = a>r/c także staje się duży i pierwsze kilka wyrazów szeregu
J0(x) gwałtownie wzrośnie. Oznacza to, że parabola, którą przedstawia rys. 23.5, opada
przy większych częstościach gwałtowniej w dół. Wygląda to właściwie tak, jakby pole
spadało do zera przy pewnej wielkiej częstości, może na przykład wtedy, gdy c/co jest
w przybliżeniu równe połowie a. Zobaczmy, czy funkcja J0(x) rzeczywiście przechodzi
przez zero i ozy zmienia znak. Zacznijmy od podstawienia x = 2:
Jo(2) = 1-1 + 4-^ = 0,22.
Funkcja ciągle jeszcze jest różna od zera; podstawmy więc większą wartość .r; powiedz-
my x = 2,5.
Po obliczeniach
JO(2,5) = 1-1,56+0,61-0,09 = -0,04.
Funkcja Jo już „poprzednio” przeszła przez zero. Porównując wyniki dla x = 2 i x =
= 2,5 widzimy, że funkcja Jo przechodzi przez zero dla x oddalonego od 2,5 o jedną pią-
tą przedziału (2;2,5). Pozwala to przypuszczać, że miejscem zerowym będzie x równe
w przybliżeniu 2,4. Zobaczmy, co nam ta wartość x daje:
J0(2,4) = 1-1,44+0,52-0,08 = 0,00.
*’ Porównaj: Tom I, cz. 1, rozdz. 23 (Rezonans).
23.j. WNĘKA REZONANSOWA
49
Otrzymujemy więc zero, z dokładnością do dwóch miejsc po przecinku. Gdyby rachu-
nek przeprowadzić dokładniej (albo, ponieważ Jo jest dobrze znaną funkcją, gdyby zaj-
rzeć do odpowiedniej książki), okazałoby się, że Jo przechodzi przez zero dla x = 2,405.
Wykonaliśmy jednak te rachunki sami, aby pokazać, że można to zrobić samemu, a nie
szukać wyniku w książkach.
Gdy już jednak zajrzymy do tablic funkcji Jo, warto się zainteresować przebiegiem
tej funkcji dla większych wartości x; przebieg ten ilustruje wykres z rys. 23.6. Ze wzro-
stem x funkcja J0(x) oscyluje pomiędzy wartościami dodatnimi i ujemnymi, przy czym
amplituda tych oscylacji maleje.
Otrzymaliśmy więc następujący interesujący wynik: jeżeli przejdziemy do dostatecz-
nie wielkich częstości, wzrost pola elektrycznego w środku naszego kondensatora bę-
dzie przeciwny niż zwrot pola elektrycznego w pobliżu krawędzi. Przypuśćmy na przy-
kład, że bierzemy częstość co na tyle wielką, że x — wr/c jest równe 4 na zewnętrznej
krawędzi kondensatora; wówczas krawędź kondensatora odpowiada współrzędnej osi
odciętych, x = 4, na rys. 23.6. Oznacza to, że nasz kondensator pracuje przy częstości
co = 4c/a. Na krawędziach płytek pole elektryczne będzie miało stosunkowo dużą war-
tość bezwzględną, ale zwrot jego będzie przeciwny do tego, którego można by się spo-
dziewać. To jest właśnie ta groźna sytuacja, w jakiej może się znaleźć kondensator przy
wielkich częstościach. Przy przejściu do bardzo wielkich częstości pole elektryczne oscy-
luje tam i z powrotem wiele razy, gdy posuwamy się od środka kondensatora ku jego kra-
wędziom. Pojawią się także, związane z tymi polami elektrycznymi, pola magnetyczne.
Nie należy się więc dziwić, że przy wielkich częstościach nasz kondensator nie zachowuje
się, jak przystało na pojemność doskonałą. Raczej należałoby się zastanowić, czy jest
on bardziej podobny do kondensatora, czy też do cewki indukcyjnej. Zaznaczmy, że na
krawędziach kondensatora zachodzą jeszcze bardziej złożone zjawiska, które pominę-
liśmy. Występuje tam na przykład promieniowanie fal na zewnątrz, poza krawędzie,
tak że naprawdę pola są jeszcze bardziej skomplikowane niż te, które obliczyliśmy, ale
na razie te zjawiska nie będą nas interesować.
23.6. Funkcja Bessela J0(x) ' ' . .
Wykłady z fizyki
50
23. REZONATORY WNĘKOWE
Moglibyśmy spróbować wymyślić układ zastępczy dla kondensatora, ale być może
będzie lepiej, jeśli po prostu przyznamy, że kondensator zaprojektowany przez nas dla
małych częstości nie będzie pracował należycie przy zbyt wielkich częstościach. Chcąc
omówić działanie takiego obiektu dla wielkich częstości powinniśmy porzucić to przy-
bliżenie równań Maxwella, na którym opierały się nasze metody opisu obwodów, i po-
wrócić do pełnego układu równań, które w pełni opisują pola w przestrzeni. Zamiast
zajmować się wyidealizowanymi elementami obwodu musimy zająć się przewodnikami
rzeczywistymi, takimi jakie one są, biorąc po uwagę wszystkie pola istniejące w przestrze-
ni pomiędzy tymi przewodnikami. Nie będziemy więc już próbowali konstruować na
przykład obwodu rezonansowego dla wielkich częstości używając do tego celu cewki i kon-
densatora płaskiego.
Wspomnieliśmy już, że opisywany przez nas kondensator płaski ma pewne właściwo-
ści zarówno kondensatora, jak i cewki indukcyjnej. Istnienie pola elektrycznego pociąga
za sobą istnienie ładunków na powierzchniach płytek, a pola magnetyczne wywołują
indukowaną siłę elektromotoryczną. Czyżbyśmy więc mieli już obwód rezonansowy?
Okazuje się, że tak! Przypuśćmy, że dobieramy częstość, przy której pole elektryczne
spada do zera dla pewnego promienia leżącego wewnątrz kolistej płytki, tzn. a>a/c jest
większe od 2,405. Pole elektryczne będzie wtedy równe zeru na pobocznicy walca, któ-
23.7. Pole elektryczne i magnetyczne w zam-
kniętej, cylindrycznej puszce
rego oś pokrywa się z osią kondensatora.
Przypuśćmy teraz, że bierzemy cienką folię
metalową i wycinamy z niej pasek o szero-
kości równej odległości płytek. Następnie wy-
ginamy ten pasek, nadając mu kształt obrę-
czy o promieniu równym promieniowi, dla
którego pole elektryczne jest równe zeru. Jeże-
li teraz umieścimy tę przewodzącą obręcz po-
między płytkami, to ponieważ nie ma tam pól
elektrycznych, nie popłyną przez nią żadne
prądy i nie nastąpią żadne zmiany w polach
elektrycznych i magnetycznych. Można więc
zewrzeć kondensator i nic się nie zmieni. Po-
patrzmy na to, co otrzymaliśmy: zamkniętą
cylindryczną puszkę, a wewnątrz niej pola ele-
ktryczne i magnetyczne, bez żadnych połączeń
z otoczeniem. Pola w środku nie zmienią się,
nawet gdy odrzucimy brzegi płytek wystające
z naszej puszki i przewody kondensatora. To,
co nam zostaje, to zamknięta puszka z polami
elektrycznymi i magnetycznymi w środku, jak
to pokazano na rys. 23.7a. Pola elektryczne
oscylują tam i z powrotem z częstością a>, która
- nie zapomnijmy - określiła średnicę puszki.
Amplituda oscylującego pola E zmienia się
23_j WNĘKA REZONANSOWA
51 —
z odległością od osi puszki, tak jak pokazano to na wykresie rys. 23.7b. Krzywa ta jest po
prostu pierwszym „lukiem” funkcji Bessela, rzędu zero. Linie sił poła magnetycznego
naszej puszki są okręgami o środkach leżących na osi puszki. Pole to oscyluje w czasie,
przesunięte w fazie względem pola elektrycznego o 90°.
Można także wypisać odpowiedni szereg dla pola magnetycznego i podać jego wy-
jcres, tak jak to zrobiono na rys. 23.7c.
Jak się to dzieje, że wewnątrz puszki pozbawionej połączeń z otoczeniem może istnieć
pole elektryczne i magnetyczne? Jest to dlatego możliwe, że pola elektryczne i magnetycz-
ne wzajemnie się podtrzymują; zmienne pole E wytwarza pole B, a zmienne pole B wy-
twarza pole E — tak jak wynika to z równań Maxwella. Pole magnetyczne ma charakter
indukcyjny, a elektryczne — pojemnościowy; wspólnie tworzą one coś w rodzaju obwo-
du rezonansowego. Zauważmy, że opisana powyżej sytuacja powstanie tylko w wypadku,
gdy promień puszki będzie dokładnie równy 2,405 c/co. Dla puszki o takim promieniu
pola elektryczne i magnetyczne będą się wzajemnie podtrzymywać — w opisany powy-
żej sposób — tylko dla szczególnej częstości. A więc cylindryczna puszka o promieniu r
jest rezonatorem dla częstości
(o0 = 2,405 —.
r
(23.18)
Powiedzieliśmy, że po całkowitym zamknięciu puszki pola będą w dalszym ciągu tak
samo jak przedtem oscylować. Nie jest to jednak całkiem prawdziwe. Byłoby to możliwe
jedynie wtedy, gdyby ścianki puszki były przewodnikami doskonałymi. Jednakże w wy-
padku rzeczywistej puszki zmienne prądy, które istnieją na wewnętrznych ściankach,
tracą energię na skutek oporu materiału. Oscylacje pól będą więc stopniowo zanikać.
Z rysunku 23.7 widać, że polom elektrycznym i magnetycznym wewnątrz wnęki muszą
towarzyszyć silne prądy. Ponieważ pionowe pole elektryczne urywa się gwałtownie na
dolnej i górnej ściance puszki, dywergencja pola w tych rejonach jest duża; na we-
wnętrznych powierzchniach puszki muszą się więc gromadzić dodatnie i ujemne ładunki
elektryczne, jak to pokazano na rys. 23.7a. Gdy pole elektryczne zmienia zwrot, ładunki
te muszą zmienić znak, co powoduje powstanie zmiennego prądu pomiędzy górną i dol-
ną ścianką puszki. Ładunki te będą przepływać w bocznych ściankach puszki, tak jak
to pokazano na rysunku. To, żew bocznych ściankach muszą płynąć prądy, można także
zrozumieć, jeżeli rozpatrzyć zachowanie się pola magnetycznego. Z wykresu na rys.
23.7c widać, że pole magnetyczne spada gwałtownie do zera na krawędzi puszki. Taka
nagła zmiana pola może zajść tylko w wypadku, gdy w ściance przepływa prąd. Ten to
właśnie prąd dostarcza górnej i dolnej ściance puszki ładunków elektrycznych o zmien-
nych znakach.
To odkrycie prądów w pionowych ściankach puszki jest dla nas pewną niespodzian-
ką- Cóż w takim razie z naszym poprzednim twierdzeniem, które mówiło, że wstawienie
tej prostopadłej ścianki w obszar, gdzie pole elektryczne było równe zeru, nie prowadzi
do żadnych zmian. Pamiętajmy jednak, że gdy przyprawiliśmy puszce boczną ściankę,
to płytki, górna i dolna, wystawały początkowo poza pobocznicę puszki, tak że również
na zewnątrz naszej puszki istniały pola magnetyczne. Dopiero gdy odrzuciliśmy wysta-
I
52
23. REZONATORY WNĘKOWE
jące poza krawędź puszki części płytek kondensatora, musiały na zewnętrznych powierzch-
niach pionowych ścianek pojawić się prądy wypadkowe.
Chociaż pola elektryczne i magnetyczne w całkowicie zamkniętej puszce będą stop-
niowo zanikać na skutek strat energii, możemy zatrzymać ten proces, jeżeli w puszce
zrobimy mały otwór i wprowadzimy przez niego trochę energii elektrycznej, która by
wyrównała straty. Weźmy kawałek drutu, przesuńmy go przez otwór w ściance puszki
i przymocujmy do wewnętrznej ścianki, tak aby powstała mała pętla, jak to pokazano
na rys. 23.8. Jeżeli połączymy teraz ten drut ze źródłem prądu zmiennego wielkiej częstości,
to prąd ten dostarczy energii polom elektrycznym i magnetycznym we wnęce i podtrzyma
ich oscylacje. Zajdzie to oczywiście tylko w tym wypadku, gdy częstość źródła zasilają-
cego będzie równa rezonansowej częstości puszki. Jeżeli częstość źródła będzie nieodpo-
wiednia, rezonans nie wystąpi i pola w puszce będą bardzo słabe.
Możemy łatwo zaobserwować rezonansowe właściwości naszej puszki, jeśli zrobimy
w niej drugi mały otwór i zamocujemy w nim drugą pętlę sprzęgającą, tak jak pokazuje
to rys. 23.8. Zmienne pole magnetyczne, przechodzące przez tę pętlę, wywoła w niej in-
dukowaną siłę elektromotoryczną. Jeżeli teraz połączymy tę pętlę z jakimś zewnętrznym
układem pomiarowym, to prądy w tym układzie będą proporcjonalne do natężeń pól
we wnęce. Przypuśćmy, że podłączymy teraz wejściową pętlę naszej wnęki do generatora :
sygnałów wielkiej częstości, jak to pokazano na rys. 23.9. Generator sygnałów jest źró- I
dłem prądu zmiennego, którego częstość można zmieniać przez obrót gałki umieszczo-
23.9. Układ do obserwacji rezonansu wnękowego
wnęka
23-3. WNĘKA REZONANSOWA
nej na przedniej ściance generatora. Następ-
nie pęt!? wyjściową wnęki łączymy z „detek-
torem”, który jest urządzeniem mierzącym
prąd w pętli wyjściowej, przy czym wskazania
miernika są proporcjonalne do natężenia tego
prądu. Jeżeli teraz przeprowadzimy pomiar
prądu wyjściowego w zależności od częstości
generatora sygnałów, otrzymamy funkcję,
której wykresem będzie taka krzywa, jak na
rys. 23.10. Prąd wyjściowy będzie tu mały
'o
•go
<^0 częstość
23.10. Krzywa rezonansu wnęki rezonansowej
dla wszystkich częstości, z wyjątkiem tych,
które leżą bardzo blisko co0, częstości wnęki
rezonansowej. Ta krzywa rezonansu przypomina w dużym stopniu krzywe, które opi-
saliśmy w rozdz. 23 tomu I (cz. 1). Szerokość rezonansu jest w tym wypadku jednak
dużo mniejsza niż w wypadku obwodów rezonansowych, utworzonych z cewek induk-
cyjnych i kondensatorów; znaczy to, że dobroć Q wnęki jest bardzo duża. Jeżeli wewnętrz-
ne ścianki są zrobione z jakiegoś materiału o bardzo dobrej przewodności (np. ze srebra),
to dobroć Q rzędu 100000 wcale nie jest czymś niezwykłym.
23-4. Typy drgań w rezonatorach wnękowych*’
Przypuśćmy, że chcemy sprawdzić teraz naszą teorię, dokonując w tym celu pomia-
rów dla jakiejś rzeczywistej puszki. Bierzemy puszkę o średnicy 7,6 cm i o wysokości
około 6,25 cm. Puszka ta ma pętlę wejściową i wyjściową, tak jak to pokazano na rys.
23.8. Jeżeli obliczymy oczekiwaną częstość rezenonansową tej puszki z równania (23.18),
to otrzymamy, że /0 = Wo/2rt = 3010 MHz. Gdy nastawimy częstość naszego generato-
ra sygnałów w pobliżu 3000 MHz i będziemy ją powoli zmieniać aż do momentu, w któ-
rym zaobserwujemy rezonans, przekonamy się, że maksymalny prąd na wyjściu odpo-
wiada częstości 3050 MHz, która jest wprawdzie całkiem zbliżona do przepowiedzianej
częstości rezonansu, ale nie identyczna. Istnieje kilka możliwych powodów tej rozbież-
ności. Być może, otwory, które wycięliśmy w ściankach w celu wprowadzenia pętli sprzę-
gających, zmieniają nieco częstość rezonansu. Ale ten powód odpada, bo jak wynika
z prostych rozważań, takie otwory powinny częstość rezonansu zmniejszyć tylko trochę.
Może więc skala częstości naszego generatora obarczona jest pewnym małym błędem
albo może nasz pomiar średnicy puszki nie był dostatecznie dokładny. W każdym razie
zgodność jest zupełnie dobra.
O wiele bardziej istotne jest zjawisko, które zachodzi, jeśli częstość generatora syg-
nałów zwiększać dalej — powyżej 3000 MHz. Gdy się to zrobi, otrzyma się wyniki po-
kazane na rys. 23.11. Okazuje się więc, że oprócz oczekiwanego przez nas rezonansu
w okolicy 3000 MHz istnieje także rezonans w pobliżu 3300 MHz i jeszcze jeden rezo-
Porównaj: tom I, cz. 2 rozdz. 49 (Fale stojące)
54
23. REZONATORY WNĘKOWE
□
•in
§
a
3050
3300
3820
3000
3500
, MHz
4000
23.11. Obserwowane częstości rezonansowe wnęki cylindrycznej
nans w pobliżu 3820 MHz. Co te dodatkowe rezonanse oznaczają? Może rys. 23.6 do-
starczy nam wskazówki do rozwiązania zagadki? Chociaż zakładaliśmy, że na krawędzi
puszki przypada pierwsze zero funkcji Bessela, to może się też tak zdarzyć, że krawędzi
puszki odpowiadałoby drugie zero funkcji Bessela, tak że posuwając się od środka puszki
23.12. Typ drgań o wielkich częstościach
do jej krawędzi zaobserwowaliśmy jedną pełną
oscylację pola elektrycznego, tak jak pokazano
to na rys. 23.12. Jest to inny możliwy typ drgań
oscylujących pól. Możemy się więc słusznie spo-
dziewać, że puszka będzie również rezonować
przy takim typie drgań. Ale zauważmy, że dru-
gie zero funkcji Bessela przypada dla x = 5,52,
a więc dla x przeszło dwa razy większego od
pierwszego miejsca zerowego. Częstość rezo-
nansowa tego typu drgań powinna być więc
większa niż 6000 MHz. Bez wątpienia moglibyś-
my znaleźć tam rezonans, ale to wszystko nie
wyjaśnia istnienia rezonansu dla 3300 MHz.
Powodem naszych kłopotów jest fakt, że w
naszym opisie zachowania się wnęki rezonanso-
wej uwzględniliśmy tylko jedną możliwą konfi-
gurację geometryczną pól elektrycznych i magne-
tycznych. Założyliśmy, że linie sił pól elektry-
cznych są pionowe, a linie sil pól magnetycznych
są okręgami leżącymi w płaszczyźnie poziomej.
Ale możliwe są i inne pola — wystarczy jedynie,
że spełnią one równania Maxwella i że pole ele-
ktryczne styka się ze ściankami pod kątem pro-
stym. Rozważaliśmy przypadek, w którym górna
23-4. TYPY DRGAŃ W REZONATORACH WNĘKOWYCH
i dolna ścianka puszki były płaskie, ale niewiele by się zmie-
niło, gdyby te ścianki były wygięte. W istocie, skąd puszka
może „wiedzieć”, które ścianki są jej ściankami górną
i dolną, a które są jej ściankami bocznymi? Można rzeczy-
wiście pokazać, że istnieje typ oscylacji pól, dla którego linie
sił pola elektrycznego pokrywają się, w większym lub w
mniejszym stopniu, ze średnicą puszki (rys. 23.13).
Nietrudno zrozumieć, dlaczego częstość własna tego typu
drgań jest zbliżona do częstości własnej typu drgań rozwa-
żanego przez nas na początku. Przypuśćmy, że zamiast
naszej wnęki cylindrycznej wzięlibyśmy wnękę, która ma
kształt sześcianu o krawędzi 7,6 cm. Wnęka ta będzie oczy-
wiście mieć trzy typy drgań ale wszystkie o tej samej częs-
tości. Drgania, podczas których pole elektryczne przyjmuje
kierunek „góra-dół”, będą zachodzić z tą samą częstością
co drgania, dla których pole elektryczne przyjmuje kieru-
nek „lewy-prawy”. Gdy teraz nasz sześcian poddamy defor-
macji tak, aby powstał z niego walec, to częstości się nieco
zmienią. Jeżeli jednak zachowamy wymiary wnęki mniej
więcej takie same jak poprzednio, możemy oczekiwać, że
częstości zbytnio się nie zmienią. Tak więc częstość drgań
typu przedstawionego na rys. 23.13 nie powinna się wiele
różnić od częstości drgań typu z rys. 23.8. Moglibyśmy,
choć nie będziemy tego teraz robić, dokładnie obliczyć czę-
stość własną dla typu drgań pokazanego na rys. 23.13.
Gdyby wykonać te obliczenia, okazałoby się, że dla przyję-
tych przez nas wymiarów wnęki częstość rezonansowa prawie
dokładnie odpowiada obserwowanemu przez nas rezonan-
sowi przy 3300 MHz.
23.13. Drgania poprzeczne
we wnęce cylindrycznej
23.14. Jeszcze inny typ drgań
we wnęce cylindrycznej
Przy pomocy podobnych obliczeń można wykazać, że powinien istnieć jeszcze inny
typ drgań z częstością rezonansową bliską znalezionej przez nas częstości 3800 MHz.
Dla tego rodzaju drgań pola elektryczne i magnetyczne wyglądają jak na rys. 23.14. Linie
sił pola elektrycznego nie zadają sobie trudu i nie przebiegają wzdłuż wnęki, a jedynie
°d ścianek bocznych do podstaw walca, jak to pokazano na rysunku.
Możemy już teraz uwierzyć w to, że przechodząc ku coraz to większym częstościom
Powinniśmy oczekiwać wystąpienia coraz to nowych rezonansów. Istnieje wiele ty-
pów drgań, każdy z nich o innej częstości rezonansowej, w zależności od pewnej szcze-
gólnej, skomplikowanej konfiguracji pól elektrycznych i magnetycznych. Każdą z tych
konfiguracji pól nazywamy rezonansowym typem drgań. Częstość rezonansową każdego
typu drgań można obliczyć rozwiązując równania Maxwella dla pól elektrycznych i magne-
tycznych we wnęce.
Gdy mamy rezonans przy pewnej szczególnej częstości, to jak możemy się przekonać,
J aki typ drgań został wzbudzony? Jeden ze sposobów polega na wstawieniu do wnęki
56
23. REZONATORY WNĘKOWE
b)
23.15. Krótki metalowy drut wprowadzony do wnęki zakłóci rezonans o wiele bardziej, gdy będzie
równoległy do linii sił pola E, niż gdy będzie do nich prostopadły
przez mały otwór kawałka drutu. Jeżeli pole elektryczne przebiega wzdłuż drutu, jak na
rys. 23.15a, to w drucie będą stosunkowo duże prądy „porywające” energię z pól i rezo-
nans będzie mniej wyraźny. Jeżeli zaś pole elektryczne wygląda jak na rys. 23.15b, wsta-
wienie drutu wywoła o wiele mniejszy efekt. W tym wypadku kierunek pola można zna-
leźć zginając drut, tak jak to pokazano na rys. 23.15c. Następnie obracając drut zaobser-
wujemy wyraźny efekt, gdy koniec drutu będzie równoległy do pola E, a najmniejszy
efekt, gdy koniec drutu będzie tworzyć z polem E kąt 90°.
23-5. Wnęki a obwody rezonansowe
Chociaż wydaje się, że opisywana przez nas wnęka rezonansowa różni się całkiem od
zwykłego obwodu rezonansowego, złożonego z cewki indukcyjnej i kondensatora, te
dwa układy rezonansowe są oczywiście ściśle spokrewnione. Oba te układy są członkami
jednej rodziny; są to po prostu dwa skrajne przypadki rezonatorów elektromagnetycz-
nych, a pomiędzy tymi dwoma przypadkami skrajnymi istnieje wiele przypadków pośred-
nich. Przypuśćmy, że zaczynamy rozważania od obwodu rezonansowego złożonego z po-
łączonych szeregowo kondensatora i cewki, tak jak to pokazano na rys. 23.16a. Obwód
ten będzie rezonować dla częstości coo = Jeżeli chcemy zwiększyć częstość re-
zonansu, możemy to uzyskać zmniejszając indukcyjność L. Jednym ze sposobów na zmniej-
szenie indukcyjności jest zmniejszenie liczby zwojów cewki. Jednakże nasze możliwości
są w tym przypadku ograniczone. W końcu pozostanie nam jeden ostatni zwój i będzie-
my wówczas mieli po prostu kawałek drutu, łączący górną płytkę kondensatora z płytką
dolną. Moglibyśmy jeszcze zwiększyć częstość rezonansu zmniejszając pojemność kon-
densatora; ale możemy także w dalszym ciągu zmniejszać indukcyjności, łącząc równo-
legle kilka elementów obwodu. Połączenie równolegle dwóch jednozwojowych cewek induk-
23-5. WNĘKI A OBWODY REZONANSOWE
57
23.16. Rezonatory mające coraz to większe częstości rezonansowe
cyjnych ma indukcyjność równą połowie indukcyjności każdego ze zwojów. Tak więc
gdy nasza cewka została zredukowana do jednego zwoju, możemy w dalszym ciągu zwięk-
szać częstość rezonansową dodając inne pętle łączące górną i dolną płytkę kondensato-
ra. Tak na przykład na rys. 23.16b pokazano płytki kondensatora połączone sześcioma
takimi ,,jednozwojowymi cewkami”. Jeżeli będziemy dodawać coraz to więcej takich
kawałków drutu, to w przypadku granicznym otrzymamy całkowicie zamknięty układ
rezonansowy o symetrii cylindrycznej, którego przekrój poprzeczny widzimy na rys. 23.16c.
Nasza cewka indukcyjna jest teraz pustą puszką w kształcie walca, przymocowaną do
krawędzi płytek kondensatora. Pola elektryczne i magne-
tyczne wyglądają tak, jak to pokazano na rysunku. Taki
układ jest oczywiście wnęką rezonansową i nazywa się go
wnęką „obciążoną”. Ale można go dalej uważać za obwód
L-C, którego część pojemnościowa odpowiada obszarowi,
w którym znajduje się większość pola elektrycznego, a część
indukcyjna odpowiada obszarowi, w którym znajduje się
większość pola magnetycznego.
Jeżeli chcemy jeszcze zwiększyć częstość rezonatora z rys.
23.16c, możemy to uzyskać przez dalsze zmniejszanie in-
dukcyjności L. Aby to zrobić, musimy zmniejszyć geome-
tryczne rozmiary części indukcyjnej przez, na przykład,
zmniejszenie wysokości h (patrz rysunek). Ze zmniejsze-
niem wysokości h częstość rezonansu będzie wzrastać.
W końcu otrzymamy oczywiście sytuację, w której wyso-
kość h będzie akurat równa odstępowi płytek kondensato-
ra. Będziemy mieć wówczas po prostu puszkę w kształcie
walca; nasz obwód rezonansowy stanie się rezonatorem
Wnękowym, takim jak na rys. 23.7.
23.17. Jeszcze jedna wnęka
rezonansowa
58 23. REZONATORY WNĘKOWE
Zauważmy, że w naszym pierwotnym obwodzie rezonansowym L-C z rys. 23.16a
pola magnetyczne i elektryczne były całkowicie rozdzielone. Gdy stopniowo zmienia-
liśmy układ rezonansowy, aby otrzymać coraz to większe częstości, pole magnetyczne
przybliżało się coraz bardziej ku polu elektrycznemu, aż w przypadku rezonatora wnę-
kowego oba te pola zupełnie się „wymieszały”.
Chociaż wszystkie omawiane przez nas w tym rozdziale rezonatory wnękowe były
puszkami cylindrycznymi, nie ma w tym kształcie nic magicznego. Puszka dowolnego
kształtu będzie miała częstości rezonansowe odpowiadające różnym możliwym typom
oscylacji pól elektrycznych i magnetycznych. Tak na przykład „wnęka” pokazana na rys.
23.17 będzie miała swój własny zbiór częstości rezonansowych, chociaż obliczenie ich
byłoby raczej trudne.
! i
24
falowody
24-1. Linia przesyłowa
W poprzednim rozdziale rozważaliśmy, co się działo ze skupionymi elementami obwo-
du w przypadku wielkich częstości, i przekonaliśmy się, że obwód rezonansowy mógł
być zastąpiony wnęką, w której drgania pól były w rezonansie. Innym interesującym pro-
blemem technicznym jest takie połączenie dwóch różnych obiektów, które umożliwiło-
by przesyłanie między nimi energii elektromagnetycznej. W obwodach malej częstości
połączenie to jest realizowane za pomocą drutów, ale metoda ta zawodzi dla wielkich
częstości, gdyż obwody będą wtedy promieniować energię w całą otaczającą je przestrzeń
i transport energii będzie się wymykać spod naszej kontroli. W przestrzeni na zewnątrz
przewodów pojawią się pola i wówczas prądy oraz napięcia nie będą przez druty bardzo
dobrze „prowadzone”. W bieżącym rozdziale chcemy rozpatrzyć sposoby łączenia ele-
mentów przy wielkich częstościach; problem ten będzie stanowić przynajmniej jeden
z aspektów naszego zagadnienia.
Zagadnienie nasze ma bowiem inny aspekt. Dotąd rozważaliśmy zachowanie się
fal w pustej przestrzeni. Teraz nadszedł czas, aby zobaczyć, co się dzieje, gdy oscylujące
Pola są ograniczone w jednym lub więcej wymiarach (tzn. pozbawione jednego lub wię-
ceJ stopni swobody). Odkryjemy nowe ciekawe zjawisko: gdy pola są ograniczone tylko
w dwóch wymiarach, a mogą się poruszać swobodnie w trzecim, przemieszczają się one
w postaci fal. Są to „fale prowadzone”; zajmiemy się nimi w tym rozdziale.
Zaczniemy od sformułowania ogólnej teorii linii przesyłowej. Zwykła linia przesy-
łowa, przebiegająca od słupa do słupa poprzez pola, wypromieniowuje część swojej ener-
ale częstości sieciowe (50-60 Hz) są tak małe, że strata ta nie jest istotna. Można by
Promieniowanie to zlikwidować, otaczając linię rurą metalową, ale taka metoda nie ma
Praktycznego zastosowania dla linii elektroenergetycznych, ponieważ używane napięcia
60
24. FALOWODY
i prądy wymagałyby użycia dużych, drogich i ciężkich rur. Dlatego też używa się prostych
„linii napowietrznych”.
Dla nieco większych częstości — powiedzmy kilku kiloherców — promieniowanie
może już być znaczne. Można je jednakże zmniejszyć, używając „dwuprzewodowej ple-
cionej” linii przesyłowej, tak jak się to robi w wypadku lokalnych połączeń telefonicz-
nych. Jednak przy większych częstościach promieniowanie staje się wkrótce niepożądane,
zarówno ze względu na straty energii, jak i ze względu na pojawienie się energii w innych
obwodach, mimo że wcale nie chcieliśmy jej tam mieć. Dla częstości od kilku kiloherców
do setek megaherców sygnały elektromagnetyczne i energia są zwykle przesyłane kabla-
mi koncentrycznymi, składającymi się z drutu wewnątrz cylindrycznego „przewodu ze-
wnętrznego” lub „osłony”. Chociaż przedstawiony poniżej formalizm będzie miał za-
stosowanie także do linii przesyłowej złożonej z dwóch równoległych przewodników do-
wolnego kształtu, przedstawimy go w odniesieniu do linii koncentrycznej.
Weźmy najprostszą linię koncentryczną, mającą przewód wewnętrzny, o którym za-
kładamy, że jest cienkim wydrążonym walcem, i przewód zewnętrzny, który też jest cien-
kim walcem o tej samej osi co przewód wewnętrzny (rys. 24.1). Zaczniemy od przybli-
żonego opisu zachowania się linii przy małych częstościach. Zachowanie się linii przy
małych częstościach częściowo opisaliśmy już poprzednio, kiedy to powiedzieliśmy, że
dwa takie przewody mają pewną indukcyjność na jednostkę długości lub pewną pojem-
ność na jednostkę długości. W istocie można opisać zachowanie się dowolnej linii prze-
24.1. Koncentryczna linia przesyłowa
34.2. Prądy i napięcia w linii przesyłowej
drut 1
l(x) I(x+Ax)
V(x) [ — —— 'V(x+4x)
drut 2 -
x+dx
X
syłowej przy małych częstościach przez poda-
nie jej indukcyjności na jednostkę długości
(Lo) i pojemności na jednostkę długości (Co).
Wówczas można rozpatrywać linię jako gra-
niczny przypadek filtru L-C, tak jak to
przedstawiono w § 22-7. Taki filtr, będący
obrazem linii przesyłowej, można zrobić
łącząc szeregowo małe elementy Lo zfx i bocz-
nikując je małymi elementami Co Ax, gdzie Ax
jest elementem długości linii. Korzystając
z naszych wyników dla nieskończonego filtru
widzimy, że wzdłuż linii następuje przemie-
szczanie się sygnałów elektrycznych. Zamiast
jednak rozpatrywać linię przesyłową jako
taki nieskończony filtr rozpatrzmy ją raczej
z punktu widzenia równania różniczkowego.
Przypuśćmy, że obserwujemy, co się dzie-
je w dwóch sąsiednich punktach leżących na
linii, powiedzmy w odległościach x i x+
od początku linii. Oznaczmy różnicę poten-
qałów pomiędzy przewodnikami przez V(x),
a prąd płynący wzdłuż przewodnika „go-
rącego” przez I(x) (patrz rys. 24.2). Jeżeli
24-l. LIN!*- PRZESYŁOWA
61
prąd w linii się zmienia, to na skutek indukcji powstanie na małym odcinku linii od x
xĄ-Ax spadek napięcia
dl
AV — V(x~ł-Ax')— V(x) = — L0Ax— .
dt
przechodząc do granicy dla dx->0, otrzymujemy
dV _ dl
dx 0 dt
(24.1)
Zmienny prąd powoduje powstanie gradientu napięcia.
Powracając do rysunku widzimy, że skoro w punkcie x zmienia się napięcie, to do
pojemności istniejącej w tym obszarze musi zostać dostarczony pewien ładunek. Jeżeli
więc weźmiemy mały odcinek linii pomiędzy x a x+Ax, to wystąpi na nim ładunek równy
q = Co Ark. Szybkość zmian ładunku w czasie wynosi C0AxdV/dt, ale jego zmiana na-
stąpi tylko w tym wypadku, gdy prąd I(x) dopływający do tego odcinka będzie różny
od prądu Z(x+Zlx) zeń wypływającego. Oznaczając tę różnicę przez Al mamy
, dv
Al = — C0Ax—-.
dt
Przechodząc do granicy dla Ax-*0 otrzymujemy
dl dV
dx dt
(24.2)
Tak więc zasada zachowania ładunku wymaga, aby gradient prądu był proporcjonalny
do szybkości zmian napięcia w czasie.
Równania (24.1) i (24.2) są więc podstawowymi równaniami linii przesyłowej. Mogli-
byśmy ewentualnie równania te zmodyfikować, tak aby uwzględniały one także efekty
związane z oporem drutu lub z upływem ładunku poprzez izolację pomiędzy przewodni-
kami, ale na razie pozostaniemy przy naszym prostym przykładzie.
Te dwa równania linii przesyłowej można połączyć razem różniczkując jedno z nich
względem t, a drugie względem x i eliminując z nich albo I, albo też V. Mamy wówczas
bądź
d2 V _ d2 V
bądź też
d2I d2I
dx2 dt2
Spotykamy się więc raz jeszcze z równaniem falowym względem zmiennej x. W przy-
padku jednorodnej linii przesyłowej napięcie (i prąd) przemieszcza się wzdłuż linii w po-
staci fali. Napięcie wzdłuż linii musi mieć postać V(x, t) = f(x—vi) lub V(x, f) = g(x+vt),
albo też musi być sumą obu tych rozwiązań. A co będzie z prędkością v tej fali? Wiemy,
62
24. FALOWODY
że współczynnikiem przy wyrazie 82/dt2 jest po prostu 1/r2, a więc
__ 1
Vl0Cq
(24.5)
Pozostawiamy Czytelnikowi do wykazania, że napięcie dla każdej fali w linii jest pro-
porcjonalne do prądu tej fali i że współczynnik proporcjonalności jest po prostu pozorną
opornością charakterystyczną Zo. Oznaczając przez V+ i I+ napięcie i prąd dla fali prze-
mieszczającej się w dodatnim kierunku osi x, powinno się otrzymać
r+ = Zo/+. (24.6)
Podobny związek dla fali biegnącej w ujemnym kierunku osi x ma postać
= -Z0Z_.
Pozorna oporność charakterystyczna — jak wynika to z naszych równań filtru — jest
dana przez
o
(24.7)
jest więc czystym oporem.
Aby znaleźć prędkość przenoszenia v i pozorną oporność charakterystyczną Z9 linii
przesyłowej, musimy znać indukcyjność i pojemność przypadające na jednostkę długości.
Dla kabla koncentrycznego można je łatwo obliczyć; zobaczmy więc, jak się to robi. Dla
indukcyjności przeprowadzamy podobne rozumowanie jak w § 17-8; podstawiamy
$LI2 równe energii magnetycznej, którą otrzymamy całkując eoc2B2/2 po objętości. Przy-
puśćmy, że przez środkowy przewód przepływa prąd I; wtedy jego pole B = I/2itEoc2r,
gdzie r jest odległością od osi. Biorąc za element objętości cylindryczną warstwę o gru-
bości dr i długości l, otrzymujemy następujące wyrażenie na energię magnetyczną:
eoc2 cl I \2
... (J =——• -------—\l2irrdr, '
, 2 J \27teoc r] ,
gdzie a i b są odpowiednio promieniami przewodu wewnętrznego i Zewnętrznego. Wy-
konując całkowanie otrzymujemy
I2l b ,
U = ------- -In — . (24.8)
47t£0C
Przyrównując tę energię do |ZJ2 znajdujemy
l . b
------In—
2k e0 c2 a
(24.9)
Jest ona, tak jak powinno być, proporcjonalna do długości l linii i indukcyjność na jed-
nostkę długości Lo jest zatem równa
ln(ó/O)
i ° 27t£0C2
(24.10)
244. linia przesyłowa
65
Obliczyliśmy poprzednio ładunek na kondensatorze cylindrycznym (patrz § 12-2).
•jeraz dzieląc ten ładunek przez różnicę potencjałów otrzymujemy
ln(b/a)
pojemność na jednostkę długości (Co) jest równa C/l. Zestawiając ten wynik z równaniem
(24.10) widzimy, że iloczyn L0C0 jest po prostu równy 1/c2, a v = 1//£0C0 jest tym sa-
mym równe c. Fala przebiega wzdłuż linii z prędkością światła. Zaznaczmy, że wynik
ten zależy od naszych założeń: a) że w przestrzeni między przewodami nie ma dielek-
tryków lub materiałów magnetycznych i b) że prądy przypływają tylko na powierzchniach
przewodników (tak jak działoby się to w wypadku przewodników doskonałych). Zo-
baczymy później, że dla dobrych przewodników przy wielkich częstościach wszystkie
prądy znajdują się na powierzchniach, tak jak w wypadku przewodników doskonałych,
czyli założenie to jest wtedy słuszne.
Interesujący jest tu fakt, że dopóki założenia a) i b) są słuszne, iloczyn £0C0 jest równy
1 je2 dla dowolnej równoległej pary przewodników — nawet, powiedzmy, dla przewod-
nika wewnętrznego o przekroju będącym sześciokątem, znajdującego się w eliptycznym
przewodzie zewnętrznym. Dopóki przekrój przewodu jest stały i w przestrzeni pomiędzy
przewodnikami nie ma żadnych materiałów, fale są przenoszone z prędkością światła.
Nie można wypowiedzieć takiego ogólnego twierdzenia o pozornej oporności cha-
rakterystycznej. Dla linii koncentrycznej jest ona równa
_ ln(ó/a)
0 2k£0 c
Współczynnik l/eoc ma wymiar oporu i jest równy 120k omów. Czynnik geometryczny
ln(ó/n) zależy w niewielkim stopniu od rozmiarów linii (logarytm!), tak więc dla linii
koncentrycznej — i dla większej liczby linii przesyłowych — typowe wartości pozornej
oporności charakterystycznej wahają się od około 50 do kilku setek omów.
(24.11)
24-2, Falowód prostokątny
To, o czym chcemy teraz mówić, wydaje się na pierwszy rzut oka zjawiskiem zadzi-
wiającym: jeżeli z linii koncentrycznej usunąć środkowy przewodnik, będzie ona mogła
w dalszym ciągu przenosić energię elektromagnetyczną. Innymi słowy, przy dostatecznie
wielkich częstościach pusta w środku rura będzie działała równie dobrze jak rura, wewnątrz
której są druty. Związane to jest z innym „tajemniczym” zjawiskiem, które już znamy —
obwód rezonansowy złożony z kondensatora i cewki indukcyjnej można przy wielkich
cz?stościach zastąpić po prostu puszką.
Chociaż może to się wydawać rzeczą niezwykłą dla kogoś, kto myśli o linii przesy-
łowej jako o zbiorze elementów mających pewną indukcyjność i pojemność, to każdy
z nas wie, że fale elektromagnetyczne mogą przebiegać wewnątrz pustej rury metalowej.
Jeżeli taka rura jest prosta, to można przecież przez nią patrzeć! Z pewnością więc fale
64
24. FALOWODY
elektromagnetyczne przechodzą przez rurę. Ale wiemy także, że taką pustą rurą metalową
nie można przesyłać fal małej częstości (mocy czy też sygnałów telefonicznych). Stąd
wynika, że fale elektromagnetyczne będą przechodzić wewnątrz rury tylko wtedy, gdy ich
długość będzie dostatecznie mała. Chcemy więc rozważyć graniczny przypadek największej
długości fali (lub najmniejszej częstości), która może przejść przez rurę o danych wy-
miarach. Ponieważ taka rura służy wówczas do przenoszenia fal, nazywamy ją
falowodem.
Zaczniemy nasze rozważania od rury o przekroju prostokątnym, ponieważ jest to naj-
prostszy przypadek do opisania. Podamy najpierw formalizm matematyczny, a później
powrócimy do opisu tego zagadnienia w sposób o wiele bardziej elementarny. Jednakże
to bardziej elementarne podejście można prosto zastosować tylko w przypadku falowodu
prostokątnego. Podstawowe zjawiska są natomiast takie same dla każdego falowodu
o dowolnym kształcie, co sprawia, że matematyczne rozważania będą zasadniczo bardziej
przekonywające.
Chcemy więc znaleźć, jakiego rodzaju fale mogą istnieć wewnątrz rury o prostokątnym
przekroju. Wybierzmy od razu jakiś dogodny układ współrzędnych; oś z weźmy wzdłuż
rury, a osie x i y równolegle do jej dwóch bocznych ścianek, tak jak to pokazano na rys. 24.3.
Wiemy, że fale świetlne przebiegające wzdłuż rury mają poprzeczne pole elektryczne;
spróbujmy więc najpierw poszukać rozwiązań, w których pole E będzie prostopadłe
do osi z i będzie miało na przykład tylko składową w kierunku osi y, równą Ey. To pole
elektryczne będzie miało różne wartości dla różnych punktów przekroju falowodu; w isto-
cie musi ono na ściankach równoległych do osi y spadać do zera, ponieważ prądy i ładunki
w przewodniku ustalają się zawsze tak, aby składowa styczna pola elektrycznego była
równa zeru na powierzchni przewodnika. Tak
więc wykres przebiegu funkcji Ey w zależ-
ności od x będzie jakąś krzywą, tak jak to pokaza-
no na rys. 24.4. Może jest to ta funkcja Bessela,
którą znaleźliśmy dla wnęki? Nie, funkcje Bessela
wiążą się bowiem z symetrią cylindryczną. Dla
prostokątnej geometrii fale są zwykle prostymi
funkcjami trygonometrycznymi, tak że powinniśmy
szukać zależności typu sinkxx.
Ponieważ szukamy fal, które przemieszczają
się wzdłuż falowodu, spodziewamy się, że pole
elektryczne będzie oscylowało pomiędzy warto-
ściami dodatnimi i ujemnymi, w miarę jak będzie-
my się przesuwać wzdłuż osi z, jak to przedstawia
rys. 24.5 i że oscylacje te będzie przemieszczać się
wzdłuż falowodu z pewną prędkością v. Jeśli ma-
my do czynienia z oscylacjami o pewnej określo-
nej częstości co, możemy przypuszczać, że zmiana
fali w zależności od z będzie typu cos(cot—k^z)
lub, używając dogodniejszej postaci matematycz-
24.3. Układ współrzędnych obrany do
opisu falowodu prostokątnego
24-2. FALOWÓD PROSTOKĄTNY
65
nej, typu exP I' TeS° typu zależ-
ność od z reprezentuje falę przemieszcza-
jącą się z prędkością v = w/kz (patrz
rozdz. 29, tom I, cz. 2).
Tak więc możemy przypuszczać, że fali
w falowodzie będzie odpowiadała taka
oto postać matematyczna:
g = Eo sinkxx exp [i(wt—k^z)]. (24.12)
Zobaczmy, czy to przypuszczenie bę-
dzie spełniać równania pola. Po pierwsze,
pole elektryczne nie powinno mieć składo-
wych stycznych na powierzchni przewod-
ników. Nasze pole spełnia ten postulat; jest
ono prostopadłe do górnej i do dolnej
ścianki, a na ściankach bocznych jest
równe zeru. Ściślej mówiąc, będzie ono
równe zeru, jeżeli kx wybierzemy tak, aby
połowa okresu funkcji sinkxx była dokład-
nie równa szerokości falowodu, czyli jeżeli
= k. (24.13)
Istnieją też inne możliwości, jak kxa = 2k ,
3t:,..., czyli ogólnie,
kxa = mz, (24.14)
gdzie n jest dowolną liczbą całkowitą.
Reprezentują one różne skomplikowane
konfiguracje pola, ale ograniczmy się teraz
do najprostszej, gdzie kx = n/a, przy czym
a jest szerokością wnętrza falowodu.
Po drugie, dywergencja wektora E musi
być równa zeru w pustej przestrzeni we-
wnątrz falowodu, ponieważ nie ma tam
żadnych ładunków. Nasze pole ma tylko
składową w kierunku osi y; składowa ta
n’e zmienia się z y, tak więc V-E = 0.
Na koniec, nasze pole elektryczne mu-
Sl spełniać pozostałe równania Maxwełła
w pustej przestrzeni wewnątrz falowodu,
kst to równoznaczne z żądaniem, aby
nasze pole spełniało równanie falowe:
££ ćpe, i <pe, _
flyl c2 fl[2
(24.15)
~~ Wykłady z fizyki
24.4. Pole elektryczne w falowodzie dla pewnej
wartości z
24.5. Zależność pofa elektrycznego w falowo-
dzie od z
y
o
o
66
24. FALOWODY
Musimy sprawdzić, czy nasza hipoteza, sformułowana w równaniu (24.12), spełnia powyż-
sze równanie. Druga pochodna Ey względem x jest równa po prostu — k^Ey. Druga zaś
pochodna względem y jest równa zeru, ponieważ nic w naszym zagadnieniu od y nie za-
leży. Druga pochodna względem z jest natomiast równa —!<?zEy, a druga pochodna wzglę.
dem t jest równa — (n2Ey. Równanie (24.15) mówi więc, że
co2
Ł J ’ • ' ^y+k^Ey--------TEy = Q-
c
Jeżeli Ey nie jest równe wszędzie zeru (co nie jest zbyt interesującym przypadkiem), to rów-
nanie to będzie słuszne, gdy
_ , (a2 . - • i >
k2+k2- — = Q. (24.16)
Ustaliliśmy już wartość kx, a więc równanie to mówi nam, że fale oczekiwanego przez nas
typu będą mogły istnieć wtedy, gdy k2 będzie związane z częstością przez równanie (24.16) —
innymi słowy, jeżeli
k, = V(ai2lc2)-(it2/a2). (24.17)
Opisane przez nas fale przemieszczają się w kierunku osi z i mają tę właśnie wartość kz.
Liczba falowa k2 z równania (24.17) określa nam, dla danej częstości co, prędkość, z jaką
węzły fali przemieszczają się wzdłuż falowodu. Prędkość fazowa jest równa
aj
v = —
k7
(24.18)
Pamiętamy, że 2, długość fali bieg-
nącej, dana jest przez 2 = 2ki;/co, tak
więc kz jest także równe 2rr2g, gdzie
2g jest długością fali oscylacji zachodzą-
cych wzdłuż osi z — „długością fali
falowodu”. Długość fali w falowodzie
jest oczywiście różna od długości fali
fal elektromagnetycznych o tej samej
częstości, rozchodzących się w pustej
przestrzeni. Jeżeli oznaczymy długość
fali w pustej przestrzeni przez 20, przy
czym 20 = Inclai, możemy równanie
(24.17) zapisać w postaci
(2410
rnw
Oprócz pól elektrycznych istniej^
j4-2 FALOWÓD PROSTOKĄTNY
67
rzernieszczać się z falą. Nie będziemy się jednak kłopotać teraz znalezieniem wyrażeń opi-
$ująCyeh te pola. Ponieważ c2 V x B = dE/dt, linie sił pola B będą okrążały obszar, w którym
-g/dt będzie największe, to znaczy w połowie drogi pomiędzy maksimum i minimum E. Te
pętle B będą leżały w płaszczyznach równoległych do płaszczyzny xz, pomiędzy „doli-
nami” i „szczytami” pola E, jak pokazano to na rys. 24.6.
24-3. Częstość graniczna
Równanie określające wielkość kz [równanie (24.16)] ma w rzeczywistości dwa pier-
wiastki — jeden dodatni, a drugi ujemny. Powinniśmy to zapisać w postaci
kz = ± /(co2/c2)-(rc2/a2). (24.20)
Dwa znaki przed pierwiastkiem oznaczają po prostu, że oprócz fal, które przemieszczają
się w falowodzie w kierunku dodatnim, mogą również istnieć fale, które przemieszczają
się z ujemną prędkością fazową (w kierunku —z). Oczywiście, fale mogą się rozchodzić
w każdym z dwóch kierunków. Ponieważ oba typy fal mogą być obecne w tej samej chwili,
to istnieje również możliwość rozwiązania w postaci fali stojącej.
Z naszego równania na kz wynika także, że większym częstościom odpowiadają większe
wartości kz, czyli mniejsze długości fali, aż w granicy dla dużych <o k staje się równe co/c,
a więc wartości, której spodziewaliśmy się dla fal w pustej przestrzeni. Światło oglądane
przez rurę biegnie przez nią nadal z prędkością c. Zauważmy natomiast, że gdy przejdziemy
ku małym częstościom, zacznie się dziać coś dziwnego. Początkowo długość fali będzie
coraz bardziej rosła, ale gdy co stanie się zbyt małe, to wielkość pod pierwiastkiem w rów-
naniu (24.20) nagle stanie się ujemna. Będzie tak wtedy, gdy tylko co stanie się mniejsze
od inc/a lub gdy 20 stanie się większe od 2a. Innymi słowy, dla częstości mniejszej od pew-
nej częstości krytycznej liczba falowa kz (a także 2?) staje się urojona i wówczas nie mamy
już rozwiązania. A może jednak mamy? Kto powiedział, że kz musi być rzeczywiste? Co
z tego, że otrzymujemy kz urojone — równania pola pozostają przecież w dalszym ciągu
spełnione. Może więc i urojone kz reprezentuje jakąś falę?
Przypuśćmy, że co jest mniejsze od coc; można wówczas zapisać
kz = ±ik', (24.21)
gdzie k’ jest dodatnią liczbą rzeczywistą: >
k' = I/(K2/a2)-(co2/c2). (24.22)
Jeżeli teraz wrócimy do naszego wyrażenia na Ey [równanie (24.12)], otrzymamy
Ey = EosinM e,(“'T‘Vz), (24.23)
Co możemy zapisać w następującej postaci:
Ey = Eo sin kxx . (24.24)
Wyrażenie to określa nam pole E, które oscyluje w czasie jak e'"', ale które zmienia
68
24 FALOWODY
24.7. Zależność Ey od z dla <u <C a>e
widzimy, że dla częstości nieco mniejszych
się w zależności od zmiennej z jak e±fc z. Jako
funkcja wykładnicza zmiennej rzeczywistej 2
wyrażenie to stale maleje (lub też stale roś-
nie). Przy wyprowadzaniu naszych wzorów nie
zatroszczyliśmy się o źródła, które generują
fale, ale oczywiście gdzieś w falowodzie musi
być także źródło. Znak k' musi być tak wy-
brany, aby pole malało wraz ze wzrostem
odległości od źródła fal.
Tak więc dla częstości poniżej mc ~ izcja
fale nie przemieszczają się wzdłuż falowodu;
oscylujące pola przenikają w głąb falowodu
tylko na odległość rzędu 1/k'. Z tego powodu
częstość coc nazywamy „częstością graniczną”
falowodu. Przyglądając się równaniu (24.22)
od coc, liczba falowa k' jest mała i pola mogą
przenikać w głąb falowodu na duże odległości. Ale gdy a> jest znacznie mniejsze od coc,
współczynnik k' w wykładniku jest równy ~/a i pole znika bardzo gwałtownie, tak jak
pokazano to na rys. 24.7. Na odległości a/n, czyli równej mniej więcej | szerokości falowodu,
pole maleje w stosunku 1 /e. Pola przenikają wtedy na bardzo małe odległości od źródła.
Chcemy podkreślić interesujący wynik w naszym opisie fal prowadzonych — poja-
wienie się urojonej liczby falowej kz. Zwykle gdy rozwiązujemy równanie fizyki i otrzy-
mujemy liczbę urojoną, rozwiązanie to nie ma sensu fizycznego. Jednakże dla fal urojona
liczba falowa ma pewne określone znaczenie. Równanie falowe pozostaje w dalszym
ciągu spełnione; oznacza to jedynie, że jako rozwiązanie otrzymujemy wykładniczo ma-
lejące pola zamiast przemieszczających się fal. Tak więc, jeżeli w jakimś problemie fa-
lowym liczba k staje się dla pewnej częstości urojona, oznacza to, że postać fali ulega
zmianie — fala sinusoidalna zmienia się w falę wykładniczą.
24-4. Prędkość fal prowadzonych
Prędkość fali, która występowała w powyższych rozważaniach, jest prędkością fazową,
będącą szybkością przemieszczania się węzłów fali; jest ona funkcją częstości. Możemy ji
zapisać, posługując się równaniami (24.17) i (24.18), jako
c
faZ /l—(coc/co)2
(24.25)
Dla częstości większych od częstości granicznej, dla których istnieją przemieszczające się
fale, jest mniejsze od jedności i prędkość fazowa jest rzeczywista i większa niż prędkość
światła. Już w rozdz. 48 tomu I (cz. 2) przekonaliśmy się, że są możliwe prędkości fazo*'e
większe od prędkości światła, ponieważ to tylko węzły fal poruszają się z takimi pręd-
kościami, a nie energia czy też informacja. Aby dowiedzieć się, jak szybko będą przebiegać
24-4. PRĘDKOŚĆ FAL PROWADZONYCH
69
sygnały, musimy obliczyć prędkość impulsów lub modulacji powstałych w wyniku in-
terferencji fali o pewnej częstości z jedną lub z kilkoma falami o częstościach nieco od niej
różnych (patrz rozdz. 48 tomu I, cz. 2). Prędkość obwiedni takiej grupy fal nazwaliśmy
prędkością grupową; nie jest ona równa co/k tylko dw!dk:
da>
”gruP = (24.26)
Różniczkując równanie (24.17) względem co i przekształcając wynik, aby otrzymać dwjdk,
znajdujemy, że __________
pgrUp = cł/l-(co»2, (24.27)
a więc jest mniejsza od prędkości światła.
Średnia geometryczna rfaz i fgrup jest równa właśnie c, prędkości światła:
Wgrup = C2. * (24.28)
To ciekawe — z podobnym związkiem spotkaliśmy się w mechanice kwantowej. Dla cząstki
o dowolnej prędkości — nawet relatywistycznej — pęd p i energia U są związane zależ-
nością :
U2 = p2c2+m2c*. (24.29)
Ale w mechanice kwantowej energia jest równa Tioy a pęd K/%, co z kolei równe jest Kk;
tak więc równanie (24.29) można zapisać w postaci
czyli
k = V(a)2/c2)—(m2c2/K2), (24.31)
która to postać bardzo przypomina postać równania (24.17)... Interesujące!
Prędkość grupowa fal jest także prędkością, z jaką przesyłana jest energia wzdłuż
falowodu. Chcąc znaleźć przepływ energii wzdłuż falowodu, należy pomnożyć gęstość
energii przez prędkość grupową. Jeżeli pierwiastek ze średniej kwadratu pola elektrycznego
wynosi Eo, to średnia gęstość energii elektrycznej wynosi e0E^/2. Istnieje też pewna
energia związana z polem magnetycznym. Nie będziemy tego tutaj dowodzić, ale w każdej
wnęce czy też w falowodzie energia elektryczna i magnetyczna są sobie równe, tak że cał-
kowita gęstość energii elektromagnetycznej wynosi e0E^. Moc dUjdt przesyłana przez
falowód jest więc równa
— = e0E2abv^. (24.32)
(Później poznamy inny, ogólniejszy sposób obliczania przepływu energii.)
^4-5. Obserwacja fal prowadzonych
Energię można wprowadzać do falowodu za pomocą jakiejś „anteny”. Może to być
na Przykład mały pionowy drut lub „dipol”. Obecność fal prowadzonych można obser-
70
24. FALOWODY
Falowód z dipolem zasilającym i sondą zbiorczą
wować pobierając pewną część energii elektromagnetycznej za pomocą małej „anteny”
odbiorczej, którą także może być mały kawałek drutu lub mała pętla. Rysunek 24.8 przed-
stawia falowód, w którego ściankach wycięto otwory, aby pokazać zasilający dipol i „son-
dę”. Zasilający dipol można połączyć z generatorem sygnałów kablem koncentrycznym,
a sondę można połączyć podobnym kablem z detektorem. Zwykle wygodnie jest wpro-
wadzać sondę przez długą, wąską szczelinę w falowodzie, tak jak to pokazano na rys. 24.8.
Następnie przesuwając sondę wzdłuż falowodu tam i z powrotem można badać pola
w różnych punktach.
Jeżeli częstość generatora sygnałów nastawić tak, aby była ona większa od częstości
granicznej a>c, to pojawią się fale przemieszczające się od dipola zasilającego w głąb fa-
lowodu. Są to jedyne fale, jakie mogą się pojawić w wypadku, gdy falowód jest nieskoń-
czenie długi, co można efektywnie osiągnąć przez zakończenie falowodu odpowiednio
dobraną ścianką pochłaniającą, tak aby na końcu nie było odbić. Wówczas ponieważ
detektor mierzy średnią czasową z pól w pobliżu sond, sonda pobierze sygnał, który jest
niezależny od odległości od początku falowodu; wskazania na wyjściu będą proporcjo-
nalne do przesyłanej falowodem mocy.
Jeżeli teraz koniec falowodu zamkniemy w taki sposób, że spowoduje to powstanie
fali odbitej — jako skrajny przykład przyjmiemy, że zamykamy go płytką metalową —
to oprócz istniejącej pierwotnie fali padającej pojawi się fala odbita. Te dwie fale będą
interferować i wytworzą w falowodzie falę stojącą, podobną do fal stojących w strunie,
które opisywaliśmy w rozdz. 49 tomu I (cz. 2). Wówczas przesuwając sondę wzdłuż falo-
wodu zobaczymy, że wskazania detektora ulegają okresowym zmianom — detektor
wykazuje maksimum pól w każdej strzałce, a minimum w każdym węźle fali stojącej. '
Odległość pomiędzy dwoma kolejnymi węzłami (lub strzałkami) równa jest po prostu 2g/2-
Daje to dogodny sposób pomiaru długości fali w falowodzie. Jeżeli teraz częstość jest
bliska a>c, to odległość pomiędzy węzłami zwiększa się, co odpowiada wzrostowi długości
fali w falowodzie, zgodnie z równaniem (24.19).
Przypuśćmy teraz, że częstość generatora sygnałów obieramy tak, aby była odrobin?
mniejsza od coc. Wówczas w miarę jak będziemy przesuwać sondę w głąb falowodu,
wyjściowa detektora będzie stopniowo maleć. Jeżeli częstość byłaby jeszcze mniejsza, tf
natężenie pola gwałtownie by spadło, zgodnie z krzywą z rys. 24.7, wskazując na zanik
propagacji fal.
24-6. MONTAŻ FALOWODÓW
71
j44». Montaż falowodów
Z ważnym praktycznym zastosowaniem falowodów spotykamy się przy przesyłaniu
energii o wielkiej częstości, gdy na przykład łączymy oscylator wielkich częstości lub wyjście
wzmacniacza aparatury radarowej z anteną. W istocie sama antena zwykle składa się
i parabolicznego reflektora zasilanego w swoim ognisku przez falowód, rozszerzony na
końcu na kształt „tuby”, która wypromieniowuje fale przebiegające wzdłuż falowodu.
Chociaż sygnały wielkiej częstości można przesyłać kablem koncentrycznym, to
jednak jeżeli przesyła się dużą moc, lepszy jest falowód. Po pierwsze, maksymalna moc,
jaką można przesłać linią przesyłową, jest ograniczona możliwością przebicia izolatora
(ciała stałego czy też gazu) pomiędzy przewodnikami. Dla danej mocy natężenia pól
w falowodzie są zwykle mniejsze od natężeń pól w kablu koncentrycznym, tak więc falo-
wodem można przesyłać większą moc, zanim nastąpi przebicie. Po drugie, w kablu kon-
centrycznym są zwykle większe straty mocy niż w falowodzie. W kablu koncentrycznym
centralny przewód musi być otoczony jakimś materiałem izolacyjnym, a w takim izola-
torze zachodzą straty energii — szczególnie przy wielkich częstościach. Poza tym gęstości
prądu w centralnym przewodzie są stosunkowo duże, a ponieważ straty rosną z kwadra-
tem gęstości prądu, to mniejsze prądy, które pojawiają się na ściankach falowodu, będą
powodować mniejsze straty energii. Aby redukować straty do minimum, wewnętrzne
ścianki falowodu pokrywa się często materiałem o dobrej przewodności właściwej, takim
jak srebro.
Zagadnienie łączenia „obwodu” za pomocą falowodów różni się zupełnie od zagad-
nienia tego typu przy małych częstościach i zwykle się je nazywa „hydrauliką mikrofalową”.
Zagadnieniu temu, od strony technicznej, poświęcono już wiele prac. Tak na przykład dwa
człony falowodu zwykle łączy się razem za pomocą „kołnierzy”, co można zobaczyć na
rys. 24.9. Takie połączenia mogą jednakże powodować poważne straty energii, ponieważ
prądy powierzchniowe muszą przepływać przez złącze, które może mieć stosunkowo duży
24.9. Łączenie falowodów za pomocą kołnierzy 24.10. Połączenie o niskich stratach pomiędzy
dwoma członami falowodu
kołnierz
falowód
/i wnęka
rezonansowa
falowód
72
24. FALOWODY
24.11. Falowód „T”. Na kołnierze są nało-
żone plastykowe kapturki, mające na celu
utrzymanie wnętrza falowodu „T” w czystości,
w czasie gdy me jest on używany
24.12. Pola elektryczne w falowodzie „T”
dla dwóch możliwych orientacji pól
opór. Jednym ze sposobów zabezpieczenia
się przed takimi stratami jest robienie koł-
nierzy, jak to pokazano w przekroju na rys.
24.10. Pomiędzy sąsiednimi członami falo-
wodu pozostawia się mały odstęp, a na ze-
wnętrznej ściance kołnierza wycina się rowek,
tak aby powstała mała wnęka, podobna do
wnęki z rys. 23.16c. Rozmiary rowka tak się
dobiera, aby powstała wnęka była dla prze-
syłanej częstości wnęką rezonansową. Taka
wnęka rezonansowa stanowi dla prądów du-
żą „oporność pozorną” i poprzez metalowe
złącza (w punkcie a na rys. 24.10) przepływa
stosunkowo mały prąd. Duże prądy płynące
przez falowód będą po prostu ładowały i roz-
ładowywały „pojemność” przerwy pomiędzy
członami falowodu (punkt b na rysunku),
gdzie rozproszenie energii jest małe.
Przypuśćmy, że chcemy tak zakończyć fa-
lowód, aby nie powstawały fale odbite. Mu-
simy więc dołączyć do końca falowodu coś,
co imituje nieskończoną długość falowodu.
Potrzebna nam jest „końcówka”, która dla
falowodu spełnia podobną rolę jak pozorna
oporność charakterystyczna dla linii przesy-
łowej — coś, co pochłania fale przychodzące,
nie wywołując odbić. Wówczas falowód bę-
dzie tak działał, jakby się ciągnął bez końca.
Takie końcówki realizujemy umieszczając we-
wnątrz falowodu kliny z materiału o od-
powiednio dobranym oporze, aby pochłaniał
energię fali, a nie wytwarzał prawie wcale
fal odbitych.
Jeżeli chcemy połączyć razem trzy ele-
menty — na przykład jedno źródło z dwiema
różnymi antenami — wówczas możemy p0'
służyć się falowodem w kształcie litery „T ,
jaki widzimy na rys. 24.11. Energia dostar-
czana środkowym kanałem rozdziela się
dwie części i wychodzi dwoma ramionanU
(mogą przy tym powstać także fale odbite)-
Rysunek 24.12 daje „jakościowy” obraz pó’
w falowodzie „T”; dochodząc do konc3
73
24-6. MONTAŻ FALOWODÓW
^nalu wejściowego pola rozprzestrzeniają się
i wytwarzają pola elektryczne, które z kolei
powodują powstanie fal rozchodzących się
w obu ramionach. W zależności od tego,
czy pola w kanale wejściowym są równoległe,
czy też prostopadłe do ramion falowodu ,,T”,
pola w rozgałęzieniu będą wyglądać z grubsza
tak, jak na części a) lub części b) rys. 24.12.
Na zakończenie chcielibyśmy opisać urzą-
dzenie nazywane „łącznikiem jednokierun-
24.13. Łącznik jednokierunkowy
kowym”, które jest bardzo użyteczne do określenia sytuacji powstałej po połączeniu skom-
plikowanego układu falowodów. Przypuśćmy, że chcemy wiedzieć, w jakim kierunku
przebiegają fale w pewnym określonym członie falowodu — mogłoby nas na przykład
interesować czy powstała tam (czy też nie) fala odbita o dużym natężeniu. Łącznik jedno-
kierunkowy jest zdolny pobrać niewielką część energii w falowodzie, jeżeli fala przebiega
w jednym kierunku, a nie pobiera żadnej energii, jeżeli fale przenoszą się w kierunku
przeciwnym. Łącząc wyjście łącznika z detektorem możemy mierzyć „jednokierunkową”
moc w falowodzie.
Rysunek 24.13 przedstawia nam taki łącznik jednokierunkowy; dwa człony falo-
wodu AB i CD przylutowano do siebie ściankami. Falowód CD jest wygięty tak, aby koł-
nierze obu falowodów miały się gdzie podziać. Przed zlutowaniem w każdym z falowodów
wierci się dwa lub więcej otworów (pasujących do siebie), tak że część pola w głównym
falowodzie może zostać przesłana do pomocniczego falowodu CD. Każdy z tych otworów
działa jak mała antena i wytwarza pole w falowodzie pomocniczym. Gdyby był tylko
jeden otwór, fale byłyby przesyłane w obu kierunkach i byłyby takie same, niezależnie
od kierunku rozprzestrzeniania się fali w głównym falowodzie. Ale jeżeli są dwa otwory,
odległe od siebie o czwartą część długości fali w falowodzie, to będą one odgrywały rolę
dwóch źródeł przesuniętych względem siebie w fazie o 90°. Przypomnijmy sobie jak
w rozdz. 29 tomu I (cz. 2) rozważaliśmy interferencję fal z dwóch anten odległych od
siebie o ź/4 i tak kolejno wzbudzanych, że były przesunięte w fazie o 90°. Przekonaliśmy
się, że fale odejmują się w jednym kierunku, a dodają w kierunku przeciwnym. To samo
będzie się działo tutaj. Fala wytworzona w falowodzie CD będzie posuwać się w tym
samym kierunku co fala w falowodzie AB.
Jeżeli fala w falowodzie głównym przebiega od A do B, na wyjściu D pomocniczego
falowodu także pojawi się fala. Jeżeli fala w głównym falowodzie przechodzi od B do A,
w falowodzie pomocniczym powstanie fala przebiegająca w kierunku końca C. Koniec
*en jest wy posażony w przesłonę, która pochłania falę padającą i wówczas na wyjściu
stznika nie pojawia się żadna fala.
^7. Typy drgań w falowodzie
Fala, którą opisaliśmy, stanowi jedno z wielu możliwych rozwiązań równań pola.
a*de takie rozwiązanie nazywamy „typem drgań” falowodu. Tak na przykład zależ-
74
24. FALOWODY
24.14. Inna możliwa zależność Ey od x
ność naszego pola od zmiennej x była dana
przez połowę cyklu fali sinusoidalnej. Istnieje
równie dobre rozwiązanie, dla którego zależ-
ność pola Ey od x jest dana przez pełny cyk]
fali sinusoidalnej, tak jak pokazano to na
rys. 24.14. Liczba falowa kx dla takiego typu
drgań jest dwa razy większa, a więc i częstość
graniczna jest znacznie większa. W rozważanej
przez nas fali pole E miało tylko składową E
ale istnieje wiele innych typów drgań, dla
których pola elektryczne są o wiele bardziej
skomplikowane. Jeżeli pole elektryczne ma
tylko składowe w kierunkach x i y, tak że wy.
padkowe pole elektryczne jest zawsze prosto-
padłe do kierunku z, to taki typ drgań na-
zywamy „elektrycznie poprzecznym” (trans-
wersalnym) i oznaczamy go TE. Pole ma-
gnetyczne dla takich typów drgań ma zawsze
składową w kierunku osi z. Przeciwnie, gdy
pole E ma zawsze składową z-ową (wzdłuż kierunku przemieszczania się fali), to pole
magnetyczne ma wówczas tylko składowe poprzeczne. Takie pola nazywamy „magne-
tycznie poprzecznymi” typami drgań (TM)*’. W falowodzie prostokątnym wszystkie
inne typy drgań mają częstość graniczną większą niż prosty typ drgań TE, który opisa-
liśmy. Można więc — i zwykle się tak robi — używać falowodu przy częstości nieco więk-
szej od częstości granicznej dla najprostszego typu drgań, ale mniejszej od częstości granicz-
nych dla wszystkich innych typów drgań, tak że przesyłany jest tylko ten jeden typ drgań.
W przeciwnym wypadku sytuacja panująca w falowodzie mocno się komplikuje i wymyka
się spod naszej kontroli.
24-8. Inny sposób patrzenia na fale prowadzone
Chcemy teraz przedstawić inny sposób wytłumaczenia, dlaczego to falowód gwałtow-
nie „tłumi” pola dla częstości mniejszych od częstości granicznej a>c. Pozwoli to nam mieć
bardziej „fizyczny” pogląd na krańcowe zmiany zachowania się falowodu przy przejściu
od częstości małych do dużych. Dla falowodu prostokątnego sposób ten sprowadza się
do opisu pól za pomocą metod odbić lub obrazów względem ścian falowodu. Podejście
to jednakże ma zastosowanie tylko do falowodów prostokątnych; dlatego też zaczęliśmy
od opisu matematycznego, który w zasadzie ma zastosowanie do falowodów o dowolny10
kształcie.
•i W języku polskim używa się najczęściej dla typu drgań TE określenia: „fala H” (ponieważ kieru®^
wektora pola magnetycznego pokrywa się z kierunkiem propagacji), a dla typu drgań TM — fala E. (PrZ^‘
thim.)
24-8. INNY SPOSÓB PATRZENIA NA FALE PROWADZONE
75
Dla opisanego przez nas typu drgań wymiary pionowe falowodu (y) nie odgrywały
żadnej roli, tak że możemy odrzucić górną i dolną ściankę falowodu i wyobrazić sobie,
2e w kierunku pionowym falowód rozciąga się w nieskończoność. Wyobrażamy sobie
więc, że falowód składa się tylko z dwóch pionowych płyt odległych od siebie o a.
Załóżmy, że źródłem pól jest umieszczony w środku falowodu pionowy drucik, przez
który przepływa prąd zmienny o częstości co. Gdyby nie było ścianek falowodu, drucik
taki promieniowałby fale cylindryczne.
Przyjmijmy, że ścianki falowodu są przewodnikami doskonałymi. Wówczas, tak jak
w elektrostatyce, warunki na powierzchni ścianek będą spełnione, jeżeli do pola wytworzo-
nego przez nasze źródło dodamy pole wytworzone przez jeden lub więcej odpowiednio
skonstruowanych obrazów źródła. Metoda obrazów ma zastosowanie w elektrodynamice
równie dobrze jak i w elektrostatyce, oczywiście pod warunkiem, że uwzględniamy opóź-
nienia pól. Wiemy, że to prawda, bo przecież często widzieliśmy obraz źródła światła
w zwierciadle, a zwierciadło jest dla fal elektromagnetycznych o częstościach optycznych
takim właśnie „doskonałym” przewodnikiem.
Na rysunku 24.15 pokazano przekrój poziomy falowodu, przy czym W\ i W2 są ścian-
kami falowodu, a So jest drucikiem, stanowiącym źródło fal. Za kierunek dodatni obie-
ramy kierunek przepływu prądu w druciku. Gdyby teraz była tylko jedna ściana, np. Wi,
moglibyśmy ją usunąć, jeśli byśmy obraz źródła (o przeciwnym znaku) umieścili w punkcie
oznaczonym Si. Ale w obecności obu ścianek powstanie także obraz So względem ścian-
ki W2, który na rysunku oznaczono S2. To źródło z kolei będzie także miało obraz wzglę-
dem W,, oznaczony przez S3. Następnie zarówno Si, jak i S3 będą miały obrazy wzglę-
dem W2 w punktach oznaczonych i S6 i tak
dalej. Pola pomiędzy naszymi dwiema prze-
wodzącymi płaszczyznami będą takie same
jak pola wytworzone przez nieskończony
ciąg źródeł umieszczonych w odległości a je-
dno od drugiego. (Jest to w istocie dokładnie
to samo, co zobaczyliśmy patrząc na dru-
cik umieszczony w połowie odległości po-
między dwoma równoległymi zwierciadła-
mi.) Aby pola znikały na ściankach, znaki
prądów w obrazach muszą zmieniać się przy
Przejściu od jednego obrazu do następnego.
Innymi słowy, prądy te oscylują przesunięte
w fazie o 180°. Pole w falowodzie jest zatem
P° prostu superpozycją pól pochodzących
takiego nieskończonego zbioru źródeł
liniowych.
Wiemy, że pole w pobliżu źródła jest
ardzo podobne do pól statycznych. W § 7-5
• H> cz. 1) rozważaliśmy pole statyczne po-
°uzące od „siatki” źródeł liniowych i prze-
24.15. Źródło liniowe So pomiędzy dwoma
przewodzącymi płaszczyznami i W2.
Płaszczyzny te można zastąpić nieskończo-
nym ciągiem obrazów źródeł.
S5«-
Si •-
-W,
źródło
liniowe
falowód
W2
S2
S4 .+
obrazy źródeł
76
24. FALOWODY
konaliśmy się, że jest ono podobne do pola naładowanej płytki, z wyjątkiem wyrazów,
które maleją wykładniczo ze wzrostem odległości od siatki. W naszym przypadku średnie
natężenie źródła jest równe zeru, ponieważ każde dwa sąsiadujące z sobą źródła mają
znaki przeciwne. Wszystkie istniejące pola powinny więc maleć wykładniczo z odległością.
W pobliżu źródła mamy pole pochodzące głównie od tego najbliższego źródła; na więk-
szych odległościach przyczynki do pola pochodzą od wielu źródeł i ich średnia jest równa
zeru. Widzimy więc teraz, dlaczego falowód poniżej częstości granicznej daje pole male-
jące wykładniczo. Przybliżenie statystyczne jest, szczególnie dla małych częstości, zado-
walające i wynika z niego gwałtowne malenie pól z odległością.
Musimy teraz rozwiązać odwrotny problem: Dlaczego fale są w ogóle przenoszone?
To dopiero zagadka! Okazuje się, że przy wielkich częstościach opóźnienia pól mogą
spowodować dodatkowe zmiany w fazie, co powoduje, że pola pochodzące od przesu-
niętych w fazie źródeł dodają się, zamiast wzajemnie się unicestwiać. Istotnie, w rozdz. 29
tomu I (cz. 2) rozważaliśmy już analogiczne zagadnienie pól wytworzonych przez zespół
anten lub przez siatkę dyfrakcyjną. Przekonaliśmy się wówczas, że kilka odpowiednio
ustawionych anten radiowych może dać obraz interferencyjny o silnym sygnale w jednym
kierunku, a bez żadnych sygnałów w innych kierunkach.
Powróćmy do rys. 24.15 i przyjrzyjmy się polom, jakie pojawiają się w dużej odle-
głości od układu obrazów źródeł. Natężenia tych pól są duże tylko w pewnych kierun-
kach, które zależą od częstości — tylko w tych mianowicie kierunkach, dla których pola
od wszystkich źródeł dodają się zgodnie w fazie. W odpowiednio dużej odległości od źró-
deł pole przemieszcza się w tych specjalnych kierunkach w postaci fal płaskich. Na ry-
sunku 24.16 pokazano taką falę, przy czym linie ciągłe odpowiadają grzebietom, a linie
przerywane — dolinom fali. Fala będzie się rozchodzić w takim kierunku, dla którego
różnica w opóźnieniu dwóch sąsiednich źródeł względem grzebietu fali będzić odpowiadała
połowie okresu drgania. Innymi słowy, różnica pomiędzy r2 a r0 na rysunku równa jest
połowie długości fali w próżni:
r2-r0 = —•
Kąt 9 jest więc dany przez
j
sin0 = —. (24.33)
2a
Istnieje oczywiście drugi ciąg fal, których kierunek tworzy z linią źródeł kąt (90°—$)
Całkowite pole w falowodzie (nie za blisko źródła) jest superpozycją tych dwóch ciągów
fal, tak jak to pokazano na rys. 24.17. Oczywiście, pola takie istnieją w rzeczywistości
tylko pomiędzy ściankami falowodu.
W punktach takich jak A i C spotykają się grzbiety obu ciągów fal i wartość pola przyj'
muje maksimum; natomiast w punktach takich jak B fale mają swoje „szczytowe” wartości
ujemne i pole osiąga minimalną (największą ujemną) swoją wartość. W miarę upływu
czasu pole w falowodzie przebiega wzdłuż falowodu jako fala o długości która jest
24-8- 1NNY SPOSOB PATRZENIA NA FALE PROWADZONE
77
równa odległości od A do C. Odległość ta
jest związana z 6 wzorem
2
COS 6 = —. (24.34)
Korzystając z równania (24.33) na B otrzy-
mujemy
źo
2 = — = -=.
g cos 6 )/l-(2o/2a)2
(24.35)
Wynik jest identyczny z tym, jaki otrzyma-
liśmy z równania (24.19).
Widzimy teraz, dlaczego przemieszczanie
się fal zachodzi tylko powyżej granicznej
częstości o0. Jeżeli długość fali w próżni jest
większa od la, nie istnieje kąt, pod którym
rozchodzą się fale na rys. 24.16. Interferencja
niezbędna do wytworzenia się fal pojaw;a się
raptownie, gdy 20 spada poniżej 2a lub gdy
m staje się większe od w0 = ~c]a.
Jeżeli częstość jest dostatecznie wielka,
to mogą istnieć dwa (lub więcej) możliwe
kierunki, w których fale mogą się rozcho-
dzić. Dla naszego przypadku zachodzi to dla
ż0 < ja. Jednakże w ogólności może to tak-
że zajść, gdy ź0 < a. Te dodatkowe fale od-
powiadają typom drgań w falowodzie o wię-
kszej częstości, o których już wspomnieli-
śmy (§ 24-7).
Z naszego opisu wynika również jasno,
dlaczego prędkość fazowa fal prowadzonych
jest większa od c i dlaczego zależy ona od co.
zmianą co zmienia się kąt pomiędzy kie-
^nkiem fal swobodnych, a linią źródeł na
^s. 24.16 i dlatego też się zmienia prędkość
rozchodzenia się fal wzdłuż falowodu.
Chociaż opisywaliśmy falę prowadzoną
J^ko superpozycję pól pochodzących od nie-
mczonego układu źródeł liniowych, moż-
na się przekonać, że doszlibyśmy do tych sa-
24.16. Jeden zbiór fal spójnych, pochodzą-
cych od ciągu źródeł liniowych
24.17. Pole w falowodzie można rozpatry-
wać jako superpozycję dwóch ciągów fal
płaskich
li 24. FALOWODY
mych wyników rozważając dwa ciągi fal rozchodzących się w próżni i ulegających ko-
lejnym wielokrotnym odbiciom pomiędzy dwoma doskonałymi zwierciadłami — pa-
miętając, że odbiciu towarzyszy zmiana fazy o 180°. Te dwa ciągi fal odbitych będą się
wzajemnie wygaszać, z wyjątkiem przypadku, gdy będą się one rozchodzić pod kątem 0,
określonym równaniem (24.33). Każdą rzecz możemy więc rozpatrywać na wiele różnych
sposobów.
f
25
elektrodynamika w zapisie relatywistycznym
w tym rozdziale c = 1
25-1. Cztero wektory*’
Omówimy teraz zastosowanie postulatów szczególnej teorii względności w elektro-
dynamice. Ponieważ omawialiśmy już szczególną teorię względności w rozdz. 15-17 tomu I
(cz. 1), przypomnijmy teraz tylko w skrócie jej podstawowe pojęcia.
Stwierdzono doświadczalnie, że prawa fizyki nie zmieniają się, jeśli się poruszamy ze
stałą prędkością. Jeżeli znajdowalibyśmy się w pojeździe kosmicznym, poruszającym się
ze stałą prędkością po linii prostej, to fakt ten moglibyśmy stwierdzić dopiero wyglądając
„na zewnątrz” z naszego pojazdu albo przynajmniej przeprowadzając jakąś obserwację
związaną z jego otoczeniem. Jeżeli więc zapisujemy jakieś prawdziwe prawo fizyki, musi
ono być tak skonstruowane, aby zawierało w sobie tę istotną cechę zjawisk przyrody.
Związek pomiędzy czasem i przestrzenią w dwóch układach współrzędnych, z których
jeden, S', porusza się ruchem jednostajnym wzdłuż osi x z prędkością v względem drugiego
układu, S, określa przekształcenie Lorentza:
t—vx
(25.1)
x—vt
, Z - Z. 4
/l-t>2
Prawa fizyki muszą mieć taką postać, która nie zmienia się po przekształceniu Lo-
rentza. Jest to analogiczne do zasady, która nam mówi, że prawa fizyki nie zależą od orien-
. 1 Porównaj: Toml.cz. 1, rozdz. 15 (Szczególna teoria względności), rozdz. 16 (Relatywistyczna energia
rozdz. 17 (Czasoprzestrzeń).
80
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
tacji naszego układu współrzędnych. W rozdziale 11 tomu I (cz. 1) widzieliśmy, że mate-
matyczny sposób wyrażenia niezmienniczości praw fizyki względem obrotów polegał na
zapisaniu naszych równań w języku wektorów.
Jeżeli mamy na przykład dwa wektory
A = (Ax, Aj,, A-,~) oraz B = (Bx, By, Bz),
to jak się przekonaliśmy, wyrażenie
A-B = AxBx-j-Aj,Bj,-j-AzBz
nie zmienia się przy przejściu do obróconego układu współrzędnych. Wiemy więc, że je-
żeli po obu stronach jakiegoś równania mamy iloczyn skalarny, taki jak A-B, to równanie
takie będzie miało dokładnie tę samą postać we wszystkich układach współrzędnych,
otrzymanych w wyniku transformacji obrotu. Znaleźliśmy także operator (patrz rozdz. 2
tomu II, cz. 1)
\ dx dy S z
taki że po podziałaniu nim na funkcję skalarną otrzymamy trzy wielkości, które prze-
kształcają się jak współrzędne wektora. Za pomocą tego operatora zdefiniowaliśmy gra-
dient, a łącząc odpowiednio ów operator z innymi wektorami określiliśmy dywergencję
i laplasjan. Wreszcie przekonaliśmy się, że dodając w odpowiedni sposób iloczyny po-
wstałe z pomnożenia składowych jednego wektora przez odpowiednie składowe drugiego
wektora, otrzymujemy trzy nowe wielkości, które się zachowują jak nowy wektor. Ope-
rację tę nazwaliśmy iloczynem wektorowym dwóch wektorów. Posługując się iloczynem
wektorowym i naszym operatorem V zdefiniowaliśmy następnie rotację wektora.
Ponieważ będziemy się jeszcze powoływać na nasze wiadomości z analizy wektoro-
wej, zamieszczamy w tab. 25.1 podstawowe operacje na wektorach w trójwymiarowej
przestrzeni, którymi się poprzednio posługiwaliśmy. Sedno sprawy tkwi w tym, że musi
być możliwe zapisanie równań fizyki tak, aby obie strony przy obrotach przekształcały
się jednakowo. Jeżeli po jednej stronie równania mamy wektor, to druga strona również
musi być wektorem, a obie strony będą się zmieniać w identyczny sposób przy obrocie
Tabela 25.1. Ważne wielkości i operacje anali-
zy wektorowej w trzech wymiarach
definicja wektora iloczyn skalamy wektorowy operator różniczkowy gradient dywergencja laplasjan iloczyn wektorowy rotacja A = (Ax, Ay, AA AB V VA V-V = v2 AxB VxA
naszego układu współrzędnych. Podo-
bnie, jeżeli jedna strona równania jest
skalarem, druga strona musi być też ska-
larem, tak aby żadna ze stron nie zmie-
niała się przy obrocie współrzędnych
i tak dalej.
W szczególnej teorii względności czas
i przestrzeń są nierozerwalnie z sobą zwią-
zane, musimy więc teraz dokonać ana-
logicznych operacji w przestrzeni cztc-
rowymiarowej. Chcemy, aby nasze r°w'
nania nie tylko pozostawały takie saine
przy obrotach, ale żeby były takie sa-
25-l. czterowektory 81
me w każdym układzie inercjalnym. Oznacza to, że nasze równania powinny
być niezmiennicze względem przekształcenia Lorentza, określonego równaniami (25.1).
Rozważania zawarte w tym rozdziale mają na celu pokazanie, jak to można zrobić. Za-
njm jednak zaczniemy, zróbmy coś, co wielce ułatwi naszą pracę (i uprości nasz zapis).
Obierzmy mianowicie tak nasze jednostki długości i czasu, aby prędkość światła c była
równa 1. Będzie to równoznaczne z obraniem za jednostkę czasu takiego czasu, jaki zu~
iywa światło na przebycie jednego metra (około 3-10“9 s). Możemy nawet tę jednostkę
czasu nazwać „jednym metrem”. Dzięki jej wprowadzeniu wszystkie nasze równania
będą wyraźniej wykazywać symetrię czasoprzestrzenną. Z naszych równań relatywistycz-
nych znikną także wszystkie współczynniki c. (Jeżeli sprawiłoby to komuś trudność, to
może zawsze wstawić z powrotem c do każdego równania, zastępując każde t przez ct
lub, w ogólnym przypadku, pakując wszędzie c, tak aby otrzymać poprawne wymiary
wielkości występujących w równaniach.) Po tych przygotowaniach możemy rozpocząć.
Nasze zadanie polega na zrealizowaniu w czterech wymiarach czasoprzestrzeni tego wszyst-
kiego, co za pomocą wektorów uzyskaliśmy w trzech wymiarach. Jest to w rzeczywistości
zabawa całkiem prosta; będziemy po prostu opierać się na analogiach. Jedyną prawdziwą
trudnością będzie zapis (symbol wektora wykorzystaliśmy już dla trzech wymiarów)
i pewna drobna zmiana dotycząca znaków.
Najpierw, przez analogię do wektorów w trzech wymiarach, zdefiniujemy czterowektor
jako obiekt scharakteryzowany przez cztery wielkości at, ax, ay i az, które przy przejściu
do poruszającego się układu współrzędnych przekształcają się tak, jak t, x, y i z. Istnieje
kilka różnych metod zapisu cztero wektorów; będziemy tu używali symbolu a^, przez
który będziemy rozumieć zbiór czterech liczb (a„ ax, ay, aj); wskaźnik p może — innymi
słowy — przyjmować cztery „wartości”: t, x, y, z. Niekiedy będzie też wygodnie ozna-
czyć trzy przestrzenne składowe przez trój wektor i pisać: a^ = (at, a).
Spotkaliśmy się już z jednym czterowektorem, który się składa z energii i pędu cząstki
(rozdz. 17 tomu I, cz. 1). W naszym nowym zapisie
^ = (^P). (25.2)
co oznacza, że czterowektor powstaje z energii E i z trzech składowych trójwektora
P cząstki.
Wygląda na to, że nasze zadanie jest rzeczywiście bardzo proste — dla każdego wek-
tora reprezentującego wielkość fizyczną powinniśmy tylko znaleźć brakującą składową
1 już będziemy mieli czterowektor. Aby się jednak przekonać, że rzecz nie na*tym polega,
rozpatrzmy wektor prędkości o składowych
dx dy dz
Vx = ~dt’ Vy== ~dt’ Vz = ~dt'
Powstaje pytanie: Jaka jest odpowiednia składowa czasowa? Właściwą odpowiedź po-
Wlnna nam dać nasza intuicja. Ponieważ czterowektory mają postać podobną do t, x,
y’ z, moglibyśmy przypuszczać, że składową czasową jest
dt .
6 ~ Wyklady z fiżyki
82
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
Tymczasem to jest błędne'. Występujący w każdym mianowniku czas t nie jest niezmien-
niczy względem przekształcenia Lorentza. Wielkości w licznikach zachowują się jak przy-
stało na składowe czterowektora, ale całą sprawę psują różniczki dt w mianowniku;
różniczki te są różne w dwóch różnych układach i powodują asymetrię w zachowaniu
się liczników i mianowników przy przekształceniu układu współrzędnych.
Okazuje się jednak, że wypisane przez nas cztery składowe „prędkości” staną się
składowymi czterowektora, jeżeli podzielimy je tylko przez 1 — v2. Możemy się prze-
konać, że jest to prawda, biorąc pod uwagę czterowektor pędu
= (£, P) =
m0 mov
V\-v2 9 1/1—r2
(25.3)
i dzieląc go przez masę spoczynkową m0, która w przestrzeni czterowymiarowej jest ska-
larem, a więc niezmiennikiem; otrzymujemy wówczas wielkość
1 v
/l-t>2 ’ 1/1—u2
(25.4)
mQ
która w dalszym ciągu musi być czterowektorem. (Podzielenie przez skalar nie zmienia
własności transformacyjnych.) Możemy więc zdefiniować „czterowektor prędkości”
jako
1 v
Uy~7r^9
l . (25.5)
i - _
U y- . . _ U* , •
1/1—U2 1/1- V2
Ś J i
Czterowektor prędkości jest wielkością użyteczną; możemy na przykład zapisać
P» = (25.6)
Jest to typowa postać, jaką powinno mieć równanie „poprawne” relatywistycznie. (Pra-
wa strona jest tu iloczynem niezmiennika i czterowektora, a więc jest w dalszym ciągu
czterowektorem.)
25-2. Iloczyn skalarny
Możemy uznać za fakt wzięty z życia, że przy obrotach osi współrzędnych odległość
punktu od początku układu się nie zmienia. Matematycznie oznacza to, że r2 = x2+
+y2+z2 jest niezmiennikiem. Innymi słowy, po obrocie r'2 = r2, czyli
x'2+y'2+z'2 = x2+y2+z2.
Wyłania się teraz pytanie: Czy istnieje podobna wielkość, która jest niezmiennicza wzglę*
dem przekształcenia Lorentza? Owszem, istnieje. Z równania (25.1) widać, że
* t'2—x'2 = t2—x2.
25-2. ILOCZYN SKALARNY
83
Wygląda to całkiem ładnie, tylko że wielkość ta zależy od konkretnego wyboru kierunku
oSi x. Możemy to poprawić odejmując od obu stron równania y2 i z2. Wówczas każde
przekształcenie Lorentza plus obrót pozostawiają tę wielkość niezmienioną. Tak więc
wielkością analogiczną do r2 w trzech wymiarach w przestrzeni czterowymiarowej jest
t2—x2—y2—z2.
jest to niezmiennik tzw. „właściwej grupy Lorentza”, co w języku transformacji oznacza
niezmienniczość względem ruchów ze stałą prędkością oraz obrotów.
Ponieważ niezmienniczość ta jest kwestią czysto algebraiczną, zależną tylko od praw
transformacji określonej równaniem (25.1) i od praw transformacji obrotów, będzie
ona słuszna dla dowolnego czterowektora (z definicji bowiem wszystkie czterowektory
transformują się tak samo). Tak więc dla dowolnego czterowektora a,;
a'2—a2—a'2—az2 = a,2—a2—a2—a2.
Wielkość tę nazwiemy „długością” czterowektora a^. (Są tacy, którzy zmieniają znaki
wszystkich wyrazów i nazywają długością wyrażenie a2+a2+a2—a2; korzystając z li-
teratury musimy więc mieć się na baczności.)
Jeżeli teraz mamy dwa wektory a^ i b^, odpowiednie ich składowe transformują się
tak samo i wyrażenie
®A axbx ayby azbz
jest także wielkością niezmienniczą (skalarem). (Wykazaliśmy to zresztą już w rozdz. 17
tomu I, cz. 1.) Wyrażenie to jest oczywiście zupełnie podobne do iloczynu skalarnego
wektorów. Będziemy je nawet nazywać iloczynem skalarnym dwóch czterowektorów.
Zapis a^-bp wydawałby się zapisem logicznym — wówczas wyglądałoby to jak iloczyn ska-
larny. Niestety, tak się jednak nie robi; zwykle używa się zapisu bez kropki. Pozostaniemy
w zgodzie z tą umową i będziemy zapisywać iloczyn skalarny po prostu jako a^b^. Tak
więc z definicji,
aĄ, = alb-axbx-aypy-azbz. (25.7)
Zawsze, gdy zobaczymy razem dwa identyczne wskaźniki (czasem zamiast /z będziemy
używać v lub innych liter), będzie to oznaczać, że mamy wziąć cztery iloczyny i dodać
je, pamiętając o ujemnych znakach iloczynów składowych przestrzennych. Korzystając
z tej umowy, niezmienniczość iloczynu skalarnego względem przekształcenia Lorentza
można zapisać jako
a^b^ (ipbff
Ponieważ trzy ostatnie wyrazy po prawej stronie wzoru (25.7) odpowiadają iloczy-
nowi wektorowemu w przestrzeni trójwymiarowej, często wygodniej jest pisać
a^b? = a^—a-b.
Jest również oczywiste, że opisywana poprzednio czterowymiarowa długość może być
^Pisana jako a^:
alza/i = a2—a2—ay—a2 = aj—a-a. , (25.8)
84
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
Czasem będzie też wygodnie zapisywać tę wielkość jako a*:
Ą = a^.
Podamy teraz przykład ilustrujący użyteczność iloczynów skalarnych czterowektorów.
Antyprotony (?) powstają w dużych akceleratorach w wyniku reakcji
P+P->P+P+P+P.
Oznacza to, że proton o pewnej energii kinetycznej zderza się z protonem będącym w spo-
czynku (np. z protonem znajdującym się w tarczy wodorowej na drodze wiązki) i jeżeli
padający proton ma wystarczającą energię, wytworzona zostaje oprócz dwóch proto-
nów pierwotnych para proton-antyproton*’. Pytanie brzmi: Jaką energię musi mieć
padający proton, aby reakcja była energetycznie możliwa?
Odpowiedź na pytanie znajdziemy najłatwiej rozpatrując reakcję w układzie środka
masy (ŚM) (patrz rys. 25.1). Padający proton oznaczmy przez a, a jego czterowektor
pędu przez Podobnie, proton-tarczę oznaczmy przez b, a jego czteropęd przez p*.
Gdyby padający proton miał akurat tylko tyle energii, aby wywołać reakcję, to stan koń-
cowy — sytuacja po zderzeniu — byłby „zlepkiem” trzech protonów i antyprotonu, spo-
czywających w układzie ŚM. Jeżeli zaś energia padającego protonu byłaby nieznacznie
większa, to cząstki znajdujące się w stanie końcowym miałyby pewną energię kinetyczną
i każda z nich poruszałaby się niezależnie od pozostałych; jeżeliby natomiast energia
padającego protonu była nieco mniejsza, to te cztery cząstki nie mogłyby w ogóle pow-
stać.
Jeżeli przez oznaczymy całkowity czteropęd zlepka cząstek w stanie końcowym,
to z zasad zachowania energii i pędu wynika, że
pa+p6 = Pc
oraz
E°+Eb = Ef.
Oba te równanią można zastąpić jednym:
#+/£=/£. ' ' (25.9)
Jest rzeczą istotną, że otrzymaliśmy równanie dla czterowektorów, a więc jest ono
prawdziwe w każdym inercjalnym układzie odniesienia. Możemy z tego skorzystać, aby
*’ Można by się zapytać: dlaczego nie bierzemy pod uwagę reakcji
P+P-*P+P+P
lub nawet reakcji
P+P—P+P,
które oczywiście wymagają mniej energii. Odpowiedź na to pytanie daje zasada nazywana zasadą zacho-
wania barionów, która mówi, że różnica pomiędzy „liczbą protonów i liczbą antyprotonów” nie może się
zmienić. Różnica ta jest równa 2 po lewej stronie naszej reakcji. Dlatego też, jeżeli chcemy otrzymać po
prawej stronie antyproton, musimy otrzymać także trzy protony (lub inne bariony).
25-2. ILOCZYN SKALARNY ' - 85
25.1. Reakcja P+P -» 3P+P, rozpatrywana w układzie ŚM i w układzie laboratoryjnym. Zakłada się, że
padający proton ma akurat na tyle energii, aby zapoczątkować reakcję. Pełne kółka oznaczają protony,
puste kółka — antyprotony
uprościć nasze rachunki. Zaczniemy od obliczenia „długości” wyrażeń znajdujących się
po obu stronach równania (25.9); „długości” te są oczywiście także sobie równe. Otrzy-
mujemy
(25.10)
Ponieważ iloczyn jest niezmiennikiem, możemy obliczyć jego wartość w dowolnym
układzie współrzędnych. W układzie środka masy składowa czasowa p^ jest równa ener-
gii spoczynkowej czterech protonów, mianowicie 4Af, a część przestrzenna, p, jest równa
zeru; tak więc p^ — (4Af, 0). Skorzystaliśmy tu z faktu, że masy spoczynkowe protonu
i antyprotonu są sobie równe i oznaczyliśmy ich wspólną masę przez M.
Tak więc równanie (25.10) przybiera postać
= 16M2. (25.11)
Obliczenie p^p^ i p^p^ jest bardzo łatwe, ponieważ „długość” czterowektorowa pędu
każdej cząstki jest równa po prostu kwadratowi masy cząstki:
p^p,, = E2— p2 = M2.
Można to wykazać bezpośrednim rachunkiem, ale możemy to zrobić dużo zgrabniej
ZauWażając, że dla cząstki znajdującej się w spoczynku p^ = (M, 0), a więc p^p^ = M2.
Ale ponieważ p^p^ jest niezmiennikiem, musi ono być równe Af2 w kaidym układzie
^niesienia. Podstawiając te wyniki do równania (25.11) mamy
2^; -w
A fi - W. (25.12)
86
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
Teraz możemy obliczyć także w układzie laboratoryjnym. Czterowektor
można zapisać jako (Ea, p“), podczas gdy p£ = (M, 0), ponieważ odpowiada ono wekto-
rowi w spoczynku. Tak więc p“p* musi być równe ME°; a ponieważ wiemy, że iloczyn
skalarny jest niezmiennikiem, wartość liczbowa MEa musi być taka sama, jaką znaleźliśmy
we wzorze (25.12). Otrzymujemy więc
Ea = IM,
co stanowi szukany przez nas wynik. Całkowita energia padającego protonu musi być
równa przynajmniej IM (około 6,6 GeV, ponieważ M = 938 MeV), czyli po odjęciu
energii spoczynkowej kinetyczna energia protonu-pocisku musi być przynajmniej równa
6M (około 5,6 GeV). Akcelerator Bevatron w Berkeley został tak zaprojektowany, aby
energia kinetyczna przyspieszanych protonów wynosiła 6,2 GeV, co umożliwia produkcję
antyprotonów.
Ponieważ iloczyny skalarne są niezmiennikami, interesują nas zawsze ich wartości
liczbowe. Jakaż będzie „długość” czterowektora prędkości u^uj.
A więc u? jest aterowektorem jednostkowym.
25-3. Gradient czterowymiarowy
Następną wielkością, którą musimy rozważyć, jest czterowymiarowy odpowiednik
gradientu. Przypominamy sobie (rozdz. 14 tomu I, cz. 1), że trzy operatory różniczkowe
dfdx, d/dy, d/dz transformują się jak wektor i nazywamy je gradientem. Posługując się
analogią, moglibyśmy przypuszczać, że czterowymiarowy gradient, powinien mieć po-
stać (d/dt, d/8x, 8/dy, 8/8z). Ale to nieprawda!
Aby zobaczyć, gdzie tkwi błąd, rozważmy funkcję skalarną <p, która zależy tylko od
zmiennych x i t. Jeżeli dokonamy małej zmiany At współrzędnej t, zachowując przy tym
stałą wartość zmiennej x, zmiana <p wyniesie
A<p = -^At. (25.13)
Z drugiej strony, dla poruszającego się obserwatora
dm Sm ,
Am =------Ax'-j-----At'.
y Sx dt’
Korzystając z równania (25.1) możemy wyrazić Ax i At' przy pomocy At. Pamiętając,
że zmienną x ustaliliśmy, a więc że Ax = 0, piszemy
v At
Ax' = - ---------Ac, At' =
FI-v2 Vl-v2
2S-3. gradient czterowymiarowy
87
stąd
porównując ten wynik z równaniem (25.13) przekonujemy się, że
dtp 1 / dtp dtp \
dt ^l—v2 \ćh' dx')
Podobnie otrzymujemy
dtp 1 / dtp d<p\
—• = I —:—V —r I.
dx y'l—v2 \bx di )
Możemy teraz zobaczyć, że z nowym gradientem jest coś nie w porządku. Wzorami
określającymi x i t przez x' i t' [otrzymanymi z równania (25.1)] są:
t' + vx' x' + vt'
t = ------- , X = —=-.
— v2 VI — v2
W taki właśnie sposób musi się przekształcać czterowektor. Ale w takim razie oba znaki
w nawiasach równań (25.14) i (25.15) są złe!
Tak więc prawidłowym czterowymiarowym operatorem gradientu nie jest (d/dt, V),
lecz operator, który oznaczymy i zdefiniujemy jako
Id \ Id d d d\
V =1 —, —VI = I—.-------.----,-----1.
A \ dt f \ Qt dx dy dz J
(25.16)
Przy takiej definicji znikają pojawiające się powyżej niezgodności znaków i tak się
zachowuje, jak przystało na czterowektor. (Te ujemne znaki są dość kłopotliwe, ale nic
na to nie poradzimy.) Oczywiście, jeżeli mówimy, że V,, „zachowuje się jak czterowektor”,
oznacza to po prostu, że czterogradient skalara jest czterowektorem. Jeżeli tp jest rzeczy-
wiście niezmienniczym polem skalarnym (lorentzowsko niezmienniczym), to V/p jest
polem czterowektorowym.
W porządku. Jeśli mamy już wektory, gradient i iloczyn skalarny, to następną wiel-
kością, której musimy poszukać, jest niezmiennik analogiczny do dywergencji w trój-
wymiarowej analizie wektorowej. Widać jasno, że takim odpowiednikiem dywergencji
jest wyrażenie ^b^, gdzie jest polem czterowektorowym, którego składowe są funkcja-
mi przestrzeni i czasu. Definiujemy dywergencję czterowektora b^ = (ó,,b) jako iloczyn
skalarny V„ i
d I b \ I d \ I d \ d
b - - — bx- - — k- - — k = —ó,+v-b, (25.17)
dt \ dx ] \ dy/ \ dz/ dt
gdzie V-b jest zwykłą, trójwymiarową dywergencją wektora b. Zaznaczmy, że i tu trzeba
Uważać na znaki. Część znaków ujemnych wzięła się tu z definicji iloczynu skalarnego
Równanie (25.7)]; obecność pozostałych wynika z tego, że składowymi przestrzennymi
88
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
są — d/dx, itd. [równanie (25.16)]. Dywergencja określona równaniem (25.17) jest
niezmiennikiem i jej wartość jest taka sama we wszystkich układach współrzędnych, po-
wiązanych z sobą przekształceniem Lorentza.
Rozpatrzmy teraz zagadnienie fizyczne, w którym pojawia się czterodywergencja.
Użyjemy jej mianowicie, aby znaleźć pole elektromagnetyczne wokół poruszającego się
drutu. Wiemy już (t. II, cz. 1, § 13-7), że gęstość ładunku elektrycznego o i gęstość prądu j
tworzą czterowektor = (o, i). Jeżeli przez nienaładowany drut przepływa prąd jx, to
w układzie odniesienia poruszającym się wzdłuż osi x z prędkością v ten sam drut będzie
miał gęstość ładunku i gęstość prądu [określone przekształceniem Lorentza, równanie
(25.1)] odpowiednio równe
, _ _ Jx
Q /---------- ’ x /--------7 *
yi-v2 yi-v2
si । <
Są to dokładnie takie same wzory, do jakich doszliśmy w rozdz. 13 (t. II, cz. 1). Pod-
stawiając te wielkości do równań Maxwella dla poruszającego się układu współrzędnych
możemy określić szukane pole elektromagnetyczne.
Zasada zachowania ładunku (t. II, cz. 1, § 13-2) również przybiera prostą postać
w zapisie czterowektorowym. Rozważmy czterodywergencję :
V^ = -^-+V-j. (25.18)
Zasada zachowania ładunku mówi, że wypływ prądu na jednostkę objętości musi
być równy szybkości wzrostu gęstości ładunku, wziętej ze znakiem ujemnym. Innymi
słowy:
Jeśli podstawimy tę zależność do równania (25.18), zasada zachowaniaładunku przy-
bierze następującą postać:
Vm7; = 0. ' (25.19)
Ponieważ wielkość jest niezmiennikiem (skalarem), to skoro jest ona równa zeru
w jednym układzie odniesienia, musi być także równa zeru we wszystkich układach od-
niesienia. Wynika stąd, że jeżeli ładunek jest zachowany w jednym układzie współrzęd-
nych, to jest również zachowany we wszystkich układach współrzędnych poruszających
się ze stałą prędkością względem pierwszego układu.
Jako ostatni przykład rozważmy iloczyn skalarny operatora gradientu z samym sobą-
W przestrzeni trójwymiarowej taki iloczyn daje operator Laplace’a
*1 ‘ - Sx2 8y2 dz2'
Co otrzymamy watmeh wymiarach? Możemy się o tym łatwo przekonać. Korzystając
Tabela 25.2 Ważne wielkości analizy wektorowej w trzech i w czterech wymiarach
Trzy wymiary • Cztery wymiary
wektor A = (Ax, Ayi Az) a„ = (at, ax, ay, az) = (a,, a)
iloczyn skalarny A’B — AxBx-}~ AyBy-\-AzBz = cif bf—£ixbx—dyby—azbz — £Zzbz—a*b
Id d d \ Z d d d d \ 1 d \
operator wektorowy \ dx ’ dy ’ dz 1 > \ dt ’ dx ’ dy’ dz / \ dt ’ /
/ dtp dtp dip \ I dtp dtp dtp d<p\ Z dtp \
gradient \ dx dy dz / \ dt ’ dx ’ dy ’ dz) \ dt ’V<?)
dAx dAy dAz da, dax dav daz da.
dywergencja v-A = —^ + —^ + — v a =—!- + —± + -^ + —Ł = _A+v.a
dx dy dz • * dt dx dy dz dt
d2 d2 d2 d2 d2 d2 d2 d2 2 2
laplasjan i dalambercjan V V ~d^+d^+d? Qt2 dX2 dy* dzl dfl V 1=1
90
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
z naszych definicji gradientu i iloczynu skalarnego otrzymujemy
d d I 8\( 8\ I 8\i 8\ / 8\( 8\ _ 52
dt dt \ dx 1 \ dx I \ Syl\ dy/ \ dz / \ dz / dt2
Ten operator, będący odpowiednikiem trójwymiarowego operatora Laplace’a, nazy-
wamy operatorem d’Alemberta (dalambercjanem)-, bywa on oznaczany w specjalny sposób*’;
d2
□2 = v,v--v2.
(25.20)
Z definicji tej wynika, że jest to niezmienniczy operator skalarny; jego działanie na pole
cztero wektorowe generuje nowe pole czterowektorowe. [Uwaga: niekiedy można się
spotkać z inną definicją operatora d’Alemberta, w której znak jest przeciwny do znaku
w równaniu (25.20).]
Znaleźliśmy więc czterowektorowe odpowiedniki większości wielkości trójwymia-
rowych, które zamieściliśmy w tab. 25.1. (Nie mamy jeszcze odpowiedników iloczynu
wektorowego i operatora rotacji; znajdziemy je dopiero w następnym rozdziale.) Wy-
daje się, że będzie je łatwiej zapamiętać, jeżeli zbierzemy wszystkie ważne definicje i wy-
niki w jednym miejscu i dlatego zamieszczamy takie podsumowanie w tab. 25.2.
25-4. Elektrodynamika w zapisie czterowymiarowym
Z operatorem d’Alemberta spotkaliśmy się już, nie wiedząc jeszcze, że tak się on właś-
nie nazywa, w § 18-6 (t. II, cz. 1); znalezione tam przez nas równania różniczkowe na po-
tencjały możemy zapisać w nowych oznaczeniach jako
□29’ = —, D2a = —. (25.21)
£0 £o
Po prawej stronie równań (25.21) występują cztery wielkości: qx, jx, jy, jz — wszystkie
podzielone przez stałą uniwersalną e0> która jest taka sama we wszystkich układach współ-
rzędnych, pod warunkiem, że we wszystkich tych układach używa się tej samej jednostki
ładunku. Tak więc cztery wielkości o/e0, jx/c0> jylEo, Jzl£o również transformują się jak
czterowektor. Możemy je zapisać jako jjeo. Operator d’Alemberta nie zmienia się przy
zmianie układu współrzędnych, a więc wielkości <p, Ax, Ay, Az muszą się także transfor-
mować jak czterowektor, co oznacza, że są one składowymi czterowektora. Jednym sło-
wem
= (9?, A)
jest czterowektorem. Potencjał skalarny i potencjał wektorowy stanowią w rzeczywistości
dwa różne aspekty tej samej wielkości fizycznej — są współzależne — i jeżeli wy stępują
*’ W polskiej literaturze naukowej operator cfAlemberta oznacza się zwykle symbolem □ (bez kwa-
dratu). (Przyp. tłum.) _
elektrodynamika w zapisie czterowymiarowym 91
e razem jako całość, to relatywistyczna niezmienniczość świata fizycznego staje się
oczywista. Wielkość A^ nazywamy czteropotencjałem.
zapisie czterowektorowym równania (25.21) przybierają prostą postać:
□ = —. (25.22)
< eo
Sens fizyczny tego równania jest dokładnie taki sam jak sens fizyczny równań Maxwella.
Ale możność zapisania ich w eleganckiej postaci sprawia zawsze pewną przyjemność.
Ta ładna postać ma też głębsze znaczenie; wskazuje ona bezpośrednio na niezmienni-
czość elektrodynamiki względem przekształcenia Lorentza.
Pamiętamy, że aby wyprowadzić równania (25.21) z równań Maxwella musieliśmy
skorzystać z warunku cechowania:
dtp
+V-A = 0, (25.23)
ot
czyli po prostu z V ^A^ = 0; warunek cechowania mówi nam, że dywergencja cztero wek-
tora A^ jest równa zeru. Warunek ten nazywamy warunkiem Lorentza. Dużą zaletą tego
warunku jest niezmienniczość, dzięki czemu równania Maxwella mają postać (25.22)
we wszystkich układach odniesienia.
25-5. Czteropotencjał poruszającego się ładunku*1
Wypiszemy teraz prawa transformacji określające wielkości 99 i A w poruszającym
się układzie poprzez <p i A w układzie spoczywającym (właściwie te prawa są pośrednio
zawarte w naszych poprzednich rozważaniach). Ponieważ = (99, A) jest czterowekto-
rem, równania, które otrzymamy, muszą być zupełnie podobne do równań (25.1), z tą
różnicą, że t będzie zastąpione przez <p a x przez A. Tak więc:
<p—vAx
Ax—v<p
X 1/1-u2 ’
Ay = Ay,
A = Az.
(25.2$
W samej postaci tych równań tkwi założenie, że primowany układ współrzędnych po-
rusza się wzdłuż osi x, w kierunku dodatnim, a jego prędkość mierzona w układzie nie-
Primowanym wynosi v.
Rozważmy przykład ilustrujący użyteczność pojęcia czteropotencjału. Jaki jest po-
tencjał skalarny i wektorowy ładunku q poruszającego się z prędkością v wzdłuż osi xl
»>
Porównaj: Tom II, cz. 1, rozdz. 13 (Magnetostatyka).
92
•' 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNY^
25.2. Układ odniesienia S' porusza się z prędko-
ścią v względem S. Ładunek spoczywający w po-
czątku układu S' ma w układzie S współrzędną
x — vt. Potencjały w punkcie P można obliczać
w którymkolwiek z tych dwóch układów
Problem ten jest łatwy do rozwiązania
w układzie współrzędnych poruszającym
się wraz z ładunkiem, ponieważ w tym
układzie ładunek pozostaje w spoczyn-
ku. Powiedzmy, że ładunek znajduje się
w początku układu S', tak jak to pokaza-
no na rys. 25.2. Potencjał skalarny w po-
ruszającym się układzie jest równy
a
<?' = -------r, (25.25)
4izeor
gdzie r' jest odległością od ładunku q do
punktu pola, mierzoną w układzie poru-
szającym się. Potencjał wektorowy A'
jest oczywiście równy zeru.
Możemy teraz w prosty sposób okre-
ślić <p i A, potencjały mierzone w spo-
czywającym układzie współrzędnych. Związkami odwrotnymi do (25.24) są
_ <p’ + ^x . _ A _ A' A _ A'
<P --------— , AX — ---— , Ay Ay, A2 Az.
^l-u2 FI —v2
(25.26)
Podstawiając <p' z równania (25.25) i A' = 0, otrzymujemy
q 1 g 1
47te0 rVl-p2 47te0 ^l-p2 x'2+y'2+z'2
Wzór ten określa nam potencjał skalarny w układzie S, ale niestety — wyrażony przez
współrzędne układu S'. Zależność od t, x, y, z otrzymamy podstawiając f, x', y', z'
z równań (25.1). Otrzymujemy wówczas
g 1 _ 1
4ire0 1/1—r2 |/ \^x-vi)ly/].-v2}2+y2+z2
(25.27)
Postępując analogicznie ze składowymi potencjału wektorowego A, można pokazać, że
A — vę>.
(25.28)
Są to tanaana wzory, które w inny sposób wyprowadziliśmy w rozdz. 21 (t. H, cz. !)•
25-6. Niezmienniczość równań elektrodynamiki
Przekonaliśmy się, że potencjały <p i A wzięte razem tworzą czterowektor, który
oznaczamy A^, i że równania falowe — zupełny układ równań określających AM poprzez
25-6. NIEZMIENNICZOŚĆ RÓWNAŃ ELEKTRODYNAMIKI
93
__ można zapisać tak jak w równaniu (25.22). Równania te wraz z zasadą zachowania
jadunku dają nam fundamentalne prawo pola elektromagnetycznego:
□ %, = —Z,, V^ = 0. (25.29)
®o
Tu, na tym maleńkim skrawku stronicy, są wszystkie równania Maxwella — piękne i pro-
ste. Czy ten sposób zapisu równań nauczył nas czegoś oprócz dowiedzenia piękna i pro-
stoty równań? W szczególności, czy jest to coś innego od tego, co mieliśmy poprzednio,
kiedy to wypisywaliśmy równania dla wszystkich poszczególnych składowych? Czy mo-
żemy wyprowadzić z tych równań jakieś wnioski, których nie można było wyprowadzić
z równań falowych określających potencjały przez ładunki i prądy? Odpowiedzią na to
pytanie jest wyraźne „nie”. To, co zrobiliśmy, polega jedynie na nadaniu nowych nazw
pewnym pojęciom — wprowadzeniu nowej metody zapisu. Wprowadziliśmy symbol D2
dla pochodnych, ale w dalszym ciągu symbol ten oznacza nic innego, jak tylko drugą
pochodną względem t, minus druga pochodna względem x, minus druga pochodna wzglę-
dem y, minus druga pochodna względem z. A nasze p oznacza, że mamy cztery równania,
po jednym dla każdego p = t,x,y lub z. Jakież więc znaczenie ma ten fakt, że równa-
nia mogą być zapisane w prostej postaci? Jeżeli oceniać by ten fakt ze względu na jego
użyteczność dla wyprowadzenia bezpośrednich wniosków, to nie reprezentuje on żadnych
wartości. Możliwe jednak, że ta prosta postać równań oznacza, że i sama natura jest
obdarzona pewną prostotą.
Pozwól Czytelniku, że pokażemy Ci coś ciekawego, coś, co właśnie odkryliśmy:
Wszystkie prawa fizyki mogą być zawarte w jednym równaniu; tym równaniem jest
u = 0. (25.30)
Jakież to proste równanie! Oczywiście, musimy wiedzieć, co oznacza ten symbol u. Jest
to pewna wielkość fizyczna, którą nazwiemy „odstępstwem od rzeczywistości” danej
sytuacji. Mamy też wzór określający tę wielkość. Oto, jak będziemy ją obliczać. Bierze-
my wszystkie znane prawa fizyki i zapisujemy w specjalnej postaci. Przypuśćmy na przy-
kład, że weźmiemy prawo mechaniki F = ma i przepiszemy je w postaci F—ma = 0.
Nazwiemy teraz wielkość (F—ma), która oczywiście powinna być równa zeru, „niedo-
pasowaniem” mechaniki. Następnie podnosimy do kwadratu to „niedopasowanie” i ozna-
czamy przez Ui, która to wielkość może być nazwana „odstępstwem od rzeczywistości
zjawisk mechaniki”. Innymi słowy, tworzymy wyrażenie
Uj = (F-ma)2. (25.31)
Teraz możemy wypisać inne prawo fizyczne, powiedzmy V E = g/e0, i zdefiniować u2:
/ Q \2
u2 = VE——) ,
\ Eof
które moglibyśmy nazwać „gaussowskim odstępstwem elektryczności”. Następnie wy-
pisujemy u3, u4, itd. — po jednym dla każdego istniejącego prawa fizycznego.
W końcu, sumę tych wszystkich „odstępstw” u,-, odpowiadających wszystkim zja-
94
25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM
wiskom zachodzącym w naszym świecie fizycznym, nazwijmy „całkowitym odstępstwem
świata” u, tzn. u = Wówczas wielkie „prawo Przyrody” mówi:
U — 0. | (25.32)
To „prawo” oznacza oczywiście, że suma kwadratów wszystkich „niedopasowań” jest
równa zeru. Aby zaś suma wielu kwadratów była równa zeru, każdy z jej członów też
musi być równy zeru.
Tak więc „piękne w swej prostocie” prawo wyrażone równaniem (25.32) jest równo-
ważne szeregowi praw, które wypisaliśmy przed chwilą. Widać stąd zupełnie jasno, że
prosta postać zapisu, maskująca złożoną naturę praw przy pomocy definicji symbolów,
nie ma nic wspólnego z rzeczywistą prostotą — to po prostu pewien fortel. Piękno równa-
nia (25.32), wynikające z faktu, że równanie to zawiera w sobie wiele innych równań,
jest tylko pewnym chwytem. Jeśli się rozwikła całą tę historię, znajdziemy się z powrotem
w punkcie, z którego wyszliśmy.
Jednakże prostota praw elektromagnetyzmu ma pewne głębsze znaczenie, tak samo
jak i teoria analizy wektorowej ma swoje głębsze znaczenie. Fakt, że równania elektro-
magnetyki można zapisać przy użyciu bardzo szczególnej metody zapisu, metody wpro-
wadzonej specjalnie dla czterowymiarowej geometrii przekształcenia Lorentza, czyli w po-
staci równań wektorowych w czteroprzestrzeni, oznacza, że elektromagnetyzm jest nie-
zmienniczy względem przekształcenia Lorentza. Właśnie dlatego, że równania Maxwella
są niezmiennicze względem tych transformacji, można je zapisać w tak eleganckiej po-
staci.
Ta tak bardzo elegancka postać równań elektrodynamiki, równanie (25.29), nie jest
dziełem przypadku. Teoria względności narodziła się na skutek stwierdzenia na drodze
doświadczalnej, że zjawiska „przepowiedziane” przez równania Maxwella były takie
same we wszystkich układach inercjalnych. I Lorentz znalazł swoje przekształcenie właś-
nie badając własności transformacyjne równań Maxwella — jako jedyne przekształcenie
nie zmieniające postaci tych równań.
Istnieje jednak jeszcze jeden powód, aby nasze równania zapisywać w taki sposób.
Zostało mianowicie odkryte — zgodnie z hipotezą Einsteina — że wszystkie prawa fi-
zyki są niezmiennicze względem przekształcenia Lorentza. To właśnie jest zasada względ-
ności. Tak więc jeżeli znajdziemy postać zapisu, z której od razu wynika, czy wypisane
prawo jest niezmiennicze, czy też nie, możemy być wówczas pewni, że poszukując nowych
teorii będziemy wypisywać tylko takie równania, które są zgodne z zasadą względności-
Fakt, że przy tej szczególnej metodzie zapisu równania Maxwella przybierają tak
prostą postać, nie jest żadną niespodzianką, bo właśnie te równania były bodźcem do
wynalezienia tej metody. Ale interesujące jest to, że każde prawo fizyki — czy to opisu-
jące przemieszczanie się fal mezonowych, czy zachowanie się neutrin podczas rozpadu
beta itd. — musi być niezmiennicze względem przekształcenia Lorentza. A więc, gdy p°"
dróżujemy ze stałą prędkością w pojeździe kosmicznym, wszystkie prawa przyrody trans-
formują się wspólnie w taki sposób, że nie występują żadne nowe zjawiska. Właśnie dla-
tego, że zasada względności tkwi w naturze rzeczy, równania opisujące nasz świat będ4
miały prostą postać w zapisie czterowektorowym.
26
lorentzowskie transformacje pól
w tym rozdziale c = 1
26-1. Czteropotencjał poruszającego się ładunku*1
Stwierdziliśmy w poprzednim rozdziale, że potencjał A? = (ę>, A) jest czterowekto-
rem. Jego składową czasową jest potencjał skalarny <p, a trzy składowe przestrzenne two-
rzą potencjał wektorowy A. Wyprowadziliśmy także, posługując się przekształceniem
Lorentza, wzory na potencjały cząstki poruszającej się wzdłuż linii prostej ze stałą pręd-
kością. [Wzory te otrzymaliśmy już za pomocą innej metody w rozdz. 21 (t. II, cz. 1).]
Dla ładunku punktowego, którego położenie w chwili t jest dane trójwektorem (vt, 0, 0),
potencjały w punkcie (x, y, z) są równe
q
W ______r (x _ v a 2
47tE0ł/l — V2 —-----y-+y2 + z2
L
:
47teol/l-v2 [ Vt +y2+z2
L l—v
Ay = A2 = 0.
(26.1)
Równania (26.1) określają potencjały w punkcie x, y i z w chwili t dla ładunku, któ-
reS° „rzeczywiste” położenie (przez które rozumiemy położenie w chwili t) określone
Jest Przez x = vt. Zauważmy, że w tych równaniach występują zmienne (x— vt), y
1 Porównaj: Tom II. cz. 1, rozdz. 20 (Rozwiązania równań Maxwella w próżni).
96
26. LORENTZOWSKIE TRANSFORMACJE POL
26.1. Znajdowanie pól w punkcie P, pocho-
dzących od ładunku q poruszającego się
wzdłuż osi x ze stałą prędkością v. Pole,
które jest „teraz” w punkcie (x, y, z), można
wyrazić równie dobrze przez położenie
„rzeczywiste” P, jak i przez położenie „opóź-
nione” P' (yf chwili t' = t—r'/c)
26.2. Ładunek porusza się po jakimś dowolnym
torze. Pole w punkcie (x, y, z) w chwili t jest
określone przez położenie P' i prędkość / w chwi-
li opóźnionej r' = t—r'/c. Pole to można wy-
godnie wyrazić poprzez współrzędne względem
położenia „pozornego” PpOzor- (Rzeczywistym
położeniem w chwili t jest punkt P.)
i z, będące współrzędnymi mierzonymi
względem bieżącego położenia punktu P
poruszającego się ładunku (patrz rys. 26.1).
Wiemy, że w rzeczywistości oddziaływanie
rozchodzi się z prędkością c, a więc na-
prawdę „liczy się” wpływ pochodzący od
ładunku znajdującego się w tyle w opó-
źnionym położeniu P':*} Punkt P' okre-
śla współrzędna x = vt' (gdzie t' = t—rr(c
jest czasem opóźnionym). Ale powiedzie-
liśmy, że ładunek poruszał się po linii
prostej ze stałą prędkością, tak więc od-
działywania w położeniu P' i w położeniu
bieżącym są ze sobą bezpośrednio zwią-
zane. W rzeczywistości, jeżeli zrobimy do-
datkowe założenie, że potencjały zależą
tylko od położenia i od prędkości w chwili
opóźnionej, to równania (26.1) będą sta-
nowić wzory w pełni określające poten-
cjały ładunku poruszającego się w dowolny
sposób. Wygląda to następująco. Przy-
puśćmy, że mamy ładunek poruszający
się w pewien dowolny sposób, powiedzmy
po torze takim, jak na rys. 26.2 i próbu-
jemy znaleźć potencjały w punkcie (x, y,
z). Najpierw znajdujemy położenie opóź-
nione P' i prędkość v' w tym punkcie.
Następnie wyobrażamy sobie, że ładunek
porusza się w dalszym ciągu z tą prędko-
ścią przez chwilę (t' — f), będącą miarą
opóźnienia, tak że przyjmie w końcu pewne
urojone położenie Ppo2or, które możemy
nazwać „położeniem pozornym” i że przy-
będzie tam z prędkością v'. (Oczywiście,
ładunek niczego takiego nie robi; w chwili
t znajduje się on naprawdę w punkcie P-)
Wówczas potencjały w punkcie (x, y,
są właśnie takie, jakie otrzymalibyśmy
z równań (26.1) dla wyimaginowanego 13'
dunku znajdującego się w pozornym pol°'
♦’ Nie należy mylić znaków prim użytych tutaj dla oznaczania opóźnionych położeń i chwil ze z°a
kami odnoszącymi się do układu odniesienia poddanemu przekształceniu Lorentza w poprzednim rozdziać
26-1. CZTEROPOTENCJAŁ PORUSZAJĄCEGO SIĘ ŁADUNKU 97
źeniu Ppozor. Mówimy po prostu, że ponieważ potencjały zależą tylko od tego, co się
dzieje z ładunkiem w chwili opóźnionej, to będą one takie same w wypadku, gdyby ładu-
nek poruszał się dalej ze stałą prędkością, jak i w wypadku, gdyby ładunek zmienił swoją
prędkość po chwili t', tzn. po tym, kiedy potencjały, które miały się pojawić w chwili t
w punkcie (x, y, z) zostały, już określone.
Wiemy oczywiście, że w chwili gdy mamy już wzory określające potencjały pochodzą-
ce od ładunku poruszającego się w dowolny sposób, to mamy całą elektrodynamikę;
możemy znaleźć potencjały pochodzące od dowolnego układu ładunków, biorąc super-
pozycję potencjałów każdego z tych ładunków. Możemy więc zebrać wszystkie zjawiska
elektrodynamiki albo wypisując równania Maxwella, albo posługując się takim oto zbio-
rem twierdzeń. (Zapamiętajmy te twierdzenia na wypadek gdybyśmy mieli się kiedyś
znaleźć na bezludnej wyspie. Za ich pomocą można zrekonstruować całą naszą wiedzę.
Oczywiście, będziemy musieli znać do tego przekształcenie Lorentza, ale tego nigdy nie
zapomnimy ani na bezludnej wyspie, ani też gdziekolwiek indziej.)
Twierdzenie pierwsze'. Ap jest czterowektorem. Twierdzenie drugie: potencjał kulom-
bowski spoczywającego ładunku jest równy ąAr:eor. Twierdzenie trzecie: potencjały wy-
tworzone przez \poruszający się w dowolny sposób ładunek zależą tylko od położenia
i prędkości w chwili opóźnionej. Mając te trzy fakty, mamy całą resztę. Opierając się na
fakcie, że A^ jest czterowektorem, możemy poddać przekształceniu potencjał Coulomba,
który znamy, i otrzymać potencjały dla ładunku poruszającego się ze stałą prędkością.
Następnie, dzięki twierdzeniu mówiącemu, że potencjały zależą tylko od prędkości w chwili
opóźnionej, możemy znaleźć je posługując się metodą położenia pozornego. Nie jest
to specjalnie dogodna droga prowadząca do wyników, ale jest rzeczą interesującą, że
prawa fizyki mogą być sformułowane na wiele różnych sposobów.
Można się czasem spotkać z nieostrożnym stwierdzeniem, iż całą elektrodynamikę
można wyprowadzić jedynie z przekształcenia Lorentza i z prawa Coulomba. Oczywiście,
takie twierdzenie jest zupełnie fałszywe. Przede wszystkim, musimy założyć, że potencjał
skalarny i potencjał wektorowy tworzą razem czterowektor. To dopiero mówi nam,
jak się potencjały transformują. Ale w takim razie, dlaczego tylko się liczy sytuacja w chwili
opóźnionej? Co więcej, dlaczego potencjały zależą tylko od położenia i od prędkości,
a nie na przykład od przyspieszenia? Pola E i B na pewno zależą od przyspieszenia. Gdy-
byśmy spróbowali przeprowadzić takie samo rozumowanie dla tych pól, powiedzieli-
byśmy, że zależą one tylko od położenia i od prędkości w chwili opóźnionej. Ale wówczas
Pola pochodzące od ładunku poruszającego się ruchem przyspieszonym byłyby takie
same, jak pola pochodzące od ładunku znajdującego się w położeniu pozornym, co jest
niePrawdą. Pola zależą nie tylko od położenia i prędkości w różnych punktach toru, ale
także od przyspieszenia.
Tak więc w tym wielkim twierdzeniu, które głosi, że wszystko można wyprowadzić
Przekształcenia Lorentza, tkwi wiele dodatkowych, milczących założeń. (Ile razy widzi-
my obszerne twierdzenia mówiące, że z bardzo małej liczby założeń można otrzymać
^lele, W'iele wyników, to zawsze można się przekonać, iż nie jest to prawdą. Zwykle
takim twierdzeniu zawarte są pośrednio liczne założenia, które wcale nie są takie
^"iste, jeżeli zastanowić się nad nimi dostatecznie wnikliwie.)
Okłady z fizyki
98
26. LORENTZOWSKIE TRANSFORMACJE P0L
26-2. Pola ładunku punktowego
poruszającego się ze stałą prędkością
Teraz, kiedy mamy już potencjały ładunku punktowego poruszającego się ze stałą
prędkością, powinniśmy znaleźć pola — będą one potrzebne dla celów praktycznych.
Z cząstkami poruszającymi się ruchem jednostajnym mamy do czynienia w wielu wypad-
kach — przykładem mogą być promienie kosmiczne przechodzące przez komorę Wil-
sona lub nawet wolno poruszające się elektrony w drucie. Zobaczmy więc, choćby w szcze-
gólnym przypadku, jak wyglądają w rzeczywistości pola dla dowolnej prędkości — nawet
dla prędkości bliskich prędkości światła — zakładając jedynie, że nie występują przy-
spieszenia. Problem ten jest całkiem interesujący.
Pola otrzymujemy z potencjałów na podstawie zwykłych reguł:
' i
3A
E = —--------—-,
dt
B = VxA.
Najpierw obijcaąmy £/.
£ = S<f> dAz
2 dz dt ‘
Ale Az jest równe zeru; różniczkując więc w równaniach (26.1) otrzymujemy
£ =--------q ---------------f. (26.2)
4»e0j/1-V2 r (x-vt)2 l3'2
——+y +z2
L 1—« J
Podobnie dla Ey:
£„*= —- ------------------T-. (26.3)
IV21-2]
* L v J
Obliczenie składowej x-owej wymaga nieco więcej zachodu. Pochodna jest tu bardziej
skomplikowana i składowa Ax nie jest równa zeru. Najpierw
> dtp q (x—at)/(l—u2)
Ąne0]/\-v2 f(x-vt)2 213
—:---~2—Fr+z2
L l—v J
Następnie różniczkując Ax względem t znajdujemy
dAx q —v2(x—vt)/(l—v2)
dt Ąm^i^2 ru-at)2 y
+z J
i I
26-2. POLA ŁADUNKU PUNKTOWEGO O STAŁEJ PRĘDKOŚCI
99
W końcu, po dodaniu,
q x—vt
47tE0ł/l-t>2 F fo-ttp2 [ 2 ! z2~|3/2
1—V2
(26.6)
Sensem fizycznym pola E zajmiemy się za chwilę; znajdźmy najpierw pole B. Dla skła-
dowej z-owej
SAV SA
n ____ ____y _____ __
1 Sx Sy
Ponieważ Ay jest równe zeru, musimy znaleźć tylko jedną pochodną. Zauważmy jednak,
że Ax to po prostu v<p, a pochodna SfSy z vq> jest po prostu równa —vEy. Tak więc
Bz = vEy. (26.7)
Podobnie l z SAX SA, S(p / B=— -=+v—- 1 ' y Sz Sx Sz
oraz By = -vEz. (26.8)
Na koniec, składowa Bx jest równa zeru, gdyż zarówno Ay, jak i A, są równe zeru. Pole
magnetyczne możemy zapisać w prostej postaci
B = vxE. (26.9)
Zobaczmy teraz, jak wyglądają oba pola. Spróbujemy narysować obraz pola w różnych
położeniach względem obecnego położenia ładunku. To prawda, że wpływ ładunku po-
chodzi, w pewnym sensie, od położenia opó-
źnionego; ale ponieważ ruch jest dokładnie
określony, położenie opóźnione jest jedno-
znacznie podane poprzez położenie obecne.
Dla stałych prędkości wygodniej jest związać
pola z bieżącym położeniem, ponieważ skła-
dowe pola w punkcie (x, y, z) zależą tylko od
(v—rt), y i z, które są współrzędnymi wek-
tora przesunięcia rP od położenia obecnego
do (a, yt z) (patrz rys. 26.3).
Rozważmy najpierw punkt, dla którego
2 — 0. Wówczas wektor E ma tylko składowe
* kierunkach osi x i y. Z równań (26.3)
’ (26.6) wynika, że stosunek tych składowych
Jest po prostu równy stosunkowi składowych
A‘'Owej i y-owej wektora przesunięcia. Ozna-
Cza to, że pole E ma ten sam kierunek co
Wektor rP, tak jak to pokazano na rys. 26.3.
26.3. Dla ładunku poruszającego się ze stałą
prędkością pole elektryczne rozchodzi się
radialnie od „rzeczywistego” położenia ła-
dunku
100
26. LORENTZOWSKIE TRANSFORMACJE PQL
26.4. Pole elektryczne ładunku poruszają-
cego się ze stałą prędkością V = 0,9c, część
(b), w porównaniu z polem spoczywającego
ładunku , część (a)
Ponieważ pole Ez jest także proporcjonalne
do z, to jasno z tego widać, że ta propor-
cjonalność E do r jest słuszna również dla
trzech wymiarów. Krótko mówiąc — pole
elektryczne ładunku jest radialne i linie sił
pola rozchodzą się promieniście od ładunku
właśnie tak jak w wypadku ładunku spoczy-
wającego. Oczywiście, pole nie jest dokładnie
takie samo, jak dla spoczywającego ładunku
ze względu na wszystkie dodatkowe czynniki
(1—v2). Ale można pokazać coś dość inte-
resującego. Różnica pomiędzy tymi polami
jest akurat taka, jaką otrzymałoby się rysując
pole kulombowskie w specjalnym układzie
współrzędnych, w którym skala osi x byłaby
„ściśnięta” o czynnik /l — v2. Gdyby zrobić
taki rysunek, to okazałoby się, że linie sił
pola będą rozpościerać się szeroko przed i za
ładunkiem, a po bokach będą ściśnięte ra-
zem, tak jak to pokazano na rys. 26.4.
Jeżeli zwiążemy, jak to się zwykle robi,
natężenie pola E z gęstością linii sił, to zoba-
czymy, że pole jest silniejsze po bokach, a sła-
bsze przed i za ładunkiem — właśnie tak,
jak to wynika z równań. Przede wszystkim
przyjrzyjmy się natężeniu*pola prostopadłego
do toru ruchu, tzn. dla (x—vf) = 0, i uwzględnijmy, że odległość od ładunku jest w tym
kierunku równa y2+z2. W punkcie tym całkowite natężenie pola wynosi j/E2+E2,
czyli
9 1
£ =_______r
47Ceoł/l- v2 y2+?2'
(26.10)
Pole jest odwrotnie proporcjonalne do kwadratu odległości, podobnie jak pole Coulom-
ba, z tym że jest ono zwiększone o stały, dodatkowy czynnik 1//1 —v2, który jest zawsze
większy od jedności. A więc po bokach poruszającego się ładunku pole jest silniejsze, niż
wynikałoby to z prawa Coulomba. W rzeczywistości pole po bokach poruszającego się
ładunku jest większe od pola Coulomba w stosunku równym stosunkowi energii cząstki
do jej masy spoczynkowej.
Przed (i za) ładunkiem, na jego torze, y i z- są równe zeru i
E = EX
?(1-^2)
4k£0(^— Vt)2 '
(26.11)
46-2. POLA ŁADUNKU PUNKTOWEGO O STAŁEJ PRĘDKOŚCI
101
pole zmienia się znowu jak odwrotność kwadratu odległości od ładunku, ale jest teraz
zmniejszone o czynnik (1— v2), zgodnie z obrazem linii sił pola. Jeżeli v/c jest małe, to
vz/c2 jest jeszcze mniejsze i wpływ członu (1—u2) jest bardzo mały; powracamy do prawa
Coulomba. Ale jeżeli cząstka porusza się z prędkością bardzo bliską prędkości światła,
pole w kierunku ku przodowi jest ogromnie zmniejszone, a pole w kierunku bocznym
jest ogromnie zwiększone.
Nasze wyniki dla pola ładunku elektrycznego można przedstawić w sposób następu-
jący: Przypuśćmy, że narysowaliśmy na kance papieru linie sił pola dla ładunku spoczy-
wającego, a następnie wprawiliśmy rysunek w ruch z prędkością v. Wówczas, oczywiście,
cały rysunek zostałby „ściśnięty” przez skrócenie lorentzowskie, tzn. że ziarenka grafitu
na papierze pojawiłyby się w innych miejscach. Zadziwiające w tym wszystkim jest to, że
rysunek, który zobaczylibyśmy na przelatującej kartce, reprezentowałby w dalszym ciągu
linie sił pola ładunku punktowego. Skrócenie Lorentza przesuwa te linie bliżej ku sobie
po bokach i rozsuwa je w przodzie i w tyle, dokładnie w taki sposób, aby gęstości linii
były takie, jakie być powinny. Poprzednio podkreślaliśmy, że linie sił pola nie są czymś
rzeczywistym, ale są tylko pewnym sposobem przedstawienia pola. Jednakże w tym wy-
padku wydaje się, że są one prawie czymś rzeczywistym. W tym szczególnym przypadku,
jeżeli popełnimy nieścisłość wyobrażając sobie, że linie sił pola są rzeczywiście w prze-
strzeni i poddamy je transformacji, to otrzymamy poprawne pole. Jednakże to nie czyni
linii sił pola ani trochę bardziej rzeczywistymi. Aby pamiętać, że nie są one czymś rzeczy-
wistym, wystarczy tylko pomyśleć o polach elektrycznych, wytworzonych przez ładunek
i magnes; kiedy magnes się porusza, powstają nowe pola elektryczne i niszczą ten piękny
obraz. Tak więc zgrabny pomysł rysunku ulegającego skróceniu nie ma zastosowania
w ogólnym przypadku. Jest to jednak wygodny sposób zapamiętania, jak wyglądają pola
pochodzące od poruszającego się szybko ładunku.
Pole magnetyczne jest równe vxE [z równania (26.9)]. Jeżeli prędkość pomnożyć
wektorowo przez radialne pole E, to otrzyma się pole B, które okrąża linię ruchu, tak
jak to pokazano na rys. 26.5. Jeżeli wstawić z powrotem wszystkie współczynniki c, to
okaże się, że jest to ten sam wynik, jaki mieliśmy dla ładunków o małej prędkości. Dobrym
sposobem zobaczenia, gdzie należy wstawić współczynniki c, jest odwołanie się do prawa
siły,
F = ę(E+vxB).
Widać, że prędkość razy pole magnetyczne
nta ten sam wymiar co pole elektryczne. A
W1?c po prawej stronie równania (26.9) musi
się pojawić czynnik 1/c2:
B = (vxE)/c2. (26.12)
poruszającego się wolno ładunku (v c)
H^ożna za pole E przyjąć pole Coulomba;
26.5. Pole magnetyczne w pobliżu poru-
szającego się ładunku wynosi vxE
(porównaj z rys. 26.4)
102
26. LORENTZOWSKIE TRANSFORMACJE PÓL
71—^
<k
wówczas
~ <7 vxr
B = ——. (26.13)
47teoc r
Wzór ten odpowiada dokładnie tym równa-
niom na pole magnetyczne prądu, które zna-
leźliśmy w § 14-7 (tom II, cz. 1).
Chcielibyśmy przy okazji pokazać coś in-
teresującego, nad czym warto się zastanowić.
(Później powrócimy jeszcze do omówienia
tego problemu.) Wyobraźmy sobie dwa elek-
trony, których prędkości są prostopadłe
względem siebie, tak że jeden z nich przetnie
tor drugiego, ale zanim on jeszcze nadejdzie,
tak że elektrony się nie zderzą. W pewnej
chwili ich położenie względne będzie takie,
jak na rys. 26.6a. Rozpatrzmy siłę, z jaką ła-
dunek q2 działa na ładunek qL i odwrotnie.
Na ładunek q2 działa tylko siła elektryczna
pochodząca od ładunku qt, ponieważ ładunek q2 nie wytwarza pola magnetycznego
wzdłuż swej linii ruchu. Na ładunek q2 jednak działa również siła elektryczna, ale w do-
datku działa też siła magnetyczna, ponieważ ładunek qt porusza się w polu B wytworzo-
nym przez ładunek q2. Siły te wyglądają tak, jak to przedstawiono na rys. 26.6b. Siły elek-
tryczne działające na ładunki i q2 są równe i przeciwnie skierowane. Jednakże na ładu-
nek qt działa jeszcze siła poprzeczna (magnetyczna), a na ładunek q2 żadna siła poprzeczna
nie działa. Czyżby akcja nie była równa reakcji? Troskę o ten problem pozostawiamy
czytelnikowi.
F,
ąfE, ®Bi
w2
^^“Fg
v2
pomiędzy dwoma
26.6. Siły działające
poruszającymi się ładunkami nie za-
wsze są równe i przeciwnie skierowa-
ne. Okazuje się, że „akcja” nie jest rów-
na „reakcji”
26-3. Relatywistyczna transformacja pól
W poprzednim paragrafie wyliczyliśmy z podanych transformacji potencjałów pola
elektryczne i magnetyczne. Znajomość pól jest oczywiście ważna, mimo że poprzednio
podaliśmy argumenty, że potencjały są realnymi wielkościami o znaczeniu fizycznym. Pola
są także czymś rzeczywistym. Przydałby się z wielu względów sposób na obliczanie pól
w poruszającym się układzie, jeżeli się zna już pola w układzie „spoczynku”. Znamy
prawa transformacji dla wielkości <p i A, ponieważ A? jest czterowektorem. Teraz chcie-
libyśmy poznać prawa transformacyjne dla pól E i B. Dane są pola E i B w jednym ukła-
dzie odniesienia, a jak wyglądają one w innym, poruszającym się względem niego ukła-
dzie? Wygodnie jest mieć taką transformację. Można wprawdzie zawsze dojść do tego
drogą okrężną, obliczając najpierw potencjały, a potem pola, ale czasem korzystnie jest
móc transformować pola bezpośrednio. Zobaczmy teraz, jak się to robi.
W jaki sposób można znaleźć prawa transformacji pól? Znamy prawa transformacji
<p i A, wiemy jak wyrazić pole poprzez <p i A — powinno się łatwo znaleźć transformacje
26.j. RELATYWISTYCZNA TRANSFORMACJA PÓL
103
dla pól B i E. (Można by przypuszczać, że z każdego wektora można w jakiś sposób utwo-
rzyć czterowektor, tak że dla pola E powinno istnieć coś, co mogłoby być użyte jako czwar-
ta składowa. I tak samo dla pola B. Ale tak nie jest. Jest całkiem inaczej, niż można by
się spodziewać.) Na początek rozpatrzmy tylko pole magnetyczne B, które jest oczywiście
równe V xA. Wiemy teraz, że potencjał wektorowy, ze swoimi składowymi x-ową, y-ową
i z-ową, jest tylko częścią czegoś; jest też składowa w kierunku t. Wiemy także, że dla
pochodnych takich jak V oprócz części x-owej, y-owej i z-owej istnieje także pochodna
względem t. Spróbujmy więc obliczyć, co się stanie, gdy zastąpimy „j>” przez „t” lub „z”
przez „t” lub coś w tym rodzaju.
Zauważmy, przede wszystkim, jaką mają postać wyrazy V x A, kiedy rozpiszemy
VxA na składowe:
dAz dAv dAx dAz dA„ dAx
___2_____y q x______z __ __y______x
dy dz y dz dx ’ 1 dx dy
(26.14)
Składowa x-owa równa jest parze wyrazów, zawierających jedynie składowe j-owe i z-
-owe. Przypuśćmy, że tę kombinację pochodnych i składowych nazwiemy „tworem zy”
i oznaczymy go w skrócie przez Fzy. Będziemy po prostu rozumieć, że
dA.
F = —-
Zy Sy
dAy
dz
(26.15)
Podobnie, By jest równe „tworowi” tego samego typu, ale tym razem jest to „twór xz”.
A Bz jest oczywiście odpowiednim „tworem yx”. Mamy więc
Bx = Fzy, By = Fxz, Bz = Fyx. (26.16)
Co się teraz stanie, jeżeli spróbujemy po prostu spreparować też kilka tworów typu
„t”, jak Fxl i Flz (przyroda bowiem powinna być piękna i symetryczna względem x, y,
z i 0? Tak na przykład, co to jest Flz? Oczywiście, jest to
. dAt dAz
dz dt
Ale pamiętajmy, że At — tak że jest to także
dAz
• dz dt
^Widzieliśmy to już poprzednio. Jest to z-owa składowa pola. No, prawie, znak bowiem
Jest zły. Ale zapomnieliśmy, że w czterowymiarowym gradiencie pochodna względem t
Występuje ze znakiem przeciwnym niż pochodne względem x, y, i z. Tak więc powinniśmy
bardziej konsekwentnie „dobudować” Flz jako
dA. dAz
“ (26'17)
Wówczas jest to dokładnie równe — Ez. Sprawdzając takżej co to jest JF/Jt i Fty, przeko-
104
26. LORENTZOWSKIE TRANSFORMACJE PÓL
Tabela 26.1. Składowe Ff,„
namy się, że te trzy możliwości dają
Etx ~ Fty ~ Ey’ Elz — Ez. (26.18)
Co się dzieje, gdy oba wskaźniki są tl Albo w przypadku gdy oba są x? Dostajemy
takie oto twory:
“ 5t 5t
oraz
_ SAX cAx
xx dx dx ’
które nie dają nic innego jak zero.
Mamy więc sześć tego rodzaju tworów F. Dalsze sześć można otrzymać przestawiając
wskaźniki, ale nie dają one nic naprawdę nowego, ponieważ
EXy = Fyx . i
i tak dalej. A więc z szesnastu możliwych kombinacji czterech wskaźników branych pa-
rami dostajemy tylko sześć różnych obiektów fizycznych; są to właśnie składowe pól B i E.
Do oznaczenia ogólnego wyrazu F będziemy używać ogólnych wskaźników p i v,
z których każdy może przyjmować wartość 0, 1, 2 lub 3, co oznacza w naszym zwykłym
zapisie wektorowym t, x, y, i z. Również wszystko będzie zgodne z naszym zapisem cztero-
wektorowym, jeżeli F,„ zdefiniujemy jako
F,„ = ^A-^A,, (26.19)
pamiętając, że V,, = (d/dt, —clcx, —dfdy, —d/Sz) i że A^ = (<p, Ax, Ay, Az).
Przekonaliśmy się, że istnieje sześć wielkości powiązanych z sobą przez przyrodę,
które stanowią różne aspekty tego samego. Pole elektryczne i magnetyczne, które w na-
szym poruszającym się wolno świecie (gdzie nie obchodzi nas prędkość światła) uważa-
liśmy za dwa odrębne wektory, w czteroprzestrzeni nie są wektorami. Są one częściami
nowego „tworu”. Nasze fizyczne „pole” jest w rzeczywistości sześcioskładnikowym obiek-
tem F^. W taki właśnie sposób musimy nań patrzeć w teorii względności. Podsumowanie
naszych wyników zamieszczamy w tab. 26.1.
Widzimy, że dokonaliśmy tutaj po prostu uogól-
nienia iloczynu wektorowego. Zaczęliśmy od operacji
rotacji i od faktu, że własności transformacyjne rota-
cji są takie same jak własności transformacyjne dwóch
wektorów — zwykłego, trójwymiarowego wektora A
i operatora gradientu, który — jak wiemy — także się
zachowuje jak wektor. Przypatrzmy się przez chwil?
zwykłemu iloczynowi wektorowemu w trzech wymia-
rach, np. momentowi pędu cząstki. Z ruchem dowol-
nego obiektu w płaszczyźnie jest związana ważna
1 wielkość (xvy—yvx). Dla ruchu w trzech wynua'
F^ = -F,n
Fp? = 0
Fxy ——Bz Fxt = Ex
Fyz = —Bx Fyl = Ey
Fzx = —By Fa = Ez
,6.3. RELATYWISTYCZNA transformacja pól 105
rach mamy trzy takie ważne wielkości, które nazywamy składowymi momentu
pędu:
Lxy = m(xvy-yvx), Lyz = m(yvz-zvy), Lzx = m(zvx-xvz).
Następnie (chociaż niektórzy z nas mogli już o tym zapomnieć) odkryliśmy w rozdz. 20
tomu I (cz. 1) zadziwiającą rzecz, że te trzy wielkości można utożsamić ze składowymi
wektora. Aby to zrobić, musieliśmy utworzyć sztuczne prawo — regułę prawej ręki.
Mieliśmy po prostu szczęście. Mieliśmy szczęście, bo moment (z i i j równymi x, y
lub z) był obiektem antysymetrycznym:
L, = 0.
Z dziewięciu możliwych wielkości Lu tylko trzy są niezależne. I przy zmianie układu współ-
rzędnych tak właśnie się dzieje, że trzy obiekty transformują się dokładnie tak samo jak
składowe wektora.
Podobne powody pozwalają nam przedstawić element powierzchni jako wektor. Ele-
ment powierzchni jest scharakteryzowany przez dwa elementy liniowe — powiedzmy
przez dx i dy — które można uważać również za składowe wektora rfa, prostopadłego
do powierzchni. Ale w czterech wymiarach nie można tego zrobić. Jaka jest bowiem
„normalna” do dx dyl Czy ma ona kierunek osi z, czy też leży wzdłuż osi t?
W skrócie, dla trzech wymiarów tak się szczęśliwie składa, że po utworzeniu iloczynu
dwóch wektorów, takiego jak Ltj, można go w dalszym ciągu przedstawiać przez inny wek-
tor, ponieważ istotne są tam tylko trzy składowe, które się dodatkowo transformują akurat
tak jak składowe wektora. Ale w czterech wymiarach jest to oczywiście niemożliwe, po-
nieważ mamy tu sześć niezależnych wyrazów, a sześciu wielkości nie można przedstawić
za pomocą czterech.
Nawet w trzech wymiarach mogą istnieć takie iloczyny wektorów, których nie da się
przedstawić za pomocą wektorów. Przypuśćmy, że weźmiemy dowolne dwa wektory
a = (ax, ay, az) i b = (bx, by, bz) i utworzymy wszystkie możliwe iloczyny składowych,
jak np. axbx,axby, itd. Będzie tu dziewięć możliwych wielkości:
axbx, axby, axbz,
aybx, ayby, aybz,
azbx, azby, azbz.
Wielkości te można by oznaczyć przez Tv.
Jeżeli teraz przejść do obróconego układu współrzędnych (np. obróconego wokół
°S1 z), to składowe wektorów a i b się zmienią. W naszym układzie ax, na przykład, zo-
stanie zastąpione
a' = fircos0+fivsin0,
a by '
b'y = bycos6—Z\sin0.
1 P°dobnie dla innych składowych. Wszystkie dziewięć składowych wyprowadzonej przez
106
26. LORENTZOWSKIE TRANSFORMACJE POL
nas wielkości „iloczynowej” Ty ulegnie także zmianie. Tak na przykład Txy = axby zmienia
się na
Txy = axby(cos2&)—axbx(cos9 sin&)+ayby(sinO cos0)—aybx(sin20),
czyli
T' = T,„cos20—TxxcosO sin0-ł-T „sinfl cosfl—Tv,sin20.
ay A- *4 yy y
Każda składowa Tyjest kombinacją liniową składowych Ty.
Przekonaliśmy się więc, że nie tylko można mieć „iloczyn wektorowy” jak axb, który
ma trzy składowe, transformujące się jak wektor, ale można też sztucznie utworzyć innego
rodzaju „iloczyn” dwóch wektorów Ty, o dziewięciu składowych, które przy obrocie
transformują się według skomplikowanego zbioru reguł tu znalezionych. Taki obiekt,
do którego opisu potrzeba dwóch wskaźników zamiast jednego, nazywamy tensorem.
Jest to tensor „drugiego rzędu”, ponieważ tę samą operację można przeprowadzić także
z trzema wektorami i otrzymać tensor trzeciego rzędu, lub z czterema, aby otrzymać
tensor czwartego rzędu, i tak dalej. Wektor jest tensorem pierwszego rzędu.
Zasadniczą rzeczą w tym wszystkim jest to, że nasza elektromagnetyczna wielkość
jest także tensorem drugiego rzędu, ponieważ ma dwa wskaźniki. Jest to jednakże tensor
w czterech wymiarach. Transformuje się on w szczególny sposób, który za chwilę wy-
prowadzimy — właśnie w taki sposób, w jaki się transformuje iloczyn wektorów. Przy
tym okazuje się, że jeżeli zamienić wskaźniki miejscami, to F^, zmienia znak. Mamy tu
szczególny przypadek — jest to tensor antysymetryczny. Mówimy więc: obydwa pola, elek-
tryczne i magnetyczne, są częściami antysymetrycznego tensora drugiego rzędu w czte-
rech wymiarach.
Przeszliśmy długą drogę. Przypomnijmy sobie, jak dawno temu określaliśmy, co to
jest prędkość! Teraz mówimy już o „antysymetrycznym tensorze drugiego rzędu w czte-
rech wymiarach”.
Musimy teraz znaleźć prawa transformacji tensora F^. Nie jest to wcale trudne do
zrobienia; jest tylko żmudne — nie wymaga wcale wiele inteligencji, ale wymaga sporo
pracy. To, czego szukamy, to przekształcenie Lorentza ^^A^. Ponieważ V/I jest
szczególnym przypadkiem wektora, będziemy rozważać ogólną antysymetryczną kombi-
nację iloczynów wektorów, którą oznaczymy G^:
G^ = a,bu. (26.20)
(Dla naszych celów a? zostanie na końcu zastąpione V/1, a potencjałem >4U.) Składowe
i b^ transformują się według wzorów Lorentza, a zatem
, at—va . b.—vbx
. at = ....ht =
VI — v2 Vl—v2
, ax—va. . bx—vb.
a* = r------bx =
l^l—u2 /l — v2
,, , (26J1)
ay ’ by by >
b'z = bz.
26-3. RELATYWISTYCZNA TRANSFORMACJA PÓL
107
poddajmy teraz transformacji składowe G^. Zaczynamy od Gtx:
Gtx atbx axbt
atbx-axbt.
Ale to jest po prostu Gtx, tak że otrzymujemy prosty wynik
Gtx = Gtx*
Uczyńmy to samo dla jeszcze jednej składowej:
a-™x , b-vbx _ {a,b-a^-v(axbr-arb^
G'ty =
Otrzymujemy zatem , _ Gty—vGxy Crty n-v2
I oczywiście, w ten sam sposób . G,-vGxz GtZ ! ^l-v2
Widać teraz jasno, jak będzie się transformować reszta. Zróbmy tabelkę wszystkich sześciu
wyrazów; tylko że teraz można je równie dobrze wypisać dla
Fr — F r' _ Fxy-vF,y
* tx * tx> *xy ]/l—v2
, F,v~VFrv
ty xy ‘y j/l-r2 ’ Fyz = FyZ,
, Ftz—vF„ Fzx _ Fzx-vFzt
' }/\-v2 • j/l-r2
(26.22)
Oczywiście, w dalszym ciągu Fy, = — F'vtl i F^ = 0.
Mamy więc transformację pola elektrycznego i magnetycznego. Pozostaje nam tylko
Przyjrzeć się tab. 26.1, aby znaleźć, co nasz wspaniały zapis przy użyciu F^ oznacza dla
wektorów E i B. To tylko kwestia podstawienia. Abyśmy więc mogli zobaczyć, jak to
wygląda w zwykłych oznaczeniach, przepiszemy naszą transformację składowych pola
w tab. 26.2.
Równania w tab. 26.2 mówią nam, jak się zmieniają pola E i B, jeżeli przechodzimy
°d jednego inercjalnego układu odniesienia do drugiego. Jeżeli mamy dane E i B w jed-
nym układzie, możemy znaleźć, czemu one są równe w innym układzie, który się poru-
SZa względem pierwszego z prędkością v.
Równania te można zapisać w postaci, która jest łatwiejsza do zapamiętania, jeżeli
Zauważyć, że ponieważ v ma kierunek osi x, wszystkie wyrazy z u są składowymi iloczy-
108
26* LORENTZOWSK1E TRANSFORMACJE PÓL
Tabela 26 2. Przekształcenie Lorentza pola elektryczne-
go i magnetycznego (Uwaga: c = 1)
F.' = E B' = B
* X X
F.' Ey—vBz By+vEz B =
y M-v2 y V\-v2
E' _ Ez+»By Bz—vEy £$ = - -
1 1—V2 2 y i-o2
Tabela 26 3. Alternatywna postać transformacji pól
(Uwaga: c = 1)
B' X = Bx
(E+vxB)j, B' (B—v x E)y
tj—V2 y Fl—v2
(E+vxB)z B' (B—v x E)z
)j—v2 Vl—v2
Tabela 26 4 Jeszcze jedna postać przekształcenia
Lorentza pól E i B
26J. RELATYWISTYCZNA transformacja pól
109
pów wektorowych vxE i vxB. Można więc przepisać transformację w postaci pokazanej
w tab. 26.3.
Teraz można łatwiej zapamiętać, gdzie występują poszczególne składowe. W rzeczy-
wistości transformację można zapisać jeszcze prościej, jeżeli zdefiniujemy składowe pola
wzdłuż osi x jako składowe „równoległe” E, i B, (ponieważ są one równoległe do względ-
flej prędkości układów S i S') i zdefiniujemy całkowite składowe poprzeczne — wekto-
rowe sumy składowych w kierunkach y i z — jako składowe „prostopadłe” E± i B±. Wów-
czas otrzymujemy równania podane w tab. 26.4. (Wstawiliśmy tu z powrotem wszystkie
współczynniki c, tak aby w przyszłości było nam wygodniej korzystać z tych wzorów.)
Transformacje pól dają nam nowy sposób na rozwiązanie pewnych problemów, któ-
re już rozwiązaliśmy poprzednio: pozwalają na przykład znaleźć pola poruszającego się
ładunku. Poprzednio wyprowadziliśmy te pola różniczkując potencjały. Teraz natomiast
moglibyśmy to zrobić transformując pole Coulomba. Jeżeli w układzie S spoczywa ładu-
nek punktowy, to wówczas jest tam tylko proste, radialne pole E. W układzie S' zoba-
czymy punktowy ładunek, poruszający się z prędkością w, jeżeli tylko układ S' porusza
się względem układu S z prędkością v = — u. Pozostawiamy czytelnikowi do sprawdze-
nia, że transformacje z tab. 26.3 i 26.4 dają te same pola elektryczne i magnetyczne, jakie
otrzymaliśmy w § 26-2.
Transformacja w tab. 26.2 daje nam ciekawą a prostą odpowiedź na pytanie: Co wi-
dzimy poruszając się względem dowolnego układu nieruchomych ładunków? Przypuśćmy,
na przykład, że chcemy znać pola w naszym układzie S', jeżeli się poruszamy pomiędzy
płytkami kondensatora w kierunku do nich równoległym, tak jak to pokazano na rys.
26.7. (Równie dobrze można by powiedzieć, że naładowany kondensator przesuwa się
względem nas.) Cóż więc zobaczymy? Transformacja jest w tym przypadku prosta, bo
w układzie pierwotnym pole B jest równe zeru. Przypuśćmy najpierw, że nasz ruch od-
bywa się w kierunku prostopadłym do E; wówczas stwierdzimy istnienie pola E' =
— E/ /l — v2/c2, które w dalszym ciągu jest całkowicie poprzeczne. Oprócz tego zobaczymy
pole magnetyczne B' = — vxE'/c2. (W naszym wzorze na pole B' nie występuje 11 — v2,
bo B' wyraziliśmy poprzez pole E', a nie poprzez pole E; ale to na jedno wychodzi.)
Tak więc, gdy się poruszamy prostopadle do statycznego pola elektrycznego, widzimy
zmniejszone pole E i nowe pole poprzeczne B. Jeżeli nasz ruch nie jest prostopadły do E,
rozbijamy E na Eh i E, . Część równoległa się nie zmienia, E' = E,, a składowa prosto-
padła tak się zmienia, jak to opisaliśmy
Powyżej.
Rozważmy przypadek przeciwny i wy-
obrażmy sobie, że poruszamy się przez czyste
statyczne pole magnetyczne. Tym razem zo-
aczytny elektryczne pole E', równe vaB'
Paleomagnetyczne zmienione o czynnik
' ~~v2/c2 (zakładając, że jest ono poprze-
otf e ’^k długo, jak długo v jest dużo mniejsze
c> można pomijać zmianę pola magnety-
26.7. Układ współrzędnych S', poruszający
się przez statyczne pole elektryczne
1 10 26. LORENTZOWSKIE TRANSFORMACJE PÓL
cznego i głównym efektem jest pojawienie się pola elektrycznego. Jako przykład tego faktu
rozważmy słynny niegdyś problem wyznaczania prędkości samolotu. Problem ten przestał
być już słynny, ponieważ teraz można wyznaczać prędkość w powietrzu z odbić od Ziemi
przy pomocy radaru, ale przez wiele lat bardzo trudno było określić prędkość samolotu
podczas złej pogody. Nie było widać Ziemi, nie wiedziało się gdzie jest „góra”, a gdzie
„dół” i tak dalej. A mimo to ważną rzeczą była znajomość prędkości ruchu względem
Ziemi. Jak można to zrobić nie widząc Ziemi? Wielu z tych, którzy znali wzory transfor-
macji, myślało o wykorzystaniu faktu, że samolot porusza się w polu magnetycznym Ziemi.
Przypuśćmy, że samolot leci w obszarze, gdzie pole magnetyczne jest mniej lub bardziej
znane. Weźmy tylko prosty przypadek, w którym pole magnetyczne jest pionowe. Jeżeli
przelatywalibyśmy przez nie z poziomą prędkością v, to zgodnie z naszym wzorem powinni-
byśmy zobaczyć pole elektryczne, które jest równe vxB, to znaczy jest prostopadłe do
kierunku ruchu. Gdy w poprzek samolotu zawiesimy izolowany drut, wówczas to pole
elektryczne wyindukuje na końcach drutu ładunki. To nic nowego. Z punktu widzenia
kogoś z Ziemi drut porusza się w polu i siła q (y x B) sprawia, że ładunki się przesuwają ku
końcom drutu. Równania transformacji wypowiadają tę samą rzecz, tylko w inny sposób.
(Fakt, że możemy wypowiedzieć coś więcej niż w jeden sposób, nie oznacza, że jeden z tych
sposobów jest lepszy od drugiego. Mamy tak wiele różnych metod i narzędzi, że zwykle
możemy otrzymać ten sam wynik na 65 różnych sposobów!)
Tak więc, aby zmierzyć prędkość v, wystarczy zmierzyć tylko napięcie pomiędzy koń-
cami drutu. Nie można tego zrobić przy użyciu woltomierza, ponieważ te same pola będą
działać na druty woltomierza, ale są sposoby mierzenia takich pól. O niektórych z tych
sposobów wspomnieliśmy przy omawianiu elektryczności atmosferycznej w rozdz. 9
(tom II, cz. 1). Tak więc prędkość samolotu powinna się tym sposobem dać zmierzyć.
Ten ważny problem nie był jednakże nigdy rozwiązany w taki sposób, a to dlatego,
że wytworzone pole elektryczne jest rzędu miliwoltów ma metr. Można wprawdzie mie-
rzyć takie pola, ale kłopot w tym, że te pola — niestety — wcale się nie różnią od innych
pól elektrycznych. Wytworzonego przez ruch w polu magnetycznym pola nie można od-
różnić od jakiegoś pola elektrycznego, które istnieje już w powietrzu z innych przyczyn,
powiedzmy pochodzącego od elektrycznych ładunków w powietrzu lub na chmurach.
W rozdziale 9 (tom II, cz. 2) powiedzieliśmy, że typowe pola elektryczne, które istnieją
nad powierzchnią Ziemi, mają natężenie około 100 V/m. Ale są one zupełnie nieregularne,
tak że gdy samolot leci przez powietrze, odczuwa on fluktuacje pól elektrycznych. Fluktua-
cje te są olbrzymie w porównaniu z maleńkimi polami/ za które odpowiedzialny jest
wyraz vxB i okazuje się, że ze względów praktycznych nie da się zmierzyć prędkości
samolotu wykorzystując jego ruch w polu magnetycznym Ziemi.
i
26-4. Równania ruchu w zapisie relatywistycznym**
Niewiele będziemy mieli korzyści ze znalezienia pól elektrycznych i magnetyczny^
z równań Maxwella, jeżeli nie będziemy wiedzieć, jakie jest działanie tych pól, kiedy "T
*’ W tym paragrafie będziemy z powrotem uwzględniać wszystkie współczynniki c.
RÓWNANIA RUCHU W ZAPISIE RELATYWISTYCZNYM
111
stąpią. Pamiętamy zapewne, że pola te są potrzebne do znalezienia sił działających na ła-
dunki oraz że siły te określają ruch ładunku. Tak więc częścią teorii elektrodynamiki
jest oczywiście zależność pomiędzy ruchem ładunków a siłami.
Siła działająca w polach E i B na pojedynczy ładunek jest równa
F = ę(E4-vxB).
(26.23)
Siła ta jest dla małych prędkości równa masie razy przyspieszenie, a poprawnym pra-
wem dla dowolnej prędkości będzie stwierdzenie, że siła jest równa cbpjdt. Zapisując p=
=ffjQv/l'l~u2/c2 znajdujemy, że poprawnym relatywistycznym równaniem ruchu jest
4 I-7=^=4 = F = <7(E+v XB). (26.24)
\/l-v2/c2/
Chcielibyśmy teraz omówić to równanie z punktu widzenia teorii względności. Po-
nieważ nadaliśmy naszym równaniom Maxwella postać relatywistyczną, rzeczą intere-
sującą powinny być równania ruchu w postaci relatywistycznej. Zobaczmy, czy potrafimy
przepisać to równanie w zapisie czterowektorowym.
Wiemy, że pęd jest częścią czterowektora p^, którego składową czasową jest energia
iMo/yl— v2jc2. Można by więc spróbować zastąpić lewą stronę równania (26.24) przez
dpjdt. Wówczas trzeba tylko znaleźć czwartą składową, która towarzyszy sile F. Ta czwarta
składowa musi być równa szybkości zmian energii, czyli szybkości wykonywania pracy,
a więc Fv. Chcielibyśmy zatem zapisać prawą stronę równania (26.24) w postaci cztero-
wektora (F-v, Fx, Fy, Fz). Nie jest to jednak czterowektor.
Pochodna czasowa czterowektora nie jest już czterowektorem, ponieważ d[dt wymaga
wyboru pewnego specjalnego układu odniesienia dla zmierzenia t. Na tę samą trudność
natknęliśmy się poprzednio, kiedy to próbowaliśmy „przerobić” prędkość v na cztero-
wektor. Naszą pierwszą hipotezą było, że składową czasową będzie c dtjdt — c. Ale wiel-
kości
\ dt dt dt} 1 v
nie są składowymi czterowektora. Przekonaliśmy się już, że można je „przerobić” na
czterowektor, mnożąc każdą ze składowych przez czynnik 1/j/l—v2/c2. „Czteroprędkość”
/ 1 v
I , =' ’ , ......
\F1— v2[c2 V1 — v2/c2
Jest natomiast czterowektorem.
Okazuje się więc, że jeżeli się chce, aby pochodne tworzyły czterowektor, cały dowcip
P°iega na przemnożeniu djdt przez 1//1—r2/c2.
Naszą kolejną hipotezą będzie, że
Vl— v2}c2 dt
(26.27)
P°winno być czterowektorem. Ale co to jest v? Jest to prędkość cząstki, a nie układu współ-
112
26 LORENTZOWSKIE TRANSFORMACJE PÓL
rzędnych! AtwtCtm wielkość zdefiniowana przez i '
, 1 T X
/ Fv F \ ~
4 = —' (26.28)
\ 1/1 — v2/c2 /l — v2/c2 /
stanowi rozszerzenie pojęcia siły na cztery wymiary — można ją nazwać „czterosiłą”.
Jest to oczywiście czterowektor, a jego składowe przestrzenne nie są składowymi F,
ale składowymi F/j/1—v2lc2.
Pytanie brzmi: dlaczego 4 jest czterowektorem? Dobrze byłoby zrozumieć trochę
rolę tego czynnikal/j/1 — v2/c2. Ponieważ pojawił się on teraz dwa razy, czas już zrozumieć,
dlaczego djdt można zawsze „uzdrowić” tym samym czynnikiem. Odpowiedź jest nastę-
pująca: Gdy bierzemy pochodną czasową jakiejś funkcji x, to obliczamy przyrost Ax
dla małego przedziału At zmiennej t. Ale w innym układzie odniesienia przedział At
mógłby odpowiadać zmianom zarówno i', jak i x', a zatem jeżeli zmienić tylko i', to
zmiana x będzie inna. Musi się więc znaleźć taką zmienną naszego różniczkowania, która
będzie miarą „przedziału” czasoprzestrzeni i to miarą, która będzie taka sama we wszyst-
kich układach odniesienia. Gdy cząstka „porusza się” w czteroprzestrzeni, jej współrzędne
doznają zmiany: At, Ax, Ay, Az. Czy z tych wielkości da się utworzyć niezmienniczy
przedział? No cóż, są to składowe czterowektora xtt = (et, x, y, z), tak że jeżeli zdefiniu-
jemy wielkość As:
• ' (As)2 = — Ax Ax„ =—~ (c2At2—Ax2—Ay2—Az2), (26.29)
c2 c2
która jest czterowymiarowym iloczynem skalarnym, to otrzymamy wówczas dobry cztero-
wektor, którego długość można użyć za miarę czterowymiarowego przedziału. Z As — lub
z jej granicy ds — możemy określić parametr s = Jds. A pochodna względem s jest przy-
jemną operacją czterowymiarową, ponieważ jest ona niezmiennikiem przekształcenia
Lorentza.
Łatwo można związać ds z dt dla poruszającej się cząstki. Dla cząstki punktowej,
będącej w ruchu,
dx = vxdt, dy = vydt, dz = v.dt (26.30)
oraz , ,
ds — V(dt2/c2)(c2—v2—v2—v2) = dt^\—v2lc2. (26.31)
A zatem pperator 1 d
j/f-u2/? dt
jest operatorem niezmienniczym. Jeżeli podziałamy nim na jakiś czterowektor, to otrzy-
mamy inny czterowektor. Tak na przykład, jeżeli podziałamy nim na (ct, x, y, t), to dosta-
niemy czteroprędkość u^:
dx
-~- = ua.
ds
Widać teraz jasno „uzdrawiąjąc<" rolę czynnika 1//1—v2/c2. \
2^4. RÓWNANIA RUCHU W ZAPISIE RELATYWISTYCZNYM
113
Niezmiennicza zmienna s jest pożyteczną wielkością fizyczną. Nazywa się ją „czasem
własnym” wzdłuż toru cząstki, ponieważ ds jest zawsze przedziałem czasu w układzie od-
niesienia, który się porusza w każdej poszczególnej chwili wraz z cząstką. (Wówczas
= zly = zlz = 0 a = Jt.) Jeżeli potrafilibyśmy sobie wyobrazić „zegar”, którego
chód nie zależy od przyspieszenia, to taki zegar, przenoszony wraz z cząstką, pokazywałby
czas s.
Możemy się teraz cofnąć i wypisać' prawa Newtona (tak jak je poprawił Einstein)
w zgrabnej postaci:
. > (26.32)
as
gdzie jest określone równaniem (26.28). Również pęd można zapisać jato
dx
p=mou=mo—^-, (26.33)
as
gdzie współrzędne x/t = (cl, x, y, z) opisują teraz tor cząstki. Wreszcie, zapis cztero-
wymiarowy pozwala nam zapisać równanie ruchu w takiej oto bardzo prostej postaci:
= (26.34)
ds2
która przypomina postać F = ma. Należy jednak zauważyć, że równanie (26.34) nie jest)
takie samo jak równanie F = ma, ponieważ czterowymiarowa postać równania (26.34)
zawiera w sobie prawa mechaniki relatywistycznej, które różnią się od prawa Newtona
dla wielkich prędkości. Mamy tu odmienną sytuację niż w przypadku równań Maxwella,
gdzie mogliśmy przepisać równania w postaci relatywistycznej, nie zmieniając ich zna-
czenia, gdyż była to tylko zmiana metody zapisu.
Powróćmy teraz do równania (26.24) i zobaczmy, jak można zapisać prawą stronę
w zapisie czterowektorowym. Trzy składowe — po podzieleniu przez j/1—v2/c2 — są
składowymi f?, tak że
. f = ?(E+*xB)x =
/l— v2/c2
(26.35)
Musimy teraz wszystkie wielkości wyrazić w ich zapisie relatywistycznym. Przede wszyst-
kim 1/j/l—v2/c2, vy/y/l— v2/c2 i vz/j/l— v2/c2 są składowymi w kierunkach t,y i z cztero-
Prędkości u^. Z tabeli 26.1 można wziąć składowe F^, odpowiadające składowym Ex,
& z i By-, wtedy
fx Q^Ft^xt MyFxy UzFxz)>
O
" Wykłady z fizyki
114
26. LORENTZOWSKIE TRANSFORMACIE PÓL
co zaczyna wyglądać interesująco. Każdy wyraz ma wskaźnik x, co wyglada sensownie,
bo szukamy składowej x-owej. Następnie, wszystkie pozostałe wskaźniki występują parami
tt,yy,zz — nie ma tylko pary xx. No, to dopiszemy po prostu ten brakujący wyraz:
fx = q{UtPX-^XFXX-^yFXy-‘ UzFxz) (26.36)
Postępując tak niczego nie zmieniliśmy, bo tensor jest antysymetryczny i Fxx = 0. To
wstawienie wyrazu xx pozwala nam zapisać równanie w „stenograficznej” postaci
4 = (26.37)
Równanie to jest takie samo jak równanie (26.36), jeżeli przyjąć regułę, że zawsze, gdy
jakiś wskaźnik pojawia się dwa razy (tak jak wskaźnik v tutaj), to automatycznie wykonu-
jemy po nim sumowanie, tak samo jak w przypadku iloczynu skalarnego, korzystając
z tej samej umowy dla znaków.
Łatwo można uwierzyć, że równanie (26.37) określa równie dobrze dla [i = y lub
p, ~ z, ale co będzie dla p = t? Zobaczmy, ot dla zabawy, co nam daje równanie (26.37):
ft tłfytFtt tixFtx uyFty u2Ftj).
Musimy teraz z powrotem „przetłumaczyć” to wyrażenie na oznaczenia Ł i B. Otrzy-
mujemy:
f, = q 0+ Ex+ -—L= Ą+
\ F7!—v2/c2 F7! — v2/c2 F7! —v2/c2
czyli
r = ?V'E
Jl /1=^72 ‘
Ale z równania (26.28) wynika, że ft powinno być równe
(26.38)
F-v __ ę(E+vxB)-v
F7!- v2/c2 ]/l—v2/c2
A to jest to samo, co równanie (26.38), gdyż (vxB)-v jest równe zeru. A więc wszystko
się zgadza.
Podsumowując, nasze równanie ruchu można zapisać w eleganckiej postaci:
w0 , 2 tfUfFp,
as
(26.39)
Chociaż to miło zobaczyć, że da się zapisać równania w ten sposób, to taka postać nie
jest zbyt pożyteczna. Zwykle wygodniej jest rozwiązywać ruchy cząstki korzystając z piet*
wotnych równań (26.24) i tak właśnie będziemy zwykle czynić.
27
energia i pęd pola
27-1. Lokalna zasada zachowania
Zdajemy sobie jasno sprawę z tego, że energia obiektów materialnych nie jest zachowy-
wana. Kiedy jakiś obiekt promieniuje światło, traci energię. Jednakże istnieje możliwość,
że tę stratę energii można przedstawić jako jakąś inną postać energii, na przykład jako
światło. Dlatego też teoria zachowania energii nie jest pełna, jeżeli nie wziąć pod uwagę
energii związanej ze światłem lub ogólnie — z polem elektromagnetycznym. Zajmiemy się
teraz zasadą zachowania energii oraz zasadą zachowania pędu dla pól. Z pewnością nie
można rozważać obu tych zasad oddzielnie, bo w teorii względności pęd i energia stanowią
dwa różne aspekty tego samego czterowektora.
Na początku tomu I omawialiśmy zasadę zachowania energii; powiedzieliśmy wtedy
zaledwie, że całkowita energia w świecie jest stała. Chcemy teraz dokonać pewnego istot-
nego uogólnienia zasady zachowania energii — uogólnienia, które powie nam szczegó-
łowo o tym, jak energia jest zachowywana. Ta nowa zasada będzie mówić, że jeżeli energia
zanika w jakimś obszarze, to zachodzi to dlatego, że energia wypływa poprzez granice
tego obszaru. Jest to nieco mocniejsza zasada niż zasada zachowania energii bez tego
zastrzeżenia.
Aby zobaczyć, co oznacza to uogólnienie, przypatrzmy się, jak działa zasada zachowa-
na ładunku. Zasadę zachowania ładunku opisaliśmy mówiąc, że istnieje gęstość prądu j
1 gęstość ładunku q i kiedy ładunek maleje w jakimś miejscu, to z tego miejsca musi na-
stąpić wypływ ładunku. Nazywamy to zasadą zachowania ładunku. Matematyczną posta-
Ci4 tej zasady zachowania jest równanie
(27.1)
116
27. ENERGIA I PĘD POLA
27.1. Dwa „sposoby” na zachowanie ła-
dunku: a) Qi+Q2 jest stałe; b) dQ-Jdt =
= / j-n da = —dQ2!dt
wamy „lokalną” zasadą zachowania, po to
Na skutek tej zasady całkowity ładunek
w świecie jest zawsze stały — nigdy nie ma wy-
padkowego przyrostu lub straty ładunku. Je-
dnakże całkowity ładunek w świecie mógłby
pozostać stały w inny sposób. Przypuśćmy,
że w pobliżu jakiegoś punktu (1) znajduje się
pewien ładunek Qr, podczas gdy w pobliżu
jakiegoś punktu (2), znajdującego się w pewnej
odległości od punktu (1), nie ma ładunku (rys.
27.1). Przypuśćmy teraz, że w miarę upływu
czasu ładunek 2i będzie stopniowo zanikał
i że równocześnie z maleniem będzie się
pojawiał pewien ładunek Q2 w pobliżu pun-
ktu (2) w taki sposób, że w każdej chwili suma
ładunków Qi i Q2 będzie stała. Innymi słowy,
w każdym stanie pośrednim ilość ładunku
stracona przez Qi będzie dodana do Q2.
Wówczas całkowity ładunek w świecie byłby
zachowany. To jest zasada zachowania na
skalę „światową”, a nie zasada, którą nazy-
bowiem, aby ładunek dostał się z punktu (1)
do (2) nie musi się on pojawić nigdzie w przestrzeni pomiędzy punktami (1) i (2). Lokal-
nie ładunek został po prostu „stracony”.
W teorii względności z taką „światową” zasadą zachowania jest związana pewna
trudność. Pojęcie „chwil równoczesnych” w odległych od siebie punktach nie jest w róż-
nych układach równoważne. Dwa zdarzenia, które są równoczesne w jednym układzie,
nie są równoczesne w innym układzie, poruszającym się względem pierwszego. Dla „świa-
towego” zachowania typu powyżej opisanego, konieczne jest, aby ładunek stracony z Q\
pojawił się równocześnie w Q2. W przeciwnym wypadku byłyby pewne chwile, w których
ładunek nie byłby zachowany. Wydaje się, że nie ma sposobu, aby uczynić zasadę zacho-
wania ładunku relatywistycznie niezmienniczą bez nadania tej zasadzie charakteru
„lokalnej” zasady zachowania. Prawdę mówiąc, żądanie lorentzowskiej niezmienniczości
relatywistycznej wydaje się ograniczać w zdumiewający sposób dopuszczalne prawa przy-
rody. W nowoczesnej kwantowej teorii pola, na przykład, chciano często zmodyfikować
teorię przez dopuszczenie tego, co się nazywa oddziaływaniem „nielokalnym” — kiedy
coś, co znajduje się tutaj, oddziaływa bezpośrednio na coś znajdującego się tam — ale
popadano w kłopoty związane z zasadą względności.
„Lokalna” zasada zachowania polega na czymś innym. Mówi ona, że ładunek może
się dostać z jednego miejsca do drugiego tylko w tym przypadku, jeżeli w przestrzeni
pomiędzy tymi miejscami coś się dzieje. Dla opisu tej zasady potrzebna jest nie tylko
gęstość ładunku q, ale również inny typ wielkości, a mianowicie wektor j, określający szyb-
kość przepływu ładunku przez powierzchnię. Ten przepływ jest następnie związany z szyb'
kością zmiany gęstości ładunku równaniem (27.1). Jest to bardziej skrajny typ zasady za-
27,1. LOKALNA ZASADA ZACHOWANIA 117
chowania. Mówi ona, że ładunek jest zachowany w pewien szczególny sposób — zacho-
wany „lokalnie”.
Okazuje się, że zachowanie energii jest także procesem lokalnym. W danym obszarze
przestrzeni dana jest nie tylko gęstość energii, ale także i wektor, który ma przedstawić
szybkość wypływu energii przez powierzchnię. Tak na przykład w przypadku, gdy źródło
świetlne promieniuje, można znaleźć energię świetlną wysyłaną przez to źródło. Jeżeli
wyobrazić sobie pewną powierzchnię matematyczną, otaczającą źródło światła, to energia
stracona w obszarze ograniczonym tą powierzchnią jest równa energii, która przez tę
powierzchnię wypływa na zewnątrz.
27-2. Zasada zachowania energii
i elektromagnetyzm
Chcemy teraz opisać jakościowo zasadę zachowania energii w przypadku elektro-
magnetyzmu. Aby to zrobić, musimy określić, ile energii znajduje się w dowolnym elemen-
cie objętości przestrzeni oraz znaleźć szybkość przepływu energii. Przypuśćmy, że najpierw
zajmiemy się tylko energią pola elektromagnetycznego. Niech u określa gęstość energii
pola (tzn. ilość energii na jednostkową objętość w przestrzeni), a wektor S niech określa
strumień energii pola (tzn. energię przepływającą w jednostce czasu przez jednostkową
powierzchnię, prostopadłą do kierunku przepływu). Wówczas na zasadzie ścisłej analogii
z zasadą zachowania ładunku [równanie (27.1)] można napisać „lokalną” zasadę zacho-
wania energii w polu:
— = -VS.
dt
(27.2)
Oczywiście, zasada ta nie jest w ogólnym przypadku prawdziwa; nie jest bowiem
prawdą, że energia samego tylko pola jest zachowana. Przypuśćmy, że znajdujemy się
w ciemnym pokoju i że w pewnej chwili przekręcamy kontakt lampy. Nagle pokój jesl
Pełen światła, a więc w polu jest energia, chociaż poprzednio wcale jej nie było. Rów-
nanie (27.2) nie jest pełną zasadą zachowania, ponieważ nie jest zachowana sama energia
P°la, a zacnowana jest jedynie całkowita energia światła — a więc ponadto jeszcze energia
obiektów materialnych. Energia pola będzie się zmieniać, jeżeli materia będzie wykonywać
Pewną pracę na polu albo też jeżeli pole wykona pewną pracę na materii.
Jeżeli jednak w interesującym nas obszarze przestrzennym występuje materia, to wiemy,
*]e ona ma energii. Każda cząstka ma energię moc2//!—v2/c2. Całkowita energia materii
Jest więc po prostu sumą wszystkich energii cząstek, a przepływ tej energii przez powierzch-
jest równy po prostu sumie energii niesionych przez każdą cząstkę, która przechodzi
^2ez Powierzchnię. Teraz chcemy mówić tylko o energii pola elektromagnetycznego.
s«ny zatem napisać równanie, które będzie stwierdzeniem, że całkowita energia pola
sku^111 °^szarze maleje <tlbo na skutek wypływu energii pola z tego obszaru, albo na
^go, że pole traci swoją energię na rzecz materii (lub zyskuje energię, co odpowiada
\ S-n da + (praca wykonana na materii wewnątrz K). (27.3)
118 27. ENERGIA I PĘD POŁĄ
ujemnej stracie). W obszarze V jest energia pola równa
\“dV-
V
a szybkość jej malenia jest równa pochodnej czasowej z tej całki wziętej ze znakiem minus.
Wypływ energii pola na zewnątrz z obszaru V jest równy całce ze składowej normalnej S
po powierzchni 27 otaczającej V,
J S b da.
Tak więc
udV =
s
Widzieliśmy poprzednio, że pole wykonuje w jednostce czasu pracę na każdej jednostce
objętości materii równą E-j. [Siłą działającą na cząstkę jest F = ę(E+vxB), a praca
wykonana w jednostce czasu jest równa F-v = ęE-v. Jeżeli w jednostce objętości jest N
cząstek, to praca wykonana w jednostce czasu i w jednostce objętości jest równa AfyE-v,
ale Nqy — j.] Zatem wartość iloczynu E-j musi być równa energii straconej w jednostce
czasu i w jednostce objętości przez pole. Równanie (27.3) przybiera teraz postać
— y fudV= fs-oda+ fE-jdK (27.4)
To jest nasza zasada zachowania energii w polu. Można przekształcić ją na równanie
różniczkowe typu równania (27.2), jeżeli zamienić drugi wyraz na całkę objętościową.
Można to zrobić łatwo posługując się twierdzeniem Gaussa. Całka powierzchniowa ze
składowej normalnej S jest równa całce z dywergencji wektora S po obszarze ograniczo-
nym powierzchnią £. Tak więc równanie (27.3) jest równoważne równaniu
V-SdV+f E-jdV,
V ’ V V
gdzie pochodną czasową pierwszego wyrazu wprowadziliśmy pod znak całki. Ponieważ
równanie to jest prawdziwe dla dowolnego obszaru V, znaki całek można usunąć i rów-
nanie energii dla pola elektromagnetycznego przybierze postać
= V-S+E-j. (27.5)
dt
Równanie to nie daje nam jednak żadnych korzyści, jeżeli nie wiemy, czym są wiel-
kości u i S. Być może, powinniśmy po prostu powiedzieć, jak się one wyrażają poprzez
pola E i B, gdyż w rzeczywistości zależy nam tylko na ostatecznym wyniku. WolW
jednak pokazać, jakim rozumowaniem posłużył się Poynting w r. 1884 dla otrzymam8
wzorów na m i S i zobaczyć skąd się one biorą. (Znajomość tego wyprowadzenia nie będzie
jednak potrzebna do zrozumienia dalszej części tych wykładów.)
7.3. gęstość energii i strumień energii
119
27-3. Gęstość energii i strumień energii
w polu elektromagnetycznym
Pomysł sprowadza się do założenia, że istnieje gęstość energii pola u i strumień energii S,
które zależą tylko od pól E i B. (Wiemy na przykład, że w elektrostatyce gęstość energii
można zapisać jako |eoE-E). Oczywiście, u i S mogłyby zależeć od potencjałów lub czegoś
innego, ale zobaczmy, do czego potrafimy dojść. Można spróbować przepisać wiel-
kość E-j w taki sposób, aby się stała sumą dwóch wyrazów: jednego, który jest pochodną
czasową pewnej wielkości, i drugiego, który jest dywergencją, pewnej innej wielkości. Tą
pierwszą wielkością będzie u, a drugą S (z odpowiednimi znakami). Obie wielkości należy
wyrazić tylko poprzez pola; to znaczy, że chcemy zapisać naszą równość jako
Su _
E-j = - — -VS. . (27.6)
Lewą stronę tej równości należy wyrazić tylko poprzez pola. Jak to można zrobić?
Oczywiście, korzystając z równań Maxwella. Z równania Maxwella dla rotacji pola B
, SE
j = eoc2V XB—e0—•
dt
Podstawiając tę wartość do równości (27.6) otrzymujemy wyrażenie, w którym występują
tylko wielkości E i B:
SE
Ej = £oc2E-(V xB)—e0E = —-. (27.7)
ot
Częściowo już skończyliśmy. Ostatni wyraz jest pochodną czasową — jest to (S/St) x
X(|e0E-E). A więc |eoE-E stanowi przynajmniej jedną część u. Teraz pozostało nam
tylko przekształcić drugi wyraz w dywergencję pewnego pola wektorowego.
Na pierwszy rzut oka moglibyśmy sądzić, że pierwszy wyraz po prawej stronie rów-
nania (27.7) jest z dokładnością do współczynnika e0c2 równy
(VxB)-E. (27.8)
A jak wiemy z algebry wektorów, iloczyn (axb)-c można zastąpić iloczynem a-(bxc),
tak że nasz wyraz powinien także być równy
V-(BxE), (27.9)
czyli dywergencji „pewnej wielkości”, tak jak chcielibyśmy. Tylko że to jest źle! Ostrze-
galiśmy poprzednio, że operator V jest „podobny” do wektora, ale nie „dokładnie”
2 nim identyczny. Powodem tej „różnicy” jest dodatkowa konwencja rachunku różnicz-
kowego: kiedy operator różniczkowy stoi przed iloczynem, to działa on na wszystko,
c° się znajduje po jego prawej stronie. W równaniach (27.7) operator V działa tylko na
P°le B, a nie na pole E. Ale w postaci (27.9) ze zwykłej umowy wynikałoby, że V działa
Zarówno na B, jak i na E. A to nie jest to samo. Istotnie, gdybyśmy wypisali składowe
120
27. ENERGIA I PĘD POŁĄ
wyrażenia V-(BxE), stwierdzilibyśmy, że jest ono równe E-(VxB) plus kilka dodatko-
wych wyrazów. Sytuacja jest podobna do tego, co się dzieje, gdy obliczamy w rachunku
różniczkowym pochodną z iloczynu. Tak na przykład
d df dg
~r (fg) = ~rg+f-r-
dx dx dx
Zamiast wypisywać wszystkie składowe wyrażenia V-(BxE) wolimy raczej zastosować
pewien fortel, który jest bardzo użyteczny w problemach tego typu. Fortel ten pozwala
na używanie wszystkich reguł algebry wektorowej wobec wyrażeń zawierających operator V,
bez popadania w kłopoty. Polega on na odrzuceniu — przynajmniej na chwilę — reguły
zapisu rachunku różniczkowego, mówiącej, na co działa operator różniczkowy. Otóż
kolejność wyrazów jest zwykle wykorzystywana dla dwóch odrębnych celów. Jeden z nich
dotyczy rachunku różniczkowego: f(djdx)g to nie jest to samo co g(d!dx')f-, a drugi do-
tyczy wektorów: axb jest różne od bxa. Można, jeżeli się chce, zrezygnować chwilowo
z reguły rachunku różniczkowego. Zamiast mówić, że pochodna działa na wszystkie
wyrażenia występujące po jej prawej stronie, utwórzmy nową regułę, w której nie ważna
jest kolejność, w jakiej wypisujemy wyrazy. Wówczas będziemy mogli żonglować wyraza-
mi, o nic się nie martwiąc.
Oto nasza umowa: przy pomocy wskaźnika będziemy zaznaczać, na co działa opera-
tor; kolejność wyrazów nie ma żadnego znaczenia. Przyjmijmy na przykład, że operator
D zastępuje dfdx. Wówczas Df oznacza, że się bierze tylko pochodną z wielkości f. A więc
df
Dff=—.
dx
A jeżeli mamy Dffg, to
.n - z df\ *
Ale zauważmy teraz, że zgodnie z naszą nową regułą, fDjg aa&cza. to samo! Tę samą
rzecz można zapisać w dowolny sposób:
Dffg = gDff = fDfg =fgDf.
Widać, że Df może występować nawet jako ostatni czynnik „iloczynu”. (Zdumiewające,
że taki wygodny sposób zapisu nie bywa nigdy wykładany w książkach matematycznych
czy też fizycznych.)
Można by zadać pytanie: Co będzie, gdy zechcę napisać pochodną iloczynu /g? Chcę
mieć pochodną obu czynników. To proste — postępujemy właśnie tak, jak mówimy;
piszemy £y(/g)+Z)g(/g). A to jest równe g(S//5x)4-/(Sg/5x), co w naszym starym za-
pisie oznaczaliśmy przez d(fg)ldx.
Zobaczymy, że teraz możemy bardzo łatwo uzyskać nowe wyrażenie dla V-(BxE).
Zaczynamy od przejścia do nowego zapisu; piszemy:
V-(BxE) = Vb-(BxE)+V£-(BxE). (27.10)
27-3. GĘSTOŚĆ ENERGII I STRUMIEŃ ENERGII
121
Od tej chwili nie musimy już zachowywać kolejności wyrazów. Zawsze wiemy, że
działa tylko na E, a działa tylko na B; w tej sytuacji można posługiwać się opera-
torem V jak gdyby był on zwykłym wektorem. (Oczywiście, kiedy już skończymy, będzie-
my musieli powrócić do „normalnego” zapisu, którego każdy zwykle używa.) Tak więc
możemy teraz dokonywać różnych operacji i zmieniać na przykład kolejność czynników
w iloczynach skalarnych i wektorowych lub dokonywać innych przestawień zgodnych
z algebrą wektorów. Tak na przykład, środkowy wyraz równania (27.10) można prze-
pisać jako E-VbxB. (Pamiętamy, że a bxc = b cxa.) A ostatni wyraz jest taki sam,
jak iloczyn B'ExV£. Wygląda to dość dziwacznie, ale to nic nie szkodzi. Jeżeli spróbu-
jemy teraz powrócić do normalnego zapisu, to musimy dokonać takich przestawień, aby
operator V działał tylko na swoją „własną” zmienną. Pierwszy wyraz ma już taką po-
stać, tak że wskaźnik w nim można odrzucić. Drugi wyraz wymaga takiego przekształ-
cenia, aby operator V występował przed wektorem E. Można to zrobić przez odwrócenie
kolejności czynników w iloczynie wektorowym i przez zmianę znaku:
B-(ExV£) = -B-(V£xE).
Teraz mamy już tradycyjną kolejność i możemy powrócić do zwykłego zapisu. Równa-
nie (27.10) jest równoważne równaniu
V-(BxE) = E-(VxB)-B-(VxE). (27.11)
(W tym szczególnym przypadku szybszą metodą byłoby rozpisanie na składowe, ale
warto było poświęcić trochę czasu na pokazanie tego matematycznego fortelu. Prawdo-
podobnie nigdzie indziej go nie spotkacie, a jest on bardzo pożyteczny do wyzwolenia
algebry wektorowej spod reguł dotyczących kolejności wyrazów przy brańiu pochodnych.)
Powracamy teraz do naszych rozważań o zasadzie zachowania energii i wykorzysta-
my nasz nowy wynik, równanie (27.11), do przekształcenia wyrazu VxB w równaniu
(27.7). To równanie energii przybiera postać
E-j = eoc2V-(BxE)+e0c2B-(VxE)— Qe0E-E). ' (27.12)
ot
Widać teraz, że już prawie skończyliśmy. Ostatni z występujących tu wyrazów jest piękną
pochodną względem t i użyjemy go do wyznaczenia u; występuje tu też wyraz, który jest
przepiękną dywergencją, a więc pomoże nam określić S. Na nieszczęście pozostaje jeszcze
środkowy wyraz, który nie jest ani dywergencją, ani pochodną względem t. Tak więc
°d osiągnięcia celu dzieli nas jeszcze jeden krok. Zastanówmy się trochę i przyjrzyjmy
S1? z powrotem różniczkowym równaniom Maxwella, a odkryjemy, że VxE jest, na
szczęście, równe — dB/dt, co oznacza, że dodatkowy człon można przekształcić w coś,
co jest czystą pochodną czasową:
B-(VxE) = B-
Teraz mamy już dokładnie to, czego chcieliśmy.
122
27. ENERGIA I PĘD POĘą
Nasze równanie energii wygląda następująco:
d I e0 c2 e0 \
Ej = V-(eoc2BxE)--M— BB+-^EE , (27.13)
ot \ 2 2 f '
co będzie identyczne z równaniem (27.6), jeżeli tylko wprowadzimy definicje
“ "Z'' « = yE’E+~B-B (27.14)
oraz '
- ' S = e0c2ExB. .t / * ’ , (27.15)
(Przestawienie kolejności czynników w iloczynie wektorowym powoduje potrzebną zmia-
nę znaku.)
Nasze wysiłki zakończyły się sukcesem. Otrzymaliśmy wyrażenie na gęstość energii,
będące sumą „elektrycznej” gęstości energii i „magnetycznej” gęstości energii, których
postacie są takie same jak te, które znaleźliśmy w statyce, kiedy to wyrażaliśmy energię
poprzez pola. Znaleźliśmy także wzór na wektor strumienia energii pola elektromagne-
tycznego. Ten nowy wektor, S = eoc2ExB nosi imię swego odkrywcy; nazywamy go
„wektorem Poyntinga”. Wyraża on szybkość, z jaką energia pola przemieszcza się w prze-
strzeni. Energia, która przepływa w ciągu jednej sekundy przez małą powierzchnię da
jest równa S-n<źa, gdzie n jest wektorem jednostkowym, prostopadłym do da. (Teraz,
gdy już mamy nasze wzory na u i S, Czytelnik może zapomnieć, jeśli sobie tego życzy,
w jaki sposób zostały uzyskane.)
27-4. Niejednoznaczność w energii pola
Zanim się zajmiemy pewnymi zastosowaniami wzorów Poyntinga (równania (27.14)
i (27.15)], chcielibyśmy powiedzieć, że w rzeczywistości wcale tych wzorów nie „udowod-
niliśmy”. Znaleźliśmy tylko możliwe „u" i możliwe „S”. Skąd wiemy, że gdy jeszcze tro-
chę pożonglujemy wyrazami, to nie potrafimy znaleźć innego wzoru na „w” i innego
wzoru na „S”. Te nowe S i nowe u mogłyby być różne od starych, ale spełniałyby w dal-
szym ciągu równanie (27.6). To jest możliwe. Można to zrobić, ale znalezione nowe wy-
rażenia zawsze zawierać będą różne pochodne pola (i to zawsze w wyrazach drugiego rzędu,
jak na przykład drugą pochodną lub kwadrat pierwszej pochodnej). W istocie istnieje
nieskończona liczba różnych możliwości dla u i S, a jak dotąd, nikt nie pomyślał o do-
świadczalnej metodzie stwierdzenia, która z nich jest słuszna! Domyślono się, że najpros-
tsza z tych możliwości jest prawdopodobnie tą poprawną, ale należy powiedzieć, że nie
wiemy na pewno, jaka jest rzeczywista lokalizacja w przestrzeni energii pola elektromagne-
tycznego. A więc i my wybierzemy najprostsze wyjście i będziemy mówić, że energia pola
jest dana równaniem (27.14). Wówczas wektor strumienia energii S musi być określony
równaniem (27.15).
Ciekawe — wydaje się, że nie ma jednoznacznego sposobu na usunięcie nieokreśloności
w lokalizacji energii pola. Czasami się twierdzi, że zagadnienie to można rozwiązać p°*
sługując się następującym rozumowaniem na gruncie teorii grawitacji. W teorii grawita-
27-4. niejednoznaczość w energii pola
123
cji każda energia jest źródłem przyciągania grawitacyjnego. Dlatego też, jeżeli mamy wie-
dzieć, w jakim kierunku działa siła ciężkości, gęstość energii elektryczności musi być
odpowiednio zlokalizowana. Jednak — jak dotąd — nikt nie wykonał tak precyzyjnego
doświadczenia, które pozwoliłoby określić dokładną lokalizację efektu grawitacyjnego
pól elektromagnetycznych. To, że pole elektromagnetyczne może być samo źródłem siły
grawitacyjnej, jest postulatem, bez którego trudno sobie poradzić. Istotnie, zaobserwo-
wano, że światło ulega odchyleniu przechodząc w pobliżu Słońca; można by powiedzieć,
2e Słońce przyciąga do siebie światło. Czyż nie wypada uznać, że światło przyciąga z rów-
ną siłą Słońce? W każdym razie wszyscy uznają zawsze te proste wyrażenia, które zna-
leźliśmy na lokalizację energii elektromagnetycznej i jej strumienia. A chociaż czasami
uzyskane przy ich pomocy wyniki wydają się dziwne, to nikt jeszcze nie znalazł, aby coś
z tymi wyrażeniami było nie w porządku, tzn. nie znaleziono sprzeczności z doświadcze-
niem. Tak więc będziemy naśladować wszystkich, a poza tym wierzymy, że jest to prawdo-
podobnie jak najbardziej słuszne.
Powinniśmy uczynić jeszcze jedną uwagę dotyczącą wzoru na energię. Przede wszyst-
kim, energia przypadająca na jednostkę objętości pola ma bardzo prostą postać: jest
to energia elektrostatyczna plus energia magnetyczna, jeżeli energię elektrostatyczną wy-
razi się przez E2, a energię magnetyczną przez B2. Podczas rozwiązywania zagadnień elek-
trostatycznych znaleźliśmy dwa wyrażenia, które mogły określać energię. Oprócz tego zna-
leźliśmy wtedy też kilka innych wzorów na energię w polu elektrostatycznym, takich
jak który w przypadku elektrostatycznym był równy całce z E-E. Jednakże dla pola
elektrodynamicznego ta równość upadła i nie było jakiegoś oczywistego powodu, dzięki
któremu można by było wybrać jedno z tych wyrażeń jako prawdziwe. Podobnie znaleź-
liśmy wzór na energię magnetyczną. Jest on słuszny ogólnie. Jedynym poprawnym wzo-
rem na gęstość energii pól dynamicznych jest równanie (27.14).
27-5. Przykłady strumienia energii
Nasz wzór na wektor strumienia energii S — to całkiem coś nowego. Chcemy teraz
zobaczyć, co nam ten wzór daje w kilku szczególnych przypadkach, a także zobaczyć,
czy nie sprowadza się on do czegoś, co już znamy.’ Ja-
ko pierwszy przykład rozpatrzymy światło. W fali świet-
lej wektory E i U są prostopadłe do siebie, a także do
kierunku rozchodzenia się fali (patrz rys. 27.2). W
fali elektromagnetycznej wartość bezwzględna we-
ktora B jest równa 1/c razy wartość bezwzględna wekto-
ra E, a ponieważ wektory te tworzą kąt prosty
E2
ExB =—.
c
Stąd dla światła przepływ energii przez jednostkę powie-
rzchni w ciągu sekundy jest równy
S = e0cE2. (27.16)
27.2. Wektory E, B i S dla fali
świetlnej x
E
v
kierunek
S
124
27. ENERGIA I PĘD POLA.
Dla fali świetlnej, w przypadku której E = Eo cos co (t—x/c), średnia szybkość przeply.
wu energii przez jednostkę powierzchni, <S)śr (nazywana „natężeniem” światła) jest
równa wartości średniej kwadratu pola elektrycznego razy eoc:
natężenie = <S>śr = £0c<£2>śr. (27.17)
*.
- Wierzcie w to lub nie wierzcie, ale ten sam wzór wyprowadziliśmy już w § 31 - 3 tomu I
(cz. 2), kiedy to uczyliśmy się o świetle. Można uwierzyć, że wynik ten jest poprawny,
ponieważ sprawdza się on jeszcze z czymś innym. Kiedy mamy wiązkę światła, to w prze-
strzeni jest jakaś gęstość energii dana równaniem (27.14). Podstawiając cB = E dla fali
świetlnej otrzymujemy
E2
Ale pole E zmienia się w przestrzeni, tak że średnia energia jest równa
<u>śr = £0<E2>śr. (27.18)
No i wszystko się zgadza; jest to takie samo równanie, jak równanie (27.17).
Weźmy teraz inny przykład. Jest on chyba dość ciekawy. Przypatrzmy się mianowicie
przepływowi energii w kondensatorze, który powoli ładujemy. (Nie chcemy tak wielkich
częstości, aby kondensator zaczął się zachowywać jak wnęka rezonansowa, ale nie chce-
my też prądu stałego.) Przypuśćmy, że użyjemy zwykłego, kolistego kondensatora pła-
skiego, pokazanego na rys. 27.3. Wewnątrz kondensatora jest prawie jednorodne pole
elektryczne, które się zmienia w czasie. W każdej chwili całkowita energia elektromagne-
tyczna wewnątrz kondensatora jest równa iloczynowi u
i objętości kondensatora. Jeżeli promień płytek jest
równy a, a ich odstęp wynosi h, to całkowitą energią po-
między płytkami będzie
U =
(27.19)
27.3. W pobliżu ładującego się
kondensatora wektor Poyntinga
układa się radialnie wokół osi
kondensatora
(27.20)
Energia ta zmienia się wraz ze zmianami pola E. Kiedy
kondensator się ładuje, to do obszaru pomiędzy płytkami
dopływa energia z szybkością
dU
----= e0 hEE.
dt
Musi więc zachodzić przepływ energii — skądś do obsza-
ru wewnątrz kondensatora. Moglibyśmy oczywiści®
sądzić, że ten przepływ „przybywa” przewodami, a’e
tak nie jest! Nie może on bowiem z tego kierunku
wejść do przestrzeni pomiędzy płytkami, ponieważ pole
jest prostopadłe do płytek; a ExB musi być do nich
równolegle.
27-5. PRZYKŁADY STRUMIENIA ENERGII
125
Pamiętamy oczywiście, że gdy kondensator się ładuje, wokół jego osi powstaje pole
magnetyczne o symetrii walcowej. Opisywaliśmy to w rozdz. 23. Korzystając z ostatnie-
go równania Maxwella znaleźliśmy, że pole magnetyczne przy krawędzi kondensatora
jest dane wzorem
2nac2B = £• na2,
czyli ' 1
Jego kierunek jest pokazany na rys. 27.3. Mamy więc strumień energii, proporcjonalny
do E xB. Strumień ten dopływa w każdym punkcie wokół krawędzi, tak jak to pokazano
na rysunku. Energia w rzeczywistości nie dopływa wzdłuż drutów, ale z przestrzeni ota-
czającej kondensator.
Sprawdźmy, czy całkowity przepływ energii poprzez całą powierzchnię pomiędzy
krawędziami płytek równa się (czy też nie) szybkości zmian energii wewnątrz. Lepiej
by było, gdyby się równał. Właściwie całą tę pracę wykonaliśmy już przy wyprowadza-
niu równania (27.15), no ale zobaczmy to jeszcze raz. Pole powierzchni pomiędzy kra-
wędziami płytek jest równe 2nah, a wielkość S = eqc2ExB jest równa
„ / a •
eoc2E —-E
\2c2
a więc całkowity strumień energii wynosi
na2he0EE.
To się w pełni zgadza z równaniem (27.20).
Przedziwne! Okazuje się, że gdy ładujemy kon-
densator, energia nie dopływa wzdłuż drutów;
dopływa ona poprzez „pobocznicę” odstępu
pomiędzy płytkami. Tak, to właśnie mówi
nam ta teoria!
Jak to jest możliwe? Nie jest to łatwe py-
tanie, ale spróbujmy na nie odpowiedzieć w ta-
ki oto sposób. Przypuśćmy, że nad, pod i dale-
ko poza kondensatorem są jakieś ładunki. Je-
żeli te ładunki są daleko od kondensatora, to
otacza go słabe, ale niezmiernie „rozpostarte”
Pole elektryczne (patrz rys. 27.4). Następnie,
Ze zbliżaniem się ładunków do siebie, pole
w pobliżu kondensatora zwiększa się. Tak więc
energia pola, która jest początkowo daleko
P°za kondensatorem, przesuwa się ku niemu
1 w końcu dociera pomiędzy płytki.
Teraz z kolei zapytajmy, co się dzieje w ka-
wałku drutu oporowego, kiedy przepływa
27.4. Pola istniejące na zewnątrz kondensa-
tora, gdy ten jest ładowany przez sprowa-
dzenie dwóch ładunków z dużej odległości
126
27. ENERGIA I PĘD POLA
przez niego prąd. Ponieważ drut ma opór,
musi w jego wnętrzu istnieć pole elektry-
czne, powodujące przepływ prądu. Po-
nieważ wzdłuż drutu następuje spadek
potencjału, to także tuż na zewnątrz dru-
tu musi istnieć pole elektryczne, równo-
ległe do jego powierzchni. (patrz rys.
27.5.) Dodatkowo, na skutek przepływu
prądu, mamy jeszcze pole magnetyczne,
które okrąża drut. Wektory E i B two-
rzą kąt prosty; dlatego też wektor Poyn-
tinga jest skierowany radialnie do wnę-
trza, tak jak to pokazano na rysunku.
Do drutu dopływa energia z całego jego
otoczenia. Jest ona oczywiście równa
energii traconej w drucie w postaci ciep-
ła. Tak więc nasza „zwariowana” teoria
powiada, że elektrony uzyskują swoją
energię, potrzebną do wytworzenia ciep-
ła, kosztem energii dopływającej do dru-
tu z pól na zewnątrz drutu. Intuicyjnie
wydawałoby się, że elektrony uzyskują
swoją energię będąc „popychane” wzdłuż
drutu, tak że energia powinna dopływać
z dołu (lub z góry) wzdłuż drutu. Ale
teoria mówi, że elektrony są w rzeczy-
wistości popychane przez pole elektryczne,
pochodzące od ładunków, które się znaj-
dują gdzieś bardzo daleko, i że elektrony
uzyskują swoją energię potrzebną do wy-
27.5. Wektor Poyntinga S w pobliżu drutu,
przez który przepływa prąd
27.6. Ładunek i magnes wytwarzają wektor
Poyntinga, który krąży po zamkniętych pętlach
tworzenia ciepła właśnie od tych pól. Ta energia w jakiś sposób przepływa od odległych ła-
dunków do rozległego obszaru przestrzeni, a następnie dopływa do wnętrza, do drutu.
W końcu, aby się przekonać, że ta teoria jest absolutnie zbzikowana, weźmy jeszcze
jeden przykład, w którym rozpatrzymy ładunek elektryczny i magnes, znajdujące się blisko
siebie w spoczynku — zupełnie nieruchome. Przypuśćmy, że będziemy rozważać sytuację,
w której punktowy ładunek spoczywa w pobliżu środka magnesu sztabkowego, tak jak
to pokazano na rys. 27.6. Wszystko się znajduje w spoczynku, a więc i energia w zależ-
ności od czasu się nie zmienia. Również i pola E i B są zupełnie statyczne. Ale wektor
Poyntinga mówi, że istnieje pewien strumień energii, ponieważ iloczyn E xB jest różny od
zera. Jeżeli się przyjrzymy wektorowi strumienia energii, to przekonamy się, że krąży
on po prostu bez przerwy dookoła. Nigdzie nie ma żadnej zmiany energii — wszystko,
co dopływa do wolnego obszaru przestrzennego, wypływa zaraz z niego na zewnątrz-
Przypomina to przypadek nieściśliwej wody, opływającej coś dookoła. A zatem, w tej
27-5. PRZYKŁADY STRUMIENIA ENERGII
127
tak zwanej sytuacji statycznej zachodzi krążenie energii. Jakie to wszystko staje się absur-
dalne!
Być może, nie będzie to wszystko takie zadziwiające, jeżeli sobie przypomnimy, że to,
co nazywamy magnesem „statycznym”, jest w rzeczywistości krążącym prądem stałym.
Elektrony wewnątrz trwałego magnesu obracają się bezustannie wokół swych osi. Może
więc to krążenie energii na zewnątrz nie jest mimo wszystko takie dziwne.
Bez wątpienia zaczynamy odnosić wrażenie, że jeżeli chodzi o lokalizację energii
w polu elektromagnetycznym, teoria Poyntinga przeciwstawia się, przynajmniej częścio-
wo, naszej intuicji. Można by więc przypuszczać, że należałoby zrewidować naszą intuicję
i nauczyć się jeszcze wielu rzeczy. Ale nie wydaje się to rzeczywiście konieczne. Nie należy
uważać tego za wielki grzech, jeżeli od czasu do czasu zapomnimy, że energia w drucie
dopływa do niego z zewnątrz, a nie wzdłuż drutu. Wydaje się, że rzadko tylko w rozwa-
żaniach o zachowaniu energii będzie miało znaczenie dokładne określenie, jaką drogę
obiera energia. Krążenie energii wokół magnesu i ładunku wydaje się, w większości wy-
padków, zupełnie nieistotne. Nie jest to jakiś zasadniczy szczegół, ale widać zeń jasno,
że nasza zwykła intuicja czasami może nas sprowadzić na manowce.
27-6. Pęd pola
Chcielibyśmy z kolei pomówić o pędzie w polu elektromagnetycznym. Podobnie jak
pole ma energię, tak będzie miało pewien pęd na jednostkę objętości. Tę gęstość pędu
oznaczamy przez g. Oczywiście, pęd ma różne możliwe kierunki, tak że g musi być wek-
torem. Rozważmy oddzielnie każdą z jego składowych; jako pierwszą bierzemy skła-
dową x-ową. Ponieważ każda składowa pędu jest zachowana, powinniśmy móc napisać
prawo, które wygląda mniej więcej tak:
_ ^ / pęd \ ____ ^Sx , /wypływ!
dt (materii/x — + ( pędu /*'
Po lewej stronie tego równania mamy coś bardzo prostego: Szybkość zmian pędu ma-
terii jest po prostu równa działającej na nią sile. Siłą działającą na cząstkę jest F =
= ?(E+v xB); w przypadku układu ładunków siła na jednostkę objętości jest równa
feE-f-j xB). Jednakże wyraz „wypływ pędu” jest dziwny. Nie może być on dywergencją
wektora, ponieważ nie jest skalarem, jest to raczej _v-owa składowa jakiegoś wektora.
Powinno to być, w każdym razie, coś w tym rodzaju:
da db dc
——F ——F —,
dx dy dz
Ponieważ .r-owa składowa pędu mogła przypływać z każdego z trzech kierunków. W każ-
dym przypadku, czymkolwiek są a, b i c, wypisana tu suma powinna być równa wypły-
wowi składowej x-owej pędu.
Należałoby teraz wyrazić gE+jxB tylko poprzez pola E i B — eliminując q i j za
128
27. ENERGIA I PĘD POLą
pomocą równań Maxwella — a następnie tak poprzestawiać wyrazy i dokonać takich
podstawień, aby oE+jxB przybrało postać
. k ,
dg 8a db dc
-----------1-----1----.
i dt dx dy dz
Następnie, porównując poszczególne wyrazy, otrzymalibyśmy wyrażenia na gx, a, b i c.
Wymagałoby to dużo pracy i nie będziemy tego robić. Zamiast tego znajdziemy tylko
wyrażenie na gęstość pędu g — i to inną metodą.
Istnieje w mechanice takie oto ważne twierdzenie: zawsze gdy mamy przepływ energii
w dowolnej postaci (czy to energii pola, czy też energii innego typu), energia przepływa-
jąca przez jednostkę powierzchni w jednostce czasu jest równa, po pomnożeniu przez
1/c2, pędowi na jednostkę objętości w przestrzeni. Dla szczególnego przypadku elektro-
dynamiki to twierdzenie głosi, że g jest równe 1/c2 razy wektor Poyntinga:
•g = -4s. (27.21)
, . , c
Tak więc wektor Poyntinga nie tylko określa przepływ energii, ale jeżeli podzielić go przez
c2, określa także gęstość pędu. Taki sam wynik otrzymalibyśmy posługując się proce-
durą wskazaną powyżej, ale bardziej interesujące jest zwrócenie uwagi na ten ogólniej-
szy wynik. Podamy teraz kilka ciekawych przykładów i rozważań ilustrujących to ogólne
twierdzenie.
Przykład pierwszy: Przypuśćmy, że mamy wiele cząstek w pudle — powiedzmy N
cząstek na metr sześcienny — poruszających się z pewną prędkością v. Wyobraźmy sobie
ponadto płaszczyznę prostopadłą do v. Strumień energii przez jednostkę powierzchni
tej płaszczyzny na sekundę jest równy Nv, czyli liczbie cząstek przepływających przez
powierzchnię w ciągu sekundy, pomnożonej przez energię unoszoną przez każdą z czą-
stek. Energia każdej cząstki jest równa moc2/^l—v2/c2. Tak więc strumień energii w ciągu
sekundy równa się
m0c2
.................................
Ale pęd każdej cząstki jest równy m0v/l/l—v2/c2, tak źc gętfofcią pędu jest
. N mov
)/i—v2/c2
co jest akurat równe 1/c2 razy strumień energii — zgodnie z twierdzeniem. Tak więc twier-
dzenie to jest prawdziwe dla zbioru cząstek.
Jest ono także prawdziwe dla światła. Kiedy uczyliśmy się o świetle w tomie I widzie-
liśmy, że pochłanianiu energii z wiązki świetlnej towarzyszy przekazywanie pewneg0
pędu do substancji pochłaniającej. Wykazaliśmy nawet (w rozdz. 36 tomu I, cz. 2), &
pęd ten jest równy 1/c razy pochłonięta energia [równanie (36.24) tomu I], Jeżeli Uq będz,e
energią przybywającą do jednostki powierzchni w ciągu sekundy, to pęd przybywają#
27-6. PĘD POLA
129
27.7. Energia U przenosi, w ruchu odby-
wającym się z prędkością c, pęd p = U/C
tej samej powierzchni w ciągu jednej sekun-
dy będzie równy U0/c. Ale strumień przemie-
szcza się z prędkością c, tak że jego gęstość
na powierzchni pochłaniania musi być równa
U0lc2. A więc i tym razem twierdzenie to jest
prawdziwe.
Opiszemy teraz doświadczenie myślowe, któ-
rego autorem był Einstein, a które jeszcze raz
ilustruje tę samą sprawę. Przypuśćmy, że mamy
wagon na kołach (z założenia bez tarcia) o pe-
wnej dużej masie M. Na jednym końcu wagonu
znajduje się urządzenie, które będzie wyrzucać
jakieś cząstki lub wysyłać światło (lub cokol-
wiek — nie robi to żadnej różnicy, co to jest),
które są następnie zatrzymane na przeciwległej
ścianie wagonu. Początkowo w jednym końcu
wagonu znajdowała się pewna energia — po-
wiedzmy energia U, jak zaznaczono to na
rys. 27.la. — która później znajdowała się w prze-
ciwległym końcu, tak jak to pokazano na
rys. 27.7c. Energia U przebyła więc odległość L,
równą długości wagonu. Z tą energią U zwią-
zana jest masa U/c2, a więc, jeżeli wagon po-
zostałby nieruchomy, to jego środek ciężkości
przesunąłby się. Einsteinowi nie podobał się
wniosek, że środek ciężkości jakiegoś obiektu
może być przesunięty jedynie na skutek jakichś
wewnętrznych „rozróbek” i założył, że środka
ciężkości nie można przesunąć w wyniku żadnych
działań wewnątrz obiektu. Ale w takim razie,
jeżeli przesunięto energię U z jednego końca na drugi, to cały wagon musiał ulec od-
rzutowi na pewną odległość x, tak jak pokazano na części c) rysunku. Istotnie, widać,
że całkowita masa wagonu pomnożona przez x musi być równa masie przesuniętej ener-
gii U/c2 razy £ (zakładając, że U/c2 jest dużo mniejsze od M):
U
Mx = —-L. (27.22)
c2
Rozpatrzmy teraz szczególny przypadek, kiedy energia jest unoszona przez błysk
s"iatJa. (Rozumowanie to stosuje się równie dobrze dla cząstek, ale poprowadzimy je
z§odnie z Einsteinem, który się interesował zagadnieniem światła.) Co powoduje ruch
Wagonu? Einstein rozumował następująco: Kiedy światło jest emitowane, musi nastąpić
°drzut, pewien nieznany odrzut z pędem p. To właśnie ten odrzut powoduje ruch wagonu
9
Wykłady z fizyki
130
27. ENERGIA I PĘD POLA
wstecz. Prędkość odrzutu wagonu będzie ilorazem pędu i masy wagonu:
Wagon porusza się z tą prędkością do momentu, kiedy energia świetlna U dotrze do prze-
ciwległego końca. Następnie w momencie uderzenia o ściankę energia oddaje z powrotem
swój pęd i zatrzymuje wagon. Jeżeli odległość x jest mała, to czas, w którym wagon się
porusza, jest prawie równy L/c; mamy więc
L p L
X = Vt — V-- =------.
c Mc
Wstawiając tak otrzymane x do równania (27.22) otrzymujemy
U
p = —.
c
Znowu mamy związek między energią i pędem dla światła. Dzieląc go przez c, aby dostać
gęstość pędu, g — p[c, otrzymujemy raz jeszcze, źe
U
g = (27.23)
c
Można by się z powodzeniem zapytać: A czy to twierdzenie o środku ciężkości jest
rzeczywiście takie ważne? A może jest ono fałszywe? Może, ale wówczas załamałaby się
również zasada zachowania momentu pędu. Przypuśćmy, że nasz wagon porusza się po
torze z pewną prędkością v i że „wystrzelamy” pewną energię świetlną z sufitu wagonu
w kierunku jego podłogi — pomiędzy punktem A a punktem B na rys. 27.8. Chcemy teraz
rozpatrzyć moment pędu układu względem punktu P. Przed opuszczeniem przez energię
punktu A ma ona masę m = U2/c i prędkość v, a więc jej moment pędu wynosi mvrA
W momencie, gdy energia przybywa do punktu B, ma ona tę samą masę i jeżeli pęd całego
wagonu nie ma ulec zmianie, energia musi
mieć w dalszym ciągu tę samą prędkość v. Jej
moment pędu względem punktu P jest więc rów-
ny mvrB. Moment pędu ulegnie zmianie, je'
żeli wagonowi w momencie, kiedy światło
zostało wyemitowane, nie został przekazany
odpowiedni pęd odrzutu — to znaczy, jeżeli
światło nie przenosi pędu U/c. Okazuje się, że za-
sada zachowania momentu pędu i twierdzenie
o środku ciężkości są ze sobą w teorii wzgl?"
dności ściśle związane. Tak więc, gdyby twiet'
dzenie o środku ciężkości było fałszywe, zała'
małaby się i zasada zachowania moment11
pędu. W każdym razie to twierdzenie równik
27.8. Energia U musi przenosić z sobą
pęd U/c, jeżeli ma być zachowany moment
pędu względem punktu P
27-6. PĘD POLA
131
w przypadku elektrodynamiki okazuje się ogólnie słusznym prawem i możemy posłu-
giwać się nim przy określaniu pędu pola.
Wspomnimy jeszcze dwa inne przykłady, w których ważną rolę spełnia pojęcie pędu
pola elektromagnetycznego. W § 26-2 wykazaliśmy załamanie się prawa akcji i reakcji
w przypadku dwóch naładowanych cząstek, które się poruszały po trajektoriach orto-
gonalnych. Siły działające na obie te cząstki nie równoważą się, a więc akcja nie jest równa
reakcji. Wynika stąd, że wypadkowy pęd cząstek materialnych musi się zmieniać — nie
jest więc on zachowany. Ale w takiej sytuacji pęd pola także się zmienia. Gdybyśmy bo-
wiem obliczyli pęd określony wektorem Poyntinga, nie byłby on stały. Jednakże zmiana
pędów cząstek zostaje „wyrównana” przez tę zmianę pędu pola, tak że całkowity pęd
cząstek plus pęd pola jest zachowany.
A wreszcie jeszcze jeden przykład: przypadek magnesu i ładunku, pokazany na rys.
27.6. Nie byliśmy zbyt zadowoleni, kiedy się okazało, że energia przepływa dookoła po
okręgach, ale teraz ponieważ wiemy, że strumień energii i pęd są proporcjonalne, wiemy
także, że istnieje i pęd krążący w przestrzeni. Ale taki krążący pęd oznacza, że występuje
tu pewien moment pędu — a więc w polu istnieje moment pędu. Czy pamiętacie paradoks,
który opisaliśmy w § 17-4 (t. II, cz. 1), dotyczący solenoidu i tarczy z umieszczonymi
na niej ładunkami. Wydawało się, że po wyłączeniu prądu cała tarcza powinna zacząć
się obracać. Zagadka brzmiała: Skąd się wziął moment pędu? Otóż stąd, że jeżeli mamy
pole magnetyczne i jakieś ładunki, to w polu jest pewien moment pędu. Musiał on zostać
tam wprowadzony, kiedy pole się tworzyło. Po wyłączeniu pola ten moment zostaje zwró-
cony. A więc tarcza, o której mowa w tym paradoksie, rzeczywiście zacznie się obracać.
Ten tajemniczy, krążący strumień energii, który początkowo wydawał się tak śmieszny,
jest bezwzględnie konieczny. Rzeczywiście, istnieje tu przepływ pędu. Jest on niezbędny
do utrzymania zasady zachowania momentu pędu całego świata.
28
masa elektromagnełyczna
28-1. Energia pola dla ładunku punktowego
Łącząc teorię względności z równaniami Maxwella zakończyliśmy zasadniczą część
naszej pracy nad teorią elektromagnetyzmu. Pozostało oczywiście do rozważenia kilka
szczegółów, które pominęliśmy, oraz jeszcze jedna obszerna dziedzina, którą zajmiemy
się w przyszłości, a dotycząca oddziaływania pól elektromagnetycznych z materią. Chce-
my się jednak zatrzymać na chwilę, aby pokazać, że ta ogromna budowla, która z takim
powodzeniem tłumaczy tak wiele zjawisk, w pewnym momencie wali się w gruzy. Okazu-
je się zawsze, gdy zagłębić się zbyt daleko w jakąś dziedzinę fizyki, że tkwią tam jakieś
trudności. Tematem naszym będzie teraz poważna trudność — załamanie się klasycznej
teorii elektromagnetyzmu. Wiemy, że przyczyną załamia się całej fizyki klasycznej jest
istnienie efektów kwantowomechanicznych. Mechanika klasyczna jest teorią konsekwen-
tną matematycznie, ale niezgodną z doświadczeniem. Interesującą natomiast jest rzeczą,
że klasyczna teoria elektromagnetyzmu jest sama w sobie teorią niezadowalającą. Istnieją
pewne trudności, dotyczące pojęć teorii Maxwella, których mechanika kwantowa też nie
rozwiązuje i które nie są nawet bezpośrednio z nią związane. Można by rzec: „A może
nie warto zaprzątać sobie teraz tymi trudnościami głowy. Przecież wiemy, że mechanika
kwantowa ma zmienić prawa elektrodynamiki, czy nie powinniśmy więc poczekać i z°'
baczyć, jak te trudności będą się przedstawiały po tych zmianach”. Jednakże trudność1
te pozostaną nawet po połączeniu elektromagnetyzmu z mechaniką kwantową. Nie będz*e
więc stratą czasu, gdy je już teraz rozpatrzymy. Mają one także wielkie znaczenie hist<r
ryczne. Ponadto powinno nam to chyba sprawić przyjemność, że potrafimy dojść do &
mego sedna teorii i zobaczyć wszystko, łącznie z jej słabymi punktami.
28-1 ENERGIA POLA DLA ŁADUNKU PUNKTOWEGO
133
Trudność, o której mówimy, jest związana z pojęciami pędu i energii elektromagne-
tycznej, w wypadku gdy pojęcia te stosujemy do elektronu lub dowolnej cząstki nałado-
wanej. Pojęcie prostych cząstek naładowanych i pojęcie pola elektromagnetycznego
w pewnym sensie się z sobą nie godzą. Aby opisać tę trudność, zaczniemy od rozważe-
nia kilku przykładów związanych z pojęciami pędu i energii.
Obliczmy najpierw energię cząstki naładowanej. Przyjmijmy prosty model elektronu,
w którym cały jego ładunek q jest równomiernie rozmieszczony na powierzchni kuli
o promieniu a. Promień ten możemy przyjąć równy zeru dla specjalnego przypadku
ładunku punktowego. Obliczmy teraz energię w polu elektromagnetycznym. Jeżeli ładu-
nek pozostaje w spoczynku, to jego pole magnetyczne nie istnieje i energia na jednostkę
objętości jest proporcjonalna do kwadratu natężenia pola elektrycznego. Bezwzględna
wartość tego natężenia wynosi q]Ąite§r2, a gęstość energii jest równa
£° 172 q2
u = —E2 =--------------.
2 327r2eof4
Aby otrzymać całkowitą energię, musimy scałkować tę gęstość po całej przestrzeni. Przyj-
mując za element objętości 4tc/-2 dr otrzymamy całkowitą energię, którą oznaczymy
tfelektr, jako
c *72
= J dr'
Całkę tę można łatwo obliczyć. Dolna granica całkowania jest tu równa a, a górna oo,
czyli
Jeżeli za q podstawimy ładunek elektronu qe i q2]4Tzefi oznaczymy symbolem e2, to
1 e2
U^ = -—. (28.2)
2 a
Wszystko jest tu w jak najlepszej zgodzie, dopóki promienia a nie przyrównamy do zera
dla ładunku punktowego — to właśnie stanowi tę wielką trudność. Gęstość energii pola
jest bowiem odwrotnie proporcjonalna do czwartej potęgi odległości od środka i jej
całka objętościowa jest nieskończona. W polu otaczającym punktowy ładunek jest nie-
skończenie wiele energii.
Cóż w tym złego, że energia jest nieskończenie duża? Jeżeli energia ta nie może wy-
dostać się „na zewnątrz”, a musi na zawsze pozostać w polu, to czy rzeczywiście istnieje
Jakaś trudność związana z nieskończoną energią? Oczywiście, fakt, że wielkość jest nie-
skończenie duża, może być przykry, ale w rzeczywistości znaczenie ma tylko to, czy istnie-
ją jakieś obserw owalne zjawiska fizyczne. Aby odpowiedzieć na to pytanie, musimy się
ZaJ4ć czymś innym oprócz energii. Przypuśćmy, że zapytamy, jak się zmienia energia,
gdy poruszamy ładunek. Wówczas, gdy te zmiany będą nieskończenie wielkie, znajdzie-
się w kłopocie.
134
28. MASA ELEKTROMAGNETYCZNA
( + )
28.1. Pola E i B oraz gęstość pędu g dla
elektronu dodatniego. Dla elektronu ujem-
nego zwrot wektorów E i B jest przeciwny,
natomiast zwrot wektora g pozostaje ten sam
28.2. Element objętości 2w2 sin 040 dr użyty
w obliczeniach pędu pola
28-2. Pęd pola poruszającego się ładunku
Przypuśćmy, że pewien elektron porusza
się ze stałą prędkością w przestrzeni i za-
łóżmy na chwilę, że prędkość ta jest mała
w porównaniu z prędkością światła. Z tym
poruszającym się elektronem związany jest
pewien pęd — nawet gdyby elektron przed
naładowaniem nie miał masy — ze względu
na istnienie pędu w polu elektromagnetycz-
nym. Pokażemy, że pęd pola ma kierunek
prędkości v ładunku i dla małych prędkości
jest proporcjonalny do v. W dowolnym pun-
kcie P, w odległości r od środka ładunku i pod
kątem 9 względem linii ruchu (patrz rys,
28.1), pole elektryczne jest skierowane ra-
dialnie, a pole magnetyczne jest, jak wiadomo,
równe vxE/c2. Gęstość pędu [równanie
(27.21)] jest równa
g = 60ExB.
Tworzy więc ona pewien kąt z kierunkiem
ruchu, tak jak to pokazano na rysunku, a jej
wartość bezwzględna wynosi
fint?
g = — E2sin0.
c2
Pola są symetryczne względem kierunku ruchu, obliczając więc całkę przestrzenną
z gęstości pędu widzimy, że składowe poprzeczne dadzą w sumie zero i wypadkowy
pęd będzie równoległy do v. Składowa g w tym kierunku jest równa gsinS i musimy ją
scałkować po całej przestrzeni. Jako nasz element objętości obieramy pierścień, którego
płaszczyzna jest prostopadła do v, tak jak to pokazano na rys. 28.2. Jego objętość wynosi
27tr2sin0 d9 dr. Całkowity pęd pola poruszającego się ładunku jest więc równy
/£ V
—E2sin20 2%r2 sin0 d9 dr.
Ponieważ pole E nie zależy od kąta 9 (dla v <§ c,) możemy od razu wykonać całkowani®
względem 0; całka ta wynosi
r c cos30
I sin30 d9 = — I (1—cos20) J(cosO) = —cos0-j---------.
28-2. PĘD POLA PORUSZAJĄCEGO ŁADUNKU
135
Granicami 0 są 0 i k, tak więc całka względem 0 daje jedynie czynnik | i
8z £0V ,
p =--------=- | E2r2 dr.
3 c2 J
jest to taka sama całka (dla v < c), jaką przed chwilą obliczyliśmy w celu znalezienia
energii; jest ona równa ^/lÓT^ejja i
2 q2 v
P = V -----------7>
3 4k6q ac
czyli
2 e2 ;
p = - — v. (28.3)
3 ac2
Pęd w polu — pęd elektromagnetyczny — jest proporcjonalny do prędkości ładunku v.
Jest to akurat to, co powinniśmy otrzymać dla cząstki, której masa byłaby równa współ-
czynnikowi przy v. Dlatego współczynnik ten można nazwać masą elektromagnetyczną,
^elektromagn * napisaC
2 e2
^elektromagn j"* (28.4)
3 ac
28-3. Masa elektromagnetyczna
Skąd się bierze masa? Mówiąc o prawach mechaniki, zakładaliśmy, że każdy obiekt
„niesie” z sobą coś, co nazywamy masą — oznacza to także, że obiekt ten „niesie" pęd
proporcjonalny do jego prędkości. Teraz odkrywamy, że jest rzeczą zrozumiałą, iż cząstka
naładowana niesie z sobą pęd proporcjonalny do jej prędkości. W istocie jest to możliwe,
że masa jest po prostu „skutkiem” elektrodynamiki. Pochodzenie masy pozostawało
dotychczas nie wyjaśnione. W elektrodynamice wreszcie mamy świetną okazję, aby zro-
zumieć coś, czego nigdy dotąd nie rozumieliśmy. Okazuje się ni stąd, ni z owąd — a właści-
wie z teorii Maxwella i Poyntinga — że każda naładowana cząstka będzie mieć pęd pro-
porcjonalny do jej prędkości na skutek właśnie oddziaływań elektromagnetycznych.
Bądźmy ostrożni i załóżmy na chwilę, że są dwa rodzaje masy, że całkowity pęd ja-
kiegoś obiektu mógłby być sumą pędu mechanicznego i pędu elektromagnetycznego.
Pęd mechaniczny jest równy masie „mechanicznej”, wmech, razy v. W doświadczeniach,
w których mierzymy masę cząstki mierząc jej pęd lub mierząc jak szybko się ona porusza
P° jakiejś orbicie, mierzymy masę całkowitą. Mówimy ogólnie, że pęd jest równy iloczy-
nowi całkowitej masy (mmech+rnelektromagn) i prędkości. Tak więc obserwowana masa może
s>ę składać z dwóch części (lub też z większej ich liczby, jeżeli uwzględnimy inne pola):
z części mechanicznej oraz z części elektromagnetycznej. Z pewnością wiemy, że istnieje
cz?sć elektromagnetyczna masy i mamy na nią wzór. I istnieje wręcz sensacyjna możli-
"°ść, że części mechanicznej masy w ogóle nie ma — że cała masa jest masą elektroma-
Snetyczną.
136
28. MASA ELEKTROMAGNETYCZNA
Zobaczmy, jakie muszą być rozmiary elektronu, jeżeli nie będzie on miał masy mecha-
nicznej. Możemy je znaleźć przyrównując masę elektromagnetyczną z równania (28.4)
do masy obserwowanej elektronu me. Wtedy
2 e2
a = T---2
3 mc2
Wielkość
e2
'o =------2
mec2
(28.5)
(28.6)
nazywamy „klasycznym promieniem elektronu”; jej wartość liczbowa wynosi 2,82x
X10~13 cm, około jednej stutysięcznej średnicy atomu.
Dlaczego r0 nazywamy promieniem elektronu, a nie nasz promień a? Ponieważ rów-
nie dobrze moglibyśmy zrobić takie same obliczenia przy założeniu innego rozkładu ładun-
ków — ładunek mógłby być równomiernie rozmieszczony w kuli lub mógłby być roz-
proszony na jej powierzchni, tak jak pyłki nasionek na purchawce. Dla każdego szcze-
gólnego rozkładu czynnik 2 zmieniłby się na inny ułamek. Tak na przykład dla ładunku
^2 4
rozmieszczonego równomiernie w kuli czynnik 5 zostałby zastąpiony czynnikiem j.
Zamiast jednak się spierać, który z rozkładów jest poprawny, zdecydowano się zdefi-
niować r0 jako „promień symboliczny”. Różne teorie będą więc dodawać do r0 swoje
ulubione współczynniki.
Spróbujmy rozwijać dalej naszą elektromagnetyczną teorię masy. Dotychczas wy-
konywaliśmy obliczenia dla v c, a co się stanie, gdy przejdziemy do dużych prędkości?
Początkowe próby wprowadziły trochę zamętu, aż dopiero Lorentz zdał sobie sprawę
z tego, że naładowana kula będzie ulegała skróceniu i przy dużych prędkościach stanie się
elipsoidą, a pola będą się zmieniać zgodnie z wzorami (26.6) i (26.7) które wyprowadzi-
liśmy dla przypadku relatywistycznego w rozdz. 26. Jeśli obliczymy dla tego przypadku
całki określające pęd p, otrzymamy, że dla dowolnej prędkości v pęd zmienia się w porów-
naniu z wzorem (28.4) o czynnik 1//1—u2/c2:
Innymi słowy, masa elektromagnetyczna rośnie z prędkością odwrotnie proporcjonalnie
do jĄ—t>2/c2 — odkrycia tego dokonano jeszcze przed stworzeniem teorii względności.
We wczesnych doświadczeniach proponowano mierzyć zmiany obserwowanej masy
cząstki z prędkością, aby móc określić, ile jest masy mechanicznej, a ile elektrycznej.
Wierzono wtedy, że część elektryczna będzie się zmieniać z prędkością, a część mechaniczna
zmieniać się nie będzie. Ale gdy przeprowadzono doświadczenia, teoretycy także praco-
wali. Rychło sformułowano teorię względności, z której wynikło, że bez względu na to,
jakie jest pochodzenie masy, powinna się ona cala zmieniać jak m0/\/l — v2/c2. Równanie
(28.7) dało początek poglądowi, że masa zależy od prędkości.
Powróćmy do naszych obliczeń energii w polu, które doprowadziły nas do równa*
28-3. MASA ELEKTROMAGNETYCZNA
137
(28.8)
nia (28.2). Zgodnie z teorią względności energia U będzie mieć masę Ł7/c2; z równania
(28.2) wynika więc, że pole elektronu powinno mieć masę
I41ek.r 1 e2
yy> -- ------- - --, ---
‘elektromagn 2 2 &ę2 ’
która nie jest taka sama jak masa elektromagnetyczna, z równania (28.4). Is-
totnie, z równania (28.2) i (28.4) wynikałoby, że
^elektr i ^elektromagn •
Wzór ten odkryto przed powstaniem teorii względności i gdy Einstein i inni fizycy zaczęli
zdawać sobie sprawę, że zawsze musi być U = mc2, zapanowała ogólna konsternacja.
28-4. Siła, z jaką elektron działa sam na siebie
Rozbieżność pomiędzy obu wzorami [(28.4) i (28.8)] na masę elektromagnetyczną jest
szczególnie przykra. Starannie bowiem udowodniliśmy, że elektrodynamika jest konsy-
stentna z zasadą względności. Tymczasem z teorii względności wynika, z całą bez-
względnością, że pęd musi być równy iloczynowi energii i v)c2. Tak więc znaleźliśmy się
w kłopocie; musieliśmy zrobić jakiś błąd. Nie popełniliśmy jednak błędu rachunkowego,
ale musieliśmy coś pominąć w naszych rozważaniach.
Przy wyprowadzaniu naszych równań na energię i pęd korzystaliśmy z zasad zacho-
wania. Zakładaliśmy, że uwzględniliśmy już wszystkie siły i że wzięliśmy pod uwagę każdą
wykonaną pracę i każdy pęd niesiony przez inny „nieelektryczny mechanizm”. Czy jednak
naprawdę tak uczyniliśmy? Przecież jeżeli mamy kulę ładunku, to wszystkie siły elek-
tryczne są odpychające i elektron będzie dążył do rozlecenia się na kawałki. Ponieważ
w układzie występują siły niezrównoważone, możemy otrzymać wszelkie rodzaje błędów
w prawach wiążących z sobą energię i pęd. Aby otrzymać konsystentny obraz, musimy
sobie wyobrazić, że coś utrzymuje elektron w całości. Ładunki muszą być utrzymywane
na kuli za pomocą jakby gumowych obręczy — czegoś, co nie pozwala ładunkom odlecieć.
Pierwszy zwrócił uwagę Poincare, że te gumowe obręcze — lub coś, co utrzymuje w całości
elektron — muszą być uwzględnione w obliczeniach energii i pędu. Z tego powodu te
dodatkowe nieelektryczne siły noszą także bardziej elegancką nazwę „napięć Poincarego”.
Jeżeli uwzględnić te dodatkowe siły w obliczeniach, to masy otrzymane dwoma sposobami
zmienią się (w sposób, który zależy od szczegółowych założeń). A wyniki będą w zgodzie
z teorią względności, tzn. masa otrzymana z obliczenia pędu będzie taka sama jak masa
Pochodząca z obliczeń energii. Jednak obie te masy zawierają dwa przyczynki: przyczy-
nek elektromagnetyczny i przyczynek pochodzący od napięć Poincarego. Dopiero po
dodaniu tych dwóch przyczynków dostajemy konsystentną teorię.
Wynika stąd, że nie można przyjąć, jak to mieliśmy nadzieję, że cała masa jest masą
elektromagnetyczną. Teoria, w której nie ma nic poza elektrodynamiką, nie jest prawo-
mocna. Trzeba do niej coś jeszcze dodać. W przyrodzie muszą istnieć siły, jakkolwiek je
^zwiemy — „obręcze gumowe”, czy też „napięcia Poincarego”, czy też jeszcze inaczej —
°re pozwolą teorię tego typu uczynić teorią konsystentną.
138
28. MASA ELEKTROMAGNETYCZNĄ
Oczywiście, jeżeli tylko będziemy musieli wprowadzić siły do wnętrza elektronu, piękno
całego opisu zacznie zanikać. Wszystko się bardzo skomplikuje. Chciałoby się spytać;
Jak silne są te napięcia? W jaki sposób będzie się elektron „trząsł”? Czy będzie on drgał?
Jakie są jego wewnętrzne własności? I tak dalej. Jest rzeczą możliwą, że elektron rzeczy,
wiście ma pewne skomplikowane własności wewnętrzne. Gdyby pod tym kątem stworzyć
teorię elektronu, wynikałyby z niej dziwaczne własności; istniałyby na przykład typy
oscylacji, których „pozornie” nie obserwowalibyśmy. Powiedzieliśmy „pozornie”, po-
nieważ obserwujemy wiele rzeczy w przyrodzie, z których wciąż nie wynika nic sensownego.
Może pewnego dnia okaże się, że coś, czego dzisiaj nie rozumiemy (np. mezon), można
w rzeczywistości wytłumaczyć jako oscylację napięć Poincarego. Nie wydaje to się zbyt
prawdopodobne, ale nikt tego nie może powiedzieć z całą pewnością. Jest jeszcze tak wiele
szczegółów dotyczących cząstek elementarnych, których wciąż jeszcze nie rozumiemy.
W każdym razie złożona struktura elektronu, wynikająca z tej teorii, jest niepożądana
i próba wytłumaczenia natury całej masy poprzez elektromagnetyzm — przynajmniej
w opisany przez nas sposób — zaprowadziła nas w ślepą uliczkę.
Chcielibyśmy się zastanowić jeszcze trochę nad tym, dlaczego dopatrujemy się istnie-
nia masy, gdy stwierdzamy, że pęd w polu jest proporcjonalny do prędkości. Powoli!
Masa jest współczynnikiem pomiędzy pędem a prędkością. Ale możemy inaczej spojrzeć
na masę: cząstka na masę, jeżeli musimy wywrzeć pewną siłę, aby nadać jej przyspieszenie.
Być może, będzie nam więc łatwiej wszystko zrozumieć, jeżeli dokładniej się zastanowimy,
skąd się biorą siły. Skąd wiadomo, że musi być jakaś siła? Otóż stąd, że udowodniliśmy
zasadę zachowania pędu dla pól. Jeżeli mamy naładowaną cząstkę i będziemy ją przez
chwilę „popychać”, to w polu elektromagnetycznym pojawi się pewien pęd. Pęd ten
musiał w jakiś sposób dopłynąć do pola. Dlatego też musiała występować jakaś siła dzia-
łająca na elektron, umożliwiająca ten przepływ pędu; oprócz siły potrzebnej ze względu na
mechaniczną bezwładność elektronu musi być i siła, której przyczyną jest jego oddziały-
wanie elektromagnetyczne. A na „popychadło” musi działać odpowiednia siła, przeciwnie
skierowana (do siły działającej na elektron). Ale skąd się ta siła bierze?
Wygląda to mniej więcej tak. Elektron można uważać za naładowaną kulę. Kiedy
pozostaje ona w spoczynku, każde dwa „kawałki” ładunku odpychają się wzajemnie, zgod-
nie z prawem Coulomba, ale wszystkie siły parami się równoważą, a więc nie ma siły wy-
padkowej [patrz rys. 28.3a]. Jednakże gdy elektronowi nadać pewne przyspieszenie, siły nie
będą się już równoważyć ze względu na to, że na przejście oddziaływań elektromagnetycz-
nych od jednego „kawałka” ładunku do drugiego potrzebny jest pewien czas. Tak na przy-
kład siła, z jaką „kawałek” a działa na „kawałek” po przeciwnej stronie kuli na rys-
28.3b, zależy od położenia /? w chwili wcześniejszej, tak jak to zaznaczono na rysunku-
Zarówno wartość bezwzględna, jak i kierunek siły, zależą od ruchu ładunku. Jeżeli ładunek
porusza się z pewnym przyspieszeniem, siły w różnych częściach elektronu wyglądają tak’
jak to pokazano na rys. 28.3c. Gdy doda się do siebie te wszystkie siły, to się okaże, ze
one się nie znoszą wzajemnie. Siły te znosiłyby się dla stałej prędkości, mimo że na piet'v'
szy rzut oka wydawałoby się, że opóźnienie powinno dać niezrównoważoną siłę nawe*
dla prędkości stałej. Ale okazuje się, że wypadkowa siła istnieje tylko w przypadku, g^
elektron porusza się z pewnym przyspieszeniem. Gdyby się przyjrzeć siłom pomięć/
f 28-4. SIŁA, Z JAKĄ ELEKTRON DZIAŁA SAM NA SIEBIE
139
28.3. Siła własna elektronu poruszającego się z pewnym przyspieszeniem jest różna od zera ze względu
na opóźnienie. (Przez dF należy rozumieć siłę działającą na element powierzchni da; przez d2F należy
rozumieć siłę działającą na element powierzchni daa, pochodzącą od ładunku rozłożonego na elemencie
powierzchni dap.')
różnymi częściami elektronu, przy istnieniu przyspieszenia, okazałoby się, że akcja nie
jest dokładnie równa reakcji i elektron działa pewną siłą sam na siebie, siłą, która próbuje
przeciwdziałać przyspieszeniu. Elektron sam wstrzymuje swój ruch tzw. siłą „boot-
strapu”*’.
Można, choć nie bez trudu, obliczyć tę siłę samooddziaływania; nie będziemy się
jednak zagłębiać w tak pracochłonne obliczenia. Podamy tylko wynik, dla specjalnego
przypadku stosunkowo nieskomplikowanego ruchu w jednym wymiarze, powiedzmy
wzdłuż osi x. Wówczas siłę własną można zapisać w postaci szeregu. Pierwszy wyraz
szeregu zależy od przyspieszenia x, następny wyraz jest proporcjonalny do x i tak
dalej** ***’. Wynik jest następujący:
e2 .. 2 e2 ... e2a ....
a—x-- —x+y—x+..., (28.9)
ac2 3 cs c*
gdzie a i y są liczbowymi współczynnikami rzędu jedności. Współczynnik a przy wyrazie x
zależy od tego, jaki przyjęliśmy rozkład ładunku; jeżeli ładunek jest rozmieszczony równo-
miernie na kuli, to a = |. Jest to zatem wyraz proporcjonalny do przyspieszenia, który
się zmienia odwrotnie proporcjonalnie do promienia elektronu a i dokładnie się zgadza
z wartością, jaką otrzymaliśmy w równaniu (28.4) na melektromagn. Gdyby przyjąć inny rozkład
ładunku, o zmienionym współczynniku a, to ułamek | w równaniu (28.4) tak samo by się
zmienił. Wyraz zawierający x jest niezależny od przyjętego promienia a, a także od przy-
jętego rozkładu ładunku; współczynnik przy nim wynosi zawsze |. Kolejny wyraz jest
Proporcjonalny do promienia a, a jego współczynnik y zależy od rozkładu ładunku. Za-
ważmy, że jeżeliby przyjąć, że promień elektronu a dąży do zera, to ostatni wyraz (a także
wszystkie wyrazy wyższego rzędu) będą zmierzać do zera; drugi wyraz pozostaje stały,
** Bootstrap — dosłownie: ucho buta.
Bootstrap force — siła, z jaką elektron wstrzymuje swój ruch „łapiąc się za ucha swoich butów”,
tłum.).
*** Używamy zapisu: x = dx!dt, x — d2x/dt2, x = d2xjdt2, itd.
140 28. MASA ELEKTROMAGNETYCZNA
ale pierwszy wyraz — masa elektromagnetyczna — dąży do nieskończoności. Widać,
że pojawienie się tej nieskończoności jest spowodowane siłą, jaką jedna część elektronu
działa na drugą, dopuściliśmy bowiem, być może niezbyt mądrze, możliwość istnienia
„punktowego” elektronu, który działa sam na siebie.
28-5. Próby zmodyfikowania teorii Maxwella
Chcielibyśmy się teraz zastanowić, jak można by zmodyfikować elektrodynamikę
Maxwella, tak aby pozostawało w niej pojęcie elektronu jako prostego ładunku punkto-
wego. Czyniono już wiele takich prób i niektóre z podanych teorii były nawet w stanie
tak poprawić sytuację, że cała masa elektronu była według nich masą elektromagnetyczną.
Ale wszystkie te teorie upadły. Ciekawe jest jednak rozważenie kilku z proponowanych
rozwiązań — aby zdać sobie sprawę z wysiłków umysłu ludzkiego.
Naszą teorię elektryczności rozpoczęliśmy od omówienia wzajemnego oddziaływania
dwóch ładunków. Następnie zbudowaliśmy teorię tych oddziałujących ładunków i skoń-
czyliśmy na teorii pola. W tę teorię wierzymy tak głęboko, że wnioskujemy na jej pod-
stawie o istnieniu siły, z jaką jedna część elektronu działa na drugą. Być może, cała trud-
ność jest w tym, że elektrony wcale na siebie nie działają; być może, nasza ekstrapolacja —
od oddziaływania oddzielnych elektronów do pojęcia elektronu oddziałującego z samym
sobą — była zbyt daleko idąca. Dlatego też proponowano pewne teorie, które wykluczały
możliwość tego, że elektron działa na siebie. Znikła w nich nieskończoność pochodząca
od własnego oddziaływania. Nie było też wtedy żadnej masy elektromagnetycznej związa-
nej z cząstką; cała masa była z powrotem masą mechaniczną, ale za to w teoriach tych
pojawiły się nowe trudności.
Musimy od razu powiedzieć, że teorie takie wymagają modyfikacji pojęcia pola elektro-
magnetycznego. Pamiętamy, iż na początku powiedzieliśmy, że siła działająca na cząstkę
była w każdym punkcie określona tylko przez dwie wielkości: E i B. Jeżeli odrzucimy „siłę
własną”, to powyższe twierdzenie przestaje być prawdziwe, jeśli bowiem w pewnym miejscu
mamy elektron, to działająca na niego siła nie jest dana przez całkowite pola E i B, a je-
dynie przez te ich części, za które są odpowiedzialne inne ładunki. Musimy więc cały czas
śledzić, jaka część pól E i B pochodzi od ładunku, dla którego obliczamy działającą nań
siłę, a jaka część pól E i B pochodzi od innych ładunków. Teoria jest przez to o wiele bar-
dziej pracochłonna, ale unika się w niej kłopotów z nieskończonością.
Można więc, jeśli się chce, powiedzieć, że nie istnieje taki obiekt jak elektron, działający
na siebie, i odrzucić cały zbiór sił z równania (28.9). Ale w ten sposób wylewa się dziecko
razem z kąpielą! Drugi bowiem wyraz w równaniu (28.9), wyraz z x, jest koniecznie po-
trzebny. Ta siła powoduje coś zupełnie określonego. Jeżeli ją odrzucimy, to znajdziemy
się znowu w kłopocie. Gdy nadajemy ładunkowi przyspieszenie, promieniuje on falo
elektromagnetyczne, a więc traci energię. Dlatego też, aby nadać przyspieszenie ładun-
kowi, musi się użyć więcej siły, niż aby przyspieszyć obiekt neutralny o tej samej masie!
w przeciwnym wypadku energia nie byłaby zachowana. Praca, jaką wykonujemy w jedno-
stce czasu na poruszającym się z pewnym przyspieszeniem ładunku, musi być równa ilość*
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA
141
energii straconej w tym samym czasie na skutek promieniowania. O zjawisku tym mówi-
liśmy poprzednio*’ — nazywa się je oporem promieniowania. W dalszym ciągu pozostaje
problem : Skąd się bierze dodatkowa siła, przeciwko której musimy tę pracę wykonać?
Gdy duża antena promieniuje, siły pochodzą od oddziaływania pomiędzy jedną częścią
prądu anteny, a drugą. W przypadku pojedynczego elektronu, poruszającego się z pewnym
przyspieszeniem i wysyłającego promieniowanie w pustą przestrzeń, wydawałoby się, że
siia może pochodzić tylko od oddziaływania pomiędzy poszczególnymi częściami elek-
tronu.
W rozdziale 32 tomu I (cz. 2) znaleźliśmy, że oscylujący ładunek promieniuje w jedno-
stce czasu energię:
dW 2 e2(x)2
dt 3 c3
(28.10)
Zobaczmy, jaką z równania (28.9) otrzymamy pracę wykonywaną w jednostce czasu
przeciwko sile własnej (sile bootstrapu). Praca ta jest równa iloczynowi siły i prędkości,
czyli równa Fx:
dW e2 ... 2 e2 ....
—— = a—-xx———xx+... (28.11)
dt ac2 3 c3
Pierwszy wyraz jest proporcjonalny do dx2!dt, a zatem odpowiada po prostu szybkości
zmian energii kinetycznej jmu1, związanej z masą elektromagnetyczną. Drugi wyraz po-
winien odpowiadać wypromieniowanej mocy, danej równaniem (28.10), ale tak nie jest.
Powodem tej rozbieżności jest fakt, że drugi wyraz równania (28.11) jest prawdziwy ogól-
nie, podczas gdy równanie (28.10) jest prawdziwe tylko dla oscylującego ładunku. Można
pokazać, że te dwa równania są równoważne, jeżeli ruch ładunku jest okresowy. Prze-
piszmy mianowicie drugi wyraz równania (28.11) w postaci
2
I
e2 d ,... 2
—-37 («)+v
c3 dt 3
e2
c2
(*)2,
która jest jego prostym przekształceniem algebraicznym. Jeżeli ruch elektronu jest okre-
sowy, wielkość xx powraca periodycznie do tej samej wartości i dlatego średnia z jej po-
chodnej czasowej jest równa zeru. Natomiast drugi wyraz jest zawsze dodatni (gdyż jest
kwadratem), a więc jego średnia jest także dodatnia. Ten wyraz określa wykonaną pracę
wypadkową i jest identyczny z równaniem (28.10).
Wyraz z x w wyrażeniu na siłę własną jest potrzebny po to, aby mieć zgodność z zasadą
zachowania energii dla układów promieniujących i nie można go odrzucić. Prawdę mówiąc,
Jednym z triumfów Lorentza było wykazanie, że musi być taka siła i że pochodzi ona od
działania elektronu na siebie. Musimy wierzyć w tę koncepcję elektronu działającego na
s,ebie i potrzebny nam jest wyraz zawierający x. Cały problem polega na tym, jak otrzymać
len wyraz, nie otrzymując jednocześnie pierwszego wyrazu z równania (28.9), który jest
sPrawcą całego kłopotu. Nie wiemy, jak to zrobić. No i proszę — klasyczna teoria elek-
tr°nu zapędziła nas w ślepy zaułek.
*’ W tomie I, cz. 2. (Przyp. red. wyd. polskiego.) » - .
142
28. MASA ELEKTROMAGNETYCZNA
Było szereg prób zmodyfikowania praw elektromagnetyzmu usiłujących rozwikłać
powyższe problemy. Jeden ze sposobów zaproponowany przez Borna i Infelda polegał
na skomplikowanej zmianie równań Maxwella, tak że przestawały one być liniowe. Z rów-
nań tych wynika, że energia elektromagnetyczna i pęd są wielkościami skończonymi.
Ale prawa sugerowane przez Borna i Infelda przepowiadają istnienie zjawisk, których
nigdy nie obserwowano. Ich teoria ma także jeszcze jeden słaby punkt, do którego doj-
dziemy później, a który jest wspólny dla wszystkich prób mających na celu usunięcie
opisanych przez nas kłopotów.
Dirac zaproponował następujące, osobliwe rozwiązanie. Powiedział on: Przyjmijmy,
że za oddziaływanie elektronu na siebie odpowiedzialny jest drugi wyraz z równania (28.9)>
a nie pierwszy. Następnie wpadł na ciekawy pomysł, żeby pozbyć się pierwszego wyrazu
(ale nie obu!). Zauważmy, powiedział, że uczyniliśmy specjalne założenie, biorąc rozwią-
zania równań Maxwella w postaci fal opóźnionych', gdybyśmy zamiast tego wzięli fale
przyspieszone, otrzymalibyśmy coś innego. Wzór na siłę własną miałby postać:
e2 .. 2 e2 ... e2a ....
F= a~x+ — —x+y — x. (28.12)
ac2 3 c3 c4
Równanie to jest zupełnie podobne do równania (28.9), z wyjątkiem znaku drugiego
wyrazu szeregu — i znaków niektórych wyrazów wyższego rzędu. [Przejście od fal opóź-
nionych do przyspieszonych polega po prostu na zmianie znaku opóźnienia, co jak nie-
trudno zauważyć, jest równoważne zmianie wszędzie znaku t. Powoduje to jedynie zmianę
znaków wszystkich nieparzystych pochodnych czasowych w równaniu (28.9)]. Przyj-
mijmy więc, powiedział Dirac, nowe prawo, że elektron działa na siebie poprzez połowę
różnicy wytworzonych przez siebie pól opóźnionych i przyspieszonych. Różnica równań
(28.9) i (28.12), podzielona przed dwa, jest równa
2 e2..
F -----------X + wyrazy wyższego rzędu.
3 c3
We wszystkich wyrazach wyższego rzędu promień a występuje w jakiejś dodatniej potędze
w liczniku. Dlatego też, gdy przejdziemy do granicznego przypadku ładunku punktowego,
otrzymamy tylko jeden wyraz, taki jaki właśnie był potrzebny. W ten sposób Dirac otrzy-
mał siłę oporu promieniowania, a nie otrzymał żadnych sił wewnętrznych. Nie ma masy
elektromagnetycznej i teoria klasyczna jest uratowana, ale kosztem arbitralnego założe-
nia o sile własnej.
Dowolność związana z dodatkowym założeniem Diraca została, do pewnego przynaj-
mniej stopnia, usunięta przez Wheelera i Feynmana, którzy zaproponowali jeszcze dziw-
niejszą teorię. Sugerują oni, że punktowe ładunki oddziałują tylko z innymi ładunkami,
przy czym oddziaływanie zachodzi w połowie przez fale przyspieszone, a w połowie przez
fale opóźnione. Okazuje się, ku wielkiemu zdziwieniu, że w większości sytuacji nie obser-
wuje się żadnych efektów pochodzących od fal przyspieszonych, ale te właśnie fale p°*
wodują powstanie siły oporu promieniowania. Za opór promieniowania nie jest odpowie-
dzialny elektron działający sam na siebie, ale następujący osobliwy efekt. Gdy elektro®
porusza się z pewnym przyspieszeniem w chwili t, to oddziałuje on na wszystkie inne ła
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA
143
dunki w całym świecie, w późniejszej chwili t' — t+r]c (gdzie r jest odległością od innego
ładunku) przez fale opóźnione. Ale wówczas te inne ładunki oddziałują wstecz na pier-
wotny elektron przez ich fale przyspieszone, które przybędą w chwili t", równej t'— r/c,
co oczywiście jest równe akurat t. (Te inne ładunki oddziałują również przez swoje fale
opóźnione, ale odpowiada to po prostu normalnym falom „odbitym”). Taka kombinacja
fal przyspieszonych i opóźnionych oznacza, że oscylujący ładunek, w chwili gdy jest
przyspieszany, odczuwa siłę pochodzącą od wszystkich ładunków, które „przygotowują
się” do pochłonięcia przez niego promieniowanych fal. Widzimy, do jakich to gmatwa-
nin dochodzą ludzie, próbując otrzymać teorię elektronu!
Opiszemy teraz jeszcze teorię innego rodzaju, aby pokazać, czego to już ludzie nie
wymyślą, kiedy się bez reszty zaplączą. Jest to inna modyfikacja praw elektrodynamiki,
zaproponowana przez Boppa. Zdajemy sobie sprawę, że gdy się już raz zdecydujemy na
zmianę równań elektromagnetyzmu, to możemy zacząć od dowolnie wybranego punktu.
Można zmieniać prawo określające siłę działającą na elektron albo też zmieniać równania
Maxwella (tak jak to widzieliśmy w opisanych powyżej przykładach), albo można zmienić
coś innego. Jedną z możliwości jest zmiana wzorów, które określają potencjały poprzez
ładunki i prądy. Jeden z naszych wzorów określał potencjały w jakimś punkcie poprzez
gęstość prądu (lub ładunku) w każdym innym punkcie w chwili wcześniejszej. W zapisie
czterowektorowym
t) = f . (28.13)
Piękna w swojej prostocie koncepcja Boppa wygląda następująco: Może powodem kło-
potu jest czynnik 1/r pod całką. Załóżmy, że jako punkt wyjścia przyjmiemy jedynie, że
potencjał w jednym punkcie zależy od gęstości ładunku w każdym innym punkcie po-
przez pewną funkcję odległości pomiędzy tymi punktami, powiedzmy f(r i2). Całkowity
potencjał w punkcie (1) będzie wówczas określony poprzez całkę po całej przestrzeni
z iloczynu i tej funkcji:
^(1) = JjX2)/(r12)^2.
To wszystko. Żadnych równań różniczkowych — nic więcej. No, jeszcze jedna rzecz.
Będziemy także chcieli, aby wynik był relatywistycznie niezmienniczy. Tak więc za „od-
ległość” powinniśmy wziąć niezmienniczą „odległość” pomiędzy dwoma punktami w cza-
soprzestrzeni. Ta odległość, podniesiona do kwadratu, jest (z dokładnością do znaku,
co nie odgrywa roli), równa
5i2 = c2(J1-t2)2-i\22 = c2(t1—t2)2—(xi—x2)2—(yi—y2)2—(z1—z2)2. (28.14)
Tak więc dla niezmienniczej relatywistycznie teorii powinniśmy wziąć jakąś funkcję wiel-
kości sl2 lub — co na to samo wychodzi — jakąś funkcję s22. Teoria Boppa mówi więc, że
^(1, *0 = fj\(2, t2)F(s212)d72 dt2. (28.15)
(Całkujemy oczywiście po czterowymiarowej objętości dt2dx2dy2dz2j
Pozostaje tylko wybrać odpowiednią postać dla funkcji F. O funkcji tej zakładamy tylko
144
28. MASA ELEKTROMAGNETYCZNA
28.4. Funkcja F(s2) użyta w nielokalnej
teorii Boppa
jedną rzecz — że przyjmuje ona bardzo małe
wartości, z wyjątkiem gdy jej argument jest
bliski zera, tak że wykresem funkcji F będzie
krzywa w rodzaju krzywej z rys. 28.4. Ma
ona wąskie maksimum i ogranicza obszar
o skończonej powierzchni, symetryczny wzglę-
dem prostej s2 = 0, o szerokości, którą przyj-
miemy równą z grubsza 2a2. Można nie
wnikając w szczegóły powiedzieć, że na war-
tość potencjału w punkcie (1) mają istotny
wpływ tylko te punkty (2), dla których
s22 = c2(r2—Ą)2—r22 należy do przedziału
(+<z2, —u2). Można to podkreślić za po-
mocą stwierdzenia, że funkcja F przyjmuje
istotne wartości tylko dla
sł2 = ^(h-hY-rii » ±a2. (28.16)
Można by nadać temu bardziej „matematy-
czną” postać, ale i tak wiadomo, o co chodzi.
Załóżmy teraz, że promień a jest bardzo
mały w porównaniu z rozmiarami zwykłych
obiektów, takich jak np. silniki czy generato-
ry, tak że dla normalnych zagadnień r12 a.
W takim przypadku z równania (28.16) wynika, że ładunki dają przyczynki do całki w rów-
naniu (28.15) tylko wtedy, gdy t2—t2 należy do małego przedziału:
---- a
V r12±a ~r12l/ 1±— •
F f12
Ponieważ wartość pierwiastka można przybliżyć przez 1 ±«2/2r22, tak że
r12 / a2 \ ri2 a2
ti —12 =----11 ±-yr-) = i 3 •
c \ 2/-j2/ c 2r12c
Jakie znaczenie ma ten wynik? Wynik ten mówi nam, że jedynymi istotnymi w całce
z są takie chwile t2, które różnią się od chwili tt, dla której chcemy znaleźć potencjał,
o opóźnienie r12/c plus pewna poprawka, możliwa do pominięcia, jeżeli rl2 > a. Innymi
słowy, teoria Boppa jest zbliżona do teorii Maxwella dopóty, dopóki znajdujemy się daleko
od poszczególnych ładunków — w tym sensie, że teoria ta prowadzi do efektów fali opóź-
nionej.
Wartość całki z równania (28.15) możemy oszacować. Jeżeli będziemy najpierw cał-
kować względem t2 od — oo do +oo — przy ustalonym r12 — to s22 będzie również prze"
biegać od — oo do +oo. Przyczynki do tej całki będą pochodzić od tych chwil t2, które
należą do małego przedziału o szerokości At2 = 2-a2/2rl2c i o środku tt—r12jc. Za'
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA
145
łóżmy, że funkcja F(s2) przyjmuje dla s2 = 0 wartość K; wówczas całka względem t2
jest w przybliżeniu równa zl/2, czyli inaczej
Ka2 j„
c rl2'
Wartość jf, powinniśmy oczywiście wziąć dla chwili t2 = więc równanie
(28.15) przybiera postać
A M ' Ka2 C h-r12/c)
?i)------------I ---------------aK2.
c J rl2
Jeżeli wybierzemy K = q2c[4nsoa2, dostaniemy z powrotem rozwiązanie równań Max-
wella poprzez potencjał opóźniony, zawierające automatycznie zależność typu 1/r! I to
wszystko wynikło z prostej hipotezy, że potencjał w jednym punkcie czasoprzestrzeni
zależy od gęstości prądu we wszystkich innych punktach czasoprzestrzeni, przy czym
w zależności tej występuje funkcja wagowa będąca pewną „wąską” funkcją czterowymia-
rowej odległości pomiędzy dwoma punktami. Teoria ta przypisuje znowu elektronowi
skończoną masę elektromagnetyczną, a związek pomiędzy energią i masą jest zgodny z te-
orią względności. Musi tak być, ponieważ teoria jest od samego początku relatywistycznie
niezmiennicza i wydaje się, że wszystko jest w porządku.
Jest jednak jeden zasadniczy zarzut dotyczący tej teorii, a także wszystkich innych
teorii przez nas opisanych. Wszystkie znane cząstki stosują się do praw mechaniki kwanto-
wej, a więc musi się dokonać kwantowomechanicznej modyfikacji elektrodynamiki. Światło
zachowuje się tak jak strumień fotonów, a to nie jest zgodne w 100°/o z teorią Maxwella.
A więc teoria elektrodynamiczna musi zostać zmieniona. Wspominaliśmy już, że przed-
stawione tu wysiłki nad poprawieniem klasycznej teorii mogą być stratą czasu, bo mogłoby
się okazać, że w elektrodynamice kwantowej te trudności znikną lub zostaną rozwiązane
w jakiś inny sposób. Ale trudności te nie znikają także w elektrodynamice kwantowej.
Jest to jeden z powodów, dla których ludzie zużyli tak wiele czasu próbując usunąć trud-
ności na poziomie teorii klasycznej; mieli bowiem nadzieję, że gdyby im się udało usunąć
trudności klasyczne, a następnie dokonać kwantowych modyfikacji, pozbyliby się wszyst-
kich kłopotów.
Tymczasem teoria Maxwella po wprowadzeniu modyfikacji, których żąda mechanika
kwantowa, w dalszym ciągu ma te same trudności.
Efekty kwantowe prowadzą rzeczywiście do pewnych zmian — wzór na masę jest
nieco zmieniony, pojawia się stała Plancka li, ale okazuje się, że wynik w dalszym ciągu jest
nieskończony, jeżeli nie „obetniemy” w jakiś sposób przedziału całkowania — właśnie tak
Jak musieliśmy „ucinać” całki klasyczne przy r = a. A wyniki zależą od sposobu, w jaki
wykonamy „obcinanie”. Nie możemy, niestety, tutaj pokazać, że trudności pozostają
w zasadzie takie same, ponieważ zbyt mało wiemy o mechanice kwantowej, a jeszcze mniej
0 kwantowej elektrodynamice. Musimy więc uwierzyć na słowo, że skwantowana teoria
etektrodynamiki Maxwella dla punktowego elektronu daje również masę nieskończoną.
Okazuje się jednak, że nikomu nigdy nie udało się stworzyć wewnętrznie niesprzecznej
te°rii kwantowej z różnych zmodyfikowanych teorii klasycznych. Koncepcje Borna i In-
10 —
Wykłady z fizyki
146
28, MASA ELEKTROMAGNETYCZNA
felda nigdy nie zostały przekształcone w zadowalającą teorię kwantową. Również teorie
z opóźnionymi i przyspieszonymi falami Diraca, czy też Wheelera i Feynmana, nigdy nie
zostały przekształcone w zadowalającą teorię kwantową. Tak samo teoria Boppa nigdy
nie została przekształcona w zadowalającą teorię kwantową. Nie znamy więc dzisiaj za-
dowalającego rozwiązania tego zagadnienia. Nie wiemy, jak utworzyć konsystentną
teorię, uwzględniającą mechanikę kwantową, która nie dawałaby nieskończonej energii
własnej elektronu lub jakiegokolwiek ładunku punktowego. A jednocześnie nie ma za-
dowalającej teorii, która by opisywała ładunek niepunktowy. Jest to zagadnienie nie-
rozwiązane.
Na wypadek gdyby ktoś zdecydował się zabrać do tworzenia teorii, z której działanie
elektronu na samego siebie byłoby całkowicie usunięte, tak że masa elektromagnetyczna
przestałaby już mieć znaczenie, a następnie zabrałby się do tworzenia z tego teorii kwan-
towej, musimy go ostrzec, że na pewno się znajdzie w kłopocie. Istnieją wyraźne dowody
doświadczalne na istnienie bezwładności elektromagnetycznej, czyli istnieją dowody, że
pewna część masy naładowanych cząstek ma pochodzenie elektromagnetyczne.
W starszych podręcznikach zwykło się mówić, że ponieważ Przyroda bez wątpienia
nigdy nie „ofiaruje” nam dwóch cząstek — jednej naładowanej i drugiej neutralnej, ale
poza tym takich samych — nigdy nie będziemy w stanie powiedzieć, jaka część masy jest
elektromagnetyczna, a jaka mechaniczna. Okazuje się że Przyroda była na tyle upizejma
i sprezentowała nam takie właśnie obiekty, tak że porównując obserwowaną masę nałado-
wanej cząstki z obserwowaną masą cząstki neutralnej można stwierdzić,-czy istnieje jakaś
masa elektromagnetyczna. Istnieją na przykład neutrony i protony. Oddziałują one wza-
jemnie olbrzymimi siłami — siłami jądrowymi — których pochodzenia nie znamy. Jednak-
że, jak już to opisywaliśmy, siły jądrowe mają jedną zadziwiającą własność. Dopóki roz-
ważamy tylko siły jądrowe, neutron i proton są dokładnie takie same. Siły jądrowe po-
między neutronem a neutronem, protonem a neutronem i protonem a protonem są iden-
tyczne na tyle, na ile jesteśmy to w stanie stwierdzić. Jedyną różnicę stanowią małe siły
elektromagnetyczne; z punktu widzenia własności elektrycznych proton i neutron różnią
się między sobą, tak jak noc się różni od dnia. Tego właśnie chcieliśmy. Istnieją zatem dwie
cząstki, identyczne z punktu widzenia silnych oddziaływań, ale różne z punktu widzenia
własności elektrycznych. Pomiędzy zaś ich masami istnieje mała różnica. Różnica mas
neutronu i protonu — wyrażona jako różnica w energii spoczynkowej mc2 — wynosi,
w jednostkach MeV, około 1,3 MeV, co równe jest w przybliżeniu 2,6 razy masa elektronu.
Z klasycznej teorii wynikałoby, że ich promień jest w przybliżeniu równy od i do | kla-
sycznego promienia elektronu, czyli około 10“13 cm. Oczywiście, powinniśmy w rzeczy-
wistości posłużyć się teorią kwantową, ale w wyniku jakiegoś dziwnego trafu wszystkie
stałe — 2n i Jl itd. — znoszą się, tak że teoria kwantowa daje z grubsza taki sam promień,
jak teoria klasyczna. Kłopot tylko w tym, że jest tu zły znak\ Neutron jest cięższy od pro-
tonu.
Przyroda dała nam także szereg innych par — lub trójek — cząstek, które jak się oka-
zuje, są dokładnie takie same, z wyjątkiem ładunku elektrycznego. Oddziałują one z pro-
tonami i neutronami poprzez tzw. „silne” oddziaływania sił jądrowych. W takich oddzia-
ływaniach cząstki danego typu, powiedzmy mezony n, zachowują się pod każdym wzglę-
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA
147
Tabela 28.1, Masy cząstek
Ładunek Masa Am
Cząstka (w jednostkach ładunku elektronu) (MeV) (MeV)
n (neutron) 0 939,5
p (proton) + 1 938,2 —1,3
.T (mezon ti) 0 135,0
±1 139,6 +4,6
0 497,8
K (mezon K) ±1 493,8*’ —3,9
0 1192,3*’ —2,9*’
Z (sigma) +1 —1 1189,4 1197,2*’ +4,9*’
*) Am = (masa cząstki naładowanej) — (masa cząstki neutralnej).
[Dane z roku 1965. (Przyp, red. wyd. polskiego)]
dem jak jeden i ten sam obiekt, z wyjątkiem ładunku elektrycznego. W tabeli 28.1 podajemy
listę takich cząstek wraz z ich zmierzonymi masami. Naładowane mezony n — dodatnie
i ujemne — mają masę 139,6 MeV, ale neutralny mezon n jest lżejszy o 4,6 MeV. Wierzy-
my, że ta różnica mas jest elektromagnetyczna; odpowiadałoby to cząstce o promieniu
3-4-10“14 cm. Z tabeli widać, że różnice mas dla innych cząstek są tego samego rzędu.
Rozmiary tych cząstek można teraz określić posługując się innymi metodami, mierząc
na przykład ich średnice w zderzeniach wielkich energii. Tak więc wydaje się, że masa
elektromagnetyczna jest ogólnie w zgodzie z teorią elektromagnetyczną, jeżeli przy obli-
czeniu masy „obetniemy” nasze całki energii pola na tym samym promieniu, jaki otrzy-
mujemy z tych innych metod. Właśnie dlatego wierzymy, że te różnice odpowiadają masie
elektromagnetycznej.
Niewątpliwie martwią nas różne znaki różnic mas w tabeli. Łatwo zrozumieć, dlaczego
naładowane cząstki powinny być cięższe od neutralnych. Ale co z tymi parami, jak neutron
i proton, dla których różnica zmierzonych mas jest
akurat przeciwna? Otóż okazuje się, że te cząstki są
złożone i obliczenie dla nich masy elektromagnety-
cznej będzie bardziej pracochłonne. Tak na przykład,
chociaż neutron nie ma wypadkowego ładunku, ma
on pewien wewnętrzny rozkład ładunku — i tylko jego
wypadkowy ładunek jest równy zeru. W istocie,
wierzymy, że neutron wygląda — przynajmniej czasami
— jak proton otoczony „chmurą” mezonu rr, tak jak
to pokazano na rys. 28.5. Chociaż neutron jest „neutra-
lny”, bo jego całkowity ładunek jest równy zeru, to i tak
ma energię elektromagnetyczną (gdyż ma, na przykład,
różny od zera moment magnetyczny) i nie możemy
28.5. Neutron może czasami istnieć
jako proton otoczony „chmurą”
ujemnego mezonu n
proton
ujemny
mezon 7f
148
28. MASA ELEKTROMAGNETYCZNA
łatwo stwierdzić, jaki znak powinna mieć elektromagnetyczna różnica mas, bez szcze-
gółowej teorii struktury wewnętrznej nukleonu.
Chcielibyśmy tylko podkreślić tu następujące szczegóły: 1. teoria elektromagnetyczna
przewiduje istnienie masy elektromagnetycznej, ale jednocześnie jest to powodem, że teoria
ta się wali w gruzy, ponieważ nie można stworzyć teorii konsystentnej — sytuacja ta nie
zmienia się po wprowadzeniu poprawek kwantowych; 2. istnieją dowody doświadczalne
na istnienie masy elektromagnetycznej i 3. wszystkie te masy są z grubsza takie same jak
masa elektronu. Powracamy więc do pierwotnej koncepcji Lorentza — być może cała
masa elektronu jest czystą masą elektromagnetyczną, być może za to całe 0,511 MeV
odpowiada elektrodynamika. Tak, czy nie? Nie mamy teorii, a więc nie możemy na to
odpowiedzieć.
Należy wspomnieć o jeszcze jednej informacji doświadczalnej, która jest szczególnie
irytująca. Istnieje w świecie jeszcze inna cząstka, nazywana mionem lub mezonem p, która
na tyle, na ile potrafimy to stwierdzić, nie różni się w żaden sposób od elektronu, z wyjąt-
kiem masy. Działa ona pod każdym względem tak jak elektron: oddziałuje z neutrinami
i z polem elektromagnetycznym i nie ma sił jądrowych. Nie „robi” nic, co różniłoby się
od tego, co „robi” elektron, przynajmniej nie „robi” ona niczego takiego, co nie mogłoby
być zrozumiane jako konsekwencja jedynie jej większej masy (206,77 razy masa elektronu).
Dlatego też gdyby kiedyś ktoś znalazł wyjaśnienie natury masy elektronu, to pozostanie
mu do rozwiązania zagadka: skąd mion bierze swoją masę. Dlaczego? Ponieważ wszystko
to, co „robi” elektron, „robi” i mion, a więc powinno się otrzymać dla niego taką samą
masę, jak i dla elektronu. Są tacy, którzy wierzą niezłomnie w koncepcję, że mion i elektron
są jedną i tą samą cząstką, i że w ostatecznej teorii masy wzór na masę będzie równaniem
kwadratowym o dwóch pierwiastkach — po jednym dla każdej cząstki. Są też tacy, którzy
twierdzą, że będzie to równanie przestępne, z nieskończoną liczbą pierwiastków. Ci ostatni
zajmują się zgadywaniem, jakie muszą być masy innych cząstek tego nieskończonego
szeregu oraz zastanawiają się, dlaczego jeszcze tych cząstek nie odkryto.
28-6. Pole sił jądrowych
Chcielibyśmy zrobić jeszcze parę uwag dotyczących tej części masy, która nie jest
elektromagnetyczna. Skąd bierze się ta duża część masy? Poza elektrodynamiką są jeszcze
inne siły, np. siły jądrowe, które mają swoje własne teorie pola, chociaż nikt nie wie, czy
te istniejące obecnie teorie są prawdziwe. Teorie te również postulują istnienie energii
pola, która daje cząstkom jądra część masy, analogiczną do masy elektromagnetycznej ;
można by ją nazwać „masą pola tt-mezon owego”. Jest ona przypuszczalnie bardzo duża,
bo i siły tu są wielkie i możliwe jest, że pole mezonowe jest odpowiedzialne za masę cięż-
kich cząstek. Ale teorie pola mezonowego są wciąż jeszcze w stadium szczątkowym. Nawet
przy dobrze rozwiniętej teorii elektromagnetyzmu nie udało się nam poprawnie wytłuma-
czyć natury masy elektronu. Tymczasem wobec elektrodynamiki teoria mezonów jest
zaledwie pewną „próbą koncepcji”.
Warto poświęcić trochę czasu na przedstawienie w zarysie teorii mezonowej, ze względu
28-6. pole sił jądrowych
149
na jej interesujący związek z elektrodynamiką. W elektrodynamice pole może być opisane
przez czteropotencjał, który spełnia równanie
□2^„ = źródła.
przekonaliśmy się też, że pewne części pola mogą zostać wypromieniowane i będą istnieć
odseparowane od źródeł. Są to fotony i są one opisane przez równanie różniczkowe bez
źródeł :
□ %, = ().
Przypuszcza się, że pole sił jądrowych powinno także mieć swoje własne „fotony” —
byłyby to przypuszczalnie mezony zr — i że powinny one być opisane przez analogiczne
równanie różniczkowe. (Ze względu na niedoskonałość umysłu ludzkiego, nie potrafimy
wymyślić nic rzeczywiście nowego; dlatego musimy rozumować poprzez analogię z tym,
co już wiemy). Tak więc równanie dla mezonów mogłoby mieć postać
□ 2?> = 0,
gdzie (p mogłoby być jakimś innym czterowektorem, a może skalarem. Okazuje się, że pion
nie ma polaryzacji, a więc <p powinno być skalarem. Przy tym prostym równaniu D2ę> = 0
pole mezonowe zmieniałoby się z odległością od źródła jak 1/r2, identycznie jak się zmienia
pole elektryczne. Ale wiadomo, że siły jądrowe mają o wiele krótszy zasięg działania, a więc
to proste równanie odpada. Jest jeden sposób, w jaki można zmienić to równanie, nie
psując relatywistycznej niezmienniczości: możemy dodać lub odjąć od operatora d’Alem-
berta stałą pomnożoną przez ę>. Dlatego też Yukawa zasugerował, że swobodne kwanty
pola sił jądrowych mogłyby spełniać równanie
□ 2ę>—fjt2<p = 0, (28.17)
gdzie jz2 jest stałą, tzn. jakimś niezmienniczym skalarem. (Ponieważ n2 jest skalarnym
operatorem różniczkowym w czterech wymiarach, jego niezmienniczość nie ulegnie zmia-
nie, jeżeli dodamy doń inny skalar.)
Zobaczmy, jaka na podstawie równania (28.17) będzie siła jądrowa, w wypadku gdy
sytuacja nie zmienia się z czasem. Szukamy rozwiązania równania
V2ęs—(u2ę> = 0;
rozwiązanie to ma być sferycznie symetryczne względem jakiegoś punktowego źródła,
znajdującego się na przykład w początku układu. Jeżeli <p zależy tylko od r, to wiemy, że
1 d2
V <P =-^r(r<p)-
- . r dr
Mamy więc równanie
1 c2 ,
= o>
r dr2
czyh
a2
— (rtp) = fi2(np).
150
28. MASA ELEKTROMAGNETYCZNĄ
28.6. Potencjał Yukawy e~'"7r, porównany z po-
tencjałem Coulomba 1/r
Jeżeli przyjmiemy (r<p) za naszą zmień,
ną zależną, to otrzymamy równanie, któ.
re już wiele razy widzieliśmy. Jego roz-
wiązaniem jest
r<p = Ke±/2r.
Oczywiście, pole <p nie może się stać nie-
skończone dla dużych r, a więc odpada
znak + w funkcji wykładniczej. Roz-
wiązaniem więc jest
e"'"’
<p = K——. (28.18)
Funkcję tę nazywamy potencjałem Yuka-
wy. Dla siły przyciągającej K jest liczbą
ujemną, której wartość musi być tak do-
brana, aby pasowała do obserwowanych
doświadczalnie „natężeń” sił.
Potencjał Yukawy sił jądrowych zanika gwałtowniej niż 1/r ze względu na obecność
czynnika wykładniczego. Potencjał ten, a więc i siła, spada do zera o wiele gwałtowniej
niż 1/r dla odległości większych od l//t, tak jak to pokazano na rys 28.6. „Zasięg sił
jądrowych” jest dużo mniejszy od „zasięgu” sił elektrostatycznych. Doświadczalnie
stwierdzono, że siły jądrowe nie działają już na odległościach większych od około 10“13 cm,
tak że r= 1015 m-1.
Na koniec przyjrzyjmy się rozwiązaniu równania (28.17), mającemu postać fali swo-
bodnej. Jeżeli podstawimy
<p =
do równania (28.17), otrzymamy
ca2
—- —k2—p2 = 0.
c2 M
Wiążąc częstość z energią, a liczbę falową z pędem, tak jak robiliśmy to na końcu rozdz.
36 tomu I (cz. 2), otrzymujemy
E2
— ~p2 = p2n2,
c2
co oznacza, że „foton” Yukawy ma masę równą /z^/c. Korzystając z przybliżonej wa>-
tości na p, p ~ 10ls m-1, która odpowiada oberwowanemu zasięgowi sił jądrowych,
otrzymujemy masę 3-10-2s g, czyli 170 MeV, co z grubsza odpowiada obserwowanej
masie mezonu tt. Tak więc, przez analogię z elektrodynamiką, można by powiedzieć,
że mezon n jest „fotonem” pola sił jądrowych. Ale przechodząc od elektrodynamiki d°
zagadnienia sił jądrowych wprowadziliśmy pojęcia elektrodynamiki do rejonów, w któ-
rych pojęcia te mogą być już niesłuszne.
29
ruch ładunków w polach elektrycznych
i magnetycznych
29-1. Ruch w jednorodnym polu elektrycznym
lub w jednorodnym polu magnetycznym
Chcemy teraz opisać — głównie w sposób jakościowy — ruch ładunków w różnych
warunkach. Większość interesujących zjawisk, dotyczących ruchu ładunków w polach,
zachodzi dla bardzo złożonych sytuacji, przy wielu, wielu cząstkach wzajemnie z sobą
oddziałujących. Tak na przykład, gdy fala elektromagnetyczna przechodzi przez jakiś
ośrodek materialny lub przez plazmę, to całe miliardy cząstek oddziałują z falą i między
sobą. Takimi zagadnieniami*zajmiemy się później, na razie chcemy tylko omówić znacz-
nie prostsze zagadnienie ruchów pojedynczego ładunku w pewnym danym polu. Możemy
zatem pominąć działanie wszystkich innych cząstek, z wyjątkiem oczywiście tych ładun-
ków i prądów, które się tam gdzieś znajdują i wytwarzają pole, z jakim mamy do czynienia.
Jako pierwszy powinniśmy chyba rozpatrzyć ruch cząstki w jednorodnym polu elek-
trycznym. Przy małych prędkościach ten ruch nie jest szczególnie interesujący; jest to
Po prostu ruch jednostajnie przyspieszony z przyspieszeniem w kierunku pola. Skoro
jednak cząstka nabierze na tyle energii, aby się stać cząstką relatywistyczną, wówczas
ruch stanie się bardziej złożony. Ale znalezienie rozwiązania dla tego przypadku pozosta-
wimy już czytelnikowi.
Z kolei rozważmy ruch w jednorodnym polu magnetycznym gdy nie ma pola elektrycz-
nego. To zagadnienie już rozwiązaliśmy — jednym z rozwiązań jest ruch cząstki po okrę-
SU- Siła magnetyczna ęvxB jest zawsze prostopadła do kierunku ruchu, tak że wektor
^9ldt jest prostopadły do wektora p, a jego wartość bezwzględna wynosi vp[R, gdzie R
lest promieniem okręgu:
vp
F - qvB = —
152
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH
magnetycznym
29.2. Spektrometr pędu z polem jednorodnym,
dający ogniskowanie typu „t”; a) różne pędy,
b) różne kąty. Kierunek pola magnetycznego jest
prostopadły do płaszczyzny rysunku
(29.1)
’ Promień orbity kołowej jest więc równy
R = —
qB
To tylko jedno z możliwych rozwią.
; • zań. Jeżeli cząstka ma składową ruchu
wzdłuż kierunku pola, to składowej tej
odpowiada ruch jednostajny, ponieważ
siła magnetyczna nie może mieć różnej od
zera składowej w kierunku pola. Wypad-
kowy ruch cząstki w jednorodnym polu
magnetycznym składa się z ruchu ze stałą
prędkością równoległą do pola B i z ruchu
po okręgu, w płaszczyźnie prostopadłej
do pola B — tor tego ruchu jest spiralą
cylindryczną (rys. 29.1). Promień spirali
określa równanie (29.1), jeżeli zastąpić
w nim p przez , składową pędu pro-
stopadłą do pola.
29-2. Analiza pędu
Z jednorodnego pola magnetycznego
często korzysta się w „analizatorze pędu”
lub „spektrometrze pędu” dla naładowa-
nych cząstek wielkich energii. Przypuść-
my, że naładowane cząstki są „wstrzeli-
wane” do jednorodnego pola magnetycz-
nego w punkcie A na rys. 29.2a, przy
czym to pole magnetyczne jest prosto-
padłe do płaszczyzny rysunku. Każda
z tych cząstek wejdzie na orbitę, która
jest okręgiem o promieniu proporcjonal-
nym do pędu cząstki. Jeżeli wszystkie
cząstki wchodzą prostopadle do krawędzi
pola, to opuszczą one pole w odległości x
(od punktu A), proporcjonalnej do ich
pędu p. Licznik umieszczony w pewnym
punkcie, np. w punkcie C, będzie rejestro-
wał tylko te cząstki, których pęd różni
się od pędu p = qBx!2 o pewną wielkość
zl/>.
^ff-2. ANALIZA PĘDU
153
Oczywiście, cząstki nie muszą dokonywać obiegu aż o 180°, zanim zostaną policzone,
ale tzw. „spektrometr tt” ma pewną specjalną własność. Mianowicie, nie jest konieczne,
aby cząstki wchodziły pod kątem prostym do krawędzi pola. Na rysunku 29.2b pokazano
tory trzech cząstek, wszystkich o tej samej wartości bezwzględnej pędu, ale wchodzących
do pola pod różnymi kątami. Widać, że cząstki przebiegają po różnych torach, ale wszyst-
kie opuszczają pole bardzo blisko punktu C. Mówimy, że punkt C jest „ogniskiem”.
Zaletą takiej własności ogniskowania jest możliwość dopuszczenia w punkcie A większe-
go przedziału kątów, chociaż zwykle narzuca się pewne ograniczenie, tak jak to poka-
zano na rysunku. Taka większa tolerancja kątowa oznacza zwykle, że w danym czasie
rejestruje się więcej cząstek, co skraca czas potrzebny dla danego pomiaru.
Zmieniając pole magnetyczne lub przesuwając licznik wzdłuż kierunku x albo pokry-
wając zakres zmienności x wieloma licznikami można mierzyć „widmo” pędu w wiązce
wejściowej. (Przez „widmo pędu” f(p) rozumie się, że liczba cząstek o pędach pomiędzy
p a (p+dp) jest równa j'(p) dp.] Tego typu pomiary były wykonywane na przykład do
określenia rozkładu energii w rozpadzie fi różnych jąder.
Jest wiele innych typów spektrometrów pędu, ale opiszemy jeszcze tylko jeden, dla
którego dopuszczalny kąt bryłowy jest szczególnie duży. Zasada działania tego spektro-
metru opiera się na ruchu cząstek po spiralnych orbitach w polu jednorodnym, takim jak
na przykład na rys. 29.1. Wyobraźmy sobie układ współrzędnych cylindrycznych —
q, 6, z — obrany tak, że oś z pokrywa się z kierunkiem pola. Jeżeli cząstka jest emitowana
z początku układu, pod pewnym kątem a względem osi z, to będzie się ona poruszała
po spirali o równaniu
g = a sinkz, 0 = bz,
gdzie a, b i k są parametrami, które można łatwo wyrazić poprzezp, a i pole magnetyczne
Jeżeli zrobilibyśmy wykres odległości q od osi jako funkcji z dla jednego pędu, ale dla
kilku różnych kątów a, otrzymalibyśmy krzywe narysowane na rys. 29.3 linią ciągłą.
(Pamiętajmy, że są to po prostu rzuty torów spiralnych). Gdy kąt pomiędzy osią, a kierun-
kiem wstrzelenia cząstki jest większy, to maksymalna wartość q jest duża, ale za to po-
dłużna składowa prędkości jest mniejsza, tak że tory dla różnych kątów dążą do „zogni-
skowania się” w pobliżu punktu A na rysunku. Jeżeli w punkcie A ustawić wąską szcze-
linę, to cząstki o pewnej rozpiętości kątów początkowych mogą przejść przez tę szczelinę
i dojść do osi, gdzie są one zliczone przez
długi detektor D.
Cząstki, które opuszczają źródło w po-
czątku układu z większym pędem, ale pod tymi
samymi kątami, przebiegają wzdłuż linii prze-
rwanej i nie przedostają się przez szczelinę
w Punkcie A. Tak więc aparatura wybiera mały
Przedział pędów. Zaletą tego spektrometru
nad spektrometrem opisanym poprzednio jest
to> że szczelinę A — a także szczelinę A' —
^°żna sporządzić w kształcie pierścienia
reJestrować cząstki, które opuszczają źródło
154
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH
29.4. Eliptyczna cewka z takimi samymi prądami
w każdym osiowym przedziale <4x wytwarza
wewnątrz jednorodne pole magnetyczne
w pewnym kącie bryłowym. Można więc
wykorzystać dużą część cząstek wycho-
dzących ze źródła; jest to cenna zaleta
w przypadku słabych źródeł lub bardzo
dokładnych pomiarów.
Za tę zaletę trzeba zapłacić jednak
pewną cenę, ponieważ taka aparatura
wymaga jednorodnego pola magnetycz-
nego o dużej „objętości”, a to jest zwyk-
le opłacalne tylko dla cząstek o małej
energii. Pamiętamy, że jeden ze sposobów
utworzenia jednorodnego pola polega
na nawinięciu cewki na kuli, tak aby
gęstość prądu na powierzchni tej kuli
była proporcjonalna do sinusa kąta.
Można pokazać, że to samo zachodzi dla elipsoidy obrotowej. Dlatego też takie spek-
trometry często się robi w ten sposób, że nawija się eliptyczną cewkę na drewnianej
(albo aluminiowej) ramie. Wymagane jest tylko, aby prąd w każdym przedziale osi, z1x,
był taki sam, tak jak to pokazano na rys. 29.4.
29-3. Soczewka elektrostatyczna
Ogniskowanie cząstek ma wiele zastosowań. Tak na przykład, elektrony wylatujące
z katody lampy obrazowej w telewizorze są ogniskowane na ekianie, tak aby utworzyły
małą plamkę. W tym wypadku chcemy zebrać w małą plamkę elektrony, charakteryzujące
się tąką samą energią początkową, ale różnymi kątami początkowymi. Zagadnienie to jest
podobne do zagadnienia ogniskowania światła za pomocą soczewek, dlatego też urządze-
nia, które spełniają podobne zadanie w stosunku do cząstek, także się nazywają soczew-
kami.
Wygląd takiej soczewki elektronowej schematycznie przedstawia rys. 29.5. Jest to
„soczewka elektrostatyczna”, której działanie zależy od pola elektrycznego pomiędzy
dwiema leżącymi obok siebie elektrodami. Jej działanie można zrozumieć, jeżeli zasta-
nowić się, co się dzieje z równoległą wiązką elektronów, która wpada do soczewki z lewej
strony. Gdy elektrony przybywają do otoczenia punktu a, doznają działania siły o składo-
wej „bocznej” i uzyskują pewien impuls, który ugina elektrony w kierunku osi. Można by
się spodziewać, że te elektrony uzyskują taki sam co do wielkości, ale przeciwnie skiero-
wany impuls w otoczeniu punktu b, ale tak nie jest. Przez ten czas, w którym elektrony
docierają do punktu b, uzyskują one pewną energię, a więc pozostają w otoczeniu punktu b
krócej. Siły są takie same, ale czas ich działania jest krótszy, a więc impuls jest mniejszy-
Elektrony przechodząc przez otoczenie punktów a i b uzyskują pewien wypadkowy impu^s
w kierunku osi i zostają ugięte w kierunku pewnego wspólnego punktu. Opuszczają
obszar, w którym jest wysokie napięcie, cząstki doznają następnego „prztyczka” w k16*
29-3 SOCZEWKA ELEKTROSTATYCZNA
155
29.5. Soczewka elektrostatyczna. Pokazane linie pola są „liniami sił”, to znaczy liniami ęE
runku osi. Siła w otoczeniu punktu c
działa „na zewnątrz”, a w okolicy pun-
ktu d „do wnętrza”, ale cząstki przeby-
wają dłużej w tym drugim obszarze i uzy-
skują znowu wypadkowy impuls. Dla
niezbyt dużych odległości od osi całko-
wity impuls, po przebyciu soczewki, jest
proporcjonalny do odległości od osi (czy
potraficie wytłumaczyć, dlaczego tak jest?)
i to, jest właśnie niezbędny warunek dla
ogniskowania za pomocą soczewek.
Przeprowadzając takie samo rozu-
mowanie, można pokazać, że ogniskowa-
nie nastąpi, jeżeli elektroda środkowa
będzie dodatnia lub ujemna względem
pozostałych dwóch. Tego typu soczewki
elektrostatyczne są powszechnie używane
w elektronowych lampach katodowych i w
niektórych mikroskopach elektronowych.
29-4. Soczewka magnetyczna
Innym typem soczewki — często spo-
tykanym w mikroskopach elektronowych
~~ jest soczewka magnetyczna, której
schemat widzimy na rys. 29.6. Jest to ele-
ktromagnes o symetrii walcowej z bardzo
Clenkimi, kolistymi nabiegunnikami, które
Wytwarzają w małym obszarze nieje-
dnorodne pole o dużym natężeniu. Ele-
r°ny, które wchodzą do tego obszaru
29.6. Soczewka magnetyczna
156
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH
w kierunku pionowym, są ogniskowane. Działanie takiej soczewki można zrozu-
mieć po przyjrzeniu się powiększonemu obrazowi obszaru pomiędzy nabiegunnikamj
przedstawionemu na rys. 29.7. Rozważmy dwa elektrony a i b, które opuszczają źródło 5
pod pewnymi kątami względem osi. Gdy elektron a osiąga początek pola, zostaje odchy-
lony od nas (w głąb rysunku) przez składową poziomą pola. Ale wówczas elektron będzie
miał składową ,,boczną” prędkości, tak że gdy przejdzie on przez silne pole, mające skła-
dową pionową, otrzyma impuls w kierunku osi. Jego „boczny” ruch zostaje zatrzymany
przez siłę magnetyczną, w momencie gdy elektron opuszcza pole, a więc wypadkowy efekt
składa się z impulsu w kierunku osi i z „obrotu” wokół osi. Wszystkie siły, które działają
na cząstkę b, są skierowane przeciwnie, a więc zostanie ona również odchylona w kie-
runku osi. Z rysunku widać, że rozbieżne elektrony zostają uformowane w wiązkę równo-
ległą. Działanie soczewki magnetycznej podobne jest do działania soczewki optycznej,
z obiektem ustawionym w jej ognisku. Jeżeli za taką soczewką ustawić drugą, podobną
soczewkę magnetyczną, to elektrony zostaną zogniskowane z powrotem w jednym punkcie,
dając obraz źródła S.
29-5. Mikroskop elektronowy** 1
Wiemy, że mikroskop elektronowy może „widzieć” obiekty, które są za małe, aby
można je było oglądać przez mikroskopy optyczne. W rozdziale 30 tomu I (cz. 2) omó-
wiliśmy podstawowe ograniczenia dotyczące każdego układu optycznego, a pochodzące
od dyfrakcji na otworze obiektywu. Jeżeli otwór obiektywu wybiera z wiązki wychodzącej
ze źródła część o kącie rozwarcia 20 (patrz rys. 29.8), to dwóch sąsiednich punktów w źródle
nie będzie można zobaczyć jako oddzielonych obiektów, jeżeli są one zbliżone bardziej
niż o
2
gdzie 2 jest długością fali światła. W najlepszych mikroskopach optycznych kąt 6 jest
bliski teoretycznej granicy 90°, tak że <5 jest prawie równa długości 2, czyli w przybliżeniu
5000 A.
To samo ograniczenie stosuje się do mikroskopu elektronowego, ale w tym wypadku
długość fali jest równa — dla elektronów o energii 50 MeV — około 0,05 A. Jeżeliby się
udało użyć obiektywu z kątem apertury wejściowej bliskim 30°, można by zobaczyć
obiekty od siebie odległe zaledwie o 1 A. Ponieważ atomy w cząsteczkach są zwykle od-
ległe od siebie o 1 lub 2 A, moglibyśmy otrzymać fotografię cząsteczek. Jakże ułatwiłoby
to życie biologom — mielibyśmy fotografię nawet struktury kwasu dezoksyrybonukleino-
wego **'. Jakaż by to była wspaniała rzecz! Większość obecnych badań w biologii mole-
kularnej ma na celu znalezienie kształtów złożonych cząstek organicznych. Gdybyśmy
tylko mogli je zobaczyć!
’ Porównaj: Tom I, cz. 2, rozdz. 30 (Dyfrakcja).
1 Porównaj: Tom I, cz. 1, str. 55. (Przyp. red. wyd. potakiafo).
nr-
29-5. MIKROSKOP ELEKTRONOWY
157
Niestety, najlepsza zdolność rozdzielcza, ja-
ką uzyskano w mikroskopie elektronowym, wy-
nosi około 20 A. Powodem tego jest fakt, że ni-
komu się jeszcze nie udało skonstruować socze-
wki z dużym otworem obiektywu. Wszystkie
soczewki mają „aberrację sferyczną”, co oznacza,
że promienie tworzące dużę kąty z osią mają
inne ogniska niż promienie bliższe osi, tak
jak to pokazano na rys. 29.9. Przy użyciu spe-
cjalnych metod technicznych można skonstruo-
wać soczewki mikroskopów optycznych o aber-
racji sferycznej możliwej do pominięcia, ale niko-
mu się jeszcze nie udało zrobić soczewki elektro-
nowej pozbawionej aberracji sferycznej.
Istotnie, można pokazać, że opisane przez
nas typy soczewek elektrostatycznych lub mag-
netycznych muszą mieć pewną, nie dającą się
usunąć, aberrację sferyczną. Ta aberracja —
wraz z dyfrakcją — ogranicza zdolność rozdziel-
czą mikroskopów elektronowych do jej obec-
nej wartości.
Wspomniane ograniczenia nie dotyczą pól
elektrycznych i magnetycznych, które nie mają
symetrii osiowej albo które nie są stałe w czasie.
Może pewnego dnia ktoś wymyśli nowy typ
soczewki elektronowej, która pozwoli prze-
zwyciężyć tę nieodłączną aberrację prostej so-
czewki elektronowej. Wówczas będzie można
bezpośrednio fotografować atomy. Być może, analiza składników chemicznych będzie
polegała kiedyś na obserwacji położeń atomów, a nie na przypatrywaniu się kolorowi
jakiegoś osadu!
29.8. Zdolność rozdzielcza mikroskopu
jest ograniczona przez kąt, pod jakim
widać otwór obiektywu ze źródła
29.9. Aberracja sferyczna soczewki
29-6. Pola prowadzące w akceleratorze
Pól magnetycznych używa się także do wytworzenia odpowiednich torów cząstek
w akceleratorze cząstek wielkich energii. W urządzeniach takich jak cyklotron i syn-
^hrotron cząstki uzyskują wielkie energie, przechodząc raz po raz przez silne pole
elektryczne. Cząstki są utrzymywane w swoich cyklicznych orbitach przez pole ma-
gnetyczne.
Widzieliśmy, że w jednorodnym polu magnetycznym cząstka porusza się po orbicie
dołowej. Jest to jednak prawdą tylko dla pola doskonale jednorodnego. Wyobraźmy
s°bie pole B, które jest w przybliżeniu jednorodne na dużym obszarze, ale które w pewnej
158
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH
29.10. Ruch cząstki w polu lekko nie-
jednorodnym
części tego obszaru jest nieco silniejsze niż
gdzie indziej. Jeżeli do takiego pola wprowa-
dzić cząstkę o pędzie p, będzie się ona po-
ruszać po orbicie prawie kołowej, o promieniu
2? = pjqB. Promień krzywizny będzie jednak
nieco mniejszy w obszarze, gdzie pole magne-
tyczne jest silniejsze. Orbita nie będzie okręgiem
zamkniętym, ale będzie ona „spacerować” przez
pole, tak jak to pokazano na rys. 29.10. Jeżeli
się zechce, można uważać, że niewielki „błąd”
w polu wytwarza dodatkowy „prztyczek”, który
przesuwa cząstkę na nowy tor. Jeżeli cząstki mają
dokonać milionów obiegów w akceleratorze,
potrzebny jest jakiś rodzaj „radialnego ogniskowania”, które będzie dążyło do utrzymania
torów cząstek w pobliżu pewnej określonej orbity.
Innym kłopotem, związanym z polem jednorodnym, jest to, że cząstki nie pozostają
w jednej płaszczyźnie. Jeżeli startują one odchylone od płaszczyzny o nawet najmniejszy
kąt — lub zostają odchylone o niewielki kąt przez jakąś nieregularność w polu — to będą
one przebiegały po torze spiralnym, który w końcu zaprowadzi je na biegun magnesu
albo na górną ściankę lub na dno zbiornika próżniowego. Należy coś zrobić, aby zapobiec
takim pionowym wędrówkom; pole musi dostarczać oprócz ogniskowania radialnego
także i „ogniskowanie pionowe”.
Można się od razu domyślić, że ogniskowanie radialne powinno się uzyskać stwarzając
pole magnetyczne, które rośnie ze wzrostem odległości od środka zaprojektowanej orbity.
Jeżeli cząstka przysunie się na orbitę o za dużym promieniu, to znajdzie się w silniejszym
polu, które ugnie ją z powrotem w kierunku orbity o właściwym promieniu. Jeżeli cząstka
wejdzie na orbitę o małym promieniu, to uginające działanie pola magnetycznego będzie
mniejsze i cząstka powróci na zadaną orbitę. Jeżeli cząstka oddali się choć raz od stycznej
do idealnego koła, to będzie oscylować wokół idealnej orbity kołowej, tak jak to poka-
zano na rys. 29.1 la. Dzięki radialnemu ogniskowaniu cząstki będą się utrzymywać w po-
bliżu orbity kołowej.
W rzeczywistości ogniskowanie radialne może też zachodzić nawet przy maleniu pola
wraz ze wzrostem promieni. Może się to zdarzyć w wypadku, gdy wzrost promienia
krzywizny toru nie jest „szybszy” od wzrostu odległości cząstki od środka pola. Orbity
cząstek będą wyglądały jak na rys. 29.1 Ib. Jeżeli jednak gradient malejącego pola jest
zbyt duży, cząstki nie powracają na orbity o danym z góry promieniu, lecz będą się spi-
ralnie zaginały do wewnątrz lub odginały na zewnątrz, tak jak to pokazano na rys. 29.1 lc-
Zwykle wzrost pola opisujemy poprzez „względny gradient” lub wskaźnik pola, n:
n =
dB/B
dr/r
(29.2)
Pole prowadzące daje ogniskowanie radialne, jeżeli jego względny gradient jest większy
niż — 1.
29-6. POLA PROWADZĄCE W AKCELERATORZE
159
29.11. Ruch radialny cząstki w polu magnetycznym a) szybko wzrastającym wraz z promieniem r, b) wolno
malejącym wraz z promieniem r, c) szybko malejącym wraz z promieniem r
Radialny gradient pola będzie także wytwarzał pionowe siły działające na cząstkę.
Przypuśćmy, że mamy pole, które jest silniejsze w pobliżu środka orbity, a słabsze na
większych odległościach. Przekrój pionowy magnesu płaszczyzną prostopadłą do płasz-
czyzny orbity może wyglądać jak na rys. 29.12. (Dla protonów orbity „wychodzą” w kie-
runku patrzącego z płaszczyzny rysunku.) Jeżeli pole ma być silniejsze po lewej stronie,
a słabsze po prawej, to linie sił pola magnetycznego muszą być zakrzywione, tak jak to
pokazano na rysunku. Wynika to z prawa, że rotacja z pola B jest równa zeru w prze-
strzeni swobodnej. Jeżeli obrać współrzędne tak, jak to pokazano na rysunku, to wówczas
SBX SB,
(V xB) = —-±--2. = 0,
y Sz Sx
czyli
SBX
Sz
Ponieważ zakładamy, że SBJSx jest
ujemne, musi istnieć równa mu ujemna
wielkość SBJSz. Jeżeli „symboliczna”
Płaszczyzna orbit jest płaszczyzną symetrii,
dla której Bx = 0, składowa radialna Bx
będzie ujemna nad, a dodatnia pod pła-
SZczyzną, czyli linie muszą być zakrzy-
wione, tak jak to pokazano.
29.12. Pionowe pole prowadzące, widziane w prze-
kroju prostopadłym do płaszczyzny orbit
160
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH
Takie pole będzie miało własności ogniskowania pionowego. Wyobraźmy sobie pro-
ton, który przebiega bardziej lub mniej równolegle do płaszczyzny orbity głównej, ale
ponad nią. Składowa pozioma pola B wywrze na ten proton siłę, skierowaną w dół. Jeżeli
proton się znajduje poniżej głównej orbity, ta siła ma przeciwny zwrot. Istnieje więc
efektywna „siła porządkująca” w kierunku głównej orbity. Z naszych rozważań wynika,
że ogniskowanie będzie pionowe, jeżeli pionowa składowa pola będzie maleć ze wzrostem
promienia; jeżeli natomiast gradient pola będzie dodatni, to pojawi się „pionowe rozognisko-
wanie”. Tak więc dla ogniskowania pionowego wskaźnik pola musi być mniejszy od zera.
Powyżej znaleźliśmy, że dla ogniskowania radialnego n musi być większe od —1. Oba
te warunki dają wspólnie warunek:
-1 < n < 0,
jeżeli cząstki mają być utrzymane na stałych orbitach. W cyklotronach stosuje się wartości n
bardzo bliskie zera, w betatronach i synchrotronach używa się zazwyczaj n — —0,6.
29-7. Ogniskowanie metodą zmiennego gradientu
Takie małe wartości n dają raczej „słabe” ogniskowanie. Widać jasno, że o wiele bar-
dziej efektywne ogniskowanie radialne otrzymałoby się dla dużego gradientu dodat-
niego (n > 1), ale wówczas siły pionowe powodowałyby silne rozogniskowanie. Podobnie,
duży ujemny wzrost pola (n < —1) dawałby znaczne siły w kierunku pionowym, ale po-
wodowałby rozogniskowanie radialne. Jednakże około 10 lat temu przekonano się, że siła,
która powoduje na przemian silne ogniskowanie i silne rozogniskowanie, może dać
-wypadkowy efekt ogniskujący.
29.13. Soczewka kwadrupolowa ogniskująca
poziomo
29.14. Soczewka kwadrupolowa ogniskująca
pionowo
29-7. OGNISKOWANIE METODĄ ZMIENNEGO GRADIENTU
161
29.15- Ogniskowanie poziome i pionowe za pomocą pary soczewek kwadrupolowych
Aby wyjaśnić, jak działa metoda ogniskowania zmiennym gradientem, opiszemy naj-
pierw działanie soczewki kwadrupolowej, która pracuje na tej samej zasadzie. Wyobraźmy
sobie, że do pola z rys. 29.12 dodajemy jednorodne, ujemne pole magnetyczne, którego
natężenie jest tak dobrane, aby pole przy orbicie było równe zeru. Wypadkowe poje —
dla małych odległości „od neutralnego punktu” — wygląda tak, jak pole na rys. 29.13.
Taki czterobiegunowy magnes nazywamy „soczewką kwadrupolową”. Cząstka dodatnia,
która wchodzi do soczewki (od strony czytającego) odchylona na prawo lub na lewo od
środka, zostaje przesunięta z powrotem w kierunku środka. Jeżeli cząstka wpada powy-
żej lub poniżej punktu neutralnego, zostaje odsunięta od środka. To jest soczewka ognis-
kująca poziomo. Jeżeli zmienić znak poziomego gradientu — co można zrobić zmieniając
znaki wszystkich biegunów — znaki wszystkich sił ulegają zmianie, i otrzymujemy so-
czewkę ogniskującą pionowo, tak jak na rys. 29.14. Natężenie pola w takich soczew-
kach, a więc i siły ogniskujące, rosną liniowo z odległością soczewki od osi.
Wyobraźmy sobie teraz, że ustawimy takie dwie soczewki, jedną za drugą. Jeżeli
cząstka wchodzi z pewnym poziomym odchyleniem od osi, tak jak to pokazano na
rys. 29.15a, to zostanie ona odchylona w kierunku osi w pierwszej soczewce. Gdy cząstka
przybywa od drugiej soczewki, jest już ona bliżej osi, tak że siła działająca na nią na zew-
nątrz jest mniejsza, a więc i odchylenie na zewnątrz jest mniejsze. W efekcie cząstka zo-
staje ugięta w stronę osi; średni efekt daje ogniskowanie poziome. Z drugiej strony, jeżeli
Przyjrzeć się cząstce, która wchodzi odchylona w kierunku pionowym od osi, to jej tor
będzie wyglądał tak, jak na rys. 29.15b. Cząstka jest najpierw odchylona od osi, ale wów-
czas przybywa do drugiej soczewki z większym przesunięciem, doznaje działania większej
S1fy, tak że zostaje ugięta w stronę osi. I tym razem wypadkowy efekt jest ogniskujący.
Tak więc para soczewek kwadrupolowych działa zarówno dla ruchu w kierunku pozio-
mym, jak i dla ruchu w kierunku pionowym — w sposób bardzo zbliżony do tego,
w jaki działa soczewka optyczna. Soczewek kwadrupolowych używa się do formowania
1 kontrolowania wiązek cząstek w bardzo podobny sposób, w jaki soczewki optyczne
s4 używane dla wiązek świetlnych.
Powinniśmy zaznaczyć, że układ ze zmiennym gradientem nie zawsze daje ognisko-
wanie. Jeżeli gradienty są za duże (w stosunku do pędu cząstek lub do odstępu pomiędzy
~~ Wykłady z fizyki
162
29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH 1 MAGNETYCZNYCH
29.16. Wahadło zamocowane na drga-
jącym czopie może mieć położenie
równowagi, w którym ciężarek wa-
hadła znajduje się ponad czopem
29.17. Przyspieszenie „w dół” czopa
powoduje przesunięcie się wahadła
w kierunku pionu
soczewkami), wypadkowy efekt może być rozogniskujący. Można zobaczyć, jak cos
takiego mogłoby się wydarzyć, jeżeli wyobrazimy sobie, że odstęp pomiędzy dwoma so-
czewkami z rys. 29.15 zostałby powiększony, np. trzy lub cztery razy.
Powróćmy do prowadzącego magnesu synchrotronu. Możemy uważać, że składa się
on z przemiennego ciągu „dodatnich” i „ujemnych” soczewek, z nałożonym na nie jedno-
rodnym polem magnetycznym. To jednorodne pole ma na celu naginać cząstki do
kolistej orbity poziomej (nie wpływając na ruch pionowy), a soczewki o „znakach” prze-
miennych działają na wszystkie cząstki, które mogłyby zmylić drogę — spychając je zawsze
w kierunku głównej orbity (statystycznie rzecz biorąc).
Istnieje ładna analogia mechaniczna, która pokazuje, jak siła, która kolejno się zmie-
nia pomiędzy siłą „ogniskującą”, a siłą „rozogniskującą”, może mieć wypadkowy wynik
„ogniskujący”. Wyobraźmy sobie wahadło mechaniczne, składające się ze sztywnej sztabki,
zakończonej jakimś ciężarkiem. Sztabka ta jest zawieszona na czopie, który może byc
gwałtownie poruszany w górę i w dół przez korbę napędzaną silnikiem. Takie wahadło
ma dwa położenia równowagi. Oprócz normalnego położenia równowagi, z ciężarkiem
zwisającym w dół, wahadło znajduje się także w równowadze „wisząc do góry” — z cię-
żarkiem nad czopem! Takie wahadło przedstawia rys. 29.16.
Z opisanej powyżej analogii mechanicznej widać, że pionowy ruch czopa jest równo-
ważny zmniejszającej się sile ogniskującej. Gdy czop uzyskuje przyspieszenie w dół, cię-
żarek dąży do przesunięcia się do wewnątrz, tak jak to zaznaczono na rys. 29.17. Gdy
czop uzyskuje przyspieszenie do góry, sytuacja się zmienia na przeciwną. Siła skierowu-
jąca ciężarek w stronę osi zmienia się co chwilę, ale wypadkowym efektem jest siła w kie-
rr
29-7. OGNISKOWANIE METODĄ ZMIENNEGO GRADIENTU 163
runku osi. Tak więc wahadło będzie się wahać tam i z powrotem wokół neutralnego po-
łożenia, które jest akurat przeciwne do „normalnego” położenia równowagi.
Oczywiście, można utrzymać wahadło ciężarkiem ku górze w o wiele łatwiejszy sposób,
a mianowicie balansując nim na palcu. Ale niech ktoś spróbuje balansować dwoma nie-
zależnymi od siebie laskami na jednym palcu\ Albo jedną laską, ale mając zamknięte oczy!
Takie balansowanie wprowadza od razu poprawkę, jeżeli coś idzie nie tak, jak trzeba.
Ale jak wprowadzić takie poprawki w przypadku ogólnym, kiedy kilka rzeczy jedno-
cześnie „nie idzie” tak jak trzeba? W synchrotronie są miliardy cząstek, biegnących razem
dookoła, z których każda może wystartować z różnym „błędem”. Ten rodzaj ogniskowa-
nia, który opisaliśmy, działa na każdą z tych cząstek.
29-8. Ruch w skrzyżowanych polach elektrycznych i magnetycznych
Dotychczas mówiliśmy o cząstkach znajdujących się albo tylko w polach elektrycz-
nych, albo tylko w polach magnetycznych. Jeżeli wystąpią jednocześnie oba rodzaje pól,
powstaje kilka interesujących zjawisk. Przypuśćmy, że mamy jednorodne pole magne-
tyczne B i prostopadłe doń pole elektryczne E. Cząstki, których prędkości początkowe
będą prostopadłe do pola B, będą się poruszać po krzywej przedstawionej na rys. 29.18.
(Jest to krzywa plaska, a nie spirala!) Taki ruch potrafimy opisać jakościowo. Cząstka
(załóżmy, że dodatnia), poruszająca się w kierunku pola E, zwiększa swoją prędkość i dla-
tego też jest mniej odchylana przez pole magnetyczne. Gdy porusza się ona „pod prąd”
pola E, traci prędkość i jest coraz bardziej odchylana przez pole magnetyczne. W wypad-
kowym efekcie cząstka uzyskuje średni „dryf” w kierunku ExB.
Można w istocie pokazać, że ten ruch jest superpozycją jednostajnego ruchu po okręgu
i ruchu jednostajnego „w bok” z prędkością vd = EiB — tor na rys. 29.18 jest cykloidą.
Wyobraźmy sobie pewnego obserwatora, który się porusza na prawo, ze stałą prędkością.
W jego układzie odniesienia nasze pole magnetyczne zostaje przetransportowane na nowe
pole magnetyczne plus pewne pole elektryczne, skierowane w dól. Jeżeli obserwator się
porusza z odpowiednią prędkością, jego całkowite pole elektryczne będzie równe zeru
i obserwator zobaczy elektron poruszający się po okręgu. Tak więc oglądany przez nas
ruch jest sumą ruchu po okręgu i translacji
z prędkością „dryfu” vd = E/B. Ruch elektro-
nów w skrzyżowanych polach elektrycznych
1 magnetycznych stanowi podstawę działania
lamp magnetycznych, oscylatorów używanych
d° generacji fal ultrakrótkich.
Jest wiele innych, interesujących przykła-
dów ruchów cząstek w polach elektrycznych
1 magnetycznych — takich jak orbity elektro-
nów i protonów uwięzionych w pasach Van
Allena — ale niestety, nie mamy czasu, aby
S|? tutaj nimi zająć.
29.18. Tor cząstki w skrzyżowanych polach:
elektrycznym i magnetycznym
30
wewnętrzna geometria kryształów
30-1. Wewnętrzna geometria kryształów*)
Zakończyliśmy omawianie podstawowych praw elektryczności i magnetyzmu i chcemy
się teraz zająć elektromagnetycznymi własnościami materii. Zaczynamy od opisu ciał
stałych, tzn. kryształów. Gdy ruch atomów materii jest raczej ograniczony, skupiają się
one razem i układają się w konfiguracje o możliwie jak najmniejszej energii. Jeżeli atomy
w pewnym miejscu znalazły sieć, która zdaje się być siecią o niskiej energii, atomy znaj-
dujące się gdzie indziej ułożą się prawdopodobnie w ten sam sposób. Z tych powodów
w ciele stałym mamy powtarzającą się sieć atomów.
Innymi słowy, warunki w krysztale są następujące: Otoczenie poszczególnego atomu
w krysztale ma pewne uporządkowanie i jeżeli się przyjrzeć atomowi tego samego ro-
dzaju, znajdującemu się w innym miejscu przesuniętym nieco w przód, to znajdzie się taki
atom, którego otoczenie będzie dokładnie takie samo. Jeżeliby wybrać atom przesunięty
dalej w przód o taką samą odległość, to jeszcze raz się znajdzie dokładnie takie same
warunki. Sieć powtarza się ciągle i ciągle — i oczywiście w trzech wymiarach.
Wyobraźmy sobie problem zaprojektowania tapety — czy też materiału lub jakiegoś
wzoru geometrycznego na płaszczyźnie — w której powinien występować element wzoru,
który się powtarza, powtarza i powtarza, tak że powierzchnię można uczynić tak dużą,
jak się chce. Jest to dwuwymiarowy odpowiednik problemu, jaki kryształ „rozwiązuje
w trzech wymiarach. Tak na przykład na rys. 30.1a widzimy pospolity typ wzoru tapety-
Mamy tu pojedynczy element powtarzający się w sieci, która może się rozciągać bez
końca. Własności geometryczne tego wzoru tapety, dotyczące tylko jego własności powta-
rzania się, a nie mające nic wspólnego z geometrią samego obiektu lub jego stroną arty-
1 Porównąj C. Kittel, Wstęp do fizyki ciała stałego, PWN, Warszawa 1970. (Przyp. tłum.)
30-1. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
165
30.1. Model sieci dwuwymiarowej, złożonej
z powtarzającego się elementu
styczną, pokazano na rys. 30. Ib. Jeżeli zacząć od dowolnego punktu, można znaleźć
odpowiadający mu punkt przesuwając się o odległos'ć a w kierunku strzałki 1. Można się
również dostać do innego odpowiadającego mu punktu, jeżeli się przesunąć o odległość b
w kierunku drugiej strzałki. Oczywiście, jest wiele innych kierunków. Można na przykład
przejść od punktu a do punktu fi i osiągnąć położenie odpowiadające, ale taki „krok”
można rozpatrywać jako złożenie „kroku” wzdłuż kierunku 1, a następnie „kroku” wzdłuż
kierunku 2. Jedną z podstawowych własności sieci można opisać podając dwa najkrótsze
kroki do sąsiednich, jednakowych położeń. Przez „jednakowe” położenia rozumiemy takie
położenia, że gdyby ktoś stanął w którymkolwiek z nich i rozejrzałby się wokół siebie,
to zobaczyłby dokładnie to samo, co widziałby stojąc w innym z tych „położeń jedna-
kowych”. Jest to podstawowa własność kryształu. Jedyną różnicą jest to, że kryształ ma
uporządkowanie trójwymiarowe, a nie dwuwymiarowe; oczywiście, zamiast kwiatków
każdy element siatki stanowi pewien typ uporządkowania atomów — np. sześć atomów
wodoru i dwa atomy węgla — w formie pewnego wzoru. Sieć atomów w krysztale można
znaleźć doświadczalnie, rozpraszając na nim promienie Róntgena. Poprzednio wspomnie-
liśmy pokrótce o tej metodzie i nie powiemy
teraz już niczego więcej; dodajmy jedynie, że
dokładne uporządkowanie atomów w prze-
strzeni zostało znalezione dla większości pro-
stych kryształów oraz dla niektórych kry-
ształów dość złożonych.
Wewnętrzna struktura sieciowa kryszta-
łów ujawnia się na wiele sposobów. Po pierw-
sze, siły wiązania atomów są zwykle większe
w pewnych kierunkach niż w innych. Ozna-
cza to, że w krysztale są pewne płaszczyzny,
wzdłuż których kryształy można łatwiej
przełamać niż wzdłuż innych. Nazywamy
je płaszczyznami łupliwości. Jeżeli rozłupać
kryształ nożem, to często rozszczepi się on
wzdłuż takiej płaszczyzny. Po drugie, struk-
tura wewnętrzna często się odzwierciedla
w wyglądzie powierzchni kryształu, ze względu
na sposób, w jaki kryształ się uformował. Wy-
obraźmy sobie kryształ wytrącający się z roz-
tworu. W roztworze znajdują się atomy
„pływające” w różnych kierunkach. Atomy te
w końcu się osadzają, gdy znajdują jakieś
Położenie o najmniejszej energii. (To tak jakby
taPeta powstawała z kwiatków, poruszają-
cych się dopóty w różnych kierunkach, dopóki
Jeden z nich nie dotrze przypadkowo do
właściwego miejsca i nie zostanie tam
166
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
30.2. Kryształy naturalne: a) kwarc,
b) chlorek sodu, c) mika
t
„złapany”; potem jeszcze jeden kwiatek i jeszcze
jeden — tak że sieć rośnie stopniowo.) Łatwo się
pogodzić z tym, że kryształ rośnie w pewnych kie-
runkach z szybkością różną niż w innych kierun-
kach, przez co przybiera on pewien kształt geo-
metryczny. Ze względu na takie zjawiska zewnę-
trzne powierzchnie wielu kryształów wykazują pew-
ne cechy wewnętrznego uporządkowania atomów.
Tak na przykład na rys. 30.2a pokazano kształt
typowego kryształu kwarcu, którego sieć wewnę-
trzna jest heksagonalna. Gdybyśmy się przyjrzeli
dokładnie takiemu kryształowi, zauważylibyśmy,
że jego ścianka zewnętrzna nie jest idealnym
sześciokątem, ponieważ nie wszystkie jej boki mają
jednakową długość — w rzeczywistości są one
często bardzo nierówne. Ale pod jednym wzglę-
dem to jest bardzo dobry sześciokąt: kąty po-
między ściankami mają dokładnie po 120°. To
jasne, wymiary każdej ścianki są kwestią przy-
padku, ale kąty są cechą reprezentującą geome-
trię wewnętrzną kryształu. Chociaż więc każdy
kryształ kwarcu może mieć inny kształt, kąty po-
między odpowiednimi ściankami będą zawsze
takie same.
Wewnętrzna geometria kryształu chlorku sodu
jest także widoczna z jego kształtu zewnętrznego.
Na rysunku 30.2b pokazano kształt typowego
ziarenka soli kamiennej. I tym razem kryształ nie
jest idealnym sześcianem, ale poszczególne ścianki
są do siebie dokładnie prostopadłe.
Kryształem o bardziej skomplikowanej budo-
wie jest mika, która ma kształt taki, jaki pokaza-
no na rys. 30.2c. Jest to kryształ wysoce anizotro-
powy, o czym można się łatwo przekonać doświa-
dczalnie, ponieważ kryształ ten bardzo trudno prze-
łamać rozciągając go w jednym kierunku (poziom0
na rysunku), a bardzo łatwo — rozciągając w inny01
kierunku (pionowo). Miki używa się zwykle do
otrzymywania bardzo twardych, cienkich P*>"
tek. Mika i kwarc — to dwa przykłady natU"
ralnych minerałów zawierających krzemionkę. Trz°"
cim przykładem minerału zawierającego krzem10'
nkę jest azbest, który ma ciekawą własnos*-’
30-1. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
167
można go łatwo rozerwać, rozciągając go w dwóch kierunkach, ale nie w trzecim.
Okazuje się, że azbest składa się z bardzo mocnych włókien podłużnych.
30-2. Wiązania chemiczne w kryształach
Mechaniczne własności kryształów zależą oczywiście od typu wiązań chemicznych
pomiędzy atomami. Uderzająco różna wytrzymałość miki wzdłuż różnych kierunków zale-
ży od typu wiązań atomowych w tych kierunkach. Bez wątpienia czytelnik dowiedział się już
z chemii o różnych rodzajach wiązań chemicznych. A więc przede wszystkim, są wiązania
jonowe, jakie już opisaliśmy dla chlorku sodu. Z grubsza mówiąc, atomy sodu tracą elek-
tron i stają się jonami dodatnimi; atomy chloru zyskują elektron i stają się jonami ujem-
nymi. Dodatnie i ujemne jony układają się w trójwymiarową szachownicę i utrzymują się
razem siłami elektrycznymi.
Wiązanie kowalencyjne, w którym elektrony są rozdzielone pomiędzy dwa atomy,
spotyka się częściej i jest ono zwykle bardzo mocne. W diamencie na przykład atomy węgla
są we wszystkich czterech kierunkach związane ze swoimi najbliższymi sąsiadami wiąza-
niami kowalencyjnymi, tak że kryształ jest rzeczywiście bardzo twardy. W krysztale kwarcu
występuje także wiązanie kowalencyjne pomiędzy krzemem i tlenem, ale to wiązanie jest
w rzeczywistości tylko częściowo kowalencyjne. Ponieważ nie ma całkowitego rozdzie-
lenia elektronów, atomy są częściowo naładowane i kryształ jest nieco ,.jonowy”. Natura
nie jest taka prosta, jak usiłujemy ją przedstawić; w rzeczywistości możliwe są wszystkie
pośrednie stopnie pomiędzy wiązaniem kowalencyjnym, a jonowym.
W krysztale cukru występuje jeszcze inny typ wiązania. Kryształ ten składa się z dużych
drobin, w których atomy silnie się wzajemnie utrzymują poprzez wiązania kowalencyjne,
tak że drobina ma strukturę zwartą. Ale ponieważ te silne wiązania są już całkowicie wy-
korzystane, to pomiędzy pojedynczymi, oddzielnymi drobinami, istnieją tylko stosun-
kowo słabe siły przyciągające. Można powiedzieć, że w takich kryształach drobinowych
drobiny zachowują swoją indywidualność, a uporządkowanie wewnętrzne wygląda tak
jak na rys. 30.3. Ponieważ drobiny nie trzymają się razem mocno, to takie kryształy łatwo
można rozbić. Są one całkiem różne od czegoś w rodzaju diamentu, który w rzeczywistości
jest jedną olbrzymią drobiną, nie dająca się rozbić
bez rozerwania mocnych wiązań kowalencyj-
nych. Innym przykładem kryształu drobinowego
jest parafina.
Skrajny przykład kryształu drobinowego wy-
st?puje w takich substancjach jak na przykład
Ustalony argon. Pomiędzy atomami występują
bardzo małe siły przyciągające — każdy atom
Jest całkowicie wysyconą drobiną jednoatomo-
"'5’ Ale w bardzo niskich temperaturach ruch
C'ePlny jest bardzo mały, tak że niewielkie siły
•ałające pomiędzy atomami mogą spowodować
30.3. Sieć kryształu drobinowego
168
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
uporządkowanie atomów w regularny szyk — stos ciasno upakowanych kul.
Metale tworzą zupełnie różną klasę substancji. Wiązanie jest tu całkowicie innego typu,
W metalach wiązanie nie występuje pomiędzy przyległymi atomami, ale jest własnością
całego kryształu. Elektrony walencyjne nie są przyłączone do jednego atomu lub do pary
atomów, ale są rozdzielone na cały kryształ. Każdy atom wnosi elektron do wspólnej
„puli” elektronów, a dodatnie jony atomowe spoczywają w morzu elektronów ujemnych.
To morze elektronów trzyma razem jony, tak jakby to był jakiś „klej”.
W metalach nie ma silnej kierunkowości w wiązaniu, ponieważ nie występują tam ja-
kieś specjalne wiązania w żadnych szczególnych kierunkach. Metale są jednak w dalszym
ciągu tworami krystalicznymi, ponieważ całkowita energia jest najmniejsza w przypadku
gdy jony atomów są uporządkowane w jakimś określonym szyku, chociaż energia tego
wyróżnionego uporządkowania zwykle nie jest wiele mniejsza od energii innych możli-
wych uporządkowań. W pierwszym przybliżeniu atomy wielu metali wyglądają jak małe
kule, możliwie jak najciaśniej upakowane.
30-3. Wzrost kryształów
Spróbujmy sobie wyobrazić naturalne tworzenie się kryształów w ziemi. W powłoce
ziemskiej znajduje się olbrzymia mieszanina wszystkicfi rodzajów atomów. Są one ciągle
„wzburzane” przez działalność wulkaniczną, przez wiatr i przez wodę — ciągle pobudzają
się we wszystkich kierunkach i mieszają się ze sobą. Mimo tego, przy pomocy jakiejś
sztuczki, atomy krzemu stopniowo zaczynają się wzajemnie znajdować i znajdować zara-
zem atomy tlenu, tak aby utworzyć krzemionkę. Co chwilę jeden atom dołącza do innych,
aby uformować kryształ — mieszanina zostaje uporządkowana. A gdzieś w pobliżu szu-
kają się wzajemnie atomy sodu i chloru i budują kryształy soli kamiennej.
Jak to się dzieje, że gdy kryształ raz się już rozpocznie formować, to dopuszcza on do
udziału w tym procesie tworzenia tylko pewien szczególny typ atomu? Dzieje się tak, po-
nieważ cały układ dąży do tego, aby uczynić energię jak najmniejszą. Rosnący kryształ
będzie przyjmował nowy atom, jeżeli ten atom zmniejszy energię o tyle, o ile się tylko da.
Ale skąd kryształ wie, że atom krzemu — lub tlenu — umieszczony w pewnym szczegól-
nym miejscu będzie dawał w wyniku możliwie najmniejszą energię? Kryształ dowiaduje
się o tym metodą prób i błędów. W cieczy wszystkie atomy są w nieustannym ruchu. Każdy
atom zderza się ze swoimi sąsiadami około 1013 razy na sekundę. Jeżeli taki atom uderza
we właściwy „punkt” rosnącego kryształu, to ma on nieco mniejszą szansę wyskoczenia
z powrotem, jeżeli energia jest mała. Przez ciągłe próby przez okres milionów lat, z szyb-
kością 1013 prób na sekundę, atomy stopniowo skupiają się w takich miejscach, w których
ich energia jest najmniejsza. W końcu atomy te urastają w duże kryształy.
30-4. Sieci krystaliczne
Uporządkowanie atomów w krysztale — sieć krystaliczna — może przybrać jedn4
z wielu postaci geometrycznych. Chcielibyśmy opisać najpierw najprostsze sieci, ktofe
30-4. SIECI KRYSTALICZNE
169
30.4. Komórka elementarna kryształów regularnych: a) centrowanych przestrzennie, b) centrowanych
powierzchniowo
występują w większości metali i w gazach szlachetnych znajdujących się w stanie sta-
łym. Są to sieci regularne, które mogą występować w dwóch postaciach: sieć regularna
scentrowana przestrzennie, pokazana na rys. 30.4a, i sieć regularna scentrowana powierzch-
niowo, pokazana na rys. 30.4b. Na rysunkach pokazano oczywiście tylko jeden „sześcian”
siatki; należy sobie wyobrazić, że ten wzór powtarza się bez końca w trzech wymiarach.
Także, aby uczynić rysunek bardziej przejrzystym, pokazano jedynie „centra” atomów.
W rzeczywistym krysztale atomy są bardziej podobne do kul stykających się ze sobą.
Ciemne i jasne kółka na rysunku mogą, ogólnie biorąc, reprezentować różne rodzaje ato-
mów lub mogą być atomami tego samego typu. Tak na przykład żelazo ma sieć regularną
scentrowaną przestrzennie w niskich temperaturach, a scentrowaną powierzchniowo w wyż-
szych temperaturach. Fizyczne własności w tych dwóch postaciach krystalicznych są
zupełnie różne.
Skąd się biorą takie postacie krystaliczne? Wyobraźmy sobie, że mamy za zadanie
upakować razem kuliste atomy, tak ciasno jak tylko się da. Jeden ze sposobów polega na
rozpoczęciu od ułożenia warstwy w „heksagonalnym ciasno upakowanym uporządko-
waniu”, tak jak to pokazano na rys. 30.5a. Następnie można dobudować drugą warstwę,
taką jak pierwsza, ale przesuniętą poziomo, jak to pokazano na rys. 30.5b. Z kolei można
nałożyć trzecią warstwę. Ale uwaga! Trzecią warstwę można położyć na dwa różne spo-
s°by. Jeżeli zacząć układanie tej warstwy od umieszczenia atomu w punkcie A na rys.
30-5b, to każdy atom w trzeciej warstwie będzie leżał akurat nad atomem spodniej war-
stwy. z drugiej strony, jeżeli zacząć układanie trzeciej warstwy od położenia atomu
w Punkcie B, to centra atomów trzeciej warstwy będą leżały dokładnie w środku trójkąta
tworzonego przez trzy atomy spodniej warstwy. Każdy inny punkt, w którym rozpocz-
Jleiny układać trzecią warstwę, jest równoważny punktowi A lub B, a więc istnieją tylko
a sPosoby ułożenia trzeciej warstwy.
Jeżeli trzecia warstwa ma atom w punkcie B, to sieć krystaliczna jest siecią regularną
trowaną powierzchniowo, ale widzianą pod pewnym kątem. Wygląda to śmiesznie,
170
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
30.6. Co to jest sześciokąt, czy też że zaczynając od sześciokątów można skończyć na sześ-
sześcian oglądany „z wierzchołka”? cianie. Ale zauważmy, że sześcian oglądany ,,z wierz-
chołka” ma kontur sześciokątny. Tak na przykład
rys. 30.6 mógłby przedstawiać płaski sześciokąt lub
sześcian oglądany „z wierzchołka”.
Jeżeli dodać trzecią warstwę do rys. 30.5b zaczynając
od atomu w punkcie A, to nie otrzyma się struktury re-
gularnej, a siatka będzie miała zamiast tego tylko syme-
trię heksagonalną. Widać jasno, że obie opisane możli-
wości zapewniają równie ciasne upakowanie.
Niektóre metale, np. miedź i srebro, wybierają pier-
wszą możliwość, sieć regularną scentrowaną powierz-
chniowo. Inne metale, np. beryl i magnez, wybierają
drugą możliwość; tworzą one kryształy heksagonalne-
Oczywiście, to, która siatka się pojawia, zależy nie tyl-
ko od upakowania małych kulek, ale musi być także częściowo określone przeZ
inne czynniki. W szczególności jednym z tych czynników jest niewielka resztkowa zależ-
ność kątowa sił międzyatomowych (lub w wypadku metali — energia morza elektrono")-
Wiadomości na ten temat można znaleźć w podręcznikach chemii.
30-5. Symetria w dwóch wymiarach
. , ich
Chcielibyśmy teraz omówić niektóre z własności kryształów z punktu widzenia
symetrii wewnętrznych. Główną cechą kryształu jest fakt, że jeżeli przejdziemy od J
30-5. SYMETRIA W DWÓCH WYMIARACH
171
nego atomu do odpowiadającego mu atomu, odległego o jedną jednostkę sieci, to znaj-
dziemy się znowu w otoczeniu tego samego rodzaju co na początku. Jest to podstawowe
twierdzenie. Ale gdyby ktoś z nas był atomem, przekonałby się, że istnieje inny typ zmian,
które mogłyby go zaprowadzić do takiego samego otoczenia, to znaczy istnieje inna
dopuszczalna „symetria”. Rysunek 30.7a pokazuje inny możliwy wzór „tapetopodobny”
(chociaż takiej tapety prawdopodobnie nikt nigdy nie widział). Porównajmy na przykład
otoczenia punktów A i B. Na pierwszy rzut oka zdawałoby się, że są one takie same, ale
nie całkiem. Punkty C i D są równoważne punktowi A, ale otoczenie punktu B będzie takie
samo, jak otoczenie punktu A tylko w wypadku, jeżeliby jedno z nich poddać odbiciu
zwierciadlanemu.
W tym „modelu sieci” są inne rodzaje punktów „równoważnych”. Tak na przykład,
punkty E i F mają „takie same” otoczenia, z tym że jedno z nich jest obrócone względem
drugiego o 90°. Ta sieć ma dość szczególną cechę. Obrót o 90° — lub dowolną wielokrot-
ność 90° — wokół takiego bieguna jak punkt A daje znowu tę samą sieć. Kryształ o ta-
kiej strukturze będzie miał na zewnątrz „sześcienne" naroża, ale jego budowa wewnętrz-
na jest bardziej złożona od budowy prostego sześcianu.
Teraz, gdy opisaliśmy kilka szczególnych przykładów, spróbujmy znaleźć wszystkie
możliwe symetrie, jakie może mieć kryształ. Na początek rozważmy, co się dzieje na płasz-
czyźnie. Sieć płaska może być określona przez dwa tzw. wektory proste, które przebie-
gają od jednego punktu sieci do dwóch najbliższych punktów równoważnych. Wektory
1 i 2 są wektorami prostymi sieci na rys. 30.1. Dwa wektory a i b na rys. 30.7a są wekto-
rami prostymi pokazanej tam sieci. Oczywiście, moglibyśmy z powodzeniem zastąpić
wektor a wektorem —a lub wektor b wektorem —b. Ponieważ wektory a i b są równe
co do wartości bezwzględnej i prostopadłe do siebie, obrót o 90° przekształca wektor
a w b i b w — a, dając znowu tę samą sieć.
Widzimy, że istnieją sieci, które mają symetrię „czterokrotną”. Poprzednio opisaliśmy
ciasno upakowane uporządkowanie, bazujące na sześciokącie, który może mieć symetrię
sześciokątną. Obrót układu kółek z rys. 30.5a o kąt 60° wokół środka dowolnego z kó-
łek przeprowadza sieć z powrotem w siebie.
30.7. Model sieci o wysokiej symetrii
172
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
Jakie są inne rodzaje symetrii względem obrotów? Czy możemy mieć na przykład pię-
cio- lub ośmiokątną symetrię obrotową? Łatwo zobaczyć, że takie symetrie nie są możli-
we. Jedyną symetrią o krotności większej od czterech jest symetria sześciokrotna. Pokażmy
najpierw, że symetria o krotności większej od sześciu nie jest możliwa. Spróbujmy sobie
na przykład wyobrazić sieć o dwóch równych wektorach prostych z kątem zawartym po-
między nimi mniejszym od 60°, tak jak na rys. 30.8a. Stawiamy hipotezę, że punkty B
i C są równoważne punktowi A i że wektory a i b są dwoma najkrótszymi wektorami od
punktu A do jego najbliższych sąsiadów. Ale oczywiście tak nie jest, ponieważ odległość
od punktu B do C jest krótsza od odległości każdego z tych punktów do A. W punkcie D
musi się znajdować sąsiad równoważny punktowi A, który jest bliżej A niż B lub C.
Powinniśmy byli wybrać b' jako jeden z naszych wektorów prostych. A więc kąt pomię-
dzy dwoma wektorami prostymi musi mieć 60° lub więcej. Ośmiokątna symetria nie jest
możliwa.
A co z symetrią pięciokątną? Jeżeli założymy, że wektory proste a i b mają jednakową
długość i tworzą kąt 2?r/5 — 72°, tak jak na rys. 30.8a, to powinien tam także być punkt
równoważny sieci w D, przesunięty względem C o 72° wokół A. Ale wówczas wektor b',
od punktu E do C, jest mniejszy od wektora b, a więc wektor b nie jest wektorem prostym.
Nie może być symetrii pięciokrotnej. Jedyne możliwości, które nie doprowadzają nas
do opisanych powyżej sprzeczności, to: 6 =
30.8. a. Symetrie obrotowe o krotności więk-
szej od sześciu nie są możliwe, b. Symetria
obrotowa pięciokrotna nie jest możliwa.
60°, 90° lub 120°. Zero lub 180° są oczywiście
także możliwe. Nasz wynik można ująć mó-
wiąc, że sieć nie ulega zmianie przy rotacji
o jeden pełny obrót (nie ma w ogóle żadnej
zmiany), o połowę, o jedną trzecią, o jedną
czwartą lub o jedną szóstą pełnego obrotu. Są
to wszystkie możliwe symetrie na płaszczyźnie
— w sumie jest ich pięć. Jeżeli 6 = 2tv/ n,
mówimy o symetrii „n-krotnej”. Mówimy,
że sieć z n równym 4 lub 6 ma „wyższą
symetrię” niż sieć z n równym 1 lub 2.
Powracając do rys. 30.7a widzimy, że ta
sieć ma czterokrotną symetrię obrotową. Na
rysunku 30.7b narysowano inny „wzór”,
który ma te same własności symetrii co część
a). Małe, podobne do przecinków figurki
są obiektami asymetrycznymi, które służą
do określania symetrii sieci w każdym kwa-
dracie. Zauważmy, że przecinki w dwóch
sąsiednich kwadratach są odwrócone wzgl?'
dem siebie, tak więc komórka podstawowa
jest większa od jednego z tych kwadracików-
Gdyby nie było tych figurek, sieć miałab}
w dalszym ciągu czterokrotną symetrię, a'e
komórka podstawowa byłaby mniejsza. M0'
30-5. SYMETRIA W DWÓCH WYMIARACH
173
dele sieci z rys. 30.7 mają także i inne własności symetrii. Tak na przykład odbicie wzglę-
dem każdej z przerywanych linii R-R odtwarza tę samą sieć.
Sieci z rys. 30.7 mają jeszcze inny typ symetrii. Jeżeli odbić sieć względem linii Y-Y
i przesunąć ją o jeden kwadrat w prawo (lub w lewo), otrzyma się z powrotem sieć począt-
kową. Linię Y-Y nazywa się „linią poślizgu”.
Były to wszystkie możliwe symetrie w dwóch wymiarach. Jest jeszcze jedna operacja
symetrii przestrzennej, która w dwóch wymiarach jest równoważna obrotowi o 180°, ale
która jest zupełnie inną operacją w trzech wymiarach. Jest to inwersja. Polega ona na tym,
że każdy punkt odległy od jakiegoś środka [np. od punktu A na rys. 30.9b] o wektor
przesunięcia R zostaje przesunięty do punktu odległego od środka o — R.
Inwersja sieci a) z rys. 30.9 wytwarza nową sieć, ale inwersja sieci b) odtwarza tę samą
sieć. Dla sieci dwuwymiarowej (jak można to zobaczyć z rysunku), inwersja sieci b)
względem punktu A jest równoważna obrotowi o 180° wokół tego samego punktu. Przy-
puśćmy jednak, że siatkę z rys. 30.9b uczynimy trójwymiarową, wyobrażając sobie, że
każda z „szóstek” i „dziewiątek” ma małą strzałkę, wystającą do góry z rysunku. Po in-
wersji w trzech wymiarach wszystkie strzałki zostaną odwrócone „do góry nogami”,
tak że sieć nie zostanie odtworzona. Jeżeli oznaczyć groty i lotki strzałek odpowiednio
przez kropki i krzyżyki, to można utworzyć sieć trójwymiarową, taką jak na rys. 30.9c,
która nie jest symetryczna względem inwersji lub można utworzyć sieć pokazaną w części
30.9. Symetria względem inwersji. Model (b) sieci pozostaje bez zmian jeżeli R -> —R, ale model
(a) sieci ulega zmianie. W trzech wymiarach model (d) jest symetryczny względem inwersji, natomiast
model (c) sieci takim nie jest
174
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
d) rysunku, która ma taką symetrię. Zauważmy, że nie da się zastąpić trójwymiarowej
inwersji przez żadną kombinację obrotów.
Jeżeli będziemy charakteryzować „symetrię” jakiegoś wzoru — lub sieci krystalicznej —
przez opisane przez nas typy operacji, to się okaże, że w dwóch wymiarach możliwe jest
17 odmiennych sieci. Sieć o najmniejszej możliwej symetrii jest pokazana na rys. 30.1
a sieć o wysokiej symetrii — na rys. 30.7. Czytelnikowi pozostawiamy zabawienie się
w odnalezienie wszystkich 17 możliwości.
Zadziwiający jest fakt, że z tak niewielu z tych 17 możliwych wzorów korzysta się
przy projektowaniu tapet lub tkanin. Spotyka się zawsze te same, trzy lub cztery, podsta-
wowe wzory. Czy wynika to z braku wyobraźni u projektantów, czy też wiele z tych możli-
wych wzorów nie jest przyjemnych dla oka?
30-6. Symetrie w trzech wymiarach
Dotąd mówiliśmy tylko o sieciach w dwóch wymiarach. Jednakże, nas interesują prze-
de wszystkim sieci atomów w trzech wymiarach. Po pierwsze, kryształ trójwymiarowy
będzie oczywiście miał trzy wektory proste. Jeżeli następnie spytać o możliwe operacje
symetrii w trzech wymiarach, to się okaże, że istnieje 230 różnych możliwych symetrii!
Dla pewnych celów te 230 rodzajów symetrii można podzielić na siedem klas, które są
przedstawione na rys. 30.10. Sieć o najmniejszej symetrii nazywamy trójskośną. Jej ko-
mórką elementarną jest równoległościan. Wektory proste mają różne długości i żadne
dwa z kątów zawartych pomiędzy nimi nie są sobie równe. Nie może więc istnieć żadna
symetria obrotowa lub odbiciowa. Istnieją tu jednak dwie możliwe symetrie — komórka
elementarna może zostać lub też nie zmieniona przez inwersję względem punktu. [ Przez
inwersję w trzech wymiarach rozumiemy w dalszym ciągu, że przesunięcia przestrzenne R
zostają zastąpione przesunięciami — R; innymi słowy, że punkt (x, y, z) przechodzi w punkt
(—x, — y, —z).] Tak więc siatka trójskośną ma tylko dwie możliwe symetrie, chyba że
pomiędzy wektorami prostymi zachodzą jakieś szczególne zależności. Jeżeli na przykład
wszystkie wektory mają jednakową długość i „oddzielone” są od siebie tymi samymi
kątami, to mamy sieć trygonalną, której komórkę pokazano na rysunku. Rysunek ten
może mieć dodatkową symetrię; może nie ulegać zmianie przy obrocie wokół dłuższej
przekątnej przestrzennej.
Jeżeli jeden z wektorów prostych, np. c, jest prostopadły do pozostałych, to mamy
elementarną komórkę jednoskośną. Możliwa jest tu nowa symetria — obrót o 180° wo-
kół c. Komórka heksagonalna jest przypadkiem szczególnym, dla którego wektory a i b
są sobie równe i kąt pomiędzy nimi wynosi 60°, tak że obrót o 60° lub 120° lub 180
wokół wektora c odtwarza tę samą sieć (dla pewnych symetrii wewnętrznych).
Jeżeli wszystkie wektory proste są wzajemnie prostopadłe, ale mają różne długości,
otrzymujemy komórkę rombową. Jest ona symetryczna względem obrotów o 180° wok
trzech osi. Symetrie wyższego rzędu są możliwe w komórce tetragonalnej, która ma wszyst
kie kąty proste i dwa równe wektory proste. Na koniec jest jeszcze komórka regularna’
która jest najbardziej symetryczna z wszystkich.
30 6 SYMETRIE W TRZECH WYMIARACH
175
trygonalna
30.10. Siedem klas sieci krystalicznej
Przyczyną tych wszystkich rozważań na temat symetrii jest to, że wewnętrzne symetrie
kryształów znajdują odzwierciedlenie — czasem w bardzo subtelny sposób — w makrosko-
powych własnościach fizycznych kryształu. Widzieliśmy na przykład, że w ogólnym wy-
padku kryształ ma tensor polaryzowalności elektrycznej. Jeżeli przedstawimy tensor
poprzez elipsoidę polaryzacji, to powinniśmy oczekiwać, że niektóre z symetrii kryształu
wystąpią także w tej elipsoidzie. Tak na przykład kryształ regularny jest symetryczny
względem obrotów o 90° wokół każdego z trzech kierunków ortogonalnych. Rzecz jasna,
jedyną elipsoidą o tej własności jest kula. Kryształ regularny musi zatem być dielektrykiem
izotropowym.
Z drugiej strony, kryształ tetragonalny ma czterokrotną symetrię obrotową. Jego
elipsoida musi mieć dwie ze swych osi głównych równe, a trzecia oś musi być równoległa
osi kryształu. Podobnie, ponieważ kryształ rombowy ma dwukrotną symetrię obro-
tową wokół trzech prostopadłych osi, jego osie muszą się pokrywać z osiami elipsoidy
°firotowej. Z tych samych względów jedna z osi kryształu jednoskośnego musi być równo-
legła do jednej z osi głównych elipsoidy, chociaż nic nie da się powiedzieć o pozostałych
176
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
osiach. Ponieważ kryształ trójskośny nie ma symetrii obrotowej, jego elipsoida może
mieć zupełnie dowolną orientację.
Jak widać, poszukiwanie wszystkich możliwych symetrii i wiązanie ich z różnymi
możliwymi tensorami fizycznymi stanowi doskonałą, a zarazem pożyteczną zabawę.
Rozważyliśmy tylko tensor polaryzacji, ale dla innych tensorów, na przykład dla tensora
sprężystości, sprawy się znacznie komplikują. Istnieje dziedzina matematyki, nazwana
„teorią grup”, która się zajmuje takimi właśnie zagadnieniami, ale zwykle można dojść
do tego, co jest potrzebne za pomocą zwykłego „pomyślunku”.
30-7. Wytrzymałość metali
Powiedzieliśmy, że metale mają zazwyczaj prostą krystaliczną strukturę regularną;
chcemy teraz omówić ich własności mechaniczne, które zależą od tej struktury. Metale
są, mówiąc ogólnie, bardzo „miękkie”, ponieważ łatwo można przesuwać jedną warstwę
kryształu po drugiej. Można by pomyśleć: „To dziwne; wiemy przecież, że metale są
twarde.” A jednak tak nie jest; pojedynczy kryształ metalu można bardzo łatwo odkształcić.
Przyjrzyjmy się na przykład dwóm warstwom kryształu, poddanym sile ścinającej,
tak jak to pokazano schematycznie na rys. 30.11 a. Na pierwszy rzut oka mogłoby się
wydawać, że cała warstwa się nie poruszy, dopóki siła nie będzie na tyle duża, aby mogła
przesunąć całą warstwę przez „garby”, tak że warstwa zostałaby przesunięta o jedną „bruz-
dę” na lewo. Chociaż przesunięcie rzeczywiście występuje wzdłuż pewnej płaszczyzny,
to jednak nie dzieje się to w taki właśnie sposób. (Gdyby tak było, można by obliczyć,
że metal jest o wiele bardziej wytrzymały niż w rzeczywistości.) Przesuwanie wygląda raczej
tak, jak gdyby co chwilę przeskakiwał nowy atom; najpierw przeskakuje atom z lewej
strony, potem następny i tak dalej, tak jak to zaznaczono na rys. 30.1 Ib. W wyniku tego
procesu między dwoma atomami powstaje wolna przestrzeń, która się szybko przesuwa
na prawo i w efekcie cała górna warstwa zostaje przesunięta o jeden odstęp pomiędzy
atomami. To „ślizganie się” zachodzi w ten właśnie sposób, ponieważ na przeniesienie
co chwilę jednego atomu przez garb potrzeba o wiele mniej energii niż na przeniesienie
całego ich rzędu. Skoro tylko siła będzie już dostatecznie duża, aby zapoczątkować ten
proces, dalszy jego ciąg nastąpi bardzo szybko.
Okazuje się, że w rzeczywistym krysztale przesuwanie występuje sukcesywnie najpierw
w jednej płaszczyźnie, następnie ulega tam zahamowaniu i zaczyna się w jakiejś innej
30.11. Poślizg płaszczyzn krystalicznych
a)
b)
30-7. WYTRZYMAŁOŚĆ METALI
177
płaszczyźnie. Dokładne powody dlaczego aku-
rat się tak dzieje, są dość tajemnicze. W rze-
czywistości wydaje się zupełnie dziwne, że ko-
lejne obszary przesunięcia leżą często w pra-
wie jednakowych odstępach od siebie. Na
rysunku 30.12 widać fotografię maleńkiego,
cienkiego kryształu miedzi, który był rozcią-
gany. Można tu zobaczyć różne płaszczyzny,
w których nastąpiło przesuwanie.
Nagłe przesuwanie się pojedynczych
płaszczyzn kryształu można łatwo zaobser-
wować, jeżeli się weźmie kawałek cyny, która
ma duże kryształy i jeżeli się ją rozciągnie,
trzymając ją blisko ucha. Można wtedy
usłyszeć serię „tykań”, gdy płaszczyzny,
jedna po drugiej, wskakują w swoje nowe
położenia.
Zagadnienie występowania „brakującego”
atomu w jednym rzędzie jest nieco trud-
niejsze, niż mogłoby się wydawać z rys. 30.11.
Gdy jest więcej warstw, sytuacja wygląda
raczej jak na rys. 30.13. Taką niedoskona-
łość w krysztale nazywa się dyslokacją. Przy-
puszcza się, że dyslokacje powstają albo
w procesie formowania się kryształu, albo zo-
stają wytworzone w jakimś zagłębieniu lub
rysie na powierzchni. Gdy tylko już raz pow-
staną, mogą się one poruszać stosunkowo
swobodnie po całym krysztale. Totalne od-
kształcenia kryształów są wynikiem ruchów
wielu takich dyslokacji.
Dyslokacje mogą się poruszać swobodnie,
to znaczy potrzebują niewiele dodatkowej
energii dopóty, dopóki reszta kryształu ma
sieć doskonałą. Ale dyslokacje mogą „ugrzęz-
nąć”, jeżeli napotkają jakiś inny rodzaj wad
w krysztale. Aby wyminąć taką wadę, dys-
lokacje potrzebują dużo energii; zostają one
w*ęc zatrzymane. To właśnie zjawisko jest
odpowiedzialne za wytrzymałość niedosko-
nałych kryształów metalu. Kryształy czystego
Zelaza są całkiem miękkie, ale mała domie-
szka atomów zanieczyszczenia może wytwo-
30.12. Fotografia niaicgu kjryształu miedzi,
który był rozciągany
30.13. Dyslokacja w krysztale
Wykłady z fizyki
12 -
178
30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW
30-14- Dyslokacja śrubowa
30.15. Wzrost kryształu
30.16. Kryształ parafiny, który wyrósł
wokół dyslokacji śrubowej
rzyć tyle wad, że skutecznie unieruchamia
dyslokację. Jak wiadomo, stal, która jest
„z pochodzenia” żelazem, jest bardzo twarda.
Aby wyprodukować stal, rozpuszcza się małą
ilość węgla w roztopionym żelazie; jeżeli taki
stop się gwałtownie oziębi, węgiel wytrąca się
w postaci małych ziaren, tworząc wiele mikro-
skopijnych zniekształceń w sieci. Dyslokacje nie
mogą się już więcej poruszać i metal staje się
twardy.
Czysta miedź jest bardzo miękka, ale można
ją „utwardzić mechanicznie”. Robi się to albo
kując miedź, albo zginając ją tam i z powrotem.
W tym przypadku wytwarza się wiele nowych
dyslokacji różnych typów, które interferując ze
sobą redukują swą ruchliwość. Być może, ktoś
widział sztuczkę polegającą na tym, że bierze
się sztabkę „piekielnie miękkiej” miedzi i deli-
katnie się ją zgina wokół czyjegoś nadgarstka
w formie bransoletki. W tym procesie miedź
zostaje utwardzona i nie można już jej łatwo
odgiąć z powrotem! Utwardzony metal, taki
jak miedź, można z powrotem zmiękczyć, wy-
żarzając go w wysokiej temperaturze. Ruch
cieplny atomów „sprasowuje” dyslokacje
i znowu tworzy duże pojedyncze kryształy.
Opisaliśmy dotąd tylko tak zwaną dyslokację
poślizgową. Istnieje wiele innych typów dyslo-
kacji, jedną z nich jest dyslokacja śrubowa, po-
kazana na rys. 30.14. Dyslokacje te odgrywają
ważną rolę we wzroście kryształu.
30-8. Dyslokacje i wzrost kryształów
Przez długi czas proces wzrostu kryształu
stanowił jedną z wielkich zagadek. Opisaliśmy-
jak to się dzieje, że każdy atom, drogą ciągły0^
prób, może się zdecydować, czy lepiej W
w krysztale, czy też nie. Ale to oznacza,
każdy atom musi znaleźć miejsce o małej enet
gii. Jednakże atom umieszczony na nowej P°
wierzchni jest związany od spodu tylko Je°
30-8. DYSLOKACJE I WZROST KRYSZTAŁÓW
179
nym lub dwoma wiązaniami i nie ma on takiej samej energii, jaką by miał, gdyby
się znajdował w kącie, mając po bokach trzy atomy. Wyobraźmy sobie na przykład
rosnący kryształ jako stertę klocków, tak jak to pokazano na rys. 30.15. Jeżeli spró-
bować przyłożyć nowy „klocek”, powiedzmy w punkcie A, to będzie on miał tylko jed-
nego z sześciu możliwych sąsiadów, których powinien uzyskać w ostatecznym wyniku.
Jego energia, przy tylu brakujących wiązaniach, nie będzie bardzo mała. Lepiej byłoby
mu już w położeniu B, w którym „klocek” ma już połowę swych wiązań. Kryształy rze-
czywiście rosną przez dołączenie nowych „klocków” w miejscach takich jak B.
Co się jednak stanie, gdy jeden rząd zostanie skończony? Aby zacząć nowy rząd, atom
musi przyjąć stan spoczynku mając przyłączone jedynie dwa boki, a to również nie jest
bardzo prawdopodobne. Nawet gdyby tak się stało, to co będzie, gdy warstwa zostanie
ukończona? Jedną z odpowiedzi jest wyjaśnienie, że kryształ woli rosnąć wokół jakiejś
dyslokacji, na przykład wokół dyslokacji śrubowej, takiej jak na rys. 30.14, a „klocki”
dodające się do kryształu mogą zawsze znaleźć miejsce, gdzie są dla nich dostępne trzy
wiązania. Dlatego też kryształ woli rosnąć, jeżeli ma w sobie dyslokację. Taką spiralę
wzrostu pokazano na rys. 30.16, który jest fotografią pojedynczego kryształu parafiny.
30-9. Model kryształu Bragga i Nye’a
Oczywiście, nie jesteśmy w stanie zobaczyć, co się dzieje z poszczególnymi atomami
w krysztale. Istnieje także, z czego zdajemy sobie teraz sprawę, wiele złożonych zjawisk,
których opis jakościowy jest niełatwy. L. Bragg i J. F. Nye wymyślili sposób sporządzenia
modelu kryształu metalicznego. Model ten w zadziwiający sposób pozwala zaobserwo-
wać zjawiska, które, jak w to wierzymy, występują w rzeczywistym metalu. Poniżej przed-
stawiamy artykuł Bragga i Nye’a, który opisuje ich metodę i pokazuje uzyskane przy jej
pomocy wyniki.
Dynamiczny model struktury krystalicznej *’
Sir Lawrance Bragg, F. R. S. i J. F. Nye
Streszczenie
Strukturę krystaliczną metalu imituje zbiór ba-
nieczek o średnicy jednego milimetra lub mniej-
szej, unoszących się na powierzchni roztworu
mydła. Banieczki wydmuchuje się z cienkiej
pipety stałym ciśnieniem powietrza; godny uwagi
jest fakt, że wymiary banieczek są jednakowe.
Banieczki trzymają się razem siłami napięcia
powierzchniowego, w jednej warstwie lub też
w trójwymiarowym skupisku. Taki zbiór może
zawierać setki tysięcy banieczek i utrzymuje się
przez godzinę lub dłużej. Zbiory cząsteczek
wykazują struktury, o których przypuszczano, że
istnieją w metalach oraz imitują efekty, które
były obserwowane, takie jak granice ziaren,
dyslokacje i inne typy defektów sieci, poślizg,
rekrystalizację, hartowanie i zniekształcenia sieci
pochodzące od obcych atomów.
1. Model banieczek
W proponowanych od czasu do czasu modelach
struktury krystalicznej atomy przedstawiano
w postaci małych, pływających lub zawieszonych
•’ Artykuł ten pochodzi z „Proceedings of the Royal
Society of London”, 190, September 1947, str. 474-481 i prze-
drukowany został w Wykładach Ftynmana za zezwoleniem
Autorów i Royal Society. (Przyp. red. wyd. polskiego.)
swobodnie magnesów, lub w postaci kolistych
krążków unoszących się na powierzchni wody
i utrzymujących się razem siłami przyciągania
kapilarnego. Modele te mają pewne wady; na
przykład w wypadku zetknięcia się pływających
obiektów siły tarcia hamują ich swobodny ruch
względem siebie. Poważniejszą wadą jest ograni-
czenie liczby składników modelu, ponieważ aby
się zbliżyć do tego, co się dzieje w krysztale
rzeczywistym, potrzebna jest duża liczba składni-
ków. Niniejsza praca opisuje zachowanie się
modelu, w którym atomy są reprezentowane
przez małe banieczki o średnicy od 0,1 do 2 mm,
unoszące się na powierzchni roztworu mydła. Te
małe banieczki są dostatecznie wytrzymałe dla
doświadczeń trwających godzinę lub dłużej,
ślizgają się one po sobie bez tarcia i można je
wytwarzać w dużych ilościach. Niektóre z foto-
grafii w tej pracy zostały zrobione dla zbiorów
banieczek liczących 100000 lub więcej banie-
czek. Ten model odzwierciedla bardzo dobrze
własności struktury metalicznej, ponieważ wszyst-
kie banieczki są tego samego typu i utrzymują się
razem siłą totalnego przyciągania kapilarnego, co
odpowiada sile wiążącej elektrony swobodnie
w metalu. Krótki opis tego modelu został podany
w „Journal od Scientific Instruments” (Bragg-
1942b) ♦>.
•> Bragg W. L. 1942b, J. Sci. Inslrum. 19, 148.
pyNAMICZNY ROZWÓJ STRUKTURY KRYSTALICZNEJ
181
2. Metoda wytwarzania banieczek
Banieczki są wydmuchiwane z wąskiego otworu,
pod powierzchnią roztworu mydła. Najlepsze
wyniki otrzymano używając roztworu, którego
przepis podał p. Green z Royal Institution.
15,2 cm3 przedestylowanego kwasu olejowego
należy dobrze wstrząsnąć z 50 cm3 wody desty-
lowanej. Następnie miesza się to z 73 cm3 10%-
-ego roztworu trójetyloaminy, dopełnia się miesza-
niną do 200 cm3 i dodaje się do niej 164 cm3
czystej gliceryny. Tak otrzymanej mieszaninie poz-
dukowanych banieczek. Przykładowo — pipeta
grubościenna z otworem o średnicy 49 p., przy
ciśnieniu 100 cm słupa wody, wytwarzała banieczki
o średnicy 1,2 mm. Cienkościenna pipeta o śred-
nicy wylotu 27 p, przy ciśnieniu 180 cm słupa
wody, wytwarzała banieczki o średnicy 0,6 mm.
Wygodnie jest nazywać banieczki o średnicy od
2,0 do 1,0 mm „dużymi” banieczkami, o średnicy
od 0,8 do 0,6 mm — „średnimi” banieczkami
i o średnicy od 0,3 do 0,1 mm — „małymi” ba-
nieczkami, ponieważ ich zachowanie zmienia się
w zależności od ich rozmiarów.
1. Aparatura do wytwarzania warstw banieczek
wala się odstać, po czym odciąga się spod spodu
klarowny płyn. W niektórych doświadczeniach
płyn ten rozcieńczano w trzy razy większej obję-
tości wody, aby zmniejszyć lepkość. Otwór dyszy
pipety znajdował się około 5 mm pod powierzch-
nią. Stałe ciśnienie powietrza od 50 do 200 cm
słupa wody dostarczano za pomocą dwóch pomp
typu Winchester. Normalnie banieczki mają za-
dziwiająco jednakowe rozmiary. Czasami zdarza
się otrzymywać nierówne banieczki, ale można
temu zapobiec zmieniając pipetę lub ciśnienie.
Niepożądane bańki można łatwo usunąć przesu-
wając po powierzchni płomień palnika. Rysunek 1
Pokazuje aparaturę. Przekonaliśmy się, że korzyst-
nie jest poczernić dno naczynia, ponieważ szcze-
8óły struktury, takie jak granice ziaren i dysloka- !
CJe ukazują się wówczas wyraźniej. '—
Na fotografii 2 pokazano część „warstwy”,
czyli dwuwymiarowego „kryształu”, zbudowanej
* banieczek. Regularność tej warstwa można
ostrzec spoglądając na rysunek pod małym ką-
. 'n- Rozmiar banieczek zmienia się wraz ze
srednicą dyszy pipety, ale nie zauważono, aby ten
r°zniiar się zmieniał w jakiś widoczny sposób
c*snieniem, czy też z głębokością zanurzenia
°tu pipety pod powierzchnią. Wzrost ciśnienia
°duje przede wszystkim wzrost liczby pro-
Okazalo się, że przy użyciu tej aparatury nie-
możliwe jest takie zmniejszenie średnicy pipety,
aby móc wytwarzać banieczki o średnicy mniej-
szej od 0,6 mm. Ponieważ pożądane było wyko-
nywanie doświadczenia z małymi banieczkami,
użyliśmy takiego oto sposobu — roztwór mydła
umieszczano w obracającym się naczyniu, a do
jego ścianki wewnętrznej, możliwie jak najbli-
żej, przytykano cienką pipetę, równolegle do linii
sił prądu. Banieczki były porywane z otworu
pipety w momencie powstawania i, jeżeli utrzy-
mywano stałe warunki, były one dość jednakowe.
Takie banieczki są produkowane z wydajnością
tysiąca lub więcej banieczek w ciągu sekundy,
czemu towarzyszy dźwięk o wysokim tonie.
Podczas obrotu naczynia roztwór mydła podnosi
się ostro w górę wzdłuż obwodu naczynia, ale
po ustaniu obrotu roztwór opada, zabierając ze
sobą większość banieczek. Za pomocą urządze-
nia pokazanego na rys. 3 otrzymano banieczki
3. Aparatura do wytwarzania banieczek o małych rozmiarach
o średnicy 0,12 mm. Przykładowo — przy użyciu
cienkościennej pipety, z otworem 30 p., przy
ciśnieniu 190 cm słupa wody i prędkości cieczy
180 cm/s względem wylotu pipety, otrzymano
182
DYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ
bameczki o średnicy 0,14 mm Użyto przy tym
naczynia o średnicy 9,5 cm i prędkości 6 obrotow
na sekundę Fotografia 4 jest powiększonym
obrazem tych „małych” banieczek i pokazuje
stopień ich regularności, model sieci otrzymany
przy użyciu obracającego się naczynia nie jest
tak doskonały, jak model otrzymany przy użyciu
naczynia spoczywającego, rzędy banieczek są
trochę nieregularne, co można zobaczyć patrząc
na fotografię pod małym kątem
Te dwuwymiarowe kryształy wykazują struk-
tury, o których przypuszczano, ze istnieją w meta-
lach i imitują zjawiska, które były obserwowane,
takie jak granice ziaren, dyslokacje i inne typy de-
fektów sieci, poślizg, rekrystalizację, hartowanie
i zniekształcenia pochodzące od atomów „ob-
cych”
3. Granice ziaren
Na fotografiach 5a, 5b i 5c pokazano typowe
granice ziaren dla banieczek o średnicach od-
powiednio 1,87, 0,76 i 0,30 mm Szerokość za-
burzonej powierzchni przy granicy, gdzie rozkład
banieczek jest nieregularny, jest w Ogólnym przy-
padku tym większa, im mniejsze są bameczki
Na fotografii 5a, która pokazuje kilka porcji
przylegających do siebie ziaien, bameczki znajdu-
jące się na granicy pomiędzy dwoma ziarnami
należą w „zdecydowany” sposob do jednego
uporządkowania krystalicznego lub do drugiego
Na fotografii 5c widać wyraźnie „warstwę
Beilby’ego” pomiędzy dwoma ziarnami Małe ba-
nieczki, jak to będzie można zobaczyć, mają
większą sztywność mz duże bameczki i fakt ten
powoduje większą meregularnosc przy warstwie
granicznej
Poszczególne ziarna można dokładnie zoba-
czyć, jeżeli fotografie warstw polikrystalicznych,
takie jak fot 5a, 5b, i 5c, oglądać ukośnie Przy
odpowiednim oświetleniu taka pływająca warstwa
banieczek, oglądana ukośnie, imituje w zadzi-
wiający sposob wypolerowaną i wytrawioną po-
wierzchnię metalu
Zdarza się często, ze mektore z „atomow za-
nieczyszczenia”, czyli bameczki, które są wyraźnie
większe lub mniejsze od przeciętnej, występują
w warstwie polikrystalicznej i gdy tak się dzieje,
to większość tych „nietypowych ’ banieczek znaj-
duje się przy granicach ziaren Nie należy sobie
jednak wyobrażać, ze te nietypowe bameczki
przesuwają się w kierunku granic, wadą modely
jest właśnie to, ze me może zajsc żadna dyfuZja
banieczek przez całą „budowlę” — możliwe $ą
jedynie lokalne przeszeregowania banieczek są
siadujących ze sobą Okazuje się natomiast, Ze
to właśnie granice dążą do tej „przebudowy”
która polega na tym, ze jeden z kryształów rośnie
kosztem drugiego do momentu, az natrafi na
atomy „nietypowe”
4. Dyslokacje
Gdy pojedynczy kryształ lub warstwę poi,,
krystaliczną poddać sciskamu, rozciąganiu lub
odkształcaniu jakiegoś innego typu, zachowują się
one bardzo podobme do sposobu, w jaki, jak to
sobie wyobrażamy, zachowuje się model poddany
jakiemuś odkształceniu Do pewnej granicy model
zachowuje się sprężyście Powyżej tej granicy
model poddaje się — następuje poślizg wzdłuz
jednego z trzech jednakowo nachylonych kierun-
ków ściśle upakowanych rzędów Poślizgowi
ulegają bameczki znajdujące się w jakimś rzędzie
Bameczki te przesuwają się nad bameczkami
z sąsiedniego rzędu o odległość równą odstępowi
pomiędzy sąsiadami Obserwacja tego procesu
jest bardzo interesująca Ten ruch me następuje
równocześnie w całym rzędzie, ale zaczyna się
przy jednym końcu od pojawienia się „dysloka
cji”, gdzie mamy lokalnie o jedną bameczkę więcej
w rzędzie po jednej strome linii poślizgu niz
w rzędzie po drugiej stronie Ta dyslokacja prze-
biega następnie wzdłuz linii poślizgu, z jednego
końca na drugi, powodując w ostatecznym wy'
niku przesunięcie o jedną odległość „międzyato-
mową” Możliwość zachodzenia tego procesu
została poddana przez Orwana Polanyi’a i Tay
lora, po to aby wytłumaczyć małe siły potrzebne
do wytworzenia plastycznych „ślizgów” w struk
turach metali Teona rozwinięta dalej przez Tay
lora (1934)*>, a mająca na celu wytłumaczenie o
kształceń plastycznych w kryształach, zajmuje si$
oddziaływaniem wzajemnym oraz stanem rown°
wagi takich dyslokacji Bameczki dostarczaj**
uderzającego obrazu tego, co spodziewano sie>
istnieje w metalu Czasem dyslokacje PrzesU'^ta]
się zupełnie powoli — przejście przez kry5
stanowi dla nich kwestię kilku sekund, takie dy^
kacje można tez oglądać w kryształach P°
------------- -g-ł
•> Taylor GI 1934, Proc Roy Soc A I45
d^S4MICZNY MODEL STRUKTURY KRYSTALICZNEJ
183
nych odkształceniom niejednorodnym Pojawia-
ją się one w postaci czarnych linii i można je
^baczyć na serii fotografii, 12a-12e Gdy war-
stwa polikrystaliczna jest ściskana, te czarne linie
przesuwają się bezładnie przez cały kryształ
Ma fotografiach 6a, 6b i 6c można zobaczyć
przykłady dyslokacji Na fotografii 6a, gdzie
średnica banieczek wynosi 1,9 mm, dyslokacja jest
bardzo „lokalna” i rozciąga się tylko na szesc
banieczek Na fotografii 6b (średnica 0,76 mm)
dyslokacja się rozciąga na dwanaście banieczek,
a na fot 6c (średnica 0,30 mm) wpływ dyslokacji
można odnaleźć na obszarze, ktorego długość
jest równa około 50-ciu średnicom banieczek
Większa sztywność małych banieczek prowadzi
do powstawania dłuższych dyslokacji Jednakże,
jeśliby prześledzić dowolny zbiór banieczek, to
się okaze, ze nie ma jakiejś standardowej długości
dyslokacji dla banieczek o danym rozmiarze
Długość dyslokacji zalezy od natury odkształce-
nia w krysztale Granicę pomiędzy dwoma krysz-
tałami, a kątem pomiędzy odpowiednimi osiami
równym 30° (największy kąt dopuszczalny), można
rozpatrywać jako ciąg dyslokacji w naprzemian-
ległych rzędach i w tym przypadku dyslokacje są
bardzo krótkie Wraz z maleniem kąta pomiędzy
sąsiadującymi z sobą kryształami dyslokacje
występują w coraz to większych odstępach i jedno-
cześnie się stają coraz dłuzsze, az w końcu otrzy-
muje się pojedyncze dyslokacje w dużym obszarze
o doskonałej strukturze
Fotografia 7 pokazuje trzy dyslokacje równo-
ległe Jeżeli za Taylorem wprowadzić pojęcia
, dyslokacja dodatnia” i „dyslokacja ujemna”,
to od lewej do prawej można zobaczyć dyslokację
dodatnią, ujemną i dodatnią „Wstęga” pomiędzy
dwoma ostatnimi dyslokacjami zawiera trzy
banieczki w nadmiarze, co można dostrzec,
Patrząc się na fotografię wzdłuz rzędów pozio-
mych Fotografia 8 pokazuje dyslokację wysu-
WaJącą się z granicy ziaren — zjawisko dosc
ezęsto obserwowane
Fotografia 9 pokazuje obszar, w którym dwie
n>eczki zajęły miejsce jednej Można to uważać
i graniczny przypadek dyslokacji dodatmej
^Jemnej w sąsiednich rzędach, przy czym pod-
e ściskaniu ścianki obu dyslokacji lezą tuz
do s,e'31e Przypadek przeciwny prowadziłby
k^1Ury w strukturze — w miejscu, gdzie spoty-
, y się dwie dyslokacje, brakowałoby jednej
oanieczki
5. Inne typy defektu
sieci
Fotografia 10 pokazuje wąski pasek pomiędzy
dwoma kryształami, zorientowanymi równolegle
Pasek ten przecina pewna liczba linii defektu,
czyli miejsce, gdzie banieczki nie są gęsto upako-
wane Właśnie w takich miejscach można się
spodziewać wystąpienia rekrystalizacji Granice
ziaren zbhzają się do siebie i taki pasek zostaje
wchłonięty przez kryształ doskonały
Fotografie 1 la-lig ilustrują przykłady upo-
rządkowań, które się często pojawiają w takich
miejscach, gdzie panuje lokalny niedobór banie-
czek Podczas gdy dyslokacja wygląda zwykle tak,
jak jakiś ciemny pasek, to tego typu uporządko-
wanie występuje w kształcie litery V lub w kształ-
cie trójkąta Takie typowe uporządkowanie „V”
widać na fot lla Gdy model poddać odkształ-
ceniu, powstaje uporządkowanie „V”, uformo-
wane przez dwie dyslokacje, które się spotykają
pod kątem 60°, uporządkowanie to ulega znisz-
czeniu, gdy dyslokacje przesuwają się w dalszym
ciągu wzdłuz swych torow Fotografia llb po-
kazuje mały trojkącik, który także zawiera w so-
bie dyslokację, ponieważ, jak można zauwazyc,
rząd poniżej trojkącika zawiera o jedną banieczkę
więcej od rzędów niższych Jeżeli dostarczyć
troszkę „ruchów cieplnych”, zamieszawszy de-
likatnie roztwor w jakimś miejscu, to takie
defekty znikają, zostając zastąpione przez struktu-
rę doskonałą
Tu i owdzie w krysztale jest puste miejsce,
w którym brakuje banieczki, a które wygląda
na fotografii jak ciemna plama Przykłady takich
defektów można zobaczyć na fot lig Taka luka
nie może zostać wypełniona na drodze lokalnego
przeszeregowania się banieczek, ponieważ wy-
pełnienie takiej luki powodowałoby powsta-
nie następnej Takiego rodzaju dziury pojawia-
ją się i znikają podczas „obrobki” kryształu
, na zimno”
Tego typu struktury w modelu sugerują, ze
podobne defekty lokalne mogą istnieć w rzeczy-
wistym metalu Mogą one odgrywać pewną rolę
w takich procesach jak dyfuzja lub przejście od
struktury uporządkowanej do struktury bezład-
nej, zmniejszając bariery energetyczne w swoim
sąsiedztwie oraz działając jako jądra krystalizacji
w przemianie allotropowej
184
DYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ
6. Rekrystalizacja i hartowanie
Fotografia 12a i 12e ukazują tę samą warstwę
banieczek w kilku następujących po sobie chwi-
lach. Warstwa pokrywająca powierzchnię roz-
tworu została dość dokładnie zamieszana pałeczką
szklaną, a następnie pozostawiona w spokoju,
tak aby się sama „uspokoiła”. Fotografia 12a
pokazuje wygląd tej warstwy po upływie 1 s od
chwili zaprzestania mieszania. Warstwa ulega
rozbiciu na pewną liczbę małych „krystalitów”;
w krystalitach tych są duże odkształcenia niejedno-
rodne, na co wskazują liczne dyslokacje i inne
defekty sieci. Następna fotografia (12b) pokazuje
tę samą warstwę w 32 s później. Małe ziarna zrosły
-!ę formując większe ziarna, a duża część odkształ-
cenia podczas tego procesu znika. Rekrystalizacja
następuje etapami; fotografie ostatnich trzech
etapów pokazują wygląd warstwy w 2,14 i 25 min
po zamieszaniu. Procesu wtórnego uporząd-
kowania nie da się śledzić dłużej, ponieważ ba-
nieczki stojąc tak długo kurczą się najwyraźniej
na skutek dyfuzji powietrza przez ich ścianki
oraz stają się cienkie i wykazują tendencję do
pękania. Podczas procesu rekrystalizacji model
był pozostawiony w całkowitym spokoju, proces
ten zachodzi coraz wolniej, przy czym ruch banie-
czek w jednej części roztworu powoduje powsta-
nie odkształceń, które wzbudzają nowe prze-
szeregowania w jakiejś części sąsiedniej, a te
z kolei oddziałują na jeszcze inną część warstwy.
Podczas tych kilku etapów rekrystalizacji
można zaobserwować kilka interesujących zja-
wisk. Zauważmy trzy małe ziarna w punktach
oznaczonych przez współrzędne AA, BB i CC.
Ziarno AA istnieje przez wszystkie etapy, chociaż
jego postać się zmienia. BB jest jeszcze obecne
po 14 min, ale znika po 25 min, pozostawiając po
sobie cztery dyslokacje, których obecność ozna-
cza istnienie w ziarnie odkształceń wewnętrznych.
Ziarno CC kurczy się i w końcu znika na fot. 12d,
pozostawiając po sobie dziurę i uporządkowanie
typu „V”, które z kolei znika na fot. 12e. W tym
samym czasie słabo zarysowana granica ziarna
DD na fot. 12d staje się już dobrze zarysowana na
fot. 12e. Można też zauważyć rozprostowanie się \
granicy ziaren w sąsiedztwie EE na fot. 12b-12e.
Na fotografiach widać dyslokacje różnych dłu-
gości, odpowiadające wszystkim etapom pomiędzy
lekkim wypaczeniem struktury, a zdecydowaną
granicą ziaren. Dziury, odpowiadające brakują-
cym banieczkom, mają postać czarnych kropek.
Niektóre z tych dziur powstają i znikają na skutek
ruchu dyslokacji, ale inne dziury odpowiadają
miejscom, w których jakaś banieczka pękła.
Można dostrzec wiele przykładów uporządko-
wania typu „V” i trójkącików. Oglądając tę serię
fotografii można też dostrzec inne, interesujące
zjawiska.
Fotografie 13a, 13b i 13c pokazują część warstwy
po upływie 4 min po wymieszaniu. Interesujące
jest tu pojawienie się dwóch etapów w dążeniu
do bardziej doskonałego uporządkowania. Te
pizemiany występują wyraźniej, jeżeli oglądać
fotografię z ukosa. Na fotografii 13a uporządko-
wanie jest bardzo chaotyczne. Na fotografii 13b
banieczki zgrupowały się w rzędy, ale zakrzywie-
nie tych rzędów wskazuje na wysoki stan napięć
wewnętrznych. Na fotografii 13c ten stan napięcia
został złagodzony na skutek wytworzenia się
nowej granicy A-A; rzędy po obu stronach tej
granicy są już proste. Okazuje się, że energia tak
odkształconego kryształu jest większa od energii
granicy międzykrystalicznej.
7. Efekt atomu zanieczyszczenia
Fotografia 14 pokazuje efekt pochodzący od
banieczki o „złych” rozmiarach, a rozciągający
się na dość duży obszar. Jeżeli porównać ten
rysunek z doskonałymi warstwami z fot. 2 i 4,
to można zobaczyć, że regularność rzędów na tym
całym rysunku zakłócają trzy banieczki — jedna
większa, a dwie mniejsze od banieczek „normal-
nych”. Jak już o tym Wspomniano, banieczki
o „złych” rozmiarach spotyka się zazwyczaj na
granicach ziaren, gdzie występują dziury o nie-
typowych kształtach, mogące te banieczki po-
mieścić w sobie.
8. Własności mechaniczne modelu
dwuwymiarowego
Własności mechaniczne dwuwymiarowej, do-
skonałej warstwy opisano w pracy poświęconej
temu zagadnieniu (Bragg, 1942b)łl. Warstwa taka
jest rozciągnięta pomiędzy dwoma sprężynami
zanurzonymi poziomo na powierzchni roztworu
mydła. Odstępy zwojów sprężyn tak się dobiera,
aby pasowały one do odległości pomiędzy rzę-
dami banieczek, które wówczas mocno przyle-
gają do sprężyn. Jedną ze sprężyn można prze-
suwać (równolegle do niej samej) za pomocą
•JBragg W. L. 1942b, J. Sci. Instrum. 1», 148.
pYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ
185
śruby mikrometrycznej, podczas gdy druga jest
utrzymywana przez dwa poprzeczne włókna
szklane. Naprężenie ścinające można zmierzyć
mierząc odchylenie włókien szklanych. Warstwa
poddana odkształceniu ścinania zachowuje się
zgodnie z prawem sprężystości Hooke’a, aż do
momentu osiągnięcia granicy sprężystości. Po
przekroczeniu tej granicy w warstwie następuje
poślizg wzdłuż któregoś z rzędów środkowych
o odległość równą szerokości banieczki. To ści-
nanie sprężyste i poślizg mogą się powtórzyć
kilka razy. Granica sprężystości zostaje osiągnięta,
gdy jedna z krawędzi warstwy zostaje przesunięta
(na skutek ścinania) względem drugiej o odległość
równą szerokości banieczki. Potwierdza to pod-
stawowe założenie, przyjęte przez jednego z au-
torów przy obliczaniu granicy sprężystej metalu
(Bragg', 1942a)*>, które mówi, iż każdy krystalit
w metalu obrabianym na zimno przesuwa się pod
wpływem siły wtedy, gdy naprężenie wewnątrz
niego osiąga taką wartość, że poślizg wyzwala
pewną ilość energii.
Obliczenia sił działających pomiędzy baniecz-
kami wykonał M. M. Nicholson. Z obliczeń tych
wypływają dwa interesujące wnioski. Krzywa
obrazująca zależność energii potencjalnej od od-
ległości pomiędzy środkami banieczek przypo-
mina w dużym stopniu podobną krzywą dla
atomów. Energia potencjalna przyjmuje minimum
dla odległości pomiędzy środkami nieco mniejszej
od średnicy swobodnej banieczki. Wraz ze
zmniejszaniem się tej odległości energia gwał-
townie wzrasta, przy czym wzrost ten jest wyjąt-
kowo gwałtowny dla banieczek o średnicy 0,1 mm,
a maleje dla banieczek o średnicy 1 mm, co po-
twierdza wniosek wypływający z obserwacji
modelu, że małe banieczki zachowują się tak,
jak gdyby były one o wiele bardziej sztywne od
banieczek większych.
9. Skupiska trójwymiarowe
Jeżeli pozwolić banieczkom układać się w wielo-
krotnych warstwach na powierzchni roztworu,
to tworzą one skupisko — trójwymiarowy
“kryształ” — przy czym uporządkowanie jest
Jednym z tych uporządkowań, które mają naj-
gęstsze upakowanie. Fotografia 15 pokazuje
*ld°k ukośny takiego skupiska; daje się zauważyć
podobieństwo do wypolerowanej i wytra-
’’ Bragg W. L. 1942a, Naturę, 149, 511.
wionej powierzchni metalu. Na rysunku 16 widać
podobne skupisko, oglądane „z lotu ptaka”.
Niektóre części tego skupiska mają bez wątpienia
strukturę regularną o najgęstszym upakowaniu,,
przy czym powierzchnią zewnętrzną jest tu
płaszczyzna [111] lub [100]. Fotografia 17a po-
kazuje płaszczyznę [111]. Widać wyraźnie zarysy
trzech banieczek, na których spoczywa każda
z banieczek wierzchniej warstwy, a następna
warstwa tych banieczek jest ledwo, ledwo wi-
doczna i przesunięta względem warstwy „naj-
wyższej”, co wskazuje na to, że upakowanie
płaszczyzn [111] ma dobrze znaną strukturę
regularną. Fotografia 17b pokazuje płaszczyznę
[100], gdzie każda z banieczek spoczywa na czte-
rech innych. Osie komórki regularnej są oczy-
wiście nachylone pod kątem 45° do ciasno upako-
wanych rzędów warstwy powierzchniowej. Foto-
grafia 17c pokazuje strukturę bliźniaczą w sieci
regularnej po obu stronach płaszczyzny [111].
Wierzchnimi płaszczyznami są tu płaszczyzny [111]
i [100], które — choć nie widać tego wyraźnie
na fotografii — są nachylone do siebie pod pew-
nym małym kątem (można to dostrzec spoglą-
dając na rysunek z ukosa). Na fotografii 17d
widać zarówno strukturę regularną, jak i heksa-
gonalną ciasno upakowanych płaszczyzn, ale
trudno jest sprawdzić, czy po lewej stronie występu-
je rzeczywiście struktura heksagonalna o ciasnym
upakowaniu, ponieważ nie jest pewne, czy sku-
pisko w tym punkcie jest głębsze niż na dnie
warstwy. Na fotografii 16 widać przykłady struk-
tur bliźniaczych i granic między krystalicznych.
Fotografia 18 pokazuje kilka dyslokacji w struk-
turze trójwymiarowej poddanej odkształceniu
zginania.
10. Demonstracja modelu
Przy współpracy z firmą Kodak został wyko-
nany 16-milimetrowy film, pokazujący ruchy
dyslokacji i granic ziaren podczas przyłożenia
na pojedynczy kryształ i na warstwy polikrysta-
liczne naprężeń ścinających. Co więcej — jeżeli
umieścić roztwór mydła w naczyniu szklanym
o płaskim dnie, model można pokazywać w pro-
jekcji epidiaskopowej. Ponieważ do wytworzenia
banieczek potrzebna jest pewna głębokość roz-
tworu, a sam roztwór jest raczej mętny, to pożą-
dane jest, aby projekcji dokonywać przez blok
szklany, spoczywający na dnie naczynia, ledwo
zanurzony pod powierzchnią roztworu.
31
tensory
31-1. Tensor polaryzowałności dielektrycznej*’
Fizycy mają zawsze zwyczaj rozważania najprostszego przykładu jakiegoś zjawiska
i nazywania tego „fizyką”, po czym pozostawiają rozważania bardziej skomplikowanych
przykładów trosce innych gałęzi nauki, na przykład matematyce stosowanej, elektrotech-
nice, chemii czy też krystalografii. Nawet fizykę ciała stałego można zaliczyć tylko w po-
łowie do fizyki, ponieważ interesuje się ona zbytnio specjalnymi substancjami. Dlatego
też w tych wykładach będziemy pomijać wiele interesujących zagadnień. Tak na przykład
jedną z ważnych właściwości kryształów, czyli większości substancji, jest to, że ich pola-
ryzowalność dielektryczna jest różna w różnych kierunkach. Jeżeli przyłożyć pole w jakimś
kierunku, to ładunki atomowe trochę się przesuną i wytworzą pewien moment dipolowy,
ale jego wielkość zależy w dużym stopniu od kierunku pola. Komplikuje to bardzo spra-
wę. Ale w fizyce, aby ułatwić sobie życie, zaczyna się zwykle od rozważań szczególnego
przypadku, w którym polaryzowalność jest taka sama we wszystkich kierunkach. Roz-
ważenie pozostałych przypadków zostawia się innym gałęziom nauki. Dlatego też w dal-
szej części tych wykładów wcale nie będziemy korzystać z tego, o czym będziemy mówić
w tym rozdziale.
Rachunek tensorowy jest szczególnie pożyteczny do opisu własności substancji, które
to własności zmieniają się z kierunkiem — chociaż jest to tylko jeden przykład zastosowa-
nia tensorów. Ponieważ większość z Was nie ma zamiaru zostać fizykami, ale wybiera
się w realny świat, gdzie rzeczy poważnie zależą od kierunku, to wcześniej czy później
będziecie musieli korzystać z tensorów. Zgodnie więc z zasadą, aby nicżego nie pomijać,
♦’ Porównaj: Tom I, cz. 1, rozdz. II (Wektory).
31-1. TENSOR POLARYZOWALNOŚCI DIELEKTRYCZNEJ
187
omówimy teraz tensory, chociaż niezbyt szczegółowo. Chcemy mieć to przeświadczenie,
że nasze podejście do fizyki jest „kompletne”. Tak więc na przykład nasza elektrodyna-
mika jest kompletna — tak kompletna jak każdy kurs elektryczności i magnetyzmu,
nawet kurs dla zaawansowanych. Nasza mechanika nie jest natomiast kompletna, po-
nieważ uczyliśmy się jej nie osiągnąwszy jeszcze wysokiego poziomu wyrobienia mate-
matycznego i nie byliśmy w stanie omówić takich zagadnień jak zasada najmniejszego
działania, funkcje Lagrange’a czy Hamiltona, i tak dalej, które są bardziej eleganckimi
sposobami opisu mechaniki. Jednak, z wyjątkiem ogólnej teorii względności, mamy już
w sposób pełny sformułowane prawa mechaniki. Nasza elektryczność i magnetyzm są
sformułowane w sposób kompletny, a także wiele innych teorii podaliśmy w sposób
kompletny. Nie uczyniliśmy naturalnie jeszcze tego z mechaniką kwantową, musimy bo-
wiem zostawić sobie coś na przyszłość, ale powinniśmy przynajmniej wiedzieć, co to jest
tensor.
W rozdziale 30 podkreśliliśmy, że własności substancji krystalicznych są różne w róż-
nych kierunkach — mówimy, że substancje te są anizotropowe. Zależność indukowanego
momentu dipolowego od kierunku przyłożonego pola elektrycznego jest jednym z przy-
kładów, z którego właśnie skorzystamy przy wprowadzeniu pojęcia tensora. Przypuśćmy,
że dla danego kierunku pola elektrycznego indukowany moment dipolowy na jednostkę
objętości, P, jest proporcjonalny do natężenia przyłożonego pola E. (Jest to dobre przy-
bliżenie dla wielu substancji, jeżeli pole E nie jest zbyt duże.) Oznaczmy stałą proporcjo-
nalności a*’. Chcemy teraz omówić substancje, dla których a zależy od kierunku przy-
łożonego pola; tak jest na przykład w kryształach takich jak kalcyt i innych, przez które
patrząc widzimy podwójne obrazy.
Przypuśćmy, że dla jakiegoś kryształu stwierdzimy, że pole elektryczne Ej w kierunku
osi x wytwarza polaryzację ?! w tym kierunku. Następnie zaś stwierdzimy, że pole elek-
tryczne E2 w kierunku osi y, o takim samym natężeniu co pole Ej, wytwarza inną polary-
zację P2 w kierunku osi y. Co by się stało, gdybyśmy przyłożyli pole elektryczne pod
kątem 45°? No cóż, takie pole jest superpozycją dwóch pól: wzdłuż osi x i wzdłuż osi y,
tak że polaryzacja P będzie wektorową sumą Px i P2, tak jak to pokazano na rys. 31. la.
Polaryzacja nie ma już teraz tego samego kierunku co pole elektryczne. Widać, jak to
się mogło stać. W krysztale mogą istnieć ładunki, które mogą się łatwo poruszać w jed-
nym kierunku, na przykład w górę i w dół, a które raczej nie są zdolne do wykonywania
ruchów bocznych. Gdy przyłożyć siłę kulombowską pod kątem 45°, ładunki przesu-
ną się w większym stopniu w górę niż w bok. Przesunięcia nie następują w kie-
runku siły zewnętrznej ze względu na obecność asymetrycznych, wewnętrznych sił
sprężystych.
Oczywiście, nie musi to być akurat kąt 45°. Jest ogólnie słuszne, że polaryzacja indu-
kowana kryształu nie ma kierunku pola elektrycznego. W naszym powyższym przykła-
dzie udało nam się „szczęśliwie” dobrać osie x i y, dla których wektor polaryzacji P był
*’ W rozdziale 10 (t. II, cz. 1) postąpiliśmy zgodnie z ogólnie przyjętą umową i pisaliśmy P = ZfrfE,
Wzywając x (chij „podatnością”. Tutaj wygodniej będzie użyć jednego symbolu, tak ze piszemy a
^biiast eQx- Dla dielektryków izotropowych a = (x—1)e0, gdzie x jest stalą dielektryczną (patrz § 10-4).
188
31. tensory
31.1. Dodawanie się wektorów po-
laryzacji w krysztale anizotropo-
wym
równoległy do indukującego go pola elektrycznego Ę
dla obu kierunków: x i y. Gdyby obrócić kryształ
względem osi współrzędnych, pole elektryczne E
w kierunku osi y wytworzyłoby na ogół polaryzację
P, mającą zarówno składową y-ową, jak i skła-
dową x-ową. Podobnie, polaryzacja pochodząca od
pola elektrycznego, w kierunku osi x, miałaby
również składową x-ową i składową y-ową. Wektory
polaryzacji byłyby wówczas takie jak na rys. 31. Ib
a nie jak na rys. 31.la. Sprawy się dość komplikują,
ale dla każdego pola E, działającego w ustalonym
kierunku, wartość bezwzględna wektora P jest w dal-
szym ciągu proporcjonalna do wartości bezwzględnej
wektora E.
Chcemy teraz rozważyć przypadek ogólny, w któ-
rym kryształ jest dowolnie zorientowany względem
osi współrzędnych. Pole elektryczne w kierunku osi
x wytworzy polaryzację P, o składowych x-owej,
y-owej i z-owej; możemy napisać
Px = axxEx, Py = ayxEx, Pz = azxEx. (31.1)
Powiedzieliśmy tutaj tylko, że jeżeli pole elektry-
czne ma kierunek osi x, to polaryzacja nie musi mieć
tego samego kierunku, ale może mieć składowe
x-ową, y-ową i z-ową, z których każda jest proporcjonalna do składowej Ex. Współ-
czynniki proporcjonalności oznaczamy odpowiednio: axx, ayx, a2X (pierwszy wskaźnik
mówi nam, z którą składową wektora P mamy do czynienia, a drugi odnosi się do
kierunku pola elektrycznego).
Podobnie dla pola w kierunku osi y można napisać
PX = aXyEy> Py = ayyEy’ Pz = azyEy’ (3L2)
a dla pola w kierunku osi z,
Px=aX!Ez, Py = ayzEz, Pz = azzEz. (31-3)
Za pomocą powyższych wzorów powiedzieliśmy, że polaryzacja zależy liniowo od pól,
tak więc jeżeli mamy pole elektryczne E o obu składowych x-owej i y-owej, to wypadko-
wa składowa x-owa wektora P będzie sumą obu składowych Px z równań (31.1) i (31-2)-
Jeżeli natomiast pole E ma składowe wzdłuż osi x, y i z, to składowe wypadkowe wekto-
ra P będą sumą trzech przyczynków z równań (31.1), (31.2) i (31.3). Innymi słowy, wek-
tor P będzie teraz dany równaniami
Px = axxEx-3raxyEy+axzEz,
Py ayXEX~^~ayyEy~^~ayzEz’>
Pz <^zXEX~^~azyEy~^'<^zzEz'
(31-4)
31. TENSOR polaryzowalności dielektrycznej
189
Dielektryczne własności kryształu są zatem całkowicie opisane za pomocą dziewięciu
wielkości(a^, axy, axz, ayz,...), które można przedstawić symbolem a,y. (Każdy ze wskaź-
ników i i j przebiega trzy możliwe litery x, y i z.) Każde dowolne pole elektryczne E można
rozłożyć na składowe Ex, Ey i Ez\ z tych składowych, przy pomocy a,y, można znaleźć
składowe Px, Py i Pz, które wspólnie dają całkowitą polaryzację P. Zbiór dziewięciu współ-
czynników au nazywa się tensorem — w tym przypadku tensorem polaryzowalności die-
lektrycznej. Tak samo jak się mówi, że trzy liczby (Ex,Ey,Ez) „tworzą wektor E”, tak
się też mówi, że dziewięć liczb (a**, axy,...) „tworzy tensor a0”.
31-2. Przekształcanie składowych tensora
Wiemy, że po przejściu do nowego Układu współrzędnych x', y' i z' zarówno składo-
we wektora Ex., Ey. i Ez., jak i składowe wektora P będą zupełnie inne. Wszystkie więc
współczynniki a,y będą różne dla różnych układów współrzędnych. W istocie, można zo-
baczyć jak muszą się zmienić ay, zmieniając w odpowiedni sposób składowe wektorów
E i P; jeżeli bowiem opisujemy w nowym układzie współrzędnych fizycznie to samo pole
elektryczne, to powinniśmy otrzymać tę samą polaryzację. Dla każdego nowego układu
współrzędnych składowa Px- jest pewną kombinacją liniową składowych Px, Py i Pz :
P^ = aPx+bPy+cPz,
i podobnie dla innych składowych. Podstawiając Px, Py i Pz wyrażone poprzez składowe
pola E z równania (31.4) otrzymujemy
P,. = a(a^Ex+ax;,Ą+a„E'I)+
+ ^(a>x-^*+aWĄ- + a^-^z)+
+ c{aIXEx+azyEy+azzEz).
Wyraźmy teraz składowe Ex, Ey i Ez przez Ex., Ey. i Ez.; np.
Ex = a'Ex.+b'Ey.+c'Ez.,
gdzie współczynniki a', b', c' są związane z współczynnikami a, b, c, ale nie są im równe.
W ten sposób mamy składową Px-, wyrażoną przez składowe Ex-, Ey- i Ez-, to znaczy
mamy nowe współczynniki a,y. Jest to dość żmudna procedura, ale zupełnie prosta.
Mówiąc o zmianie osi zakładamy, że kryształ pozostaje nieruchomy w przestrzeni.
Jeżeli kryształ obracałby się wraz z osiami, to współczynniki a,y by się nie zmieniły. Od-
wrotnie, gdyby zmienić orientację kryształu względem osi, mielibyśmy nowy zbiór współ-
czynników a. Ale jeżeli mamy te współczynniki dla jakiejś jednej orientacji kryształu,
to możemy je znaleźć dla każdej innej orientacji za pomocą transformacji opisanej po-
wyżej. Innymi słowy, własności dielektryczne kryształu są całkowicie opisane przez po-
danie współczynników tensora polaryzowalności a,y w odniesieniu do jakiegoś dowolnie
Wybranego układu osi. Podobnie jak z cząstką można związać wektor prędkości v =
(**> vy, vz) wiedząc, że te trzy składowe, po zmianie osi współrzędnych, zmienią się
190
31. TENSORY
w pewien określony sposób, tak samo z kryształem wiąże się jego tensor polaryzowal-
ności ay, którego dziewięć składowych będzie się przy zmianie układu współrzędnych
transformować w pewien określony sposób.
Zależność pomiędzy wielkościami P i E, daną przez równanie (31.4), można zapisać
w bardziej zwartej postaci:
P- = Ę (31.5)
i
przy czym rozumie się, że i reprezentuje albo x, albo y, albo z i że sumę się bierze wzglę-
dem j = x, y i z. Dla tensorów wynaleziono wiele specjalnych metod zapisu, ale każda
z nich jest wygodna tylko dla jakiejś ograniczonej klasy zagadnień. Jedna z ogólnie przy-
jętych umów polega na opuszczeniu znaku sumy (JJP) w równaniu (31.5), przy czym ro-
zumie się, że w wypadku gdy ten sam wskaźnik pojawia się dwa razy (tutaj j), to zawsze
należy po tym wskaźniku sumować. Ponieważ w tych wykładach będziemy bardzo rzadko
posługiwać się tensorami, nie będziemy zawracać sobie głowy przyswajaniem żadnych
takich specjalnych metod zapisu lub umów.
31-3. Elipsoida energii
Chcemy się teraz oswoić nieco z tensorami. Przypuśćmy, że zadamy sobie interesu-
jące pytanie: Jaka energia jest potrzebna do spolaryzowania kryształu (oprócz energii
pola elektrycznego, która — jak wiemy — jest równa e0E2j2 na jednostkę objętości)?
Rozważmy przez chwilę ładunki atomowe, które ulegają przesunięciu. Praca wykonana
przy przesunięciu ładunku o odległość dx jest równa qExdx, a jeżeli w jednostce obję-
tości jest N ładunków, to praca wykonana jest równa qExN dx. Ale qNdx jest zmianą
dPx w momencie dipolowym na jednostkę objętości. Tak więc energia potrzebna na jed-
nostkę objętości jest równa
ExdPx.
Okazuje się, że praca wykonana przez wszystkie trzy składowe pola jest równa (na jed-
nostkę objętości)
E-rfP.
Ponieważ wartość bezwzględna wektora P jest proporcjonalna do pola E, praca wyko-
nana na jednostkę objętości, przy zmianie polaryzacji od 0 do P, jest równa całce z E-^P-
Oznaczając tę pracę przez uP*’ zapisujemy
uP = |EP = (31-6)
l
Można teraz wyrazić P poprzez E za pomocą równania (31.5). Otrzymujemy
»p = ł2'2'“.£-£<- (31”
l J *•
*• Nie należy mylić tej pracy, wykonanej przez pole elektryczne przy tworzeniu polaryzacji, z energ1^
potencjalną — p0-E trwałego momentu dipolowego p0.
31-3. ELIPSOIDA ENERGII
191
Gęstość energii uP jest liczbą niezależną od wyboru osi, a więc jest skalarem. Tensor ma
więc taką własność, że wysumowany (z wektorem) po jednym wskaźniku daje nowy wek-
tor. a wysumowany po obu wskaźnikach (z dwoma wektorami) daje skalar.
Tensor afj powinien się w rzeczywistości nazywać ..tensorem drugiego rzędu”, po-
nieważ ma on dwa wskaźniki. Wektor — z jednym wskaźnikiem — jest tensorem pierw-
szego rzędu, a skalar — bez wskaźnika — jest tensorem zerowego rzędu. Mówimy więc,
że pole elektryczne E jest tensorem pierwszego rzędu, a gęstość energii uP jest tensorem
zerowego rzędu. Pojęcie tensora można rozszerzyć do trzech lub więcej wskaźników i w ten
sposób tworzyć tensory rzędu wyższego niż drugi.
Wskaźniki tensora polaryzacji przebiegają trzy możliwe wartości — są to tensory
w trzech wymiarach. Matematycy zajmują się tensorami w czterech, pięciu lub więcej
wymiarach. Czterowymiarowym tensorem Fpr posłużyliśmy się już w naszym relatywi-
stycznym opisie pola elektromagnetycznego (rozdz. 26).
Tensor polaryzacji a:J ma interesującą własność. Jest on symetryczny, to znaczy że
zachodzi axy = ayx oraz podobne równości dla pozostałych par wskaźników. (Jest to
własność fizyczna kryształu rzeczywistego i nie musi ona być spełniona dla wszystkich
tensorów.) Czytelnik może sam udowodnić, że to musi być prawda, obliczając zmianę
energii kryształu w cyklu składającym się z następujących etapów: (1) włączenia pola
w kierunku osi .r; (2) włączenia pola w kierunku osi y; (3) wyłączenia pola w kierunku
osi .v; (4) wyłączenia pola w kierunku osi y. Po wykonaniu tego cyklu kryształ powraca
do stanu początkowego i wypadkowa praca zużyta na polaryzację musi być równa zeru.
Można pokazać, że aby to było prawdą, axy musi być równe ayx. Podobne rozumowanie
można oczywiście przeprowadzić dla axx itd. A więc tensor polaryzacji jest symetryczny.
Oznacza to także, że tensor polaryzacji można zmierzyć mierząc po prostu energię
potrzebną do spolaryzowania kryształu w różnych kierunkach. Przypuśćmy, że przykła-
damy pole E, mające tylko składową A-ową i y-ową; wówczas zgodnie z równaniem (31.7)
= łkA2+(%+«,X£,+«,/,2]. (3i-8)
Mając samo pole Ex można określić współczynnik axx; znając zaś samo Ey można wyzna-
czyć a ; przy obecności natomiast obu pól Ex i Ey otrzymujemy dodatkową energię,
za którą odpowiedzialny jest wyraz zawierający współczynnik (ax>.+«^)- Ponieważ a =
~ ayx, wyraz ten jest równy 2axyExEy; współczynnik axy można wyznaczyć mierząc tę
dodatkową energię.
Wyrażenie na energię [równanie (31.8)] ma ładną interpretację geometryczną. Przy-
puśćmy, że pytamy, jakie pola Ex i Ey odpowiadają pewnej danej z góry gęstości energii,
nP' »o- Sprowadza się to do problemu matematycznego, polegającego na rozwiązaniu
równania
+2%£xA+%£>2 = 2«o-
^est to równanie kwadratowe, tak że gdy wykreślimy wartości Ex i Ey, będące rozwiąza-
Uiami tego równania, to będą one punktami leżącymi na elipsie (rys. 31.2). (Wykresem
te8° równania musi być elipsa, a nie parabola lub hiperbola, bo energia dla każdego pola
Jest zawsze dodatnia i skończona.) Wektor E o składowych Ex i E będzie wektorem po-
192
31. TENSORY
31.2. Miejsce geometryczne wek-
tora E = (Ex, Ey), któremu odpo-
wiada stała energia polaryzacji
31.3. Elipsoida energii tensora po-
laryzacji
prowadzonym ze środka układu do punktu na elipsie.
Tak więc taka elipsa energii stanowi ładny sposób
„uwidocznienia” tensora polaryzacji.
Jeżeli uogólni się nasze rozważania na wszystkie
trzy składowe, to koniec wektora elektrycznego E
o dowolnym kierunku, potrzebnego do wytworze-
nia gęstości energii w0, będzie leżał na powierzchni
elipsoidy, tak jak to pokazano na rys. 31.3. Kształt
tej elipsoidy stałej energii określa jednoznacznie
tensor polaryzowalności.
Elipsoida ma tę cenną właściwość, że można ją
zawsze w prosty sposób określić przez podanie
kierunków trzech „osi głównych” i „średnic” elipsy
wzdłuż tych osi. „Osiami głównymi” są kierunki
najdłuższej i najkrótszej średnicy oraz kierunek do
nich obu prostopadły. Są one zaznaczone jako osie
a, b i c na rys. 31.3. W odniesieniu do tych osi eli-
psoida ma szczególnie proste równanie:
aoaEa+abbEb+accEc = 2tt0.
W odniesieniu do tych osi tensor dielektryczny ma
więc tylko trzy różne od zera składowe: aaa, abb
i acc. Należy zaznaczyć, że bez względu na to, jak bar-
dzo skomplikowany jest kryształ, zawsze można wy-
brać taki układ osi (niekoniecznie muszą to być osie
kryształu), dla którego tensor polaryzacji ma tyl-
ko trzy składowe. Dla takiego układu osi równanie
(31.4) przybiera prostą postać:
Pa = “A
Pb = abbEb, (31.9)
Pc = accEc.
Pole elektryczne skierowane wzdłuż dowolnej osi głównej wytwarza polaryzację mającą
też kierunek tej samej osi, ale współczynniki dla każdej z trzech osi mogą być, oczywiście,
różne.
Często tensor opisuje się podając dziewięć współczynników w tabelce umieszczonej
w nawiasach:
(31.10)
zz _
Dla osi głównych a, b i c różne od zera są tylko wyrazy diagonalne; mówimy wówcz3'
31.3. ELIPSOIDA ENERGII
193
o „tensorze w postaci diagonalnej”. Całkowity tensor jest wówczas równy
aM 0 0 , t ‘
0 ubb 0 (3141)
.0 0 acc . f >
Ważne jest, że każdy tensor polaryzacji (w rzeczywistości, każdy tensor symetryczny
drugiego rzędu w przestrzeni o dowolnej liczbie wymiarów) można sprowadzić do takiej
postaci przez wybranie odpowiedniego układu osi współrzędnych.
Jeżeli wszystkie trzy elementy tensora polaryzacji w postaci diagonalnej są równe,
to znaczy jeżeli
a«a = abb = «« = a> (31.12)
elipsoida energii staje się kulą i polaryzowalność jest taka sama we wszystkich kierun-
kach. Ośrodek materialny jest wtedy izotropowy. W zapisie tensorowym
Cttf = ady, (31.13)
gdzie dy jest jednostkowym tensorem: ‘ <5« = '10 0' 0 1 0 . . (31.14)
Oznacza to oczywiście, Źe 0 0 1
^=1, jeżeli i = =>;
ó,y=0, (31.15) jeżeli i ^j.
Tensor nazywamy często „deltą Kroneckera”. Czytelnik może się zabawić wykaza-
niem, że tensor (31.14) ma dokładnie taką samą postać, jeżeli przejść z naszego układu
do jakiegoś innego układu kartezjańskiego. Tensor polaryzacji z równania (31.13) daje
I
00 sprowadza się do naszego poprzedniego wyniku dla dielektryków izotropowych:
P = aE.
Kształt i orientację w przestrzeni elipsoidy polaryzacji można czasem związać z włas-
nościami symetrii kryształu. Powiedzieliśmy w rozdz. 30, że sieć trójwymiarowa może
"neć 230 różnych symetrii i że można je, dla wielu celów, dogodnie zgrupować w 7 kla-
Sach, z uwagi na kształt komórki elementarnej. Otóż elipsoida polaryzowalności musi
podobne geometryczne symetrie wewnętrzne co kryształ. Tak na przykład kryształ
lrńjskośny ma niską symetrię — elipsoida polaryzowalności będzie wtedy miała osie
Olerówne, a ich kierunki nie będą się na ogół pokrywać z osiami kryształu. Z drugiej
str°ny kryształ jednoskośny charakteryzuje się tym, że jego właściwości nie zmieniają się
13
Wykłady z fizyki
194
31. TENSORY
przy obrocie kryształu o 180° wokół jednej z osi. Tak więc tensor polaryzacji musi p0
takim obrocie pozostać taki sam. Wynika stąd, że elipsoida polaryzowalności musi przejść
po obrocie o 180° w samą siebie. A to może nastąpić tylko wtedy, gdy jedna z osi elipsoidy
będzie miała ten sam kierunek, co oś symetrii kryształu. Poza tym na rozmiary i orientację
elipsoidy nie nakłada się żadnych ograniczeń.
Jednakże dla kryształu rombowego osie elipsoidy muszą odpowiadać osiom kryształu
bowiem obrót o 180° względem którejkolwiek z trzech osi odtworzy tę samą sieć. Jeżeli
wziąć pod uwagę kryształ tetragonalny, to jego elipsoida musi mieć taką samą symetrię
co sam kryształ, a więc musi mieć dwie średnice równe. W końcu, jeśli chodzi o kryształ
regularny, to wszystkie trzy średnice elipsoidy muszą być sobie równe; elipsoida prze-
chodzi w kulę i polaryzowalność kryształu jest tu taka sama we wszystkich kierunkach.
Wyszukiwaniu możliwych rodzajów tensorów dla wszystkich możliwych symetrii
kryształu poświęca się sporo czasu i energii. Nazywa się to „opisem na gruncie teorii
grup”. Ale dla prostych przypadków tensora polaryzowalności można stosunkowo łatwo
zobaczyć, jaką postać powinny mieć te zależności.
31-4. Inne przykłady tensorów; tensor bezwładności
W fizyce mamy wiele innych przykładów tensorów. Tak na przykład w metalu lub
w innym przewodniku często się okazuje, że gęstość prądu j jest w przybliżeniu propor-
cjonalna do pola elektrycznego E; stałą proporcjonalności nazywa się przewodnością a:
j = <rE.
Dla kryształu jednak zależność pomiędzy j i E jest bardziej złożona; przewodność nie
jest taka sama we wszystkich kierunkach. Przewodność jest tensorem, co zapisujemy:
31.4. Moment pędu L bryły
sztywnej nie jest na ogół
równoległy do prędkości ką-
towej bryły u
Innym przykładem tensora fizycznego jest moment
bezwładności. W rozdziale 18 tomu I (cz. 1) widzieliśmy,
że bryła obracająca się wokół ustalonej osi ma moment pędu
L, proporcjonalny do prędkości kątowej co. Współczynnik
proporcjonalności nazwaliśmy momentem bezwładności, A
L = Iw.
Dla obiektu o kształcie dowolnym moment bezwładności
zależy od orientacji tego obiektu względem osi obrotu.
Prostokątny klocek, na przykład, będzie miał różne mo-
menty bezwładności dla każdej ze swych trzech prosto-
padłych osi. Prędkość kątowa w i moment pędu L są wek-
torami. Przy obrotach wokół którejś z osi symetrii, wek-
tory L i a> są do siebie równoległe. Ale jeżeli moment
bezwładności jest różny dla trzech osi głównych, to wek-
31_4. INNE PRZYKŁADY TENSORÓW; TENSOR BEZWŁADNOŚCI
195
tory w i l nie są, w ogólnym przypadku, jednakowo skierowane (patrz rys. 31.4).
Są one związane ze sobą w podobny sposób jak wektory E i P. W ogólnym przypadku
mamy:
Lx = IxXa,X + IXyOiy + IXzOiz>
Ey ^yx^X~^~^yy^y~^~^yz^z^
4 = łz^+łzy^y+hz^z-
(31.16)
Dziewięć współczynników Iu nazywamy tensorem bezwładności. Analogicznie jak w przy-
padku polaryzacji, energia kinetyczna musi być pewną formą kwadratową składowych
ax, my * mz-
Ek=i^I9a>t0)j. (31.17)
i,J
Za pomocą tej formy kwadratowej można zdefiniować elipsoidę bezwładności. Posłu-
gując się formą kwadratową energii można też wykazać, że tensor bezwładności jest sy-
metryczny — Że ly = Ijj.
Tensor bezwładności dla ciała sztywnego można obliczyć, jeżeli znany jest jego kształt.
Należy tylko wypisać całkowitą energię kinetyczną wszystkich cząstek w ciele. Cząstka
o masie m i o prędkości v ma energię kinetyczną Ąnw2, a całkowita energia kinetyczna
jest po prostu sumą
po wszystkich cząstkach ciała. Prędkość v każdej cząstki wiąże się z prędkością kątową a>
bryły. Załóżmy, że ciało się obraca wokół swojego środka masy, który z założenia znaj-
duje się w spoczynku. Jeżeli teraz r jest odległością cząstki od środka masy, to jej prędkość
v jest dana przez wxr. Tak więc całkowita energia kinetyczna jest równa
Ek = ^im(t,1Xr)2- (31.18)
Musimy teraz jeszcze tylko wyrazić wxr przez składowe a>x, <oy, a>2 i x, y, z, a wynik
porównać z równaniem (31.17); porównując odpowiednie wyrazy otrzymamy wtedy
współczynniki ly. W wyniku obliczeń mamy:
(<oxr)2 = (w xr)2+(w xr)2+(o> xr)2 =
= (a>yz-a)2y)2+(a)2x-<oxz)2+(t»xy—a)yx)2 =
= +o)yz2—2a>ya)2yz+a)2y2 +
-}-a)2x2—2a)2a)xxz-}-a)xz2-[-
+a>2y2—2a)xa)yyx+a)2x2.
Mnożąc to równanie przez m/2, sumując po wszystkich cząstkach i porównując z równa-
łem (31.17) widzimy, że np. Ixx jest dane przez
4. = m(y2+z2).
^st to taki sam wzór, jaki mieliśmy poprzednio (rozdz. 19 tomu I, cz. 1) dla momentu
J96
V
31. TENSORY
bezwładności ciała obracającego się wokół osi x. Ponieważ r2 = x2+y2+z2, wyraz ten
można również zapisać w postaci
4* = £ m(r2—x2).
Po znalezieniu wszystkich pozostałych wyrazów tensor bezwładności można zapisać jako
— mxz
-J?myz
u
m (r2—x2) mxy
myx S m(r2-y2)
— V1 mzx ' — mzy m(r2—z2)
(31.19)
Jeżeli ktoś chce, może to zapisać przy pomocy „zapisu tensorowego” jako
4 = X m^2 óa~r‘r^ (31.20)
gdzie rt są składowymi (x, y, z) wektora położenia cząstki, a £ oznacza sumowanie po
wszystkich cząstkach. Moment bezwładności jest zatem tensorem drugiego rzędu, któ-
rego wyrazy są związane z własnościami ciała oraz wiążą moment pędu L z prędkością
kątową w wzorem ,
(31-21)
i
Dla ciała o zupełnie dowolnym kształcie można zawsze znaleźć elipsoidę bezwładności,
a stąd jej trzy osie główne. Tensor bezwładności będzie w odniesieniu do tych osi diago-
nalny, tak że dla każdej bryły sztywnej istnieją zawsze trzy prostopadłe osie, dla których
prędkość kątowa i moment pędu są do siebie równoległe. Osie te nazywamy osiami głów-
nymi bezwładności.
31-5. Iloczyn wektorowy*’
Możemy teraz powiedzieć, że tensorami drugiego rzędu posługiwaliśmy się już w rozdz.
20 tomu I (cz. 1). Tam to bowiem zdefiniowaliśmy moment siły w dwóch wymiarach,
jako
= xFy-yFx.
Pojęcie to możemy uogólnić do trzech wymiarów, przyjmując
TU = riFJ~rJFi- <31,22)
Wielkość Tu jest tensorem drugiego rzędu. Można się o tym przekonać „działając” np-
tensorem r,y na jakiś wektor, powiedzmy na jednostkowy wektor e, w następujący sposób:
i
•* Porównaj: Tom 1,’CZ- 1, rozdz. 20 {Obroty w przestrzeni^
31.5. ILOCZYN WEKTOROWY 197
Jeżeli powyższa wielkość jest wektorem, to Ty musi się transformować jak tensor — jest
to przyjęta przez nas definicja tensora. Podstawiając za Ty jego postać (31.22) mamy
E r»ei = S riF>el ~ S rieJFi = rXF,e)-(r,e)Fr
J i J
Ponieważ iloczyny skalarne są skalarami, oba wyrazy po prawej stronie równości, a także
ich różnica, są wektorami, czyli Ty jest tensorem.
Ale ty jest szczególnym rodzajem tensora; jest to tensor antysymetryczny, tzn.
a więc ma tylko trzy wyrazy różne od zera: Txy, Ty2 i tzx. W rozdziale 20 tomu I (cz. 1)
potrafiliśmy pokazać, że te trzy wyrazy prawie „przypadkowo” transformują się tak,
jak trzy składowe wektora i mogliśmy zdefiniować wektor osiowy
t = <?x, = (T,z> r«> ^)-
Powiedzieliśmy „przypadkowo”, bo zachodzi to tylko w trzech wymiarach. W czterech,
na przykład, wymiarach antysymetryczny tensor drugiego rzędu ma sześć wyrazów róż-
nych od zera i na pewno nie da się go zastąpić wektorem o czterech składowych.
Tak samo jak wektor osiowy t = r xF, tak też każdy iloczyn wektorowy dwóch wek-
torów biegunowych jest tensorem — można to pokazać posługując się dokładnie tym sa-
mym rozumowaniem. Tensory te mogą jednak, na szczęście, być reprezentowane przez
wektory (a dokładniej przez pseudowektory), co pozwala nam znacznie uprościć ich ma-
tematykę.
Z punktu widzenia matematyki, jeżeli a i b są dowolnymi dwoma wektorami, to dzie-
więć wielkości afy tworzy tensor (chociaż może on nie mieć żadnej pożytecznej interpre-
tacji fizycznej). Tak więc dla wektora położenia r(, rtrj jest tensorem, a ponieważ dy
jest także tensorem, widzimy, że prawa strona równania (31.20) jest rzeczywiście tenso-
rem. Podobnie równanie (31.22) przedstawia tensor, ponieważ oba wyrazy po jego pra-
wej stronie są tensorami.
31-6. Tensor naprężeń
Opisywane przez nas dotychczas tensory symetryczne były po prostu współczynnika-
ch wiążącymi jeden wektor z drugim. Chcielibyśmy teraz rozpatrzyć pewien tensor,
który ma inne znaczenie fizyczne — tensor naprężeń. Przypuśćmy, że mamy ciało stałe,
na które działają różne siły. Mówimy, że wewnątrz powstają różne „naprężenia”, przez
co rozumiemy, że pomiędzy dwoma sąsiednimi częściami substancji materialnej istnieją
siły wewnętrzne. Powiedzieliśmy już trochę o takich naprężeniach w przypadku dwuwy-
miarowym, kiedy rozważaliśmy napięcie powierzchniowe w napiętej membranie w § 12-3
H, cz. 1). Zobaczymy teraz, że siły wewnętrzne wewnątrz trójwymiarowego ciała moż-
na opisać posługując się pewnym tensorem.
Rozważmy ciało z jakiegoś sprężystego materiału, np. bryłę galaretki. Jeżeli przetnie-
198
31. TENSORY
51.5. Ośrodek materialny po lewej stronie
płaszczyzny a wywiera poprzez powierzch-
nię dy dz siłę dFt na ośrodek materialny
po prawej stronie płaszczyzny
my bryłę na dwie części, to, w ogólnym przy-
padku, ośrodek materialny po każdej stronie
cięcia zostanie przesunięty przez siły wewnę-
trzne. Przed przecięciem pomiędzy tymi dwie-
ma częściami bryły musiały istnieć siły, które
utrzymywały materiał we właściwym miej-
scu; naprężenie można zdefiniować poprzez te
siły. Wyobraźmy sobie np. płaszczyznę prosto-
padłą do osi x, taką jak płaszczyzna a na rys.
31.5, i zastanówmy się, jakie siły działają po-
przez mały element powierzchni Ay Az na tej
płaszczyźnie. Ośrodek materialny po stronie
lewej powierzchni wywiera siłę JFj na ośrodek
po stronie prawej, tak jak to pokazano na
części b) rysunku. Oczywiście, występuje tu też
przeciwnie skierowana siła reakcji — AFlt
działająca na ośrodek po lewej stronie powie-
rzchni. Jeżeli rozważany element powierzch-
ni jest dostatecznie mały, można się spodzie-
wać, że JFj jest proporcjonalne do jego
powierzchni Ay Az.
Znamy już dobrze jeden rodzaj naprężenia
— ciśnienie w cieczy statycznej. Tam siła jest
31.6. Siłę działającą poprzez element
powierzchni dy dz, prostopadły do osi x,
można rozłożyć na trzy składowe: dFxi,
dFn i dFti.
31.7. Siła działająca poprzez element po-
wierzchni prostopadły do y, rozłożona na
trzy prostopadłe składowe
31-6. TENSOR NAPRĘŻEŃ
199
równa ciśnieniu razy powierzchnia i jest prostopadła do elementu powierzchni cie-
czy. Dla ciał stałych, a także dla cieczy lepkich w ruchu, siła nie musi być prostopadła
do powierzchni; oprócz ciśnień (dodatnich lub ujemnych) występują tam jeszcze siły ści-
nania. (Mówiąc „siła ścinania” mamy na myśli składowe siły działające stycznie do po-
wierzchni.) Należy oczywiście uwzględnić wszystkie trzy składowe siły. Zauważmy także,
że jeżeli wykonalibyśmy inne cięcie, płaszczyzną o jakiejś innej orientacji, to otrzymali-
byśmy na nim inne siły. Pełny opis naprężeń wewnętrznych uwzględniający tę zmianę
orientacji cięcia wymaga więc użycia tensora.
Tensor naprężeń definiujemy w sposób następujący: Najpierw bierzemy pod uwagę
fikcyjne cięcie prostopadłe do osi x i rozkładamy siłę A , działającą poprzez powierzch-
nię tego cięcia, na jej składowe AFxl, AFyl, AFzl, tak jak na rys. 31.6. Stosunek tych
sił do pola powierzchni Ay Az oznaczamy S^, Syx i Szx. Tak na przykład
ę - AF>'
J yx AyAz'
Pierwszy wskaźnik, y, odnosi się do kierunku składowej siły; drugi wskaźnik, x, oznacza
kierunek prostopadły do powierzchni. Pole powierzchni Ay Az można też zapisać jako
Aax, podkreślając, w ten sposób, że jest to pole elementu powierzchni, prostopadłego
do osi x. Wówczas
ę - AFyl
yx Aax •
Następnie wyobraźmy sobie cięcie prostopadłe do osi y. Poprzez małą powierzchnię
Ax Az będzie działać siła AF2. Tę siłę rozkładamy znowu na trzy składowe, tak jak to
pokazano na rys. 31.7, i definiujemy trzy składowe naprężenia Sxy, Syy, Szy poprzez sto-
sunki trzech składowych siły ZfF2 do pola powierzchni Aay. Na koniec, wyobraźmy so-
bie cięcie prostopadłe do osi z i zdefiniujmy, podobnie jak poprzednio, składowe Sxz, Syz
i Szz. Mamy zatem dziewięć liczb:
(31.23)
Chcemy teraz pokazać, że znajomość tych dziewięciu liczb wystarcza do zupełnego
opisu wewnętrznego stanu naprężenia i że Su jest rzeczywiście tensorem. Przypuśćmy, że
chcemy wiedzieć, jaka siła działa poprzez powierzchnię nachyloną pod jakimś dowolnym
^tem. Czy możemy się o tym dowiedzieć znając Sy? Owszem, w sposób następujący:
Wyobraźmy sobie małą bryłkę, której ścianka N leży na nowej powierzchni, a pozostałe
Sc*anki są równoległe do osi współrzędnych. Jeżeli ścianka N byłaby równoległa do osi z,
mielibyśmy prostopadłościan o podstawie trójkątnej, czyli klin pokazany na rys. 31.8.
^est to dość szczególny przypadek, ale ilustruje on wystarczająco dobrze metodę ogólną.)
S*fy napięcia działające na cały klin z rys. 31.8 są teraz w równowadze (przynajmniej
w granicy nieskończenie małych rozmiarów), tak że całkowita siła działająca na klin musi
200
31. TENSORY
31.8. Siła F„ działająca poprzez ściankę N
(o jednostkowej normalnej n), rozłożona
na trzy składowe
być teraz równa zeru. Siły działające na ścianki
równoległe do osi współrzędnych znamy bez-
pośrednio z Sy. Ich suma wektorowa musi
być równa sile działającej na ściankę N, tak
że siłę tę możemy wyrazić przy pomocy Sy-
Czyniąc założenie, że siły powierzchniowe
działające na nasz klin są w równowadze, po-
mijamy inne siły objętościowe, które mogłyby
być obecne, takie jak siła ciężkości lub pseudo-
siły, występujące w wypadku, jeżeli nasz układ
współrzędnych nie jest układem inercjalnym.
Zauważmy jednak, że takie siły objętościowe
będą proporcjonalne do objętości klina, a więc
do Ax Ay Az, podczas gdy wszystkie siły po-
wierzchniowe są proporcjonalne do takich powierzchni jak Ax Ay, Ay Az itd. Jeżeli więc
weźmiemy mały klin o wystarczająco małych rozmiarach, to siły objętościowe będzie
można zawsze pominąć w porównaniu z siłami powierzchniowymi.
Dodajmy teraz siły działające na ten mały klin. Weźmiemy najpierw składową x-ową;
jest ona sumą pięciu części, z których każda pochodzi od jednej ze ścianek. Jeżeli jednak Az
jest dostatecznie małe, siły działające na ścianki trójkątne (prostopadłe do osi ź) będą
równe i przeciwnie skierowane, tak że możemy o nich zapomnieć. Składowa x-owa siły
działającej na prostokąt podstawy jest równa
AFx2 = SxyAx Az.
Składową x-ową siły działającej na pionowy prostokąt jest
AFxi=S„AyAz.
Te dwie składowe muszą być równe składowej x-owej siły działającej na zewnątrz poprzez
ściankę N. Oznaczmy przez n jednostkowy wektor normalny ścianki N, a siłę działającą
na tę ściankę przez F„; wówczas mamy
AF„ = S„Ay Az+SxyAx Az.
JCft X* * 1 Xjr
Składowa x-owa, Sxn, naprężenia działającego poprzez tę płaszczyznę, równa jest żlA*
podzielonemu przez powierzchnię, która jest równa Aztf Ax2+Ay2; czyli
Ay Ax
Sxn = S„ +Sxy .
VAx2+Ay2 ^Ax2+Ay2
Wielkość Ax/VAx2 + Ay2 jest cosinusem kąta 6 pomiędzy wektorem n, a osią y, tak
to pokazano na rys. 31.8, a więc można ją zapisać jako ny — składową j-ową wektora »•
Podobnie Ay/Y?Ax2+Ay2 równe jest sin 8 = nx. Można więc napisać
5,. = Sxxn +S n,.
xn xx x xy y
31-6. TENSOR NAPRĘŻEŃ
201
Jeżeli teraz uogólni się powyższe rozważania dla dowolnego elementu powierzchni, otrzy-
ma się
lub ogólnie
^xn ‘^xxf^x~^‘^x)’^y~^‘^xz^z
J
(31.24)
Można więc znając SIJ znaleźć siłę działającą poprzez każdy element powierzchni, a za-
tem S,j opisuje w pełni stan naprężenia wewnętrznego w ośrodku materialnym.
Równanie (31.24) mówi, że tensor StJ wiąźe siłę S„ z wektorem jednostkowym n, tak
samo jak tensor atJ wiąże polaryzację P z polem E. Ponieważ n i S„ są wektorami, skła-
dowe Sv muszą się transformować przy zmianie osi współrzędnych, tak jak składowe ten-
sora. A zatem S:j jest rzeczywiście tensorem.
Rozpatrując siły działające na mały sześcian wykonany z jakiejś substancji materialnej
można także pokazać, że Sy jest tensorem symetrycznym. Przypuśćmy, że mamy mały
sześcian o ściankach równoległych do naszych osi współrzędnych i weźmy pod uwagę
jego przekrój, tak jak to pokazano na rys. 31.9. Jeżeli przyjmiemy długość krawędzi sześ-
cianu za jednostkę, to składowe x-owa i v-owa sił działających na ścianki prostopadłe
do osi x i y będą wyglądać tak, jak to pokazano na rysunku. Jeżeli sześcian jest mały, na-
prężenia zmieniają się w sposób nieznaczny przy przejściu od jednej ścianki sześcianu
do ścianki przeciwległej, tak że składowe sił są równe i przeciwnie skierowane — tak jak
to pokazano. Na sześcian nie może teraz działać żaden moment sił, bo zacząłby się on
obracać. Całkowity moment sił względem środka jest równy (Syx—Sxy) (razy jednostkowa
krawędź sześcianu), a ponieważ moment ten jest równy zeru, Syx jest równe Sxy, co ozna-
cza, że tensor naprężeń jest symetryczny.
Ponieważ StJ jest tensorem symetrycznym, można go
opisać przy pomocy elipsoidy, która będzie miała trzy osie
główne. Dla powierzchni prostopadłych do tych osi naprę-
żenia mają szczególnie prostą postać — odpowiadają one
ściskaniom lub rozciąganiem prostopadłym do powierzchni.
Wzdłuż tych ścianek nie występują siły ścinania. Dla
każdego naprężenia można zawsze tak wybrać nasze osie, że
składowe ścinania są równe zeru. Jeżeli elipsoida jest kulą,
to w każdym kierunku istnieją tylko siły normalne (prosto-
padłe do powierzchni). Odpowiada to ciśnieniu hydro-
statycznemu (dodatniemu lub ujemnemu). Tak więc dla
lśnienia hydrostatycznego tensor naprężeń jest diagonalny
1 wszystkie trzy składowe są sobie równe; są one w istocie
P° prostu równe ciśnieniu p. Możemy napisać
(31.25)
Tensor naprężeń — a także jego elipsoida — będzie się
u ogólnym przypadku zmieniał od punktu do punktu
31.9. Składowe x-owe i y-owt
sił działających na cztery
ścianki małego sześcianu
202
31. TENSORY
w bryle materiału; aby opisać całą bryłę, trzeba podać wartość każdej składowej
Sy jako funkcji położenia. A więc tensor naprężeń tworzy pole. Mieliśmy już poia
skalarne, jak np. temperatura T(x, y, z), dla których każdemu punktowi prze-
strzeni przyporządkowuje się jedną liczbę, i pola wektorowe, jak np. pole elektryczne
E(x, y, z), które każdemu punktowi przyporządkowują trójkę liczb. Teraz mamy p0]e
tensorowe, które przyporządkowuje każdemu punktowi przestrzeni dziewięć liczb (a w rze-
czywistości sześć dla tensora symetrycznego Sy). Pełny opis sił wewnętrznych w odkształ-
conym w dowolny sposób ciele stałym wymaga znajomości sześciu funkcji x, y i z.
V !
31-7. Tensory wyższego rzędu
Tensor naprężeń Sy opisuje siły wewnętrzne w ośrodkach materialnych. Jeżeli mate-
riał jest sprężysty, to wygodnie jest opisywać odkształcenie wewnętrzne przy użyciu inne-
go tensora Ty — nazywanego tensorem odkształceń. W przypadku tak prostego przed-
miotu, jak np. sztabki metalu, wiemy, że zmiana długości, AL, jest w przybliżeniu pro-
porcjonalna do siły, co oznacza, że sztabka jest posłuszna prawu Hooke’a
AL = yF.
Uogólnieniem tego prawa dla sprężystego ciała stałego, mogącego podlegać dowol-
nym odkształceniom, jest stwierdzenie, że odkształcenie Ty wiąże się z naprężeniem Stj
poprzez układ równań liniowych
(31.26)
kl
Jak wiemy, potencjalna energia struny (lub sztabki) jest równa
$FAL = łyF2.
Uogólnioną postacią tego prawa jest następujący wzór na gęstość energii sprężystości
w ciele stałym:
pręż = £ ^iSySkl. (31.27)
ykl
Pełny opis własności sprężystych kryształu musi być podany za pomocą współczynników
yijkI. Poznajemy więc nowy dziwoląg — tensor czwartego rzędu. Ponieważ każdy wskaź-
nik może przybrać każdą z trzech wartości x, y lub z, to współczynników tych jest 34 =
= 81. Ale w rzeczywistości są one dane tylko przez 21 różnych liczb. Po pierwsze, ponie-
waż tensor Sy jest tensorem symetrycznym, ma on tylko 6 różnych wartości i dlatego
w równaniu (31.27) występuje co najwyżej 36 różnych współczynników. Ale również Sv
można wymienić na Skl nie zmieniając energii, tak że ytjkl musi być symetryczne ze wzgl?'
du na zamianę par wskaźników ij i kl. Ogranicza to liczbę różnych współczynników do 21-
Tak więc opis sprężystych własności kryształu o najniższej możliwej symetrii wymaga
znajomości 21 stałych sprężystych! Liczba ta jest oczywiście mniejsza dla kryształów
o wyższej symetrii. Tak na przykład kryształ regularny ma tylko trzy stałe sprężyste, a sub-
stancja izotropowa tylko dwie.
jl-7. TENSORY WYŻSZEGO RZĘDU
203
O prawdziwości powyższego twierdzenia można się przekonać z następującego rozu-
mowania. Zastanówmy się, jaką postać muszą mieć składowe yiJkl, aby były niezależne
od kierunku osi współrzędnych, co musi zachodzić, jeżeli materiał jest izotropowy? Od-
powiedź: Mogą one być tylko wtedy niezależne, jeżeli uda się je wyrazić przez tensor
$... Istnieją dwa możliwe wyrażenia Wki ’ tikdji+Wjk’ które mają wymaganą syme-
trię, tak że yukl musi być ich kombinacją liniową. Stąd dla materiałów sprężystych
Yt/ki = ^(dyd^+bCd^+dn^
i dla opisania sprężystych własności materiału potrzebne są dwie stałe: a i b. Czytelniko-
wi pozostawiamy dowód, że kryształ regularny potrzebuje tylko trzech stałych.
Naszym ostatnim przykładem, tym razem związanym z tensorem trzeciego rzędu,
jest zjawisko piezoelektryczne. Kryształ poddany naprężeniu wytwarza pole elektryczne
proporcjonalne do naprężenia; ogólną postacią tego prawa jest związek
jk
gdzie Et jest polem elektrycznym, a Pjjk są współczynnikami piezoelektrycznymi lub ten-
sorem piezoelektrycznym. Czytelnik może spróbować wykazać, że jeżeli kryształ ma śro-
dek inwersji (jest niezmienniczy względem transformacji x, y, z -> — x, —y, —z), to wszyst-
kie współczynniki piezoelektryczne są równe zeru.
31-8. Czterotensor pędu elektromagnetycznego
Wszystkie tensory, które rozpatrzyliśmy dotąd w tym rozdziale, odnoszą się do prze-
strzeni trójwymiarowej; z ich definicji wynika, że mają one pewne własności transforma-
cyjne przy obrotach przestrzennych. W rozdziale 26 mieliśmy okazję posłużyć się ten-
sorem w czterowymiarowej relatywistycznej czasoprzestrzeni; był to tensor pola elektro-
magnetycznego, F^. Składowe takiego czterotensora transformują się przy przekształ-
ceniu Lorentza współrzędnych w pewien szczególny sposób, który został wtedy podany.
(Chociaż nie robiliśmy tak tego, mogliśmy rozważać przekształcenie Lorentza jako „obrót”
w czterowymiarowej „przestrzeni”, nazwanej przestrzenią Minkowskiego; wówczas
można by łatwiej dostrzec analogię z tym, co teraz robimy.)
Jako nasz ostatni przykład chcemy rozważyć jeszcze jeden tensor w czterowymiaro-
wej czasoprzestrzeni (t, x, y, z) teorii względności. Kiedy wypisywaliśmy tensor naprę-
żeń, zdefiniowaliśmy Sy jako składową siły działającej przez jednostkową powierzchnię.
Ale siła jest równa zmianie pędu w jednostce czasu. Dlatego też zamiast mówić „S^
jest x-ową składową siły działającej przez jednostkową powierzchnię, prostopadłą do y”
moglibyśmy równie dobrze powiedzieć „Sxy jest prędkością przepływu x-owej składowej
Pędu poprzez jednostkową powierzchnię, prostopadłą do y". Innymi słowy, każdy z wy-
razów Sy przedstawia także przepływ z-tej składowej pędu przez jednostkową powierzch-
ni? prostopadłą do j-tego kierunku. Są to składowe czysto przestrzenne, ale są one częś-
cią „większego” tensora w czterech wymiarach (fi i v = t, x, y, z), zawierającego do-
204
31. tensory
datkowe składowe, takie jak np. Slx, Syl> Slt itd. Spróbujemy znaleźć teraz znaczenie
fizyczne tych dodatkowych składowych.
Wiemy, że składowe przestrzenne reprezentują przepływ pędu. Dyskusja innego typu
„przepływu” — przepływu ładunku elektrycznego — dostarczy nam wskazówki, która
pomoże nam określić, co reprezentują te dodatkowe składowe tensora Syv w kierunku
czasu. Dla wielkości skalarnej, jaką jest ładunek, przepływ w jednostce czasu (przez jedno-
stkową powierzchnię prostopadłą do kierunku przepływu) jest wektorem przestrzennym —
wektorem gęstości prądu j. Widzieliśmy, że składowa czasowa tego wektora przepływu
jest gęstością całego przepływającego ładunku. Tak na przykład, j można połączyć ze
składową czasową jt = q, a więc z gęstością ładunku, tak aby utworzyć czterowektor
jtl = (o,Di czyli wskaźnik /i wja przybiera wartości t, x, y, z, co kolejno oznacza: gęstość,
przepływ w jednostce czasu w kierunku osi x, przepływ w jednostce czasu w kierunku
osi y i takiż przepływ w kierunku z ładunku skalarnego.
Moglibyśmy teraz oczekiwać, przez analogię z naszym twierdzeniem o składowej cza-
sowej przepływu wielkości skalarnej, że jeżeli Sxx, Sxy i Sxz opisują przepływ x-owej skła-
dowej pędu, to powinna istnieć składowa czasowa Sxl, która byłaby gęstością tego „cze-
goś” co przepływa; to znaczy Sxl powinno być gęstością x-owego pędu. Możemy więc
rozszerzyć „poziomo” nasz tensor, tak aby zawierał składową t. Mamy
Sxt = gęstość x-owego pędu,
Sxx = x-owy przepływ x-owego pędu,
Sxy = j’-owy przepływ x-owego pędu,
Sxz = z-owy przepływ x-owego pędu.
Podobnie dla j’-owej składowej pędu mamy trzy składowe przepływu, Syx, Syy, Syz, do
których powinniśmy dodać czwarty wyraz:
Sj,, = gęstość j’-owego pędu.
I oczywiście do Szx, S.y, Szz dodamy
Szt = gęstość z-owego pędu.
‘ W czterech wymiarach występuje także składowa t pędu, którą jak wiemy jest energia.
A więc tensor Sy powinno się rozszerzyć „pionowo”, dodając składowe Stx, Sly i Slz,
gdzie
Stx = x-owy przepływ energii,
Sty = _r-owy przepływ energii,
Stz = z-owy przepływ energii;
(31.28)
to znaczy Slx jest przepływem energii, na jednostkę powierzchni i w jednostce czasu,
poprzez powierzchnię prostopadłą do osi x, i tak dalej. Na koniec, potrzebna nam
jest jeszcze do kompletu składowa St„ która będzie gęstością energii. Uogólniliśmy
więc nasz tensor naprężeń Sy z trzech wymiarów na czterowymiarowy tensor energii
i naprężeń Syv. Wskaźnik u może przybierać cztery wartości t, x, y i z oznaczające od po-
205
31-8. CZTEROTENSOR PĘDU ELEKTROMAGNETYCZNEGO
wiednio „gęstość”, „przepływ na jednostkę powierzchni w kierunku osi x”, „przepływ
na jednostkę powierzchni w kierunku osi y” i „przepływ na jednostkę powierzchni w kie-
runku osi z”. W podobny sposób v przybiera cztery wartości t, x, y i z, wyjaśniając
nam, co przepływa — a mianowicie „energia”, „pęd w kierunku osi x”, „pęd w kierunku
osi y” i „pęd w kierunku osi z”.
Dla przykładu rozważmy ten tensor już nie w ośrodku materialnym, a w obszarze
przestrzeni swobodnej, w której jest tylko pole elektromagnetyczne. Wiemy, że strumień
energii jest dany wektorem Poyntinga S = e0c2ExB. A więc składowe x-owa, y-owa
i z-owa wektora S są, z relatywistycznego punktu widzenia, składowymi Slx, Sly i Sl2
naszego czterowymiarowego tensora energii i naprężeń. Symetria tensora StJ przenosi
się z powodzeniem na składowe czasowe, tak że czterowymiarowy tensor jest syme-
tryczny:
= Sril. (31.29)
Innymi słowy, składowe Sxl, Syl, Szl, które są gęstościami x-owego, y-owego i z-owego
pędu, są także równe x-owej, y-owej i z-owej składowej wektora Poyntinga S, strumienia
energii — co wykazaliśmy w jednym z poprzednich rozdziałów przy pomocy rozważań
innego typu.
Pozostałe składowe elektromagnetycznego tensora naprężeń można także wyra-
zić poprzez pola elektryczne i magnetyczne E i B. Oznacza to, że musimy dopuścić istnie-
nie naprężeń albo, wyrażając się mniej tajemniczo, przepływu pędu w polu elektromagne-
tycznym. Mówiliśmy o tym w rozdz. 27 w związku z równaniem (27.21), ale niezbyt do-
kładnie.
Ci, którzy chcą poddać próbie swą biegłość w operowaniu tensorami w czterech wy-
miarach, chcieliby może zobaczyć wzór, wyrażający tensor przez pola:
~ & /ty FfiaF^a\,
' a aft
gdzie znaki sum po a, fi oznaczają sumowanie po t, x, y, z, z tym że (jak zwykle w teorii
względności) przypisujemy tu specjalne znaczenie znakowi sumy £ i symbolowi ó. W su-
mach należy odejmować wyrazy ze wskaźnikami x, y, z oraz przyjąć, że <5„ = +1, pod-
czas gdy <5^ = dyy = ózz = — 1 i = 0 dla /z v (c = 1). Proponujemy, aby Czytel-
nik sprawdził: a) że powyższy wzór daje gęstość energii Stt = (e0/2)(E2 +52) i wektor
Poyntinga e0ExB; b) że w polu elektrostatycznym, przy B = 0, osie główne naprężeń
mają kierunek pola elektrycznego, że w kierunku tym istnieje napięcie (e0/2)E2, a w kie-
runkach prostopadłych do kierunku pola istnieje równe mu ciśnienie.
h współczynnik zpłamania substancji gęstych
32-1. Polaryzacja metali
Chcemy teraz omówić zjawisko załamania światła — a także związane z nim pochła-
nianie światła — przez substancje gęste*’. W rozdziale 31 t.I (cz. 2) omawialiśmy teorię
współczynnika załamania, ale nasze ograniczone możliwości matematyczne w owym cza-
sie pozwoliły nam na znalezienie współczynnika załamania jedynie dla substancji o małej
gęstości, takich jak gazy. Zostały jednak tam wyjaśnione fizyczne przyczyny istnienia
współczynnika załamania. Pole elektryczne fali świetlnej polaryzuje cząsteczki gazu,
wytwarzając drgające momenty dipolowe. Ponieważ te drgające ładunki mają pew-
ne przyspieszenie, promieniują one nowe pole w postaci fal. To nowe pole, inter-
ferując ze starym polem, wytwarza pewne pole zmienione, które jest równoważne
pewnemu przesunięciu fazowemu w fali pierwotnej. Ponieważ to przesunięcie fazowe
jest proporcjonalne do grubości substancji, całe zjawisko jest równoważne zmianie pręd-
kości fazowej fali przy jej przechodzeniu przez daną substancję. Kiedy poprzednio roz-
patrywaliśmy to zagadnienie, pominęliśmy powikłania związane z takimi zjawiskami,
jak zmiana pól w pobliżu drgających dipoli na skutek pojawienia się nowej fali. Zakła-
daliśmy, że siły działające na ładunki w atomach pochodziły tylko od fali przybywającej,
podczas gdy w rzeczywistości drgania tych ładunków były wymuszone nie tylko przez
falę padającą, ale także i przez fale promieniowane przez wszystkie pozostałe atomy.
W owym czasie trudno byłoby nam uwzględnić to zjawisko, dlatego też rozważaliśmy tylko
gaz rozrzedzony, w którym takie zjawiska można pominąć.
Teraz jednak przekonamy się, że zagadnienie to można bardzo łatwo opisać korzy-
stając z równań różniczkowych. Ta metoda zaciemnia sens fizycznego pochodzenia współ-
czynnika załamania (jako pochodzącego od fal wtórnie promieniowanych, interferują-
♦> W oryginale: dense materials (substances, media etc.). Chodzi tu o ośrodki, w których odleglosC
atomowe są niewielkie — rzędu kilku angstremów, tak ze taki ośrodek jest „zbity” lub „gęsty”. (Pr^P-
tłum.).
32-1. POLARYZACJA METALI
207
cych z falami pierwotnymi), ale upraszcza w znacznym stopniu teorię dla substancji gę-
stych. W tym rozdziale dokonamy połączenia wielu fragmentów naszych dotychczaso-
wych wykładów. Praktycznie rzecz biorąc, przerobiliśmy już wszystko, czego będziemy
tu potrzebować, dlatego też pozostaje do wprowadzenia stosunkowo niewiele pojęć
rzeczywiście nowych. Ponieważ przyda się odświeżyć naszą pamięć i przypomnieć sobie
to, co będzie nam potrzebne, w tab. 32.1 podajemy zestaw równań, z których będziemy
korzystać, wraz z odnośnikami do miejsc, gdzie można znaleźć każde z tych równań.
W większości wypadków nie będziemy tracić czasu na powtarzanie rozważań fizycznych,
a skorzystamy po prostu z samych równań.
Zaczniemy od przypomnienia mechanizmu odpowiedzialnego za współczynnik za-
łamania gazu. Zakładamy, że w jednostce objętości znajduje się N cząstek i że każda
z nich zachowuje się tak, jak oscylator harmoniczny. Używamy tu modelu atomu (czą-
steczki), w którym na elektron działa siła proporcjonalna do jego przesunięcia (wygląda
to tak, jak gdyby elektron był utrzymywany w miejscu za pomocą jakiejś sprężynki).
Podkreślaliśmy, że nie był to poprawny model klasyczny atomu, ale w przyszłości po-
każemy, że poprawna teoria kwantowomechaniczna daje wyniki, które (dla prostych
przypadków) są równoważne wynikom otrzymanym w oparciu o ten model. W naszych
poprzednich rozważaniach nie uwzględnialiśmy istnienia siły tłumienia w oscylatorach
atomowych, ale teraz to zrobimy. Taka siła odpowiada oporowi przeciwstawiającemu
się ruchowi, to znaczy sile proporcjonalnej do prędkości elektronu. Równanie ruchu ma
teraz postać
F= q^E = m(x+yx+(o^x), (32.1)
Tabela 32.1. W bieżącym rozdziale będziemy się opierać na następującym trrlnle, który został już
omówiony w poprzednich rozdziałach
Zagadnienie Gdzie szukać Równanie
oscylacje tłumione Tom I, cz. 1, rozdz. 23 m(x+yx-\-a>2x) — F
współczynnik załamania gazów Tom I, cz. 2, rozdz. 31 1 M)2e „ 1 i e
2 e0(a>2—co2)
n — n'—in"
ruchliwość Tom I, cz. 2, rozdz. 41 mx+fix = F
przewodnictwo elektryczne Tom I, cz. 2, rozdz. 43 T ; a — m m
Polaryzowalność Tom II, cz. 1, rozdz. 10 J?pol = * P
Wewnątrz dielektryka Tom II, cz. 1, rozdz. 11 Elokal = E+ T— P 3e0
208
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
gdzie x jest przesunięciem równoległym do kierunku pola E. (Zakładamy, że mamy oscy-
lator izotropowy, w którym siła przyciągająca do centrum jest taka sama dla odchyleń
we wszystkich kierunkach. Na chwilę również przyjmujemy, że fala jest spolaryzowana
liniowo, tak że pole E nie zmienia kierunku.) Jeżeli działające na atom pole elektryczne
zmienia się sinusoidalnie w zależności od czasu, to
E = £oe'“'. (32.2)
Przesunięcie będzie wówczas „oscylować” z tą samą częstością; można przyjąć
icof
x = xoe .
Podstawiając x = io>x i x = — a>2x do równania (32.1) możemy wyrazić x za pomocą E:
(32.3)
Znając przesunięcie można obliczyć przyspieszenie x i znaleźć wypromieniowaną falę,
będącą fizyczną przyczyną istnienia współczynnika załamania. W taki właśnie sposób
obliczyliśmy współczynnik załamania w rozdz. 31 tomu I (cz. 2).
Teraz jednak chcemy zastosować inną metodę podejścia do zagadnienia. Indukowa-
ny moment dipolowy atomu, p, jest równy qex lub korzystając z równania (32.3)
n - q2‘lm E
P =------5---------z- Ł.
—ct) +zy<w+<w0
(32.4)
Ponieważ moment dipolowy p jest proporcjonalny do pola E, więc
p = £oa(co)E, (32.5)
gdzie a nazywamy polaryzowalnością (zdolnością polaryzacyjni atomową*^. Na podsta-
wie tej definicji
a =-----,---;------" (32.6)
— w +zyco+<Oo
Rozwiązanie, jakie się otrzymuje w mechanice kwantowej dla ruchów elektronów
w atomach, jest podobne do powyższego wyniku, z tym jednak, że atomy mają tam kilka
częstości własnych, z których każda ma swoją własną stałą rozproszenia y. Również
i „natężenie” efektywne każdego z typów drgań jest różne, co można zaznaczyć mnożąc
polaryzowalność dla każdej częstości przez współczynnik natężenia f, który przypusz-
czalnie jest rzędu jedności. Zastępując dla każdego typu drgań trzy parametry co0, y i f
przez a>ok, yok i fOk i sumując po różnych typach drgań, przekształcamy równanie (32.6)
*’ W całym tym rozdziale będziemy używali tej samej metody zapisu, co w rozdz. 31 tomu I (cz.) 2
i przyjmiemy, że a oznacza polaryzowalność atomową, tak jak ją tu zdefiniowaliśmy. W poprzednim roz-
dziale uźy waliśmy a do oznaczania polaryzowalności objętościowej — stosunku P do E. W oznaczeniach
bieżącego rozdziału P — Nae0E [patrz równanie (32.8)].
32-1. POLARYZACJA METALI
209
w równanie:
—------7 TT.;------------• yJ*--')
e0m “T1 +z7*°+°0A
Jeżeli N jest liczbą atomów w jednostce objętości substancji, to polaryzacja P jest po
prostu równa Np = e0NaE i jest proporcjonalna do E:
P = e0M®)E. (32.8)
Innymi słowy, jeżeli na jakąś substancję działa sinusoidalne pole elektryczne, to na jed-
nostkę objętości przypada indukowany moment dipolowy, proporcjonalny do pola elek-
trycznego, przy czym należy podkreślić, że stała proporcjonalności a zależy od częstości
Dla bardzo wielkich częstości a jest małe; „reakcja” (substancji na falę świetlną) jest
niezbyt duża. Jednak dla małych częstości może nastąpić silna reakcja. Widać też, że sta-
ła proporcjonalności jest liczbą zespoloną, co oznacza, że wektor polaryzacji nie pokry-
wa się z wektorem pola elektrycznego, ale może być do pewnego stopnia przesunięty
względem niego w fazie. W każdym razie istnieje polaryzacja na jednostkę objętości,
której wartość jest proporcjonalna do natężenia pola elektrycznego.
32-2. Równania Maxwella dla dielektryka
Istnienie polaryzacji w materii oznacza, że wewnątrz substancji znajdują się polary-
zacyjne ładunki i prądy, które należy uwzględnić w pełnych równaniach Maxwella, jeżeli
się chce znaleźć pola. Tym razem zamierzamy rozwiązać równania Maxwella dla takiej
sytuacji, gdy ładunki i prądy nie są równe (tak jak w próżni) zeru, ale są pośrednio okre-
ślone przez wektor polaryzacji. Nasz pierwszy krok — to znalezienie dokładnej postaci
gęstości ładunku q i gęstości prądu j, uśrednionych po pewnej małej objętości, o takich
samych rozmiarach jak ta, którą mieliśmy na myśli definiując polaryzację P. Wówczas
potrzebną nam gęstość ładunku n i prądu j można otrzymać z polaryzacji.
W rozdziale 10 (t. II, cz. 1) widzieliśmy, że gdy polaryzacja P się zmienia od punktu
do punktu, to istnieje pewna gęstość ładunku równa
«?PoI = "VP. (32.9)
Wprawdzie wtedy mieliśmy do czynienia z polami statycznymi, ale ten sam wzór jest
słuszny również i dla pól zmiennych w czasie. Jednakże, gdy polaryzacja P się zmienia
w zależności od czasu, to ładunki są w ruchu, a więc istnieje także pewien prąd polaryzacji.
Każdy z drgających ładunków daje do prądu przyczynek równy jego ładunkowi qe, po-
mnożonemu przez jego prędkość v. Przy N takich ładunkach w jednostce objętości gęstość
prądu j jest równa
j = NqeN.
Ponieważ wiemy, że v = dxjdt, to j = Nqe(dxjdt), co się równa właśnie dPjdt. Dlatego
14 — Wykłady z fizyki
210 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
też gęstość prądu pochodzącego od zmieniającej się w czasie polaryzacji jest równa
(32.10)
Wiemy teraz dokładnie, co chcemy zrobić i jak możemy to wykonać. Piszemy równa-
nia Maxwella z gęstością ładunku i z gęstością prądu, wyrażonymi za pomocą polaryzacji
P, korzystając z równań (32.9) i (32.10). (Zakładamy, że w substancji nie ma żadnych in-
nych ładunków i prądów.) Następnie wiążemy polaryzację P z polem E przy pomocy rów-
nania (32.5) i rozwiązujemy równanie na pola E i B — szukając rozwiązań w postaci fali.
Zanim to zrobimy, chcielibyśmy tu dać pewną wzmiankę historyczną. Maxwell po-
czątkowo zapisał swoje równania w postaci różniącej się od tej, którą się posługiwaliśmy.
Ponieważ równania zapisywano w tej różnej postaci przez wiele lat — i w dalszym ciągu
niektórzy je tak zapisują — musimy tę różnicę wyjaśnić. Otóż, początkowo nie zdawano
sobie w pełni sprawy z mechanizmu fizycznego stałej dielektrycznej. Nie rozumiano na-
tury atomów, ani też tego, że istnieje polaryzacja substancji. Dlatego też nie zdawano
sobie sprawy z istnienia przyczynku do gęstości ładunku q, pochodzącego od V-P. My-
ślano tylko o ładunkach, które nie były związane w atomach (takich, jak ładunki, które
płyną w drutach lub powstają przy potarciu powierzchni materiału).
Dzisiaj wolimy przyjąć, że q określa całkowitą gęstość ładunku, zawierającą w sobie
część pochodzącą od związanych ładunków atomowych. Jeżeli oznaczyć tę część przez
Ppol, t°
Q Ppol+ftnne’
gdzie pinne jest gęstością ładunku, którą miał na myśli Maxwell, a która się odnosi do ła-
dunków nie związanych z poszczególnymi atomami. Można by więc zapisać:
eo
Podstawiając pp01 z równania (32.9) otrzymujemy
V-E = ——e--------L V P
£o £o
V-(£oE+P) = pmne. (32.11)
W gęstości prądu w równaniach Maxwella na V xB tkwią także w ogólnym przypadku
przyczynki pochodzące od prądów związanych w atomach. Dlatego też można przyjąć:
j = Jpol+jinne
i równanie Maxwella przybierze postać:
Ć2V xB = AłSS- + ^21 + . (32.120
£q £q dt
32-2. RÓWNANIA MAXWELLA DLA DIELEKTRYKA
211
Korzystając z równania (32.10) otrzymujemy
d
£oc2V xB = jinne + — (£oE+P). (32.13)
ot
Widać teraz, że gdybyśmy zdefiniowali nowy wektor D jako
D = e0E+P, (32.14)
to oba te równania pola przybrałyby postać
VD = ?ime (32.15)
oraz
3D
e0c2VxB = jinne+—. (32.16)
ot
Taką właśnie postać miały równania, których Maxwell używał dla dielektryków. Jego
dwoma pozostałymi równaniami były równania
VxE =
dB
~dt'
oraz
V-B = 0,
a więc takie same jak te, których my używamy.
Maxwell i inni współcześni mu uczeni mieli także problemy z materiałami magnetycz-
nymi (wkrótce się zajmiemy tym zagadnieniem). Ponieważ nie wiedzieli oni o krążących
prądach odpowiedzialnych za magnetyzm atomowy, używali gęstości prądu, w której
brakowało jednej części. Zamiast równania (32.16) posługiwali się oni w rzeczywistości
równaniem
VxH=j'+—,
ot
(32.17)
w którym wektor H różni się od e0c2B, ponieważ zawiera on w sobie efekty pochodzące
od prądów atomowych. (Wówczas j' odpowiada reszcie z prądów.) A zatem Maxwell
miał cztery wektory pola — E, D, B i H — gdzie D i H były zakamuflowanymi sposobami
na uniknięcie zwracania uwagi na to, co się działo wewnątrz substancji materialnych.
Równania zapisane w ten sposób można znaleźć w wielu podręcznikach fizyki.
Aby rozwiązać równania, należy koniecznie związać wektory D i H z innymi polami;
zwykle się pisało
D = eE oraz B = /zH. (32.18)
Te związki są jednak prawdziwe tylko w przybliżeniu dla niektórych substancji i to tylko
wtedy, gdy pola się nie zmieniają zbyt gwałtownie w zależności od czasu. (Dla pól sinu-
soidalnie zmiennych można często takie równania zapisać, jeżeli e i /z przyjmie się za funkcje
zespolone częstości, ale nie można uczynić tego dla pól zmieniających się w czasie w jakiś
212
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
dowolny sposób.) Dlatego też przy rozwiązywaniu tych równań były popełniane przeróż-
ne krętactwa. Uważamy, że właściwy sposób polega na zapisywaniu równań przy użyciu
wielkości podstawowych, których sens fizyczny obecnie rozumiemy — i tak właśnie
postępowaliśmy.
32-3. Fale w dielektryku
Chcemy się teraz przekonać, jaki typ fal elektromagnetycznych może istnieć w mate-
riale dielektrycznym, w którym nie ma dodatkowych ładunków oprócz tych związanych
w atomach. Przyjmujemy więc g = — V-P i j = SPfSt. Równania Maxwella przybierają
wówczas postać:
a) VE = -
VP
«o
8 /P
b) c2VxB =— I—- +E
dt \e0 ,
(32.19)
c) VxE = —
8B
~8t~’
d) V;B = 0.
1
c2 8t2
a2p
1
17
(32.20)
Równania te można rozwiązać tak samo, jak to zrobiliśmy poprzednio. Zaczynamy
od wzięcia rotacji równania (32.19c):
8
Vx(V xE) = - —V XB.
8t
Następnie skorzystamy z tożsamości wektorowej:
Vx(VxE) = V(V-E)-V2E,
a także podstawimy za VxB z równania (32.19b); otrzymujemy
1 d2P
V(V-E)—V2E = — —--
' > e0c2 8t2
równania (32.19a) dla VE otrzymujemy
i , i a2E i
VE~^--^r =----------V(V-P)+
c 8t2 e0
A zatem zamiast równania falowego otrzymaliśmy równanie, z którego wynika, że dalam-
bercjan E jest równy dwóm wyrazom, zawierającym polaryzację P.
Ponieważ jednak polaryzacja P zależy od pola E, równanie (32.20) może nadal mieć
rozwiązania w postaci fali. Ograniczmy się teraz do dielektryków izotropowych, dla któ-
rych polaryzacja P ma zawsze ten sam kierunek co pole E. Spróbujmy znaleźć rozwiąza-
nie dla fali rozchodzącej się w kierunku osi z. Wówczas pole elektryczne mogłoby się zmie-
niać jak exp[i(cot—kz)\. Założymy także, że fala jest spolaryzowana w kierunku osi x —
32-1. FALE W DIELEKTRYKU
213
że pole elektryczne ma tylko składową x-ową. Przyjmujemy więc
Ex = Eoe'^k!\ (32.21)
Wiemy, że każda funkcja argumentu (z—vt) opisuje jakąś falę, która się przemieszcza
z prędkością v. Wykładnik w równaniu (32.21) można zapisać jako
(co \
z—i,
« /
a zatem równanie (32.21) opisuje falę o prędkości fazowej
rfaz = «/k.
Współczynnik załamania n jest zdefiniowany (patrz rozdz. 31 tomu I, cz. 2) przez związek
c
^faz ’
n
Stąd równanie (32.21) przybiera postać
Ex = E0^m‘-nzlc\
Można zatem znaleźć współczynnik załamania n wyznaczając taką wartość k, aby pole
(32.21) spełniało właściwe równania pola, a następnie skorzystać z zależności
kc
n = —. (32.22)
co
W materiale izotropowym polaryzacja będzie miała tylko składową x-ową; wówczas
wektor P nie będzie się zmieniał w zależności od x, czyli V • P = 0, i pozbędziemy się
w ten sposób pierwszego wyrazu po prawej stronie równania (32.20). Również, ponieważ
zakładamy, że dielektryk jest liniowy, Px będzie się zmieniać jak e‘“' a c2Pxjct2 = —wzPx.
Laplasjan w równaniu (32.20) jest po prostu równy d2Ex]8z2 = —k2Ex, a więc otrzy-
mujemy
co2 co2
-£2£x+ £x =------------Px. (32.23)
c2 eoc
Załóżmy teraz na chwilę, że jedynie pole E wywołuje polaryzację. Ponieważ pole to
zmienia się sinusoidalnie, to można przyjąć, że polaryzacja P jest proporcjonalna do po-
la E, tak jak w równaniu (32.5). (Później powrócimy jeszcze do omówienia tego założe-
nia.) Przyjmujemy więc
Px = e0 NaEx.
Wówczas Ex w równaniu (32.23) upraszcza się i
Cl)2
k2=—(l+Wa). (32.24)
c
Znaleźliśmy więc, że fala opisana równaniem (32.21), z liczbą falową k daną przez równa-
214
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
nie (32.24), będzie spełniała równania pola. Po skorzystaniu z równania (32.22) widzimy,
że współczynnik załamania n będzie określony przez związek:
n2 = l+Mx. (32.25)
Porównajmy ten wzór z tym, co otrzymaliśmy w naszej teorii współczynnika załama-
nia gazu (rozdz. 31, t. I, cz. 2). Otrzymaliśmy tam równanie (31.29), które miało postać
, , 1 Nq2 1
n = 1 + —----------5---z-.
2 me0 —a) +<o0
Jeżeli weźmie się a z równania (32.6), to równanie (32.25) da nam
me0 — co +iya)+a>g
(32.26)
(32.27)
Po pierwsze, pojawił się teraz nowy wyraz iya>, związany z uwzględnieniem rozproszenia
energii w oscylatorach. Po drugie, po lewej stronie równania mamy n zamiast n2, a po-
nadto otrzymaliśmy jeszcze dodatkowy czynnik Zauważmy jednak, że jeżeli N jest
dostatecznie małe, tak że współczynnik n jest bliski jedności (tak jak to jest w przypadku
gazu), to wówczas równanie (32.27) stwierdza, że n2 jest równe jedności plus pewna mała
liczba: n2 = 1+e. Można wtedy napisać, że n = ^1 + e l+e/2 i oba te wyrażenia są
sobie równoważne. Tak więc nasza nowa metoda daje w przypadku gazu taki sam
wynik, jaki znaleźliśmy poprzednio.
Można by teraz przypuszczać, że równanie (32.27) powinno dać współczynnik zała-
mania także dla substancji gęstych. Musi ono być jednak nieco zmienione i to z wielu
względów. Przede wszystkim, przy wyprowadzaniu tego równania zakładaliśmy, że pole
polaryzujące, działające na każdy atom, było polem Ex. To założenie nie jest jednak praw-
dziwe, ponieważ w jednorodnych substancjach istnieje także pole wytworzone przez oko-
liczne atomy i pole to może być porównywalne z Ex. Z podobnym zagadnieniem mieliśmy
do czynienia przy omawianiu pól statycznych w dielektrykach (patrz t. II, cz. 1, rozdz. 11).
Wtedy pole działające na pojedynczy atom oszacowaliśmy wyobrażając sobie, że atom
ten znajdował się w kulistej wnęce w otaczającym go dielektryku. Pole w takiej wnęce —
które nazwaliśmy polem lokalnym — jest większe od średniego pola E o P/3£q. (Pamię-
tajmy jednak, że wynik ten jest ściśle słuszny tylko dla materiałów izotropowych, zawie-
rających w sobie szczególny przypadek kryształu regularnego.)
To samo rozumowanie będzie miało zastosowanie do pola elektrycznego fali, tak dłu-
go jak długość fali będzie dużo większa od odległości międzyatomowych. Ograniczając
się do takich przypadków mamy
(32.28)
Elokal — &+ "7-------
3e0
To pole lokalne powinno być właśnie podstawione za pole E w równaniu -(32.3), tzn.
równanie (32.8) należy przepisać w postaci
P = £oWaĄokal.
(32.29)
32-3. FALE W DIELEKTRYKU
215
W'
Podstawiając Elokal z równania (32.28) znajdujemy
P = e0Na
czyli
P =-----------e0E.
1—(2Va/3) 0
(32.30)
Innymi słowy, dla substancji gęstych polaryzacja P jest w dalszym ciągu proporcjonalna
do pola E (dla pól sinusoidalnych). Jednak stałą proporcjonalności nie jest e0Na, tak jak
to pisaliśmy w równaniu (32.23), ale powinno nią być e0Na/[l—(Na/3)]. Powinniśmy za-
tem poprawić równanie (32.25) tak, aby
n2 = 1 +
Na
(32.31)
Wygodniej będzie przepisać to równanie w postaci
n2—1
3—---= Na
n2+2
(32.32)
która jest algebraicznie równoważna postaci równania (32.31). Nazywa się je równaniem
Clausiusa-Mosottiego.
Dla substancji gęstych występuje jeszcze jedna komplikacja. Sąsiednie atomy są tak
blisko siebie, że zachodzą między nimi silne oddziaływania wzajemne. Typy drgań we-
wnętrznych są z tego powodu nieco zmienione. Częstości własne drgań atomowych są
przez te oddziaływania wzajemne „rozszerzone”, a drgania są zwykle mocno tłumione
i stała rozproszenia staje się całkiem duża. Tak więc współczynniki <u0 i y ciał stałych będą
się zdecydowanie różnić od analogicznych wielkości dla atomów swobodnych. Przy tych
zastrzeżeniach można w dalszym ciągu określać współczynnik a, przynajmniej w przybli-
żeniu, za pomocą równania (32.7). Mamy więc
= Mle y fk
,n2+2) me0 — co2+iykco+co2k‘
(32.33)
Jeszcze jedna, ostatnia komplikacja. Jeżeli omawiane ciało stałe (lub ciecz) jest mie-
szaniną kilku składników, to każdy z nich będzie wnosił swój wkład do polaryzacji. Cał-
kowite a będzie więc sumą przyczynków, pochodzących od każdego ze składników mie-
szaniny [pominąwszy niedokładność przybliżenia pola lokalnego, równanie (32.28),
w kryształach uporządkowanych — zjawiska, które opisywaliśmy przy omawianiu ferro-
elektryków]. Zapisując liczbę atomów na jednostkę objętości każdego ze składników jako
Nj, powinniśmy zastąpić równanie (32.32) równaniem
(32.34)
A
216
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
gdzie każde a, będzie dane wyrażeniem typu (32.7). Równanie (32.34) uzupełnia naszą
teorię współczynnika załamania. Wielkość 3(n2 —l)/(n2+2) jest dana przez pewną funk-
cję zespoloną częstości, która jest średnią polaryzowalnością atomową a(co). Dokładne
obliczenie polaryzowalności atomowej a(a>) (tzn. znalezienie fk, yk i wot) dla substancji
gęstych należy do trudnych zagadnień mechaniki kwantowej. Zostało to zrobione, w za-
sadzie, tylko dla kilku szczególnie prostych substancji.
32-4. Zespolony współczynnik załamania
Chcemy teraz rozpatrzyć konsekwencje naszego wyniku wyrażonego równaniem (32.33).
Przede wszystkim zauważmy, że współczynnik a jest zespolony, a więc i współczynnik
załamania n będzie liczbą zespoloną. Co to oznacza? Przypuśćmy, że przedstawimy liczbę
n jako sumę części rzeczywistej i urojonej:
n ~ nR~inj,
(32.35)
gdzie nR i n, są rzeczywistymi funkcjami co. Przyjęliśmy tu wyraz in, ze znakiem ujemnym,
gdyż wtedy iij będzie wielkością dodatnią dla wszystkich zwykłych materiałów optycz-
nych. (Dla zwykłych materiałów optycznie biernych, które same nie są, jak lasery, źród-
łami światła, y jest liczbą dodatnią i na skutek tego część urojona n jest liczbą ujem-
ną.) Nasza fala płaska z równania (32.21) wyrażona za pomocą współczynnika n,
ma postać
Ex =
32.1. Wykres cidSdowęj pot* Ex jakiejś
chwili t, jfeMl ’
Zapisując liczbę n tak jak w równaniu
(32.35) mielibyśmy
Ex = Eo ex.p(—a)n/z/c') exp[ia>(t—nRz/ć)].
(32.36)
Wyraz exp[i'co(t—nRz/ć)] opisuje falę bieg-
nącą z prędkością c/nR, a więc nR odpowiada
temu, o czym normalnie myślimy jako
o współczynniku załamania. Ale amplitudą
tej fali jest
£oexp(—coziyz/c),
a więc wyrażenie malejące wykładniczo z z-
Wykres natężenia pola elektrycznego, w pew-
nej chwili, jako funkcji z pokazano na rys-
32.1 dla n, ^ hr!1t.. Część urojona współ-
czynnika załamania odpowiada osłabieniu
fali na skutek strat energii w oscylatorach
32-4. ZESPOLONY WSPÓŁCZYNNIK ZAŁAMANIA
217
atomowych. Natężenie fali jest proporcjonalne do kwadratu amplitudy, a więc
natężenie ~ exp(—2<un/z/c).
Często się to zapisuje jako
natężenie e-^2,
gdzie = lennie nazywamy współczynnikiem pochłaniania. Równanie (32.33) daje nam
więc nie tylko teorię współczynnika załamania w ośrodkach optycznych, ale także teorię
pochłaniania światła przez te ośrodki.
Dla takiego ośrodka, który zwykle się uważa za materiał przezroczysty, wielkość
c!o>n, — mająca wymiar długości — jest całkiem duża w porównaniu z grubością mate-
riału.
32-5. Współczynnik załamania mieszaniny
Nasza teoria współczynnika załamania zawiera jeszcze inną „przepowiednię”, którą
można sprawdzić na drodze doświadczalnej. Przypuśćmy, że rozważamy mieszaninę
dwóch substancji. Współczynnik załamania mieszaniny nie jest średnią dwóch współczyn-
ników, ale powinien być wyrażony zgodnie z równaniem (32.34) przez sumę dwóch po-
laryzowalności. Jeżeli na przykład pytamy, jaki jest współczynnik załamania roztworu
cukru, to odpowiedź brzmi: całkowita polaryzowalność tego roztworu jest sumą polary-
zowalności wody i polaryzowalności cukru. Każdą z tych polaryzowalności należy obli-
czyć, przyjmując za N liczbę cząsteczek danego typu na jednostkę objętości. Innymi słowy,
jeżeli jakiś dany roztwór ma cząsteczek wody, której polaryzowalność jest równa a1;
i N2 cząsteczek cukru trzcinowego (C12H22OU) o polaryzowalności a2, to powinniśmy
mieć
/ n2—1 \
3 -rrd = “1+N2 . (32.37)
\n +2/
Wzorem tym można się posłużyć przy doświadczalnym sprawdzeniu teorii, mierząc
współczynnik załamania dla różnych stężeń cukru trzcinowego w wodzie. Robimy tu
jednak kilka założeń. Wzór nasz zakłada, że podczas rozpuszczania się cukru nie zacho-
dzą żadne procesy chemiczne i że „zakłócenia”, jakie napotykają ruchy oscylatorów ato-
mowych, nie różnią się zbytnio dla różnych stężeń. Dlatego nasz wynik jest z pewnością
tylko pewnym przybliżeniem — sprawdźmy w każdym razie, jaka jest jego dokładność^
W pierwszych trzech kolumnach tab. 32.2 zamieszczamy dane dotyczące pomiarów
Współczynnika załamania, zaczerpnięte z Handbook of Chemistry and Physics. (Wybra-
liśmy przykład roztworu cukru, ponieważ cukier jest kryształem drobinowym, który się
rozpuszcza nie jonizując roztworu i nie zmieniając w jakiś inny sposób swego stanu che-
micznego.) Kolumna A podaje zawartość procentową cukru (w odniesieniu do ciężaru),
kolumna B podaje mierzoną gęstość roztworu (g/cm3), a w kolumnie C zamieszczono
mierzony współczynnik załamania dla światła, którego długość fali wynosiła 5893 A •
^la czystego cukru wzięto współczynnik załamania mierzony dla kryształów cukru. Te
Tabela 32.2. Współczynnik załamania roztworu cukru trzcinowego oraz porównanie danych doświadczalnych z teorią [równanie (32.37)]
A Procentowa zawartość cukru (wagowo) B Gęstość (g/cm3) C n dla 20°C D Mole cukrud na 1 litr n2/n0 E Mole wodye na 1 litr F /n2-l\ 3~s \n2+2l G A^i H JV2a2 J ^0a2 (g/D
0* 0,9982 1,333 0 55,5 0,617 0,617 0 —
30 1,1270 1,3811 0,970 43,8 0,698 0,487 0,211 0,213
50 1,2296 1,4200 1,798 34,15 0,759 0,379 0,380 0,211
85 1,4454 1,5033 3,59 12,02 0,886 0,1335 0,752 0,210
100b 1,588 l,5577c 4,64 0 0,960 0 0,960 0,207
a czysta woda ó ciężar drobinowy cukru trzcinowego “ 342
b kryształy cukru e ciężar drobinowy wody =» 18
c średnia (patrz tekst)
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
32-5. WSPÓŁCZYNNIK ZAŁAMANIA MIESZANINY
219
kryształy nie są izotropowe, dlatego też mierzony współczynnik załamania jest różny dla
różnych kierunków. Handbook of Chemistry and Physics podaje trzy wartości;
n, = 1,5376, n2 = 1,5651, n3 = 1,5705,
z których wzięliśmy wartość średnią.
Można by teraz spróbować obliczyć współczynnik n dla każdego stężenia, ale nie
wiemy, jaką wartość przyjąć dla aj lub a2. Sprawdźmy naszą teorię w taki oto sposób:
założymy, że polaryzowalność wody (aj jest taka sama dla wszystkich stężeń i obliczy-
my polaryzowalność cukru trzcinowego, korzystając w wartości doświadczalnych n i obli-
czając a2 z równania (38.27). Jeżeli nasza teoria jest poprawna, to powinniśmy otrzymać
takie samo a2 dla wszystkich stężeń.
Przede wszystkim musimy znać liczby Nt i N2; wyraźmy je przy pomocy liczby Avo-
gadra No. Za naszą objętość jednostkową przyjmijmy jeden litr (1000 cm3). Wówczas
Nj/No jest ciężarem na litr, podzielonym przez ciężar gramodrobinowy. A ciężar na litr —
to gęstość (pomnożona przez 1000, aby wynik wyrazić w gramych na litr) razy ciężar
ułamkowy — wody lub cukru. W ten sposób otrzymujemy N2/No i M/Ao, co zamie-
szczono w kolumnach D i E tabeli.
W kolumnie F obliczono wielkość 3(n2—l)/(n24-2) z wartości doświadczalnych n
z kolumny C. Dla czystej wody 3(n2—l)/(n2+2) = 0,617, co jest z kolei równe
Następnie można wypełnić pozostałą część kolumny G, ponieważ dla każdego wiersza
tabeli stosunek wartości G/E ma być taki sam, a mianowicie 0,617: 55,5. Odejmując
wartości kolumny G od wartości kolumny F dostajemy przyczynek N2 a2, pochodzący
od cukru trzcinowego, zamieszczony w kolumnie H. Po podzieleniu tych pozycji przez
wartości N2/N0 z kolumny D otrzymujemy wartość Noa2, zamieszczoną w kolumnie J.
Zgodnie z naszą teorią powinniśmy oczekiwać, że wszystkie wartości N0a2 będą
takie same. Nie są one dokładnie równe, ale są bardzo do siebie zbliżone. Możemy zatem
wnioskować, że nasze koncepcje są dość poprawne. Stwierdzamy tu nawet więcej; że
nie wydaje się, aby polaryzowalność drobiny cukru zależała w dużym stopniu od otocze-
nia drobiny — polaryzowalność ta jest prawie taka sama w rozcieńczonym roztworze
jak i w krysztale.
32-6. Fale w metalach
Teorię, którą wyprowadziliśmy w tym rozdziale dla ciał stałych, można również za-
stosować, po bardzo małych zmianach, do dobrych przewodników, jakimi są metale.
W metalach na niektóre elektrony nie dziąłają siły wiązania, utrzymujące je przy poszcze-
gólnych atomach; są to te elektrony „swobodne”, które są odpowiedzialne za przewod-
nictwo. Są tam jeszcze elektrony związane i do nich to się stosuje wprost teoria opisana
Powyżej. Wpływ tych elektronów jest jednak zwykle zatarty przez zjawiska elektronów
przewodnictwa. Będziemy teraz rozważać tylko te zjawiska, za które są odpowiedzialne
elektrony swobodne.
Jeżeli na elektron nie działa siła harmoniczna — ale w dalszym ciągu jego ruch napo-
220
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
32.2. Ruch elektronu swobodnego
tyka pewien opór — to równanie ruchu
tego elektronu różni się od równania (32.1)
jedynie brakiem wyrazu Wystarczy
zatem przyjąć w naszych wzorach = o,
a ponadto uwzględnić tam jeszcze jedną
różnicę. Poprzednio musieliśmy mianowi-
cie rozróżniać pomiędzy polem średnim,
a polem lokalnym w dielektryku dlatego,
że w izolatorze każdy z dipoli znajdował
się w ustalonym położeniu i to jego poło-
żenie pozostawało w pewnym określonym
związku z położeniami pozostałych elektronów. W metalu natomiast elektrony prze-
wodnictwa poruszają się jednakowo we wszystkich kierunkach i działające na nie
w średnim efekcie pole jest po prostu średnim polem E. Nie powinniśmy więc teraz
dla elektronów przewodnictwa wprowadzać do równania (32.5) poprawki polegają-
cej na podstawieniu pola E z równania (32.28). Dlatego też dla metali wzór na
współczynnik załamania powinien mieć taką postać, jak równanie (32.27), z tym tylko,
że o>0 należy teraz przyjąć równe zeru, czyli
Na2 1
i - • n2 = l+_Zf------------. (32.38)
ms0 —ar+iym
Równanie to podaje tylko przyczynek od elektronów przewodnictwa, który — jak bę-
dziemy zakładać — jest w przypadku metali dominujący.
Wiemy teraz nawet, jak znaleźć wartość, którą należy przyjąć dla y, ponieważ jest
ona związana z przewodnością metalu. W rozdziale 43 tomu I (cz. 2) opisywaliśmy zależ-
ność przewodnictwa metali od dyfuzji elektronów swobodnych w krysztale. Elektrony
poruszają się po „zygzakowatej” drodze, od jednego rozproszenia do następnego, a po-
między rozproszeniami poruszają się one prawie swobodnie, doznając jedynie przyspie-
szenia od jakiegoś średniego pola elektrycznego (por. rys. 32.2). W rozdziale 43 tomu I
(cz. 2) znaleźliśmy, że średnia prędkość unoszenia jest równa po prostu przyspieszeniu
pomnożonemu przez średni czas pomiędzy zderzeniami, t. Przyspieszenie jest równe
qeElm, tak że
—r. ' ' (32”)
m
Wzór ten zakładał, że pole E było stałe, a więc i była prędkością stałą. Ponie-
waż w średniej nie ma tu przyspieszenia, to siła oporu jest równa sile przyłożonej. Współ-
czynnik y zdefiniowaliśmy mówiąc, że ymv jest siłą oporu [patrz równanie (32.1)] równą
qeE; dlatego też
y = 1. (32.40)
T
Czasu t nie można łatwo zmierzyć bezpośrednio, można go jednak określić mierząc
przewodność metalu. Znaleziono doświadczalnie, że w metalu pole elektryczne E wytwa-
32-6. FALE W METALACH
221
rza prąd, którego gęstość j jest proporcjonalna do pola E (dla materiałów izotropowych):
j = <rE.
Stałą proporcjonalności a nazywa się przewodnością. Do tej samej zależności prowadzi
równanie (32.39), jeżeli się w nim przyjmie
1 ^unoszenia *
Wtedy
Nqt
a =-------z.
(32.41)
m
Zatem t — a stąd i y — można związać z obserwowaną przewodnością elektryczną. Ko-
rzystając z równań (32.40) i (32.41) można przepisać nasz wzór na współczynnik załama-
nia, (32.38), w postaci:
2 1 ,
n 2 = 1H---------------,
zco(l+icor)
gdzie
1 ma
T 7 Nq2 ‘
(32.42)
(32.43)
Jest to wygodna postać wzoru na współczynnik załamania metali. <
32-7. Przybliżenia malej i wielkiej częstości;
głębokość naskórkowa i częstość plazmowa
Nasz wynik [równanie (32.42)] na współczynnik załamania metali pozwala przewidy-
wać, że przy różnych częstościach cechy propagacji fali będą całkiem różne. Zobaczmy
najpierw, co się dzieje dla bardzo małych częstości. Jeżeli co jest dostatecznie małe, równa-
nie (32.42) można z dobrym przybliżeniem zastąpić przez
n2 = (32.44)
e0<o
Otóż ze związku
— 1-'
który można sprawdzić podnosząc go stronami do kwadratu*’, dla małych częstości
otrzymujemy
n = la/2eoco(l— i). (32.45)
Części rzeczywista i urojona współczynnika n mają taką samą wartość bezwzględną.
•’ Albo podstawiając —i = e inl2; t —i = e ^Z4 = costc/4—i simr/4, co daje ten sam wynik.
222
33. ODBICIE OD POWIERZCHNI
32.3. Amplituda poprzecznej fali elektro-
magnetycznej w funkcji odległości, na jaką
fala przenika w głąb metalu
zywamy głębokością naskórkową. Jest ona
Przy n mającym tak dużą część urojoną fala
jest gwałtownie osłabiana w metalu. W wy-
niku równania (32.36) amplituda fali roz-
chodzącej się w kierunku osi z maleje jak
exp(—]/o<o/2e0c2z). (32.46)
Zapiszmy to jako
e~2‘s, (32.47)
gdzie ó jest odległością, po której przebyciu
amplituda fali maleje o czynnik e~1 = 1/2,72,
czyli z grubsza o |. Amplitudę takiej fali
jako funkcję z pokazano na rys. 323. Ponie-
waż fale elektromagnetyczne będą przenikać
w głąb metalu tylko na tę odległość, <5 na-
równa
ó = ^2e0c2l(J(o. (32.48)
Co w powyższych rozważaniach rozumieliśmy przez „małe” częstości? Jeśli się przyj-
rzymy równaniu (32.42), to zauważymy, że można je przybliżyć przez równanie (32.44)
tylko wtedy, gdy cot jest o wiele mniejsze od jedności oraz gdy <oe0lo też jest dużo mniej-
sze od jedności, to znaczy przyjęte przez nas przybliżenie małej częstości stosuje się, gdy
oraz
(32.49)
Zobaczmy, jakim to odpowiada częstościom dla takiego typowego metalu jak miedź.
Obliczamy t korzystając z równania (32.43), a o/e0 — korzystając ze zmierzonej prze-
wodności. Z tablic bierzemy następujące dane:
<r = 5,76-107(O mF1,
ciężar atomowy = 63,5 g,
gęstość = 8,9 g/cm3,
liczba Avogadra = 6,02-102 3 (gramodrobina)-1.
Jeżeli założyć, że na jeden atom przypada jeden swobodny elektron, to liczba elektronów
na metr sześcienny jest równa
♦
N= 8,5-1028m~3.
r
32-7. PRZYBLIŻENIA MAŁEJ I WIELKIEJ CZĘSTOŚCI
223
Przyjmując
otrzymujemy
qe = l,6-10-19C,
e0 = 8,85-10-12F/m,
m = 9,11 • 10~31kg,
t = 2,4-10-14s,
1 „ i
— = 4,l-1013s-1,
T
— = 6,5-1018s-1.
£o
A zatem dla częstości mniejszych od około 1012 Hz miedź będzie wykazywać typowe,
opisane przez nas zachowanie przy „małych częstościach” (częstościom tym odpowiada-
ją fale, których długość w pustej przestrzeni jest dłuższa niż 0,3 mm, czyli bardzo krótkie
fale radiowe!).
Dla fal tych głębokość naskórkowa w miedzi jest równa
<5 =
0,028m2/s
co
Dla mikrofal o częstości 10000 MHz (fale o ż = 3 cm)
<5 = 6,7-10-4cm.
Fala przenika więc na bardzo małą odległość.
Widać stąd, dlaczego omawiając wnęki rezonansowe (lub falowody) wystarczyło
się troszczyć tylko o pola wewnątrz wnęki, a nie o pola w metalu lub na zewnątrz wnęki.
Widać również teraz, dlaczego straty we wnęce są zmniejszone przy wyłożeniu ścianek
cienką warstwą srebra lub złota. Te straty pochodzą od prądu, który jest znaczny tylko
w cienkiej warstwie o grubości równej głębokości naskórkowej.
Przypuśćmy, że interesuje nas teraz współczynnik załamania takiego metalu jak miedź
przy wielkich częstościach. Dla bardzo wielkich częstości cot jest dużo większe od jedności
i równanie (32.42) można z dobrym przybliżeniem zastąpić przez
n2 = 1------a—. (32.50)
Dla fal o wielkich częstościach współczynnik załamania metalu staje się rzeczywisty —
1 mniejszy od jedności! Wynika to jasno także i z równania (32.38), jeżeli pominie się
w nim wyraz odpowiedzialny za rozproszenie energii, co można zrobić dla bardzo wiel-
kich co. z równania (32.38) otrzymujemy wtedy
n2 = 1-
Nq2e
me0(o2 '
(32.51)
i
224
32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI
GĘSTYCH
•co jest oczywiście identyczne z równaniem (32.50). Spotkaliśmy już poprzednio wielkość
Nq^lmsQ, którą nazwaliśmy częstością plazmową (t. II, cz. 1, § 7-3):
równanie (32.50) lob równanie (32.51) można więc zapisać jako
n2 =
•Częstość plazmowa jest pewnego rodzaju częstością „graniczną”.
Dla a><a>p współczynnik załamania metalu ma część urojoną i fale są osłabiane, na-
tomiast dla co > (op współczynnik załamania jest rzeczywisty i metal się staje przezro-
czysty. Wiemy oczywiście, że metale są dość przezroczyste dla promieni Róntgena. Ale
niektóre metale są przezroczyste nawet dla ultrafioletu. W tabeli 32.3 podajemy dla kilku
metali zmierzone w doświadczeniu długości fali, poniżej których metale zaczynają się
stawać przezroczyste. W drugiej kolumnie podajemy obliczone graniczne długości fali
/.p = 2-rtclaip. Uwzględniając, że doświadczalna długość fali nie jest zbyt dobrze okre-
ślona, zgodność teorii z doświadczeniem jest zupełnie dobra.
Można by się dziwić, dlaczego częstość plazmowa ,cop ma coś wspólnego z rozchodze-
niem się fal elektromagnetycznych w metalach. Częstość plazmowa pojawiła się w rozdz. 7
<t. II, cz. l)-jako częstość własna oscylacji gęstości elektronów swobodnych. (Chmura
elektronów jest odpychana przez siły elektryczne i bezwładność elektronów prowadzi
dc? oscylacji gęstości.) Dlatego też częstość rezonansowa podłużnych fal plazmy jest
równa aip. Teraz natomiast mówimy o poprzecznych falach elektromagnetycznych i oka-
zuje się, że te fale poprzeczne są pochłaniane właśnie dla częstości niższych niż cop. (Jest
to zbieżność interesująca i wcale nie przypadkowa.)
Mówiliśmy tu o rozchodzeniu się fal w metalach, natknęliśmy się jednak na przykład,
który jest piękną ilustracją uniwersalności zjawisk fizyki. Okazało się bowiem, że nie ma
żadnej różnicy, czy owe swobodne elektrony występują w metalu, czy też w plazmie jono-
sfery ziemskiej lub w atmosferze gwiazdy. Aby opisać rozchodzenie się fal radiowych
w jonosferze, można użyć tych samych wyrażeń — przyjmując oczywiście odpowiednie
wartości na N i r. Można teraz zobaczyć, dlaczego długie fale radiowe są pochłaniane
lub odbijane przez atmosferę, podczas gdy fale krótkie przechodzą przez nią na wylot.
(Dla łączności z sztucznymi satelitami musi się używać fal krótkich.)
* Mówiliśmy o skrajnych przypadkach — odpowiadających wielkim i małym częstoś-
ciom — rozchodzenia się fal w metalach. Dla częstości pośrednich musi się korzystać
z pełnego wzoru (32.42). W ogólnym przypadku współczynnik załamania będzie miał
część rzeczywistą i część urojoną; fala jest osłabiana w trakcie przechodzenia przez metal.
W przypadku bardzo cienkich warstw metale są w pewnym stopniu przezroczyste nawet
dla częstości optycznych. Tak na przykład okulary ochronne dla ludzi pracujących w po-
bliżu pieców hutniczych robi się odparowując cienką warstwę złota na szkle. Promienie
widzialne przechodzą przez takie okulary zupełnie dobrze — z silnym odcieniem zielo-
nym — a promienie podczerwone są silnie pochłaniane.
32-7. PRZYBLIŻENIA MAŁEJ I WIELKIEJ CZĘSTOŚCI
225
Tabela 32.3. Długości Sali, poniżej których metal
staje się przezroczysty*!
Metal A (doświadczalne) Ap = 27tc/iOp
Li 1550 A 1550 A
Na 2100 2090
K 3150 2870
Rb 3400 3220
♦) Na podstawie; C. Kittel, lutroduction to Solid State Physics,
John Wiley and Sons, Inc. New York 1956, str. 266
Na koniec, jeszcze jedna uwaga. Nie mogło ujść uwadze czytelnika, że wiele z tych
wzorów jest w pewnym stopniu podobnych do wzorów dla stałej dielektrycznej x, oma-
wianych w rozdz. 10 tomu II (cz. 1). Stała dielektryczna h jest miarą reakcji substancji
na stałe pole, tzn. dla co = 0. Jeżeli się uważnie przyjrzeć definicjom n i x, to się stwierdzi,
że x jest po prostu granicą n2 przy co -> 0. Rzeczywiście, przyjmując w równaniach tego
rozdziału co = 0 i n2 = x otrzymamy z powrotem równania teorii stałej dielektrycznej
z rozdz. 11 tomu II (cz. 1).
33
odbicie od powierzchni
33-1. Odbicie i załamanie światła*)
Tematem tego rozdziału jest odbicie i załamanie światła — lub ogólnie biorąc fal
elektromagnetycznych — na powierzchniach. Prawa załamania i odbicia omawialiśmy
już w rozdz. 35 tomu I (cz. 2). Oto co tam stwierdziliśmy:
1. Kąt odbicia równa się kątowi padania.
Dla kątów określonych tak jak na rys. 33.1
AodbMpad- (33-D
2. Iloczyn n sin 0 jest taki sam dla wiązki
padającej i załamanej (prawo Snelliusa):
33 1 Odbicie i załamanie fal świetlnych na
powierzchni. (Kierunki fal są prostopadłe do
grzbietów fali.)
«1 Sin 0pad = n2 sin 0zal. (33.2)
3. Natężenie światła odbitego zależy od
kąta padania, a także od kierunku polaryzacji-
Dla wektora E prostopadłego do płaszczy-
zny padania współczynnik odbicia, , Jest
równy
n ____ /pdb ___ Sin (^pad ^zał) (33.3)
4ad sin2 (0pad+^zał) '
•) Porównaj. Tom I, cz. 2, rozdz. 35 (Pol*1'?'
zacja).
i
33-1. ODBICIE I ZAŁAMANIE ŚWIATŁA
227
Dla wektora E równoległego do płaszczyzny padania współczynnik odbicia, Ą, jest
równy
n _ A>db ___ tg (®pad ®zal) ..
1 ~ tg^c^+e^ • (33-4)
4. Dla padania w kierunku normalnej (polaryzacja oczywiście dowolna!)
= . (33.5)
A>ad \ «2 + «l I
Właściwie nasze poprzednie rozważanie tego zagadnienia powinno każdemu wystar-
czyć, ale mimo to temat ten chcemy przerobić jeszcze raz, w pewien inny sposób. Dlaczego?
Jednym z powodów jest przyjmowane poprzednio założenie, że współczynniki zała-
mania są liczbami rzeczywistymi (czyli, że nie ma pochłaniania przez substancje). Ale
jest jeszcze inny powód — powinniśmy umieć rozpatrywać to, co się dzieje z falami przy
powierzchniach, z punktu widzenia równań Maxwella. Dostaniemy takie same odpowiedzi
jak poprzednio, ale tym razem będą one wypływać z bezpośredniego rozwiązania zagad-
nienia falowego, a nie z jakichś sprytnie dobranych argumentów.
Należy zaznaczyć, że amplituda odbicia od powierzchni nie jest własnością substancji,
tak jak współczynnik załamania. Jest to „właściwość powierzchni”, zależy ona bowiem
wyraźnie od „obróbki” powierzchni. Cienka warstwa jakiejś substancji obcej na po-
wierzchni rozgraniczającej dwa materiały o współczynnikach załamania nt i n2 będzie
zwykle miała wpływ na odbicie. (Są tu możliwe wszystkie typy interferencji — tak jak to
mamy w kolorowych warstwach oliwy. Odpowiednia grubość tej obcej warstwy może
nawet dla danej częstości zredukować odbitą amplitudę do zera; tak właśnie się robi
soczewki warstwowe.) Wzory, które wyprowadzimy, są słuszne tylko w wypadku nagłej
zmiany współczynnika załamania, jeżeli zachodzi ona na odległości bardzo małej w po-
równaniu z długością fali. Dla światła długość fali wynosi około 5000 A, tak że przez
„gładką” powierzchnię będziemy rozumieć taką, w której warunki się zmieniają po przej-
ściu zaledwie kilku odległości międzyatomowych (kilku angstremów). Nasze równania
będą się stosować do światła tylko dla wysoce wypolerowanych powierzchni. W ogólnym
przypadku, gdy współczynnik załamania zmienia się stopniowo na odległości równej
kilku długościom fali, odbicie jest w ogóle bardzo słabe.
33-2. Fale w substancjach gęstych
Najpierw przypomnimy sobie wygodny sposób opisu sinusoidalnej fali płaskiej, którym
S1ć Posługiwaliśmy w rozdz. 36 tomu I (cz. 2). Każdą składową pola w fali (np. pole E)
®tożna zapisać w postaci
E = £’oeZ(fl"-k-r), (33.6)
gdzie E oznacza amplitudę w punkcie r (odległość od początku układu) w chwili t. Wek-
tor k jest równoległy do kierunku rozchodzenia się fali i jego wartość bezwzględna jkj =
228
33. ODBICIE OD POWIERZCHNI
= k = 2k/2 jest liczbą falową. Prędkość fazowa fali jest równa ty — a)/k; dla fali świetl-
nej w substancji o współczynniku załamania n,ty=c/n, tak że
<on
k = —.
c
(33.7)
Przypuśćmy, że wektor k ma kierunek osi z; wówczas k -r jest równe po prostu kz, tak
jak to często pisaliśmy. Dla wektora k mającego jakiś inny kierunek należy zastąpić z
przez rk, odległość od początku układu w kierunku k; to znaczy powinno się zastąpić kz
przez krk, co jest równe właśnie k-r (patrz rys. 33.2). Równanie (33.6) jest zatem wygodnym
sposobem przedstawienia fali rozchodzącej się w dowolnym kierunku.
Należy oczywiście pamiętać, że
k-r =
gdzie kx, ky i kz są składowymi wektora k w kierunku trzech osi układu współrzęd-
nych. W zasadzie swego czasu wykazaliśmy, że (co, kx, ky, k2) jest czterowektorem i jego
iloczyn skalamy z czterowektorem (t, x,y, z) jest niezmiennikiem. A więc faza fali jest
niezmiennikiem i równanie (33.6) można by zapisać w postaci
E = Eo eKpęik^f).
Ale w tej chwili nie musimy być aż tak eleganccy.
Dla sinusoidalnego pola E, takiego jak w równaniu (33.6), 8E/8t jest tym samym co
ia>E, a 8E)8x jest równe ikxE-, podobne zależności zachodzą też dla innych składowych.
Widać stąd, dlaczego przy posługiwaniu się równaniami różniczkowymi wygodniej posłu-
giwać się funkcjami o takiej postaci jak (33.6) — wtedy różniczkowanie jest zastąpione
mnożeniem. Dalsza pożyteczna uwaga: operator V = (8/dx, 8[8y, d/dz) zostaje zastąpiony
trzema czynnikami (—ikx, —iky, —ik^. Ale
te trzy czynniki transformują się jak składowe
wektora k, tak że działanie operatora V zo-
staje zastąpione po prostu mnożeniem przez
—zk; czyli
8
8t
-> ICO,
V —żk.
(33.8)
33.2. Faza fali poruszającej się w kierunku k
jest dla danego punktu P równa (cot—k-r)
Powyższa zamiana pozostaje prawdziwa dla
każdej operacji zawierającej operator V, nie-
zależnie, czy interesuje nas gradient, dy-
wergencja, czy też rotacja. Tak na przykład
składowa z-owa rotacji V xE jest równa
5Ey 8EX
8x dy
33-2. FALE W SUBSTANCJACH GĘSTYCH
229
Jeżeli Ey i Ex są funkcjami zmieniającymi się jak e~'k r, to powyższe wyrażenie jest równe
-ikxEy+ikyEx,
co jak widać, jest składową z-ową iloczynu —zkxE.
Otrzymujemy zatem bardzo pożyteczną ogólną regułę, mówiącą, że zawsze gdy trzeba
wziąć gradient jakiegoś wektora, który się zmienia tak jak fala w trzech wymiarach (takie
wektory są ważnymi wielkościami fizyki), to tę operację różniczkowania można doko-
nać szybko i prawie bezmyślnie, pamiętając, że operator V jest równoważny mnożeniu
przez — ik.
Tak na przykład, równanie Faradaya
VxE = —
dt
przyjmuje dla fali postać
stąd zaś otrzymujemy
—ikxE = —zcoB
b = ^£
O)
(33.9)
co odpowiada znalezionemu przez nas poprzednio wynikowi dla fal w próżni — wektor B
w fali jest prostopadły do wektora E i do kierunku fali. (W próżni co/k = c.) Znak w rów-
naniu (33.9) można zapamiętać, jeśli się wie, że wektor k ma kierunek wektora Poyntinga:
S = eoc2EzB.
Jeżeli zastosujemy tę samą regułę do pozostałych równań Maxwella, to powtórnie
otrzymamy wyniki poprzedniego rozdziału, a w szczególności związek
co2n2 .
k-k = k2 =——. (33.10)
c
Ponieważ jednaj już to znamy, nie będziemy tego raz jeszcze powtarzać.
Jeżeliby ktoś chciał się zabawić, to może spróbować rozwiązać takie oto zagadnienie,
które w roku 1890 było ostatecznym sprawdzianem dla kandydatów do stopnia doktor-
skiego, a które uchodziło wówczas za bardzo trudny problem. Polegało ono mianowicie
na rozwiązaniu równania Maxwella dla fal płaskich w krysztale anizotropowym, tzn.
w przypadku, gdy polaryzacja P jest związana z polem elektrycznym E za pośrednictwem
tensora polaryzowalności. Należy oczywiście wybrać osie układu wzdłuż osi głównych
tensora, tak aby związki pomiędzy wektorami P i E były jak najprostsze (wówczas Px =
= iaEx,Py = abEy i P2 = acE2), ale należy dopuścić, że fale mają dowolny kierunek
1 dowolną polaryzację. Powinno się znaleźć związki pomiędzy polami E i B oraz zależność
wektora k od kierunku polaryzacji fali. Wówczas będzie można zrozumieć optykę krysz-
tału anizotropowego. Najlepiej jest zacząć od najprostszego przypadku kryształu dwój-
tarnnego, np. kalcytu, dla którego dwie z polaryzowalności są sobie równe (powiedzmy
ab = ac) i sprawdzić, czy potrafi się zrozumieć, dlaczego patrząc przez taki kryształ widzi
si? podwójnie. Jeżeli się potrafi to zrobić, to należy spróbować rozwiązać przypadek naj-
230
33. ODBICIE OD POWIERZCHNI
J&3. Wektory falowe k, k', k" dla fali padającej, odbitej i załamanej
trudniejszy, dla którego wszystkie trzy współczynniki a są różne. Po zrobieniu tego będzie-
cie wiedzieć, czy dorównujecie poziomowi doktoranta z 1890 roku. W tym rozdziale bę-
dziemy jednak rozważać tylko substancje izotropowe.
Wiemy z doświadczenia, że gdy fala płaska pada na granicę dwóch różnych ośrodków,
powiedzmy powietrza i szkła lub wody i oliwy, to powstaje fala odbita i fala załamana.
Przypuśćmy, że założyliśmy tylko tyle i zobaczmy, co potrafimy z tego wyprowadzić.
Wybieramy nasze osie tak, że osie y i z leżą w płaszczyźnie powierzchni granicznej, a płasz-
czyzna xy jest prostopadła do powierzchni falowych padających fal, tak jak pokazano
na rys. 33.3.
Wektor elektryczny fali padającej można zapisać jako
= Eoea”'-kr>. (33.11)
Ponieważ wektor k jest prostopadły do osi z,
Lr = kzK+kyy. (33.12)
Falę odbitą zapisujemy jako
E^ = E;e^''-k'r’, '' (33.13)
tak że jej częstością jest tt>', liczbą falową k', a jej amplitudą jest EÓ. (Oczywiście, wiemy,
że częstość i wartość bezwzględna wektora k' są takie same jak dla fali padającej, ale nie
będziemy nawet tego zakładać. Będziemy chcieli, żeby ten fakt wyniknął z naszego aparatu
matematycznego.) W końcu, dla fali załamanej możemy przyjąć
E2al = E"e'<""'-k"rt (33.14)
33-2. FALE W SUBSTANCJACH GĘSTYCH
231
Wiemy, że jedno z równań Maxwella prowadzi do równania (33.9), tak że dla każdej
z fal mamy
k x EMd k' x Eodb k" x E„.
Bpad =------—> Bodb =----------8^ =----------------(33.15)
co a> a>
Również, jeżeli współczynniki załamania dwóch ośrodków oznaczyć i n2, to z równania
(33.10) wynika, że
1 2
k2 = k2+k2 = (33.16)
c2
Ponieważ fala odbita rozchodzi się w tym samym ośrodku, co fala padająca, to
<o'2ni
k'2 =—z-2-, (33.17)
<r
podczas gdy dla fali załamanej ’ - :,
= (33.18)
c2 > . '
33-3. Warunki graniczne
Opisaliśmy już, jak wyglądają wszystkie trzy fale; musimy teraz wyrazić parametry
fali odbitej i załamanej przy pomocy parametrów fali padającej. Jak to można zrobić?
Opisane przez nas trzy fale spełniają równania Maxwella w ośrodku jednorodnym, ale
równania Maxwella muszą być także spełnione na granicy pomiędzy dwoma różnymi
ośrodkami. Musimy się zatem przypatrzeć temu, co się dzieje na samej granicy. Przeko-
namy się, że to właśnie równania Maxwella żądają, aby te trzy fale były w pewien sposób
ze sobą powiązane.
Przykładem tego, co mamy na myśli, jest warunek równości składowych y pola elek-
trycznego E po obu stronach granicy. Wymaga tego prawo Faradaya:
dB
VxE=-—, (33.19)
dt
a można się o tym przekonać w sposób następujący: rozważmy małą, prostokątną pętlę r,
obejmującą powierzchnię graniczną, tak jak to pokazano na rys. 33.4. Równanie (33.19)
mówi, że całka krzywoliniowa wokół r jest równa szybkości zmian strumienia pola B
Przez pętlę:
. rE-Js =-------fB-nćZn.
/ dt 1
Wyobraźmy sobie teraz, że prostokąt ten jest bardzo wąski, tak że pętla zamyka w sobie
nieskończenie małą powierzchnię. Jeżeli pole B pozostaje skończone (a nie ma powodu,
dla którego B miałoby być nieskończone na granicy!), to strumień przez tę powierzchnię
232
33. ODBICIE OD POWIERZCHNI
Varunek graniczny Ey2 = Eyl wynika z f E ds = 0
jest równy zeru. Zatem całka krzywoliniowa z pola E musi być równa zeru. Jeżeli Eyl
i Ey2 są składowymi pola po obu stronach granicy i jeżeli długość prostokąta wynosi l, to
Eyll-Ey2l = Q,
czyli Eyi=Ey2, (33.20)
tak jak to twierdziliśmy. Otrzymujemy zatem jeden ze związków pomiędzy polami trzech
fal.
Procedurę otrzymywania z równań Maxwella związków dotyczących zachowania się
pola na granicy dwóch ośrodków nazywamy określaniem warunków granicznych. Zwykle
się wyszukuje tyle, ile tylko się da równań, takich jak (33.20), rozważając małe prostokąciki
jak na rys. 33.4 lub używając małych powierzchni gaussowskich, obejmujących powierzch-
nię graniczną. Chociaż jest to doskonała metoda postępowania, to sprawia ona wrażenie,
że zagadnienie warunków granicznych jest odmienne dla różnych zagadnień fizycznych.
Tak na przykład w przypadku przepływu ciepła przez powierzchnię odgraniczającą
dwa ośrodki mamy do rozpatrzenia problem: jaki jest związek pomiędzy temperaturami
po obu stronach tej granicy? No cóż, można by rozumować tak: dopływ ciepła do po-
wierzchni granicznej z jednej strony powinien być równy odpływowi ciepła z drugiej strony.
Zwykle można, i na ogół jest to bardzo pożyteczne, by określać warunki graniczne posłu-
gując się takimi argumentami fizycznymi. Może się jednak czasem zdarzyć, że rozważając
jakieś zagadnienie ma się tylko kilka równań i nie widać bezpośrednio, jakich argumentów
fizycznych powinno się użyć. Dlatego też, chociaż w tej chwili interesuje nas tylko zagad-
nienie elektromagnetyczne, gdzie możemy przeprowadzić rozważania natury fizycznej,
chcemy pokazać pewną metodę, która ma zastosowanie do każdego zagadnienia — ogólny
sposób polegający na określeniu tego, co się dzieje na powierzchni granicznej, biorąc
za punkt wyjścia bezpośrednio równania różniczkowe.
Zaczniemy od wypisania równań Maxwella dla dielektryka; będziemy tym razem bardzo
drobiazgowi i wypiszemy w sposób jawny wszystkie składowe:
33-3. WARUNKI GRANICZNE
233
V P
V E =-------,
«o
idEx dEv dE \
°\ dx dy dz )
VxE = rB ” ~~dT’ dEz dEy _ dBx dy dz dt ’ dEx dEz dBy dz dx dt ' dEy dEx dBz ,
V B = dx dy dt 0, dBx dB dBz n '
c2VxB dx dy dz 1 dP dE = . 4* . > e0 dt dt
dPx ‘ dPr dP\
—2-4 Ł-| L ;
, dx dy dz /
(33.21)
(33.22a)
(33.22b)
(33.22c)
(33.23)
(33.24a)
(33.24b)
(33.24c)
1 dBz _ 1 dPx , SEX
i sy dz / Co dt + ' dt '
' dBx dBz\ 1 dPy dEy
dz dx 1 £O dt 1 dt
oBx 1 - ’ dPz dEz 4
dy ) ' C0 dt dt
Wszystkie te równania muszą teraz być spełniane w obszarze 1 (na lewo od powierzchni
granicznej) i w obszarze 2 (od niej na prawo). Rozwiązania dla obszarów 1 i 2 już wypi-
saliśmy. A wreszcie, muszą one być także spełnione na samej powierzchni granicznej,
którą nazwiemy obszarem 3. Chociaż zwykle się myśli, że granica jest czymś „ostro” nie-
ciągłym, nieskończenie cienką powierzchnią, to w rzeczywistości tak nie jest. Właściwości
fizyczne zmieniają się bardzo gwałtownie, ale nie nieskończenie szybko. W każdym razie,
można sobie wyobrazić, że pomiędzy obszarami 1 i 2 zachodzi bardzo gwałtowna, ale cią-
gła zmiana współczynnika załamania, na małej odległości, którą nazwiemy obszarem 3.
Również każda składowa pola, jak Px lub Ey, itd. będzie doznawać tego typu zmian w ob-
szarze 3. W dalszym ciągu muszą być dla tego obszaru spełnione równania różniczkowe
i właśnie dzięki „śledzeniu” równań różniczkowych dla tego obszaru będziemy mogli
otrzymywać potrzebne „warunki graniczne”.
Przypuśćmy na przykład, że mamy granicę pomiędzy próżnią (obszar 1) i szkłem (ob-
szar 2). W próżni nie ma nic, co by można było spolaryzować, tak że Pt = 0. W szkle
zaś występuje pewna polaryzacja P2. Przejście od próżni do powietrza jest „gładkie”,
ale szybkie. Gdyby się przyjrzeć którejś ze składowych wektora P, powiedzmy Px, to mo-
234
33. ODBICIE OD POWIERZCHNI
głąby ona się zmieniać tak, jak to pokazano na rys. 33.5a. Przypuśćmy, że wezmiemy teraz
pierwsze z naszych równań, równanie (33.21). Zawiera ono pochodne składowych wek-
tora P względem x, y i z. Pochodne względem y i z nie interesują nas; wzdłuż tych kierun-
ków nie dzieje się nic nadzwyczajnego. Ale pochodna względem x składowej Px przyjmuje
w obszarze 3 bardzo duże wartości, ze względu na ogromną zmianę składowej Px. p0.
chodna dPJdx będzie więc miała ostry wierzchołek na granicy, tak jak to pokazano na
rys. 33.5b. Gdyby wyobrazić sobie, że ściśniemy granicę do jeszcze cieńszej warstwy, to
wierzchołek ten będzie o wiele wyższy. Jeżeli dla fal, które nas interesują, granica jest rze-
czywiście „ostra”, to wielkość dPJdx będzie w obszarze 3 bardzo duża, o wiele większa
od jakichś innych przyczynków, które mogłyby pochodzić od zmian polaryzacji P w fali
33.5. Pola w obszarze przejściowym (3) po-
między dwoma różnymi ośrodkami [obszary
(1) i (2)1
znajdującej się daleko od granicy — dlatego
też pomijamy wszystkie przyczynki różne
od tych, za które jest odpowiedzialny obszar
graniczny.
Jak teraz może być spełnione równanie
(33.21), jeżeli po jego prawej stronie występuje
funkcja mająca tak diabelnie duży wierzcho-
łek? No cóż, będzie ono spełnione tylko wtedy,
jeżeli taki sam wierzchołek będzie miała funk-
cja występująca i po jego drugiej stronie —
musi więc pojawić się coś dużego i po lewej
stronie równania. Jedyną kandydatką na tego
rodzaju wielkość jest 3Ejdx, ponieważ zmiany
w kierunkach z i y są związane tylko z tymi
możliwymi do pominięcia przyczynkami,
o których przed chwilą wspomnieliśmy.
A zatem na rys. 33.5c należy wykreślić funk-
cję -e0(dEJdx) jako dokładną kopię funkcji
oPx[ox. Mamy więc
£r\ •' — —-------,
ć)x dx
Jeżeli to równanie scałkujemy względem x
w obszarze 3, to dojdziemy do wniosku, że
e0(^2-^i) = -(Px2-Pxl)- (33-25)
Innymi słowy, skok e0Ex przy przejściu od
obszaru 1 do obszaru 2 musi być równy sko-
kowi —Px.
Równanie (33.25) można przepisać w p°'
staci
s0Ex2+Px2 = e0Exl +Pxl, (33-26)
235
33.3. WARUNKI GRANICZNE
z której wynika, że wielkość (eoEx+P,) ma te same wartości w obszarze 2, co w obszarze 1.
Oznacza to, że wielkość (e0Ex-rPx) jest ciągła na granicy dwóch ośrodków. W ten sposób
mamy jeden z naszych warunków granicznych.
Chociaż omówiliśmy dla przykładu przypadek, w którym polaryzacja Pi była równa
zeru, bo obszarem 1 była próżnia, to widać jasno, że to samo rozumowanie można zasto-
sować do dowolnych dwóch ośrodków znajdujących się w tych dwóch obszarach, tak że
równanie (33.26) jest prawdziwe ogólnie.
Zbadajmy teraz pozostałe równania Maxwella i zobaczymy, jakie wnioski z nich wy-
nikają. Najpierw weźmy równanie (33.22a). Nie ma tam pochodnych względem x, a więc
to równanie nic nam nie mówi. (Pamiętajmy, że same pola na granicy nie stają się zbyt
duże; to tylko pochodne względem x mogą stać się tak olbrzymie, że będą one w równaniu
wyrazami dominującymi.) Z kolei rozpatrzmy równanie (33.22b). Aha! Tu jest jakaś
pochodna względem x! Po lewej stronie mamy 8EJox. Przypuśćmy, że pochodna ta jest
olbrzymia. Ale chwileczkę! Po prawej stronie nie ma niczego, co mogłoby dorównywać
tej olbrzymiej pochodnej; dlatego też nie może wystąpić żaden skok składowej Ez przy
przejściu od obszaru 1 do obszaru 2. [Gdyby tak było, to po lewej stronie równania (33.22a)
funkcja miałaby wierzchołek, a po prawej stronie żaden wierzchołek nie mógłby się po-
jawić i równanie byłoby fałszywe.] Mamy zatem nowy warunek:
Ą2=£x1. (33.27)
To samo rozumowanie w przypadku równania (33.22c) daje <.
Ey2 = Eyl. (33.28)
Ostatni wynik jest identyczny z tym, jaki otrzymaliśmy z równania (33.20) rozważając
całkę krzywoliniową.
Przechodzimy do równania (33.23). Jedyny wyraz, który mógłby być bardzo duży,
to óBJdx. Ale po prawej stronie nie ma niczego, co mogłoby mu dorównać, tak więc
dochodzimy do wniosku, że
Bx2=Bxl. (33.29)
Przejdźmy wreszcie do ostatnich równań Maxwella! Równanie (33.24a) nie daje nic,
bo nie zawiera pochodnych względem x. Równanie (33.24b) ma jedną taką pochodną
~-c2 dBJdx, ale i tym razem nie ma niczego, co mogłoby ją zrównoważyć. Otrzymujemy
Więc
Ą2=5z1. (33.30)
Ostatnie równanie jest zupełnie podobne i daje
By2 = Byi. (33.31)
Ostatnie trzy równania prowadzą do równań B2 = B2. Należy jednak zaznaczyć, że
ten wynik otrzyma się tylko wtedy, gdy po obu stronach granicy są substancje niemagne-
tyczne — a raczej wtedy, gdy można w tych ośrodkach pominąć wszystkie zjawiska magne-
tyczne. Zwykle można to zrobić dla większości substancji, z wyjątkiem ferromagnetycz-
nych. (Własności magnetyczne substancji będziemy omawiać w następnych rozdziałach.)
236
33. ODBICIE OD POWIERZCHNI
(EŁ)y =
b1=b2
(powierzchnia leży w płaszczyźnie yz)
Tabela 33.1. Warunki graniczne na po- . Nasz plan pozwolił ram wyłowić sześć zależ-
wierzchni dielektryka ności pomiędzy polami w obszarze 1 i polami
w obszarze 2. Zamieszczamy je wszystkie ra-
zem w tab. 33.1. Można ich używać do dopa-
sowania fal w dwóch obszarach. Chcemy jednak-
że podkreślić, że koncepcja, którą się posłuży-
liśmy, daje wyniki dla każdej sytuacji fizycznej,
w której mamy równania różniczkowe, a chce-
,, my znaleźć rozwiązanie, które przechodzi przez
. ostrą granicę pomiędzy dwoma ośrodkami,
gdzie następuje zmiana pewnych własności fi-
zycznych. Dla naszych obecnych celów mogli-
byśmy wyprowadzić bez trudu te same równania, rozważając na granicy strumienie
i krążenia. (Czytelnik może spróbować, czy potrafi otrzymać w ten sposób te same
wyniki.) Przedstawiliśmy jednak metodę, która daje wyniki nawet w wypadku, jeżeli ktoś
się kiedyś zaplącze i nie będzie mógł znaleźć żadnych przystępnych argumentów, dotyczą-
cych natury fizycznej tego, co się dzieje na granicy — wystarczy wówczas posłużyć się sa-
mymi tylko równaniami. >
33-4. Fale odbite i załamane
Jesteśmy teraz gotowi do zastosowania naszych warunków granicznych do fal, które
wypisaliśmy w § 33-2. Mieliśmy tam:
r- Enad = EoezpIKcnt-k^f-^)], (33.32)
Eodb = Eóexpli(ft>'t-k>:-^y)], (33.33)
: fj.) Ezai = Eoexpb’(«o"t-k^x-k"y)], (33.34)
•>. 1 R . kxEpad (33.35)
1 , R k^E^ ”«” “ »- (33.36)
^'zE^, "zał — „ " • (33.37)
Wiemy coś jeszcze: pole E jest prostopadłe do swojego wektora propagacji k dla każdej
fali.
Wyniki będą zależeć od kierunku wektora E, czyli od „polaryzacji” fali padającej. Nasz
opis znacznie się uprości, jeżeli rozważymy oddzielnie przypadek fali padającej z wek-
torem E równoległym do „płaszczyzny padania” (tzn. do płaszczyzny xy), a oddzielnie
przypadek fali padającej z wektorem E prostopadłym do płaszczyzny padania. Fala o jakiejś
33-4. FALE ODBITE I ZAŁAMANE
237
innej polaryzacji jest po prostu kombinacją li-
niową dwóch takich fal. Innymi słowy, natęże-
nia fal odbitych i załamanych są różne dla róż-
nych polaryzacji i najłatwiej jest wybrać dwa
najprostsze przypadki i rozważyć je oddziel-
nie.
Podamy najpierw pełne rozumowanie dla fa-
li padającej spolaryzowanej prostopadle do płasz-
czyzny padania, a następnie podamy same
tylko wyniki dla fali spolaryzowanej równo-
legle. Trochę tu oszukujemy, biorąc przypadek
najprostszy, ale zasada jest dla obu rodzajów
fal taka sama. Przyjmujemy zatem, że pole
Epad ma tylko składową wzdłuż osi z i ponie-
waż wszystkie wektory E mają taki sam kieru-
nek, to można znaki wektorów opuścić.
Dopóty, dopóki obie substancje są izotro-
powe, indukowane oscylacje ładunków będą
zachodziły także w kierunku osi z i pola E
fab załamanej i fali odbitej będą miały tylko
33.6. Polaryzacja fali odbitej i fali załama-
nej, w przypadku gdy pole E fali padającej
jest prostopadłe do płaszczyzny padania
składowe z-owe. Zatem dla wszystkich fal Ex — Ey = Px = Py = 0. Wektory E i B fal
będą wyglądać tak, jak to przedstawiono na rys. 33.6. (Postępujemy trochę niekonsekwent-
nie w stosunku do naszego pierwotnego planu, według którego mieliśmy otrzymać wszyst-
ko z samych równań. Ten sam wynik wypłynąłby z warunków granicznych, ale można
zaoszczędzić wielu obliczeń korzystając z argumentów fizycznych. Gdyby ktoś miał
trochę wolnego czasu, to niech sprawdzi, czy potrafi otrzymać ten sam wynik z samych
tylko równań. Widać jasno, że to, co powiedzieliśmy, zgadza się z równaniami, tyle tyl-
ko, iż nie wykazaliśmy, że nie ma żadnych innych możliwości.)
Nasze warunki graniczne, równania (33.26)-(33.31), dają zależności pomiędzy skła-
dowymi pól E i B w obszarach 1 i 2. W obszarze 2 mamy tylko falę załamaną, ale w obsza-
rze 1 mamy dwie fale. Której z nich należy użyć? Pola w obszarze 1 są oczywiście super-
pozycjami pól fali padającej i fali odbitej. (Ponieważ każda z nich spełnia równania Max-
wella, ich suma też je spełnia.) A zatem gdy wprowadzimy warunki graniczne, musimy
przyjąć, że
Ej = E E, = E ,,
* pad 1 odb* 2 zaP
i podobnie dla pól B.
Dla rozważanej przez nas polaryzacji równania (33.26) i (33.28) nie dają żadnych no-
wych informacji; pożyteczne jest tylko równanie (33.27). Mówi ono, że
Ąiad+^odb ~ ^zał
»a powierzchni granicznej, to jest dla x = 0. Mamy więc
E0exp[i(ft>f-kJ,y)]+£'óexPl,'(<0 = £Ó'exp[f(<o "t~kyy)], (33.38)
238
33. odbicie od powierzchni
co musi być prawdą dla każdego y i dla każdego t. Przypuśćmy, że rozpatrzymy najpierw
y = 0. Wówczas
Eoe'“'+£Óe’“'' =
Równanie to głosi, że suma dwu oscylacji jest równa trzeciej oscylacji. Może to się zda-
rzyć tylko wtedy, jeżeli wszystkie oscylacje mają tę samą częstość. (Jest niemożliwe, aby
trzy takie wyrazy — czy też ich dowolna liczba — o różnych częstościach dawały w sumie
zero dla wszystkich t.) A zatem
co" = co' = co. , t , (33.39)
Jak więc to przez cały czas wiedzieliśmy, częstości fali odbitej i fali załamanej są takie
same jak częstość fali padającej.
Powinniśmy naprawdę zaoszczędzić sobie trochę pracy i zamieścić ten wynik na sa-
mym początku, ale chcieliśmy pokazać, że można go uzyskać z równań. Gdy się ma do
czynienia z jakimś prawdziwie nowym problemem, zwykle najlepiej jest wypisać na sa-
mym początku wszystko to, co się wie, i zaoszczędzić sobie sporo kłopotu.
Z definicji, wartość bezwzględna k jest dana związkiem k2 = n2<o2!c2, tak więc mamy
k"2 _ k'2 _ k2
„2 „2 „2
«2 «1 «1
(33.40)
Rozpatrzmy teraz równanie (33.38) dla t — 0. Przeprowadzając znowu rozumowanie
tego samego typu jak przed chwilą, ale opierając się tym razem na fakcie, że równanie to
musi być słuszne dla wszystkich wartości y, otrzymujemy
ky=k'y = ky. (33.41)
Z równania (33.40), k'2 = k2, a zatem
k'2+k'y2=k2+k2y.
Zestawiając to z równaniem (33.41) widzimy, że
k'2 = k2,
czyli że k'x = ±kx. Znak dodatni me ma żadnego sensu; dawałby on bowiem zamiast
fali odbitej jakąś inną falę padającą, a powiedzieliśmy na początku, że w naszym zagad-
nieniu wystąpi tylko jedna fala padająca, czyli
k'x = -kx. (33.42)
Te dwa równania [(33.41) i (33.42)] mówią nam, że kąt odbicia jest równy kątowi padania,
tak jak tego oczekiwaliśmy (patrz rys. 33.3). Fala odbita ma postać
^odb = E'0enp[i(o>t-kxx+ky y)]. (33.43)
Dla fali załamanej mieliśmy już zależność
< . ky = ky
33-4. FALE ODBITE I ZAŁAMANE
239
oraz , . .
k”2 _ k2 .
• ’ ”^2 TT’ ,
n2 ni
możemy więc równania te rozwiązać i znaleźć k'x. Otrzymujemy:
n2
kx2 = k"2-k’’2=^k2-k2y.
(33.44)
(33.45)
Przypuśćmy na chwilę, że nr i n2 są liczbami rzeczywistymi (że części urojone obu
współczynników załamania są bardzo małe). Wówczas wszystkie k są również liczbami
rzeczywistymi, a na podstawie rys. 33.3 możemy stwierdzić, że
k k"
-r- = sin 0pad, -ttt = sin 0zal. (33.46)
» * i , ‘ K' K
Z zależności (33.44) otrzymujemy więc, że
njsinfl^ = «isin0pad, (33.47)
co jest prawem załamania Snelliusa — a więc znowu czymś, co już znamy. Jeżeli współ-
czynniki załamania nie są rzeczywiste, to liczby falowe są zespolone i musi się używać
równania (33.45). [Moglibyśmy wprawdzie określić kąty 0pad i 0^ jako parametry dane
równaniem (33.46) i wówczas prawo Snelliusa, równanie (33.47), byłoby prawdziwe ogól-
nie. Ale wówczas „kąty” mogłyby być także liczbami zespolonymi, tracąc w ten sposób
swoją prostą interpretację geometryczną. Najlepiej jest więc opisywać zachowanie się fal
poprzez ich wartości zespolone kx lub k".]
Jednak dotąd nie znaleźliśmy niczego nowego, poza dość naiwnym zadowoleniem
z otrzymania kilku oczywistych wyników ze skomplikowanego aparatu matematycznego.
Teraz jesteśmy w stanie znaleźć amplitudy fal, których jeszcze nie znaliśmy. Korzystając
z naszych wyników dla częstości (co" = co' = co) i liczb falowych (k" = k'y — ky) można
podzielić dwie strony równania (33.38) przez czynnik wykładniczy; wtedy otrzymuje się
E0+E’0 = E”. (33.48)
Ponieważ nie znamy ani E'o, ani £", potrzebny nam jest jeszcze jeden związek. Musimy
skorzystać z jakiegoś innego warunku granicznego. Nic nam nie przyjdzie z równań dla
Ex i Ey, bo wszystkie występujące tu wektory E mają tylko składową z-ową. Musimy
zatem skorzystać z warunków dla wektora B. Spróbujmy posłużyć się równaniem (33.29):
^x2 —
Z równań (33.35)-(33.37) otrzymujerhy
r — k) ^Pda r — ky^'°ib r
pad ’ '°xodb ’ '°x‘zał
CO CO
ky Agal
co"
Korzystając z faktu, że co" = co' = co i k'y = ky = ky, dostajemy
Eo+E'o =Eo-
240
33. ODBICIE OD POWIERZCHNI
Ale przecież jest to znowu równanie (33.48)! Straciliśmy tylko czas, nie otrzymując nic
nowego.
Moglibyśmy spróbować równania (33.30), Bz2 = Bzl, ale pole B nie ma składowych
w kierunku osi z! Zostaje więc tylko jedno równanie: równanie (33.31), Byl = Byl. Dla
wszystkich trzech fal
n _ _ k* £°db r = _ ^x^'zal (-i-i
Ą>pad > "yodb w, > Ązał • (33.49)
Podstawiając za £pad, £odh i £zał wyrażenia falowe dla x = 0 (czyli na powierzchni gra-
nicznej), otrzymujemy warunek brzegowy
k
— Eo exp [i (a>t—kvy)] + ~ E'o exp [i (a>'t-k'y)] = ~ E'0’exp [i .
co co co
Znowu wszystkie k i co są równe, a więc równanie to sprowadza się do równania:
kxEo+k'xE'o = kxE”. (33.50)
Otrzymaliśmy zatem równanie na pola E, różne od równania (33.48). Przy pomocy tych
obu równań można obliczyć E'o i E'o'. Pamiętając, że k'x = —kx, dostajemy
, k —k"
E'9 = -f—^E0, (33.51)
'Cx'TkX
„ ^kX
E°-~k^kTE(
(33.52)
33.7. Polaryzacja fal, w przypadku gdy
pole E fali padającej jest równoległe do
płaszczyzny padania
Równania te, wraz z równaniem (33.45) lub
z równaniem (33.46) na k”, dają nam to, czego
szukaliśmy. W następnym paragrafie rozważymy
ich konsekwencje.
Jeżeliby się zająć falą spolaryzowaną, której
wektor E jest równoległy do płaszczyzny pada-
nia, to trzeba uwzględnić, że wektor E będzie
mieć zarówno składową x-ową, jak i j-ową,
tak jak pokazano na rys. 33.7. Rachunki są pro-
ste, ale bardziej żmudne. (Można ułatwić sobie
pracę, wyrażając w tym przypadku wszystko
przez pola magnetyczne, gdyż pola te w obu
ośrodkach mają kierunek osi z.) Można się
przekonać, że
oraz
1^1 =
n2 k— k'x
27 -- 1^0
Mjk^+njk.,.
(33.53)
(33.54)
33-4 FALE ODBITE I ZAŁAMANE
241
Zobaczmy, czy nasze wyniki zgadzają się z wynikami, które otrzymaliśmy poprzednio.
Równanie (33.3), które wyprowadziliśmy w rozdz. 35 tomu I (cz. 2) określa stosunek na-
tężenia fali odbitej do natężenia fali padającej. Wtedy rozważaliśmy jednak tylko rzeczy-
wiste współczynniki załamania. Dla rzeczywistych n (i liczb falowych k) można napisać:
kx = £cos0pad = cos0pad,
,, „ a>n2
kx=k cosfl^, =---------cos .
c
Podstawiając to do równania (33.51) otrzymujemy:
E0 = »lC°Sepad-»2COSgzai
Eo rtiCO&e^+niCO&e^ ’ , ' '
co nie przypomina równania (33.3). Można jednak stąd otrzymać to równanie, jeżeli
skorzystamy z prawa Snelliusa, aby pozbyć się wszystkich współczynników n. Przyjmując
= nisinflp^/sin&au oraz mnożąc licznik i mianownik przez sinS^ dostajemy
Eo ___ cos 0pad sin0^,-sin 0pad cos0zał
£0 cos 0pad sin 0zal+sin 0pad cos 0zal *
Licznik i mianownik są po prostu sinusami kątów (0pad—0zat) i (^p^-Mad); otrzymujemy
więc
E0 _ S^n(^pad~^zal) “ .
Eo
Ponieważ E'o i Eo są polami w tym samym ośrodku, natężenia są proporcjonalne do kwa-
dratów tych pól elektrycznych i w rezultacie dostajemy ten sam wynik co poprzednio.
Podobnie można równanie (33.53) sprowadzić do równania (33.4).
Dla fal, które padają prostopadle do płaszczyzny granicznej, 0pad = 0 i 0zal = 0. Rów-
nanie (33.56) daje wtedy wyrażenie typu 0/0, z czego nie mamy wielkiego pożytku. Można
jednak powrócić do równania (33.55), które daje
~ = = • (33-57)
4ad \Eol \nl+n2l
Wynik ten stosuje się oczywiście dla fali o dowolnym kierunku polaryzacji, ponieważ
w przypadku padania prostopadłego nie ma wyróżnionej „płaszczyzny padania”.
33-5. Odbicie od metali
Powyższe wyniki mogą nam pomóc w zrozumieniu interesującego zjawiska — odbicia
od metali. Jak to się dzieje, że metale są takie błyszczące? Widzieliśmy w poprzednim roz-
dziale, że metale mają współczynnik załamania, który dla pewnych częstości ma dużą
16 — Wykłady z fizyki
242
33. ODBICIE OD POWIERZCHNI
33.8. Substancja silnie pochłaniająca światło przy .
częstości co także odbija światło o tej częstości
część urojoną. Zobaczmy, jakie jest natę-
żenie fali odbitej, gdy światło pada z po-
wietrza (z n = 1) na ośrodek materialny
o n = —inj. Wówczas równanie (33.55)
daje (dla padania w kierunku normalnej)
E'o __ 1+ini
Eo
Aby obliczyć stąd natężenie fali odbitej,
potrzebne nam są wartości bezwzględne
E'o i Eo, podniesione do kwadratu:
czyli
/odb ... I^l2 _ UW2
4ad l^ol2 II-™/
4db _ ...1
4ad l+«/2
(33.58)
Tak więc substancja, której współczynnik załamania jest czystą liczbą urojoną, odbija
promieniowanie elektromagnetyczne w 100 procentach!
Metale nie odbijają promieniowania w 100 procentach, ale wiele z nich bardzo dobrze
odbija światło widzialne. Innymi słowy, części urojone ich współczynników załamania są
bardzo duże. Ale widzieliśmy, że duża część urojona we współczynniku załamania oznacza
silne pochłanianie. Mamy zatem ogólną zasadę, że jeżeli jakaś substancja staje się przy
danej częstości bardzo dobrym pochłaniaczem, to fale są od niej wtedy silnie odbijane
i tylko niewielka ich część dostaje się do „środka”, gdzie ulega pochłonięciu. Zjawisko to
można zaobserwować dla silnych barwników. Czyste kryształy najsilniejszych barwników
mają „metaliczny” połysk. Prawdopodobnie zauważyliście, że wysuszony barwnik na
brzegu butelki purpurowego atramentu daje złoty, metaliczny połysk lub że wysuszony
czerwony atrament daje czasami zielonkawy metaliczny połysk. Czerwony atrament po-
chłania z światła przepuszczonego barwę zieloną, tak że jeśli atrament jest bardzo stężony,
to daje on silne odbicie powierzchniowe dla światła o częstościach odpowiadających barwie
zielonej.
Zjawisko to można łatwo zademonstrować pokrywając płytkę szklaną czerwonym atra-
mentem i pozwalając mu wyschnąć. Jeżeli skierować wiązkę światła białego na tylną ściankę
płytki, tak jak to pokazano na rys. 33.8, to otrzyma się wiązkę przepuszczoną o barwie
czerwonej i wiązkę odbitą o barwie zielonej.
33-6. Całkowite odbicie wewnętrzne
Jeżeli światło przechodzi z takiego ośrodka, jak na przykład szkło, o rzeczywistym
współczynniku załamania większym od 1, do — powiedzmy — powietrza, o współczyn'
niku załamania n2 = 1, to z prawa Snelliusa wynika, że
sinfl^ = nsinflpad.
33-6. CAŁKOWITE ODBICIE WEWNĘTRZNE
243
Kąt załamania fali 6^ staje się kątem prostym, gdy kąt padania 0pad osiąga „wartość
graniczną” 6e, daną przez
n sin 9g = 1. (33.59)
Co się stanie dla kąta 0pad większego od kąta granicznego? Wiemy, że zachodzi wówczas
całkowite odbicie wewnętrzne. Ale jak to się dzieje?
Powróćmy do równania (33.45), które daje liczbę falową k" fali załamanej:
Ale kr = k sinfip^ i k — ton/c, a więc
co2
' kx2 = — (1—n2sin20pad).
C2
Jeżeli n sin ^pad jest większe od 1, to kx2 jest ujemne i k" jest czysto urojone; powiedzmy
k" = ±ikz. Wiemy teraz, co to oznacza! Fala „załamana” [równanie (33.34)] będzie
mieć postać
Ead = -EoexP(±*rO expp(a>t-kzy)].
Amplituda fali albo rośnie, albo maleje wykładniczo ze wzrostem x. Oczywiście, chcemy
mieć tutaj znak ujemny. Wówczas amplituda fali po prawej stronie granicy będzie się
zmieniać, tak jak to pokazano na rys. 33.9. Zauważmy, że kj jest rzędu co/c — co równe
jest Źq, długości fali świetlnej w próżni. Gdy światło jest całkowicie odbite od wnętrza
powierzchni szkło-powietrze, to w powietrzu też wystąpią jakieś pola, ale rozciągają się
one poza powierzchnię jedynie na odległość rzędu długości fali światła.
Widać teraz, jak należy odpowiedzieć na takie oto pytanie. Jeżeli fala świetlna w szkle
przybywa do powierzchni pod wystarczająco dużym kątem, to ulega ona wewnętrznemu
odbiciu, jeżeli natomiast dostawić do powierzchni jeszcze jeden kawałek szkła (tak że
powierzchnia graniczna w efekcie znika), to światło jest całkowicie przepuszczone. Kiedy
33.9. Całkowite odbicie wewnętrzne
244
33. ODBICIE OD POWIERZCHNI
33.10. Jeżeli w ośrodku istnieje mała
przerwa — to odbicie wewnętrzne nie
jest „całkowite”; poza tą przerwą po-
jawia się fala załamana
to się właściwie stanie? Na pewno musi być ciągłe
przejście od całkowitego wewnętrznego odbicia
do zupełnego braku odbicia! Odpowiedź oczywiś-
cie brzmi tak: jeżeli odstęp powietrza pomiędzy
dwoma kawałkami szkła jest tak mały, że wy-
kładniczy „ogon” fali w powietrzu ma jeszcze zna-
czne natężenie w drugim kawałku szkła, to fala
wzbudzi elektrony w tym drugim kawałku i wy-
tworzy tam nową falę, tak jak to pokazano na rys.
33.10. Pewna część światła zostanie przepuszczona.
(Oczywiście, nasze rozwiązanie nie jest kompletne;
powinniśmy rozwiązać jeszcze raz wszystkie rów-
nania dla przypadku cienkiej warstwy powietrza
pomiędzy dwoma obszarami ze szkła.)
To zjawisko przechodzenia fali przez przer-
wę powietrzną można obserwować dla zwykłego
światła tylko wtedy, gdy przerwa ta jest bardzo ma-
ła (rzędu długości fali świetlnej, 10-5 cm), ale zja-
wisko to można łatwo zademonstrować dla fal
trzycentymetrowych. Wówczas wykładniczo malejące pole rozciąga się na kilka centy-
metrów. Aparaturę mikrofalową potrzebną do demonstracji tego zjawiska pokazano na
rys. 33.11. Trzycentymetrowe fale z małego nadajnika padają na równoramienny pryzmat
z parafiny, o kącie łamiącym 90°. Współczynnik załamania parafiny jest dla tych częstości
33.11. Demonstracja przenikania fal wewnętrznie odbitych
33-6. CAŁKOWITE ODBICIE WEWNĘTRZNE 245
równy 1,50, tak że kąt graniczny wynosi 41°30'. Fala zostaje zatem całkowicie odbita
od nachylonej pod kątem 45° ścianki i dociera do odbiornika A, tak jak zaznaczona
na rys. 33.1 la. Jeżeli do pryzmatu przyłożyć drugi pryzmat z parafiny, tak jak to pokazano
na części b) rysunku, to fala przechodzi na wprost przez parafinę i dociera do odbiornika
B. Jeżeli pomiędzy oboma pryzmatami zostawić odstęp rzędu kilku centymetrów, tak
jak na części c) rysunku, to wówczas wystąpią zarówno fala odbita, jak i fala prze-
puszczona. Istnienie pola elektrycznego tuż poza podstawą pryzmatu na rys. 33.1 la
można także pokazać ustawiając odbiornik B w odległości kilku centymetrów od po-
wierzchni podstawy.
34
magnetyzm materii
34-1. Diamagnetyzm i paramagnetyzm
W rozdziale tym chcielibyśmy omówić własności magnetyczne substancji materialnych.
Taką substancją, która ma najbardziej uderzające własności magnetyczne, jest oczy-
wiście żelazo. Podobne własności magnetyczne mają również pierwiastki nikiel, kobalt,
oraz — w dostatecznie niskich temperaturach (poniżej 16° C) — gadolin, jak i niektóre
szczególne stopy. Ten rodzaj magnetyzmu, nazywany ferromagnetyzmem, jest na tyle
godny zainteresowania i na tyle skomplikowany, że omówimy go w oddzielnym rozdziale.
Jednakże wszystkie zwykłe substancje wykazują pewne własności magnetyczne, chociaż
w nieznacznym na ogół stopniu, typowe dla nich wielkości są bowiem tysiąć do miliona
razy mniejsze od odpowiednich wielkości w materiałach magnetycznych. W tym rozdziale
chcemy opisać tylko ten zwykły magnetyzm, tzn. magnetyzm substancji, które nie są
ferromagnetykami.
Istnieją dwa rodzaje tego „nieznacznego magnetyzmu”. Niektóre materiały są przy-
ciągane przez pola magnetyczne, a inne są przez nie odpychane. W odróżnieniu od włas-
ności materii w polu elektrycznym, które zawsze powoduje przyciąganie dielektryków,
zachowanie się materii w polu magnetycznym jest scharakteryzowane przez dwa znaki.
Można to łatwo zademonstrować za pomocą silnego elektromagnesu, którego jeden biegun
jest zakończony ostro, a drugi płasko — tak jak to pokazano na rys. 34.1. Pole magne-
tyczne jest znacznie silniejsze w pobliżu „ostrego” bieguna niż w pobliżu bieguna płaskiego.
Jeżeli umocować na nici mały kawałek jakiejś substancji i zawiesić go pomiędzy biegunami,
to ogólnie rzecz biorąc będzie nań działać pewna mała siła. Ta mała siła objawia się w nie-
wielkim przesunięciu zawieszonej substancji przy włączeniu elektromagnesu. Ostry koniec
magnesu przyciąga bardzo silnie kilka wymienionych przed chwilą substancji ferromagne-
34-1. DIAMAGNETYZM I PARAMAGNETYZM
247
tycznych; wszystkie zaś inne substancje doznają działania jakiejś bardzo słabej siły. Nie-
które z nich są słabo przyciągane ku ostremu biegunowi, a niektóre są słabo odpychane.
Zjawisko to najłatwiej dostrzec w przypadku małego walca z bizmutu, który jest
wypychany z obszaru silnego pola. Substancje, które są w taki sposób odpychane, nazy-
wamy diamagnetykami. Bizmut jest jedną z najsilniejszych substancji diamagnetycznych,
ale nawet dla niego zjawisko diamagnetyzmu objawia się w nieznacznym stopniu. Efekt
diamagnetyzmu jest zawsze bardzo słaby. Jeżeli pomiędzy biegunami zawiesić mały ka-
wałek aluminium, to będzie nań działać pewna siła, ale w kierunku bieguna ostrego. Takie
substancje jak aluminium nazywamy paramagnetykami. (W doświadczeniu tego typu po-
jawiają się siły pochodzące od prądów wirowych, powstających przy włączaniu i wyłą-
czaniu magnesu. Siły te mogą dać silne impulsy, dlatego też należy być ostrożnym i brać
pod uwagę wychylenie wypadkowe, po „uspokojeniu się” wiszącego obiektu.)
Chcemy teraz opisać pokrótce mechanizm obu tych zjawisk. Po pierwsze, w wielu
substancjach atomy nie mają trwałych momentów magnetycznych, a raczej wszystkie
momenty magnetyczne w każdym z atomów się równoważą, tak że wypadkowy moment
magnetyczny atomu jest równy zeru. Wszystkie spiny elektronów i ruchy orbitalne dokład-
nie się równoważą, tak że żaden atom nie ma średniego momentu magnetycznego. W takiej
sytuacji, jeżeli włączy się pole magnetyczne, wewnątrz atomu zostają wytworzone przez
indukcję niewielkie dodatkowe prądy. Zgodnie z regułą Lenza prądy tę będą miały taki
kierunek, aby przeciwdziałać wzrostowi pola. A zatem wytworzone przez indukcję mo-
menty magnetyczne atomów mają kierunek przeciwny do kierunku pola magnetycznego.
Na tym właśnie polega mechanizm diamagnetyzmu.
Są jednak też takie substancje, których atomy mają trwały moment magnetyczny —
w których spiny elektronów i ruchy orbitalne dają pewien, różny od zera wypadkowy
prąd. A zatem oprócz zjawiska diamagnetyzmu (które zawsze występuje) istnieje też
możliwość, że poszczególne momenty magnetyczne atomów zostaną uporządkowane
(tzn. ustawione w jednym kierunku) przez pole magnetyczne. W tym przypadku momenty
magnetyczne starają się ustawić zgodnie z kierunkiem pola magnetycznego (podobnie
jak trwałe dipole w dielektryku są uporządkowane
przez pole elektryczne) i indukowany magnetyzm
dąży do powiększenia pola magnetycznego. Jest to
właśnie zjawisko paramagnetyzmu. Paramagnetyzm
jest ogólnie dość słaby, bo siły porządkujące są
stosunkowo małe w porównaniu z siłami pochodzą-
cymi od ruchów cieplnych, które starają się to upo-
rządkowanie zniszczyć. Wynika stąd również, że
paramagnetyzm jest czuły na temperaturę. (Wyją-
tek stanowi paramagnetyzm wynikły z obrotu wo-
kół osi elektronów, odpowiedzialnych za przewo-
dnictwo. Tego jednak zjawiska nie będziemy tutaj
omawiać.) Dla zwykłego paramagnetyzmu zjawisko
to jest tym silniejsze, im niższa jest temperatura.
Uporządkowanie jest większe przy niskich tempe-
34.1. Mały walec z bizmutu jest słabo
odpychany przez ostry nabiegunnik;
kawałek aluminium jest przyciągany
elektromagnesu
248
34. MAGNETYZM MATERII
raturach, przy których dezorganizujący wpływ zderzeń jest mniejszy. Natomiast diamag-
netyzm jest w mniejszym lub w większym stopniu niezależny od temperatury. W każdej
substancji mającej „wbudowane” momenty magnetyczne zachodzi zarówno zjawisko
diamagnetyczne, jak paramagnetyczne, ale dominuje zwykle to ostatnie.
W rozdziale 11 (t. II, cz. 1) opisywaliśmy substancję ferroelektryczną, w której wszyst-
kie dipole elektryczne zostają uporządkowane przez swe własne pola elektryczne. Można
także sobie wyobrazić analogię magnetyczną zjawiska ferroelektryczności, w której wszyst-
kie momenty magnetyczne atomów zostałyby uporządkowane i unieruchomione. leżeli-
byśmy przeprowadzili obliczenia, w jakich warunkach powinno to zajść, przekonalibyśmy
się, że ruchy cieplne powinny zniszczyć takie uporządkowanie nawet dla temperatur
tak niskich jak temperatury kilku dziesiątych stopnia Kelvina, siły magnetyczne są bo-
wiem znacznie słabsze od sił elektrycznych. Wydawałoby się więc rzeczą niemożliwą, aby
w temperaturze pokojowej istniało jakieś trwałe uporządkowanie momentów magne-
tycznych.
Z drugiej strony, takie właśnie uporządkowanie zachodzi dla żelaza. Pomiędzy mo-
mentami magnetycznymi różnych atomów żelaza działa pewna efektywna siła, która jest
znacznie, znacznie większa od bezpośredniego oddziaływania magnetycznego. Jest to pewne
zjawisko oddziaływania pośredniego, które można wytłumaczyć tylko na gruncie mecha-
niki kwantowej. Oddziaływanie to jest około 10 000 razy silniejsze od bezpośredniego
oddziaływania magnetycznego i ono to właśnie porządkuje momenty magnetyczne w sub-
stancjach ferromagnetycznych. Ten specjalny rodzaj oddziaływania omówimy w jednym
z następnych rozdziałów.
Teraz, gdy już spróbowaliśmy podać jakościowy opis diamagnetyzmu i paramagne-
tyzmu, musimy się poprawić i powiedzieć, że nie da się zrozumieć w uczciwy sposób zjawisk
magnetycznych substancji z punktu widzenia fizyki klasycznej. Takie zjawiska magnetyczne
należą do zjawisk w pełni kwantowomechanicznych. Można jednak przy pomocy pewnych
dość naciąganych rozważań na gruncie fizyki klasycznej zrozumieć w pewnym stopniu, co
się właściwie tu dzieje. Można by to tak sformułować: wolno nam się posługiwać pewnymi
argumentami klasycznymi do wyciągania wniosków dotyczących zachowania się sub-
stancji, ale argumenty takie w żadnym wypadku nie są „legalne”, bo w gruncie rzeczy wia-
domo jest doskonale, że mechanika kwantowa leży u podstaw każdego z tych zjawisk
magnetycznych. Z drugiej strony są takie sytuacje, np. w plazmie lub w jakimś obszarze
przestrzeni z dużą liczbą elektronów swobodnych, gdzie elektrony rzeczywiście się stosują
do praw mechaniki klasycznej. I dla takich okoliczności niektóre z twierdzeń klasycznego
magnetyzmu są w dalszym ciągu słuszne. Argumenty klasyczne mają także pewną war-
tość ze względów historycznych. Na początku, kiedy ludzie byli już w stanie snuć przy-
puszczenia dotyczące znaczenia i zachowania się substancji magnetycznych, posługiwali
się oni argumentami klasycznymi. A wreszcie, tak jak już to zademonstrowaliśmy, me-
chanika klasyczna pozwala nam czasem się domyślać, co się dzieje — mimo że naprawdę
uczciwy sposób przestudiowania zagadnienia polegałby na nauczeniu się najpierw mecha-
niki kwantowej, a następnie na zrozumieniu magnetyzmu z jej punktu widzenia.
Nie chcemy jednak czekać ze zrozumieniem tak prostego zjawiska jak diamagnetyzm
do czasu przestudiowania, od deski do deski, mechaniki kwantowej. Będziemy musieli
34-1. DIAMAGNETYZM I PARAMAGNETYZM
249
się oprzeć na mechanice klasycznej, która będzie nam w pewnym stopniu ukazywać,
co się dzieje, ale będziemy jednak musieli zdawać sobie sprawę, że nasze rozumowanie nie
będzie w rzeczywistości poprawne. Dlatego też podamy szereg twierdzeń, dotyczących ma-
gnetyzmu klasycznego, które wprawią nas w nie lada kłopot, bo będą dowodziły przeciw-
stawnych sobie rzeczy. Każde z tych twierdzeń, z wyjątkiem ostatniego, będzie fałszywe.
Co więcej, będą one wszystkie fałszywe, jeżeli chodzi o opis świata fizycznego, ponie-
'waż pominięto w nich prawa mechaniki kwantowej.
34-2. Momenty magnetyczne i moment pędu*>
Oto pierwsze twierdzenie, które chcemy udowodnić na gruncie mechaniki klasycznej:
jeżeli elektron porusza się po orbicie kołowej (jeżeli na przykład obiega jądro pod wpły-
wem siły centralnej), to jego moment magnetyczny i moment pędu pozostają do siebie
w pewnym określonym stosunku. Oznaczmy przez J moment pędu a przez p. moment
magnetyczny elektronu na orbicie. Wartość bezwzględna momentu pędu jest równa ilo-
czynowi masy elektronu, prędkości i promienia (patrz rys. 34.2). Moment pędu jest skiero-
wany prostopadle do płaszczyzny orbity.
J=mvr. (34.1)
(Jest to oczywiście wzór nierelatywistyczny, ale jest on dobrym przybliżeniem dla atomów,
ponieważ dla elektronów w atomach stosunek v/c jest zwykle rzędu e2/hc — czyli
rzędu 1%.)
Moment magnetyczny tej samej orbity jest równy iloczynowi natężenia prądu i pola
powierzchni ograniczonej orbitą (patrz t. II, cz. 1, § 14-5). Prąd jest równy ładunkowi
przepływającemu w jednostce czasu przez jakiś obrany punkt na orbicie; dokładniej zaś:
iloczynowi ładunku q i częstości obiegu. Częstość jest równa prędkości podzielonej przez
obwód orbity, tak więc
' v
I=q
Pole powierzchni wynosi rrr2, moment magnetyczny jest więc równy qvr = (34.2) i także skierowany prostopadle do płaszczyzny orbity. Wektory J i p mają zatem ten sam kierunek: q p. = J(ruchu orbitalnego). (34.3) 2m *’ Porównaj: Tom II, cz. 1, § 15-1 (Siły działające na pętlę z prądem, energia dipola). 34.2. Dla każdej orbity kołowej moment magnetyczny p wy- nosi ?/2m razy moment pędu J i.J \ ^\r 2****^* m,ą
250
34. MAGNETYZM MATERII
Stosunek wektorów J i p nie zależy ani od prędkości, ani od promienia. Moment magne-
tyczny każdej cząstki poruszającej się po orbicie kołowej jest równy q!2m razy moment
pędu. Dla elektronu ładunek jest ujemny; można go oznaczyć — qe. Zatem dla elektronu
u. =-----J(ruchu orbitalnego elektronu). (34.4)
2m
Jest to właśnie to, czego powinniśmy się Spodziewać z klasycznego punktu widzenia
i, dość niespodziewanie, jest to także prawdziwe z punktu widzenia mechaniki kwantowej.
No cóż, czasem tak się właśnie zdarza. Gdyby się jednak trzymać fizyki klasycznej, to
można by znaleźć także inne sytuacje, w których fizyka klasyczna daje odpowiedzi nie-
prawdziwe, a usiłowanie zapamiętania, co jest prawdziwe, a co nieprawdziwe — to dość
uciążliwa historia. Równie dobrze można by od razu podać, co jest ogólnie prawdziwe
w mechanice kwantowej. Przede wszystkim, równanie (34.4) jest prawdziwe dla ruchu
orbitalnego, ale ten ruch nie jest jedynym powodem istnienia magnetyzmu. Elektron doz-
naje także obrotu wokół swej własnej osi (podobnie jak Ziemia, która się obraca wokół
swej osi) i w wyniku tego obrotu elektron ma zarówno pewien moment pędu (zwany spi-
nem), jak i pewien moment magnetyczny. Ale z czysto kwantowomechanicznych po-
wodów — klasyczne wytłumaczenie nie istnieje — stosunek wektora p do wektora J dla
obrotu elektronu wokół własnej osi jest dwa razy większy niż dla ruchu orbitalnego elek-
tronu z momentem pędu równym J:
' qe
(X ------J(obrotu elektronu wokół osi-spinu). (34.5)
W każdym atomie znajduje się, mówiąc ogólnie, kilka elektronów i tworzy się tam
pewna kombinacja obrotów orbitalnych i spinów, która daje całkowity moment pędu
i całkowity moment magnetyczny. Chociaż nie ma na to żadnego uzasadnienia klasycz-
nego, w mechanice kwantowej (dla odosobnionego atomu) zawsze zwrot momentu magne-
tycznego jest dokładnie przeciwny do zwrotu momentu pędu. Stosunek tych dwóch wiel-
kości nie musi być równy ani —qelm, ani —qJ2m, ale może przyjmować jakąś wartość
pośrednią, ze względu na to, że całkowity moment pędu jest mieszaniną momentów pędu
pochodzących od orbit i od spinów. Można napisać:
(i = -g /Aj J (36.6)
gdzie g jest czynnikiem charakterystycznym dla danego stanu atomu. Będzie on równy 1
dla czystego momentu orbitalnego lub 2 dla czystego momentu spinowego, albo też będzie
on równy jakiejś liczbie mniejszej od 2, a większej od 1, dla jakiegoś układu złożonego,
takiego jak atom. Wzór (34.6) oczywiście nie mówi nam zbyt wiele. Mówi on, że moment
magnetyczny jest równoległy do momentu pędu, ale może mieć dowolną wartość bez-
względną. Postać równania (34.6) jest jednak wygodna, bo g — nazywane „czynnikiem S
Landego” — jest stałą bezwymiarową, której wartość jest rzędu jedności. Określenie
czynnika g dla jakiegoś konkretnego stanu atomu jest jednym z zadań mechaniki kwan-
towej.
34-2. MOMENTY MAGNETYCZNE I MOMENT PĘDU
251
Można by się też zainteresować tym, co się dzieje w jądrach. W jądrach mamy protony
i neutrony, które mogą się poruszać dookoła po jakiejś orbicie, a jednocześnie mogą,
podobnie jak elektron, mieć pewien wewnętrzny moment pędu — spin. I w tym przypadku
moment magnetyczny jest równoległy do momentu pędu, tylko że teraz rząd wielkości
stosunku |i do J jest taki, jakiego należałoby się spodziewać dla protonu poruszającego
się po okręgu, z masą m w równaniu (34.3) równą masie protonu. Dlatego też dla jądra
zwykle się pisze następującą zależność:
p=4^)j' (m”
gdzie mp jest masą protonu, ag — nazywane czynnikiem jądrowym g — jest liczbą bliską
jedności, którą należy określić dla każdego jądra z osobna.
Inną ważną różnicą pomiędzy jądrem a atomem jest to, że moment magnetyczny pro-
tonu związany z jego spinem nie ma czynnika g równego 2, tak jak elektron. Dla protonu
g = 2-(2,79). Okazuje się też, dość niespodziewanie, że neutron ma także moment magne-
tyczny związany ze spinem, a stosunek jego momentu magnetycznego do jego momentu
pędu wynosi 2-(—1,93). Innymi słowy, neutron nie jest w sensie magnetycznym całkiem
„neutralny”. Wygląda on jak mały magnes i ma moment magnetyczny tego typu, jaki
miałby obracający się ładunek ujemny.
34-3. Precesja atomowych momentów magnetycznych
Jedną z konsekwencji faktu, że moment magnetyczny jest proporcjonalny do momentu
pędu, jest precesja atomowych momentów magnetycznych w polu magnetycznym. Roz-
ważmy najpierw to zjawisko z punktu widzenia fizyki klasycznej. Przypuśćmy, że mamy
moment magnetyczny |i, zawieszony swobodnie w jednorodnym polu magnetycznym. Ten
moment magnetyczny dozna działania momentu siły r równego jx X B, który stara się usta-
wić moment magnetyczny p. zgodnie z kierunkiem pola. Ale atomowy moment magne-
tyczny jest giroskopem — ma on moment pędu J. Dlatego też pochodzący od pola magne-
tycznego moment siły nie ustawi momentu magnetycznego zgodnie z liniami sił pola.
Zamiast tego, moment magnetyczny będzie wykonywał precesję, tak jak to widzieliśmy przy
omawianiu giroskopu w rozdz. 20 tomu I (cz. 1). Moment pędu — a wraz z nim moment
magnetyczny — wykonuje precesję wokół osi równoległej do pola magnetycznego. Pręd-
kość tej precesji można znaleźć tą samą metodą, jaką posługiwaliśmy się w rozdz. 20
tomu I (cz. 1).
Przypuśćmy, że w ciągu małej chwili At moment pędu się zmienia z J na J', tak jak to
zilustrowano na rys. 34.3, tworząc przez cały czas ten sam kąt 0 z kierunkiem pola magne-
tycznego B. Oznaczmy prędkość kątową precesji przez tak że w czasie At kąt precesji
Wyniesie wpAt. Z. geometrii rysunku widać, że zmiana momentu pędu po czasie At wy-
niesie
A J = (J sin 0) (a>p A t).
252
34. MAGNETYZM MATERII
34.3. Obiekt mający moment
pędu 3 i równoległy doń mo-
ment magnetyczny p, umiesz-
czany w polu magnetycznym B,
wykonuje precesję z prędkością
kątową <op
a dla jądra
A zatem zmiana momentu pędu w jednostce czasu jest
równa
— = copJsin0, (34.8)
ćo musi się. równać momentowi siły:
t = (iBsinO. (34.9)
Prędkość kątowa precesji jest więc równa
u
= (34.10)
Podstawiając /j,/J z równania (34.6) widzimy, że dla
układu atomowego
9eS
= -g-r—;
2m
(34.11)
częstość precesji jest proporcjonalna do pola B. Dobrze
jest zapamiętać, że dla atomu (lub elektronu)
fp = == (1,4 MHz/Gs)gR, (34.12)
* 2rt •
fp = = (0,76 KHz/Gs)gB. (34.13)
(Różnica pomiędzy wzorami dla atomów i dla jąder wynika jedynie z różnicy w określeniu
czynnika g dla tych dwóch przypadków.)
A więc zgodnie z teorią klasyczną orbity elektronów i ich momenty pędu w atomie
powinny w polu magnetycznym wykonywać precesję. A czy to jest także słuszne z punktu
widzenia mechaniki kwantowej? W zasadzie tak, ale znaczenie „precesji” jest w tym przy-
padku inne. W mechanice kwantowej nie można mówić o kierunku momentu pędu w tym
samym sensie, jak to się mówi klasycznie, mimo to analogia jest bardzo ścisła — na tyle
ścisła, że będziemy w dalszym ciągu używali terminu „precesja”. Pomówimy o tym jeszcze
później, kiedy będziemy rozważać to zjawisko na gruncie mechaniki kwantowei.
34-4. Diamagnetyzm
Z kolei z punktu widzenia fizyki klasycznej chcemy rozpatrzyć diamagnetyzm. Można
to zrobić na wiele różnych sposobów. Podamy tu jeden z ładniejszych. Przypuśćmy, ^e
w otoczeniu jakiegoś atomu powoh włączamy pole magnetyczne. Wraz ze zmianami tego
pola magnetycznego powstaje na skutek indukcji magnetycznej pole elektryczne. Zgodnie
34-4 DIAMAGNETYZM
253
z prawem Faradaya całka krzywoliniowa z pola E wzdłuż dowolnej krzywej zamkniętej
jest równa szybkości zmian strumienia magnetycznego przez tę krzywą. Przypuśćmy, że
wybierzemy krzywą r, która jest okręgiem o promieniu r, współśrodkowym ze środkiem
atomu, tak jak to pokazano na rys. 34.4. Średnia składowa styczna pola elektrycznego E
wokół tej krzywej jest dana wzorem
d , ,
EItzt -----— (Bitr2),
at J
czyli powstaje tu krążące pole elektryczne o natężeniu
Powstałe w wyniku indukcji pole elektryczne działając na elektron w atomie wytwarza
moment siły równy —qeEr, który musi się równać szybkości zmian momentu pędu dJ/dt:
dJ qer2 dB
dt 2 dt'
(34.14)
Całkując względem czasu od chwili, w której pole B było jeszcze równe zeru, znajdujemy,
że zmiana momentu pędu, pochodząca od włączenia pola magnetycznego, jest równa
qer2
——B.
2
(34.15)
Jest to dodatkowy moment pędu, pochodzący od momentu siły, jaki doznają elektrony
przy włączeniu pola.
Ten dodatkowy moment pędu wytwarza pewien dodatkowy moment magnetyczny,
który ze względu na to, że jest to ruch orbitalny, jest równy po prostu iloczynowi czynnika
—qJ2m i momentu pędu. Indukowany moment diamagnetyczny jest więc równy
4,-—te
2m 4m
(34.16)
Znak ujemny (który, jak łatwo sprawdzić, wynika
z reguły Lenza) oznacza, że ten dodatkowy moment
„przeciwstawia się” polu magnetycznemu.
Chcielibyśmy przepisać równanie (34.16) w tro-
chę innej postaci. Wielkość r2, która się pojawia
w tym równaniu, jest kwadratem odległości od osi
Przechodzącej przez atom równolegle do pola B,
w przypadku więc gdy wektor B ma kierunek osi
z, r2 = x2+y2. Jeżeli będziemy rozważać ato-
my o symetrii kulistej (lub jeżeli weźmiemy śred-
n*ą po atomach, których osie własne mają
wszystkie możliwe kierunki), to średnia z wyraże-
nia x2+y2 będzie równa j średniej kwadratu
34.4. Indukowane siły elektryczne dzia-
łające na elektrony w atomie
254
34. MAGNETYZM
MATErh
rzeczywistej odległości radialnej od centrum atomu. Dlatego też zwykle wygodniej jest
zapisywać równanie (34.16) w postaci
o 2
' zł/<=* — —<r2>ir2ł. ' (34.17)
W każdym razie znaleźliśmy powstały na skutek indukcji moment magnetyczny atomu
proporcjonalny do pola magnetycznego B i przeciwstawiający się temu polu. Na tym polega
diamagnetyzm materii. To właśnie zjawisko magnetyczne jest odpowiedzialne za tę nie-
wielką siłę, która działa na kawałek bizmutu w niejednorodnym polu magnetycznym.
(Można by obliczyć tę siłę znajdując energię indukowanych w polu momentów magne-
tycznych i obserwując, jak się ta energia zmienia przy wprowadzaniu próbki substancji
do lub na zewnątrz obszaru pola o dużym natężeniu.)
Pozostał nam jeszcze jeden problem: co to jest średni promień kwadratowy
Mechanika klasyczna nie może dać na to odpowiedzi. Musimy się cofnąć i zacząć całe
rozumowanie od początku, posługując się mechaniką kwantową. Nie można naprawdę
powiedzieć, gdzie się znajduje elektron w atomie; można tylko podać prawdopodobień-
stwo tego, że elektron będzie w pewnym miejscu. Jeżeli będziemy interpretować <r2>fr
jako średni kwadrat odległości od środka dla tego rozkładu prawdopodobieństwa, to
moment diamagnetyczny dany przez mechanikę kwantową będzie akurat taki sam, jak
moment określony wzorem (34.17). To równanie określa oczywiście moment jednego
elektronu. Całkowity moment magnetyczny jest określony przez sumę po wszystkich elek-
tronach w atomie. Zadziwiającą rzeczą jest to, że rozważania klasyczne i mechanika
kwantowa dają tę samą odpowiedź, chociaż — jak to zobaczymy — rozważania klasycz-
ne, które prowadzą do równania (34.17), nie są w rzeczywistości w mechanice klasycznej
słuszne.
To samo zjawisko diamagnetyczne zachodzi nawet wtedy, gdy atom ma już jakiś
trwały moment magnetyczny. Wówczas taki układ będzie w polu magnetycznym wyko-
nywał precesję. Na skutek precesji atom uzyskuje jakąś dodatkową, niewielką prędkość
kątową i ten powolny obrót daje pewien mały prąd, który stanowi poprawkę do mo-
mentu magnetycznego. Jest to po prostu zjawisko diamagnetyczne, tyle tylko że przed-
stawione w inny sposób. Ale w rzeczywistości nie musimy się o to już troszczyć, kiedy
mówimy o paramagnetyzmie. Jeżeli najpierw obliczy się efekt diamagnetyczny, tak jak
to tutaj zrobiliśmy, nie musi się wtedy troszczyć o to, że jest tam jeszcze pewien niewiel-
ki dodatkowy prąd pochodzący od precesji. Zostało bowiem to już uwzględnione w rów-
naniu w wyrazie określającym diamagnetyzm.
34-5. Twierdzenie Larmora
Z naszych dotychczasowych wyników można już wyciągnąć pewne wnioski. Przede
wszystkim, w teorii klasycznej moment magnetyczny p był zawsze proporcjonalny do
momentu pędu J, z pewną stałą proporcjonalności określoną dla poszczególnego atomu-
Nie było tu żadnego obrotu elektronów wokół osi (spinu) i stała proporcjonalności był3
34-5- twierdzenie larmora - ’ 255
zawsze równa — qj2m-, inaczej mówiąc, w równaniu (34.6) powinniśmy przyjąć g = 1.
Stosunek wektorów |i do J był niezależny od ruchu wewnętrznego elektronów. Tak więc
zgodnie z teorią klasyczną, wszystkie układy elektronów wykonywałyby precesję z tą
samą prędkością kątową. (Nie jest to już prawdą w mechanice kwantowej.) Wynik ten
jest związany z pewnym twierdzeniem mechaniki klasycznej, które chcielibyśmy teraz
udowodnić. Przypuśćmy, że mamy grupę elektronów, które są wszystkie utrzymywane
razem przez centralną siłę przyciągającą — tak jak w atomie, gdzie elektrony są przycią-
gane przez jądro. Elektrony te będą także oddziaływać ze sobą i w ogólnym przypadku
ich ruchy mogą być całkiem skomplikowane. Przypuśćmy, że znaleźliśmy te ruchy, gdy
nie było pola magnetycznego i chcemy teraz wiedzieć, jakie będą te ruchy, gdy będzie
istniało słabe pole magnetyczne. Twierdzenie mówi, że ruch w obecności słabego pola
magnetycznego jest zawsze złożeniem jednego z rozwiązań dla ruchu bez pola i dodatko-
wego obrotu wokół osi pola, z prędkością kątową = qeBj2m. (Jest ona taka sama jak
częstość cop, jeżeli g — 1.) Oczywiście, takich ruchów może być wiele. Rzecz w tym, że
każdemu ruchowi bez pola magnetycznego odpowiada ruch w polu, który jest złożeniem
ruchu pierwotnego i pewnego jednostajnego obrotu. Twierdzenie to nazywamy twierdze-
niem Larmora, a wL nazywamy częstością Larmora.
Chcielibyśmy pokazać, jak można to twierdzenie udowodnić, ale szczegóły dowodu
pozostawimy już czytelnikowi. Weźmy najpierw jeden elektron w polu dowolnej siły
centralnej. Niech siła ta będzie po prostu równa F(r) i niech będzie skierowana ku jakie-
muś centrum. Jeżeli teraz włączymy jednorodne pole magnetyczne, to wystąpi pewna
dodatkowa siła równa <?vxB. A zatem całkowita siła będzie równa
F(r)+ęvxB. (34.18)
Popatrzmy teraz na ten sam układ fizyczny z układu współrzędnych obracającego się
z prędkością kątową m wokół osi przechodzącej przez „centrum” siły i równoległej do
pola ii. Nic jest to już układ inercjalny, musimy więc wprowadzić odpowiednie siły po-
zorne — siłę odśrodkową i siłę Coriolisa, o których mówiliśmy w rozdz. 19 tomu I (cz. 1).
Stwierdziliśmy tam, że w układzie obracającym się z prędkością kątową co występuje
pewna pozorna siła styczna, proporcjonalna do vr, składowej radialnej prędkości, równa
Etyczna = 2wC0Vf. (34.19)
Ponadto występuje tu też pewna pozorna siła radialna, która jest dana przez
Fr = mco2r-2mcovstyczna, (34.20)
gdzie vstyczna jest składową styczną prędkości, mierzoną w obracającym się układzie od-
niesienia. (Składowa radialna vr jest taka sama w obracającym się, jak i w inercjalnym
układzie odniesienia.)
Dla dostatecznie małych prędkości kątowych (tzn. jeżeli cor < fsty(;ziia) można po-
minąć pierwszy wyraz (siłę odśrodkową) w równaniu (34.20) w porównaniu z drugim
wyrazem (siłą Coriolisa). Wówczas równania (34.19) i (34.20) można wspólnie zapisać
jako ’. »'
F = (2mwxv).
(34.21)
256
34. MAGNETYZM MATERII
Jeżeli teraz złożymy obrót z polem magnetycznym, to do siły w równaniu (34.18) należy
dodać siłę z równania (34.21). Całkowitą siłą jest więc
F(r)+?vxB-2mvxw (34.22)
[Zmiana kolejności czynników iloczynu wektorowego z równania (34.21) daje ujemny
znak ostatniego wyrazu w równaniu (34.22).] Jeżeli się przyjrzeć naszemu wynikowi,
widać, że jeżeli
2mw = 4-ęB,
to dwa ostatnie wyrazy w równaniu (34.22) się znoszą i jedyną siłą, działającą w poru-
szającym się układzie, jest F(r). Ruch elektronu w układzie obracającym się jest więc do-
kładnie taki sam, jak ruch, gdy brak pola — ale, oczywiście, w układzie się nie obraca-
jącym. Udowodniliśmy tym samym twierdzenie Larmora dla jednego elektronu. Ponie-
waż dowód zakłada, że prędkość kątową co jest mała, oznacza to także, że twierdzenie
jest prawdziwe tylko dla słabych pól magnetycznych. Czytelnika moglibyśmy prosić
tylko o jedno „ulepszenie” — udowodnienie tego samego twierdzenia dla przypadku
wielu elektronów oddziałujących wzajemnie między sobą i znajdujących się ponadto
w tym samym polu centralnym. A zatem bez względu na to, jak złożony będzie atom,
twierdzenie Larmora będzie słuszne, jeżeli tylko w tym atomie występują siły centralne.
Ale w tym miejscu kończą się już wnioski z mechaniki klasycznej, gdyż w rzeczywistości
nie jest prawdą, że ruchy polegają na takiej właśnie precesji. Częstość precesji a>p z równa-
nia (34.11) jest mianowicie równa częstości a>L tylko wtedy, gdy g jest równe 1.
34-6. Fizyka klasyczna nie daje ani diamagnetyzmu,
ani paramagnetyzmu
Chcielibyśmy teraz wykazać, że według mechaniki klasycznej nie może istnieć wcale
ani diamagnetyzm, ani paramagnetyzm. Brzmi to idiotycznie — najpierw udowodniliśmy
istnienie paramagnetyzmu, diamagnetyzmu, orbit dokonujących precesji i tak dalej,
a teraz zabieramy się do udowodnienia, że to wszystko nieprawda. A tak! Mamy zamiar
udowodnić, że jeżeli będzie się śledzić wnioski wynikające z mechaniki klasycznej dosta-
tecznie daleko, to się okaże, że takie zjawiska jak diamagnetyzm i paramagnetyzm nie
istnieją, że one się wszystkie wzajemnie znoszą. Jeżeli rozpocząć rozumowanie klasyczne
w pewnym miejscu i nie zajść z tym rozumowaniem zbyt daleko, to można dostać każdą
odpowiedź, jaką się zechce. Ale jedyny poprawny i słuszny dowód wykazuje, że żadne
zjawiska magnetyczne nie istnieją.
Z mechaniki klasycznej wynika, że jeżeli mamy jakiś układ fizyczny — gaz elektro-
nów, protonów lub czegokolwiek bądź — umieszczony w pudle tak, że cńły ten układ nie
może się obracać, to nie wystąpią żadne zjawiska magnetyczne. Zjawiska magnetyczne
mogą wystąpić wówczas, gdy się ma do czynienia z jakimś układem odosobnionym,
takim jak na przykład gwiazda utrzymująca się sama w całości, który może zacząć si?
4-6. FIZYKA KLASYCZNA A DIAMAGNETYZM I PARAMAGNETYZM
257
obracać, jeżeli włączyć pole magnetyczne. Ale jeżeli mamy próbkę substancji tak trzy-
maną w jednym miejscu, że nie może się ona zacząć obracać wokół osi, to wówczas nie
wystąpią żadne zjawiska magnetyczne. To, co rozumiemy przez wstrzymywanie obrotu,
można by streścić w taki oto sposób: zakładamy, że w danej temperaturze jest tylko je-
den stan równowagi cieplnej. Twierdzenie, które możemy wtedy wykazać, głosi, że jeżeli
włączy się pole magnetyczne i odczeka, aż układ wróci do stanu równowagi cieplnej
to nie powinno się stwierdzić żadnego diamagnetyzmu ani paramagnetyzmu — nie może
bowiem wtedy powstać indukowany moment magnetyczny. Dowód: zgodnie z mecha-
niką statystyczną prawdopodobieństwo, że układ przyjmie jakiś stan ruchu, jest propor-
cjonalne do e- u,kT, gdzie U jest energią tego ruchu. No dobrze, a czym jest teraz ta ener-
gia ruchu? Dla cząstki, która się porusza w stałym polu magnetycznym, energia jest
sumą zwykłej energii potencjalnej i energii kinetycznej my2/2, bez żadnych „dodatków”
od pola magnetycznego. [Wiemy już, że siły od pól elektromagnetycznych są równe
#(E-|-v xB) i że moc F v jest równa po prostu ęE-v, a więc moc, czyli zmiana energii
w jednostce czasu, nie zależy od pola magnetycznego.] Zatem energia jakiegoś układu,
niezależnie od tego czy pole magnetyczne występuje, czy też nie, jest zawsze określona
przez sumę energii kinetycznej i energii potencjalnej. Ponieważ prawdopodobieństwo
każdego ruchu zależy tylko od energii, tzn. od prędkości i od położenia, jest ono takie
samo — bez względu na to, czy jest pole magnetyczne, czy też go nie ma. Dlatego też
pole magnetyczne nie ma wpływu na stan równowagi cieplnej. Jeżeli pewien układ umieś-
cimy w jakimś pudle, a inny taki sam układ w innym pudle, ale tym razem w polu ma-
gnetycznym, to prawdopodobieństwo znalezienia jakiejś określonej prędkości w pewnym
punkcie w pierwszym pudle będzie takie samo jak w drugim. Jeżeli w pierwszym pudle
nie będzie, średniej wartości krążącego prądu (który nie powinien wystąpić, jeżeli układ
jest w równowadze ze ściankami pozostającymi w spoczynku), to nie będzie tam też śred-
niego momentu magnetycznego. Ponieważ w drugim pudle wszystkie ruchy są takie same
jak w pierwszym, to tam także nie będzie średniego momentu magnetycznego. Wynika
stąd — według mechaniki klasycznej — że jeżeli temperatura jest stała i równowaga ciepl-
na zostaje przywrócona po włączeniu pola, to nie może istnieć moment magnetyczny
indukowany przez to pole. Zadowalające zrozumienie zjawisk magnetycznych można
jedynie otrzymać na gruncie mechaniki kwantowej.
Niestety, nie możemy założyć, że czytelnik posiada dokładną znajomość mechaniki
kwantowej i dlatego nie jest to zbyt szczęśliwy moment na rozważanie tej sprawy. Z dru-
giej strony, nie musimy zawsze się czegoś uczyć zaczynając od poznania dokładnych praw,
a kończąc na umiejętności stosowania tych praw w różnych przypadkach. Prawie każde
zagadnienie, którym zajmowaliśmy się w tych wykładach, było potraktowane w sposób
odrębny. W przypadku elektryczności zapisaliśmy na „stronicy pierwszej” równania Max-
wella, a następnie wywiedliśmy z nich wszystkie ich konsekwencje. Jest to jeden ze sposo-
bów. Ale teraz nie będziemy próbować zaczynać nowej „stronicy pierwszej” od wypisania
równań mechaniki kwantowej i wyprowadzenia wszystkich wniosków z tych równań.
Będziemy po prostu musieli podać pewne konsekwencje mechaniki kwantowej, zanim
Poznamy źródło ich pochodzenia. No to zaczynamy.
17 —
Wykłady z fizyki
258
34. MAGNETYZM MAtErij
34-7. Moment pędu w mechanice kwantowej
Podaliśmy już zależność występującą pomiędzy momentem magnetycznym, a mo-
mentem pędu. Pięknie. Ale co oznaczają pojęcia moment magnetyczny i moment pędu
w mechanice kwantowej? Okazuje się, że w mechanice kwantowej najlepiej definiować
takie pojęcia jak momenty magnetyczne przy pomocy innych pojęć, np. energii, po to
aby mieć pewność, że każdy będzie wiedział, o co chodzi. Otóż, łatwo można zdefinio-
wać moment magnetyczny przy pomocy energii, gdyż energia momentu magnetycznego
w polu magnetycznym jest równa w teorii klasycznej—|i • B. Dlatego też w mechanice kwan-
towej przyjmuje się następującą definicję momentu magnetycznego: jeżeli obliczy się
energię jakiegoś układu w polu magnetycznym i się stwierdzi, że jest ona proporcjonalna
do natężenia pola (dla słabych pól), to współczynnik tej proporcjonalności nazywa się
składową momentu magnetycznego w kierunku pola. (Nie musimy się stawać aż tak ele-
ganccy w tym, co teraz będziemy robić; możemy w dalszym ciągu myśleć o momencie
magnetycznym w zwykłym, klasycznym do pewnego stopnia sensie.)
Chcielibyśmy omówić teraz pojęcie momentu pędu w mechanice kwantowej lub ra-
czej omówić sposób opisu tego, co się w mechanice kwantowej nazywa momentem pędu.
Rzecz w tym, że jeżeli się przechodzi do praw nowego typu, to nie można po prostu za-
łożyć, że każde słowo będzie oznaczało dokładnie to samo co dawniej. Można by na
przykład pomyśleć: „Och wiadomo przecież, co to jest moment pędu! Jest to ta wielkość,
która się zmienia pod wpływem momentu sił”. No, dobrze, ale co to jest moment sił?
W mechanice kwantowej musi się mieć nowe definicje starych wielkości. Dlatego też for-
malnie najlepiej byłoby nazwać moment pędu jakoś inaczej, np. „kwantomomentem
pędu” lub czymś w tym rodzaju, bo jest on tu pojęciem definiowanym w oparciu o me-
chanikę kwantową. Ale jeżeli potrafimy znaleźć w mechanice kwantowej wielkość, która
jest identyczna z naszym starym pojęciem momentu pędu w przypadku, gdy dany układ
staje się wystarczająco duży, to nie ma potrzeby na wyszukiwanie nowej nazwy i równie
dobrze można pozostawić starą nazwę — moment pędu. Przy takim podejściu do sprawy
to dziwne pojęcie, do którego opisu się właśnie zabieramy, jest momentem pędu. Jest to
ta sama wielkość, którą w jakimś dużym układzie uznajemy za moment pędu mechaniki
klasycznej.
Na początek weźmy pod uwagę układ, w którym moment pędu jest zachowany —
taki np. układ, jak atom, znajdujący się samotnie w pustej przestrzeni. Otóż tego rodzaju
obiekt (podobny do Ziemi wirującej wokół swej osi) mógłby się w zwykłym sensie obra-
cać wokół każdej osi, jaką ktoś zechciałby sobie wybrać. A dla danego z góry spinu mo-
głoby tam istnieć wiele różnych „stanów”, wszystkich o tej samej energii, z których każdy
odpowiadałby jakiemuś szczególnemu kierunkowi osi momentu pędu. A zatem w teorii
klasycznej dla danej wartości bezwzględnej momentu pędu istnieje nieskończona liczba
możliwych stanów, wszystkich o tej samej energii.
Okazuje się jednak, że w mechanice kwantowej dzieje się kilka dziwnych rzeczy. P°
pierwsze, liczba stanów, w jakich może istnieć taki układ, jest ograniczona do liczby
skończonej. Jeżeli układ jest mały, to ta skończona liczba jest bardzo mała, jeżeli zaś
34-7. MOMENT PĘDU W MECHANICE KWANTOWEJ 259
układ jest duży, to ta skończona liczba staje się bardzo, bardzo duża. Po drugie, nie można
opisywać „stanu” przez podanie kierunku jego momentu pędu, ale można tylko podać
składową momentu pędu wzdłuż jednego kierunku, np. wzdłuż kierunku z. Z punktu
widzenia fizyki klasycznej, obiekt o danym całkowitym momencie pędu J mógłby mieć
dla swojej składowej z-owej każdą z wartości od Ą-J do — J. Ale w mechanice kwantowej
składowa z-owa momentu pędu może przybierać tylko pewne dyskretne wartości. Każdy
dany układ — jakiś atom lub jądro, lub cokolwiek — o danej z góry energii, ma pewną
liczbę charakterystyczną, j, a jego składowa w kierunku osi z momentu pędu może mieć
tylko jedną z następującego zbioru wartości:
jh,
(j-2)h, ! ., ,
(34.23)
< ’ ’ —(/—2)fi,
-(j-l)fi,
-jłl.
Największa składowa z-owa jest równa j razy fi; następna po niej jest mniejsza o jedną
jednostkę fi i tak dalej „w dół”, aż do —jh. Liczbę j nazywamy „spinem układu”. (Nie-
którzy nazywają ją „liczbą kwantową całkowitego momentu pędu”, ale my będziemy
ją nazywać „spinem”.)* *’
Można by się zaniepokoić, że to, o czym teraz mówimy, mogłoby być prawdziwe
tylko dla pewnej „specjalnej” osi z. Ale tak nie jest. Dla układu, którego spin jest równy j,
składowa momentu pędu wzdłuż dowolnej osi może mieć tylko jedną z wartości (34.23).
Chociaż jest to zupełnie tajemnicze, musimy poprosić czytelnika, aby się po prostu z tym
faktem na chwilę pogodził. Powrócimy jeszcze do tego zagadnienia i omówimy je później.
Być może, że przynajmniej to zadowoli czytelnika, iż składowa z-owa zmienia się od pew-
nej liczby do tej samej liczby ujemnej i nie musimy przynajmniej decydować, jaki jest
dodatni zwrot osi z. (Z pewnością gdybyśmy powiedzieli, że składowa z-owa przebiega
od +j do jakiejś innej wartości ujemnej, to cała sprawa stałaby się już absolutnie tajem-
nicza, ponieważ nie dałoby się wtedy określić osi z, mającej zwrot przeciwny względem
osi pierwotnej.)
Jeżeh składowa z-owa momentu pędu musi przechodzić od do —j poprzez wiel-
kości różniące się między sobą o całkowitą wielokrotność fi, to mogłoby się wydawać,
że j musi być liczbą całkowitą. Tymczasem tak, nie jest! To tylko „podwojone” j musi
być liczbą całkowitą, gdyż różnica pomiędzy +j a —j jest liczbą całkowitą. A zatem,
ł) Należy pamiętać, ze w tym przypadku „spin” będzie oznaczał całkowity moment pędu układu,
* więc — ogólnie biorąc — może się on składać z całkowitego orbitalne go momentu pędu i z całkowitego
wewnętrznego momentu pędu, czyli spinu w ogólnie przyjętym znaczeniu. (Przyp. tłum.).
260
34. MAGNETYZM MATERij
w ogólnym przypadku, spin j jest albo liczbą całkowitą, albo liczbą połówkową (wielo-
krotnością i) w zależności od tego, czy 2j jest liczbą parzystą czy nieparzystą. Weżmy
na przykład takie jądro jak lit, którego spin wynosi j = Wówczas moment pędu
względem osi z, w jednostkach h, może mieć jedną z następujących wartości:
+ł, +i, ~i, -ł-
Jeżeli jądro znajduje się w pustej przestrzeni, bez pól zewnętrznych, to może się ono zna-
leźć w jednym z czterech stanów, z których każdy ma tę samą energię. Jeżeli mamy układ
o spinie dwa, to składowa z-owa momentu pędu ma tylko wartości (w jednostkach K)
2, 1, 0, -1, —2.
Jeżeli policzyć, ile jest stanów dla jakiegoś danego z góry spinu j, to się okaże, że istnieje
(2j+1) możliwości. Innymi słowy, jeżeli podać energię a także i spin j, to się okaże, że
istnieje dokładnie (2j+1) stanów o tej energii, a każdy z tych stanów odpowiada różnym
możliwym wartościom składowej z-owej momentu pędu.
Chcielibyśmy tu zwrócić uwagę na jeszcze jeden fakt. Jeżeli wybrać na chybił trafił
jakiś atom o znanym j i zmierzyć z-ową składową momentu pędu, to wówczas można
dostać każdą z możliwych wartości i każda z tych wartości jest równie prawdopodobna.
Wszystkie te stany są w rzeczywistości stanami pojedynczymi i żaden z nich nie jest gor-
szy od drugiego. Każdy z tych stanów występuje w przyrodzie z taką samą „wagą”. (Za-
kłada się, że nie uczyniono nic, aby ograniczyć się do jakichś szczególnych „próbek”.) Ten
fakt ma, przypadkowo, pewną prostą analogię klasyczną. Jeżeli zadać to samo pytanie
z klasycznego punktu widzenia: jakie jest prawdopodobieństwo dostania pewnej szczegól-
nej wartości składowej z-owej momentu pędu, przy losowaniu z jakiegoś typowego zbioru
układów fizycznych, wszystkich o tym samym momencie pędu? — to odpowiedzią na nie
będzie, że wszystkie te wartości, od największej do najmniejszej, są równie prawdopo-
dobne. (Każdy może to łatwo udowodnić.) Wynik klasyczny odpowiada w mechanice
kwantowej jednakowemu prawdopodobieństwu każdej z (27+1) możliwości.
Z tego, co dotąd już otrzymaliśmy, można wysnuć jeszcze jeden ciekawy i nieco nie-
spodziewany wniosek. W pewnych obliczeniach klasycznych wielkość, która się pojawia
w końcowym wyniku, jest kwadratem momentu pędu J — jest, innymi słowy, równa
J'J. Okazuje się, że często można odgadnąć wzór, poprawny z punktu widzenia mechaniki
kwantowej, korzystając z obliczeń klasycznych i posługując się taką oto prostą regułą:
Aby otrzymać wzór kwantowy, należy zastąpić J2 =J J we wzorze klasycznym przez
7(j+l)S. Reguła ta jest powszechnie stosowana i zwykle daje poprawne wyniki, ale nie
zawsze. Można podać następujące rozumowanie, które pokazuje, dlaczego można regułę
tę darzyć zaufaniem.
Iloczyn skalamy J-J można zapisać jako >
J-3=J2+J2+J2.
Ponieważ wyrażenie to jest skalarem, będzie ono takie samo dla dowolnej orientacji
spinu. Jeżeli wybierzemy na chybił trafił „próbki” jakichś danych z góry układów atomo-
wych i dokonamy pomiarów wielkości J2 lub J2, lub J2, to powinniśmy otrzymać takie
34-7. moment pędu w mechanice kwantowej
261
same wartości średnie dla każdej z tych trzech składowych. (Pomiędzy tymi trzema kie-
runkami — x, y i z — nie ma żadnego specjalnego rozróżnienia.) Dlatego też średnia
z iloczynu J J jest równa potrójnej wartości podniesionej do kwadratu średniej dowol-
nej ze składowych, np. J2Z\
<J-J>śr = 3<J2>.
Ponieważ zaś iloczyn J-J jest taki sam dla wszystkich kierunków, to jego średnia jest
oczywiście równa tej jego stałej wartości; mamy więc
J- J = 3<J2\. (34.24)
Jeżeli teraz z kolei użyjemy tego samego równania w odniesieniu do mechaniki kwan-
towej, to łatwo można znaleźć <$/2>śr. Należy tylko wziąć sumę (2y'+l) możliwych war-
tości J2 i podzielić ją przez całkowitą liczbę tych wartości:
<Ą2)śr = — hz. • (34.25)
Dla układu o spinie | wygląda to tak:
Dochodzimy zatem do wniosku, że
J-J = 3<J2)śr = 3Ś&2 = ł(W)A2.
Pozostawiamy czytelnikowi wykazanie, że równanie (34.25), wraz z równaniem (34.24),_
daje wynik ogólny
J-J=;(;+1)A2. (34.26)
Chociaż z punktu widzenia fizyki klasycznej można by się spodziewać, że największą
możliwą wartością składowej z-owej wektora J jest po prostu jego wartość bezwzględna J,
a mianowicie V J-J, to mechanika kwantowa daje największą wartość składowej J2 nieco
mniejszą, ponieważ jh jest zawsze mniejsze od Vj(j+l)h. Moment pędu nigdy nie jest
..całkowicie skierowany wzdłuż kierunku z”.
- j
34-8. Energia magnetyczna atomów
Chcemy teraz znowu powrócić do momentu magnetycznego. Powiedzieliśmy, że w me-
chanice kwantowej moment magnetyczny ustalonego układu atomowego można wyrazić
przez moment pędu przy pomocy równania (34.6):
(q \
J, - - (34.27)
2/n
' < c - .<r 'r. ,
gdzie — qt i m są ładunkiem i masą elektronu.
1
262
34. MAGNETYZM MATERij
34.5. Możliwe energie magnetyczne układu ato-
mowego o spinie -, umieszczonego w polu magne-
tycznym
34 -6. Dwa możliwe stany energetyczne elektronu
-w polu magnetycznym B
Moment magnetyczny atomu umiesz-
czonego w zewnętrznym polu magne-
tycznym będzie miał pewną dodatkową
energię magnetyczną, która zależy od skła-
dowej tego momentu magnetycznego
wzdłuż kierunku pola. Wiemy, że
Umlli = -P-B. (34.28)
Obierając naszą oś z wzdłuż kierunku
B mamy
(34.29)
Korzystając zaś z równania (34.27) otrzy-
mujemy
\£m /
Z praw mechaniki kwantowej wynika, że
może przyjmować tylko pewne war-
tości: 1)S,..., —jh. Dlatego też
energia magnetyczna jakiegoś układu ato-
mowego nie może być dowolna; może
ona mieć tylko pewne wartości. Jej naj-
większa wartość wynosi na przykład
Wielkość qth]2m nosi zwykle nazwę
„magnetonu Bohra” i oznacza się ją jUB:
2m'
Możliwymi wartościami energii magnetycznej są wartości:
J,
^mag + »
n
gdzie JJh może być tylko równe: j, (J— 1), (J—2).(—j+1), —j.
Innymi słowy, energia magnetyczna układu atomowego zmienia się, jeżeli układ ten
wprowadzić do pola magnetycznego, o wielkość, która jest proporcjonalna do pola i pro-
porcjonalna do Jx. Mówimy, że energia układu atomowego jest przez pole magnetyczne
„rozszczepiona na 2j+l poziomów”. Tak na przykład atom, którego energia „na ze-
wnątrz” pola magnetycznego wynosi Uo i którego spin j = f, będzie miał, po umieszcze-
niu go w polu, cztery możliwe wartości energii. Energie te można przedstawić za pomocą
34-8. ENERGIA MAGNETYCZNA ATOMÓW
263
wykresu poziomów energii — takiego jak na rys. 34.5. Każdy poszczególny atom (z j =
= |) może mieć tylko jedną z tych czterech możliwych energii w jakimś danym polu B.
Oto, co mówi o zachowaniu się układu atomowego w polu magnetycznym mechanika
kwantowa.
Najprostszym układem „atomowym” jest pojedynczy elektron. Elektron ma spin |,
a więc istnieją dla niego dwa możliwe stany: Jz = h/2 i Jz = Dla elektronu w spo-
czynku (brak ruchu orbitalnego) moment magnetyczny pochodzący od spinu ma wartość
g równą 2, tak że energia magnetyczna może być równa ±pBB. Energie, które może mieć
elektron w polu magnetycznym, przedstawiono na rys. 34.6. Krótko mówiąc, elektron
ma spin skierowany albo „w górę” (wzdłuż pola) lub „w dół” (przeciwnie do pola).
Dla układów o większych spinach mamy więcej możliwych stanów. Można sobie
wyobrażać, że spin jest skierowany „w górę” lub „w dół” albo też ustawiony pod pew-
nym „kątem”, w zależności od wartości Jz.
W następnym rozdziale posłużymy się tymi wynikami mechaniki kwantowej do omó-
wienia magnetycznych własności substancji.
35
paramagnetyzm i rezonans magnetyczny
35-1. Skwantowane stany magnetyczne
W poprzednim rozdziale opisaliśmy, jak to w mechanice kwantowej moment pędu
jakiegoś obiektu nie ma dowolnego kierunku, a jego składowa wzdłuż danej osi może
przyjmować tylko pewne wartości dyskretne, pomiędzy którymi różnica jest stała.
Jest to fakt osobliwy i zadziwiający. Można by pomyśleć, że nie powinniśmy się za-
głębiać w te sprawy, dopóki nasze umysły nie staną się bardziej „elastyczne” i gotowe
na przyjęcie tego typu koncepcji. Faktem jednak jest, że nasze umysły nigdy się nie staną
bardziej „elastyczne” — w sensie zdolności do przyjęcia łatwo takiej koncepcji. Nie ma
takiego sposobu opisu, który byłby zarazem subtelny i zaawansowany w swej
własnej formie, a nie byłby w istocie bardziej skomplikowany niż sam przedmiot, który
próbujemy wyjaśnić. Zachowanie się materii w mikroświecie — jak już to wielokrotnie
zaznaczaliśmy — różni się od wszystkiego, do czego jesteśmy przyzwyczajeni i jest rze-
czywiście bardzo dziwne. Chociaż w dalszym ciągu będziemy mieć do czynienia z fizyką
klasyczną, to warto próbować stopniowo się zaznajamiać z prawami fizyki w mikroświe-
cie — traktując to początkowo jako pewien typ doświadczenia, bez jakiegoś głębszego
zrozumienia. Zrozumienie tych spraw przychodzi bardzo powoli — jeżeli w ogóle jest
możliwe. Oczywiście, powoli zaczynamy coraz lepiej poznawać to, co się dzieje w jakiejś
sytuacji kwantowomechanicznej — jeżeli na tym ma polegać zrozumienie — ale wciąż nie
trafia nam całkiem do przekonania to, że prawa mechaniki kwantowej są „naturalne" •
One oczywiście są naturalne, ale nie z punktu widzenia naszego bezpośredniego, codzien-
nego doświadczenia. Powinniśmy wyjaśnić, że nasze podejście do prawa dotyczącego
momentu pędu będzie zupełnie różne od naszej postawy wobec wielu omawianych przez
nas spraw. Nie będziemy próbowali go „wytłumaczyć”, ale musimy przynajmniej po^'^
dzieć, co się tu dzieje; byłoby rzeczą nieuczciwą opisywać własności magnetyczne sub-
35-1. SKWANTOWANE STANY MAGNETYCZNE
265
stancji materialnych nie wspominając o tym, że klasyczny opis magnetyzmu, tzn. mo-
mentu pędu i momentów magnetycznych — nie jest poprawny.
Jednym z najbardziej uderzających i niepokojących wniosków mechaniki kwantowej
jest to, że moment pędu wzdłuż dowolnej osi jest zawsze równy liczbie całkowitej lub
połówkowej, pomnożonej przez h. I nie jest to kwestią wyboru osi. Subtelności za-
warte w tym dziwacznym fakcie—iż można wziąć każdą inną oś i zawsze okaże się, że
składowa momentu pędu dla tej nowej osi może znowu przybierać tylko jedną z tego
samego zbioru wartości—pozostawimy do następnego rozdziału, gdzie czeka nas radość
z zobaczenia, jak ten pozorny paradoks zostaje ostatecznie rozwikłany.
Teraz po prostu pogodzimy się z tym faktem, że dla każdego układu atomowego istnie-
je pewna liczba j, nazywana spinem układu, która musi być liczbą całkowitą lub połów-
kową i że składowa momentu pędu wzdłuż dowolnej osi będzie zawsze miała jedną spo-
śród następujących wartości, leżących pomiędzy +jJl a —jJl:
Jz — jednej spośród wartości
(35.1)
Wspomnieliśmy również, że każdy prosty układ atomowy ma moment magnetyczny,
którego kierunek jest identyczny z kierunkiem jego momentu pędu. Jest to słuszne nie
tylko dla atomów i jąder, lecz także dla cząstek elementarnych. Każda cząstka elementar-
na ma swoją własną, charakterystyczną wartość j i swój moment magnetyczny. (Dla nie-
których cząstek obie te wielkości są równe zeru.) Mówiąc „moment magnetyczny” mamy
przy tym na myśli, że energię jakiegoś układu w polu magnetycznym, mającym na przy-
kład kierunek osi z, można zapisać jako —pzB dla małych pól magnetycznych. Warunek,
że pole nie może być zbyt wielkie, jest tu konieczny — w przeciwnym bowiem wypadku
pole mogłoby zakłócić ruchy wewnętrzne układu i energia nie byłaby już miarą momentu
magnetycznego, który istniał przed włączeniem pola. A jeżeli pole jest dostatecznie słabe,
zmienia ono energię o wielkość
AU =—p,zB, (35.2)
przy czym rozumie się, że /zz w tym równaniu należy zastąpić wielkością
/ q \
^==^\2^)‘/z’ • •' (35J)
gdzie Jz przyjmuje jedną z wartości z równania (35.1).
Przypuśćmy, że mamy dany układ o spinie j = |. Bez pola magnetycznego układ ten
Ma cztery możliwe stany, odpowiadające różnym wartościom składowej momentu pędu
4> z których wszystkie mają dokładnie tę samą energię. Ale w chwili, gdy włączymy pole
Magnetyczne, powstaje dodatkowa energia oddziaływania, która rozdziela te stany na
266
35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
35.1. Układ atomowy o spinie J ma
(2/4-1) możliwych energii w polu ma-
gnetycznym B. Rozszczepienie pozio-
mów energetycznych jest, dla małych
pól, proporcjonalne do pola B
cztery, nieco różniące się między sobą poziomy
energetyczne. Energie tych poziomów są równe
pewnej energii proporcjonalnej do J3, pomnożonej
przez H razy f| — wartości składowej
momentu pędu Jz. Na wykresach (rys. 35.1) poka-
zano rozszczepienie poziomów energetycznych dla
układów atomowych o spinach |, 1 i f. (Na-
leży pamiętać, że dla każdego upórządkowania
elektronów moment magnetyczny ma zawsze zwrot
przeciwny do zwrotu momentu pędu.)
Na wykresach można zauważyć, że „środek
ciężkości” poziomów energetycznych jest taki
sam w obecności pola magnetycznego, jak i bez
niego. Zauważmy także, że odstępy pomiędzy posz-
czególnymi poziomami są zawsze równe dla danej
cząstki znajdującej się w jakimś danym z góry
polu magnetycznym. Taki odstęp energetyczny
będziemy, dla danego pola magnetycznego 5,
zapisywać jako Rwp, przy czym ta postać zapisu
będzie już definicją częstości <ap. Korzystając
z równań (35.2) i (35.3) mamy
a
= g^—HB,
2m
czyli
<»P = g~B. (35.4)
2m
Wielkość g(q/2m) jest po prostu stosunkiem
momentu magnetycznego do momentu pędu —
i stanowi ona własność cząstki. Równanie (35.4)
jest tym samym wzorem, jaki otrzymaliśmy w
rozdz. 34 na prędkość kątową precesji w polu magnetycznym dla giroskopu, którego
moment pędu był równy J, a którego moment magnetyczny wynosił fi.
35-2. Doświadczenie Sterna - Gerlacha
Fakt, że moment pędu jest skwantowany, jest rzeczą tak zdumiewającą, iż warto opo*
wiedzieć trochę o historii tego zjawiska. Jego odkrycie stanowiło niemały wstrząs (choć
było przewidziane teoretycznie). Po raz pierwszy zaobserwowano je w r. 1922, w doświad-
czeniu wykonanym przez Sterna i Gerlacha. Doświadczenie to można by właściwie uwa-
żać za bezpośrednie sprawdzenie hipotezy o skwantowaniu momentu pędu. Stern i G61"'
35-2. DOŚWIADCZENIE STERNA-GERLACHA
267
lach wymyślili takie oto doświadczenie dla pomiaru momentów magnetycznych poje-
dynczych atomów srebra. Wytworzyli wiązkę atomów srebra odparowując srebro w pie-
cu o wysokiej temperaturze oraz wyprowadzając następnie część tych atomów na zewnątrz
przez układ małych otworów. Powstała w ten sposób wiązka była skierowana pomiędzy
nabiegunniki specjalnego magnesu, tak jak to pokazano na rys. 35.2. Koncepcja Sterna
i Gerlacha była następująca: jeżeli atom srebra ma moment magnetyczny /z, to w polu
magnetycznym B będzie on miał energię—gdzie z jest kierunkiem pola magnetyczne-
go. W teorii klasycznej /zz byłoby równe momentowi magnetycznemu razy cosinus kąta
pomiędzy momentem a polem magnetycznym, tak że ta dodatkowa energia w polu by-
łaby równa
AU = — fiB cos0. (35.5)
Oczywiście, momenty magnetyczne atomów wychodzących z pieca układałyby się wzdłuż
wszystkich możliwych kierunków — tak że mielibyśmy wszystkie możliwe wartości kąta
0. Jeżeli teraz pole magnetyczne zmienia się bardzo gwałtownie wzdłuż osi z, czyli jeżeli
jest jakiś duży gradient pola, to energia magnetyczna będzie się również zmieniać z poło-
żeniem i wystąpi siła działająca na momenty magnetyczne, której kierunek zależy od
znaku cos 0. Atomy będą odchylane do góry lub na dół przez siłę proporcjonalną do po-
chodnej energii magnetycznej; na podstawie zasady prac wirtualnych siła ta powinna
być równa
5U 5B
— = (35.6)
oz oz
Stern i Gerlach użyli magnesu, którego jeden nabiegunnik miał postać bardzo ostrej
krawędzi, po to aby wytwarzał bardzo gwałtowną zmianę pola. Wiązka atomów srebra
była skierowana dokładnie wzdłuż tej ostrej krawędzi, tak że atomy doznawały w tym
niejednorodnym polu działania siły „poprzecznej”. Atom srebra, którego moment magne-
tyczny miał kierunek poziomy, nie powinien doznawać działania żadnej siły i przechodzić
na wprost przez magnes. Na atom, którego moment magnetyczny był dokładnie „po-
przeczny”, powinna działać siła, odchylająca go do góry w kierunku ostrej krawędzi
magnesu. Atom o momencie magnetycznym skierowanym w dół miał doznawać odchy-
35.2. Doświadczenie Stema-Gerlacha
268 35. PARAMAGNETYZM I REZONANS MAGNETYCZNĄ
lenia na dół. Tak więc, po opuszczeniu magnesu wiązka atomów powinna zostać rozmyta
w zależności od składowych poprzecznych ich momentów magnetycznych. W teorii kla-
sycznej były dopuszczalne wszystkie kąty, tak że po osadzeniu się atomów na płytce
szklanej należałoby oczekiwać, że srebro się rozmaże wzdłuż jakiejś pionowej kreski
Wysokość tej kreski byłaby proporcjonalna do wielkości momentu magnetycznego. Sro-
motny upadek koncepcji klasycznych został w pełni ujawniony, gdy Stern i Gerlach zo-
baczyli, co się rzeczywiście stało. Znaleźli oni na płytce szklanej dwa odrębne punkty
Atomy srebra uformowały dwie wiązki.
To, że wiązka atomów, których spiny były najwyraźniej w świecie skierowane na chy-
bił trafił, zostaje rozszczepiona na dwie oddzielne wiązki, jest czymś cudownym. Skąd
moment magnetyczny wie, że wolno mu przyjąć tylko pewne składowe względem kie-
runku pola magnetycznego? No cóż, to był dopiero początek odkrycia kwantyzacji mo-
mentu pędu i zamiast próbować podać teoretyczne wyjaśnienie tego faktu powiemy tylko
że jesteśmy zaskoczeni wynikiem tego doświadczenia, tak samo jak fizycy owych czasów,
którzy musieli przyjąć ten wynik, gdy doświadczenie zostało wykonane. To, że energia
atomu w polu magnetycznym przyjmuje szereg wartości dyskretnych, jest faktem doświad-
czalnym. Dla każdej z tych wartości energia jest proporcjonalna do natężenia pola. Tak
więc dla obszaru, gdzie pole się zmienia, zasada prac wirtualnych mówi nam, że na ato-
my może tylko działać siła magnetyczna przyjmująca pewien zbiór wartości dyskretnych;
siła ta jest różna dla każdego stanu, tak że wiązka atomów zostaje rozszczepiona na kilka
oddzielnych wiązek. Mierząc odchylenie tych wiązek można znaleźć wartość momentu
magnetycznego.
’ - ""''j
35-3. Metoda wiązek molekularnych Rabiego . .
Chcielibyśmy opisać teraz ulepszoną aparaturę służącą do pomiaru momentów magne-
tycznych, która została skonstruowana przez I. I. Rabiego i jego współpracowników.
W doświadczeniu Sterna-Gerlacha odchylenie atomów było bardzo małe i pomiar mo-
mentu magnetycznego nie był zbyt dokładny. Metoda Rabiego pozwala mierzyć momen-
ty magnetyczne z fantastyczną precyzją. Metoda ta opiera się na fakcie, że energia począt-
kowa atomów zostaje w polu magnetycznym rozszczepiona na skończoną liczbę pozio-
mów energetycznych. To, że energia atomu w polu magnetycznym może przyjmować
tylko pewne dyskretne wartości, nie jest w rzeczywistości czymś bardziej zaskakującym
od tego, że atomy mają tylko pewne dyskretne poziomy energetyczne — wspominaliśmy
już o tym w tomie I (cz. 2). Dlaczego to samo nie miałoby być słuszne dla atomów w polu
magnetycznym? Otóż jest słuszne, ale próba powiązania tego faktu z pojęciem zoriento-
wanego momentu magnetycznego prowadzi do pojawienia się pewnych dziwnych impli-
kacji mechaniki kwantowej.
Gdy atom ma dwa poziomy, których energie się różnią o A U, może on dokonać przej-
ścia z poziomu wyższego na poziom niższy emitując kwant światła o częstości co, gdzie
koj = AU.
(35.7)
35-3. METODA WIĄZEK MOLEKULARNYCH RAB1EGO
269
To samo może się stać z atomami w polu magnetycznym, tylko że teraz różnice energii
są tak małe, że częstość nie odpowiada światłu tylko mikrofalom lub częstościom radio-
wym. Mogą także wystąpić przejścia z niższego poziomu energetycznego na wyższy po-
ziom energetyczny, którym towarzyszy pochłonięcie światła lub w przypadku atomów
w polu magnetycznym pochłonięcie energii mikrofalowej. A zatem, jeżeli mamy atom
w polu magnetycznym, to możemy powodować przejścia z jednego stanu do drugiego,
stosując dodatkowe pole elektromagnetyczne o odpowiedniej częstości. Innymi słowy,
jeżeli mamy atom w silnym polu magnetycznym i „połaskoczemy” ten atom słabo zmien-
nym polem elektromagnetycznym, to zaistnieje pewne prawdopodobieństwo na wytrą-
cenie atomu na inny poziom energetyczny, jeżeli częstość tego dodatkowego pola będzie
zbliżona do częstości co, określonej równaniem (35.7). Dla atomu w polu magnetycznym
częstość ta jest wprowadzoną poprzednio przez nas częstością a>p, określoną przez pole
magnetyczne równaniem (35.4). Jeżeli „połaskotać” atom złą częstością, to szansa na
spowodowanie przejścia jest bardzo mała. Tak więc w prawdopodobieństwie spowodo-
wania przejścia istnieje ostry rezonans przy cop. Mierząc częstość tego rezonansu w zna-
nym polu magnetycznym B można z dużą precyzją zmierzyć wielkość g(q/2m), a stąd czyn-
nik g.
Ciekawe, że do tych samych wniosków można dojść z punktu widzenia fizyki kla-
sycznej. Zgodnie z obrazem klasycznym, jeżeli się umieści mały giroskop o momencie
magnetycznym /z i o momencie pędu J w zewnętrznym polu magnetycznym, to giroskop
będzie wykonywać precesję wokół osi równoległej do kierunku pola magnetycznego
(patrz rys. 35.3). Przypuśćmy, że spytamy: jak można zmienić kąt, jaki tworzy klasyczny
giroskop z kierunkiem pola — a mianowicie z osią z? Pole magnetyczne wytwarza mo-
ment siły wokół jakiejś osi poziomej. Można by pomyśleć, że taki moment siły próbuje
ustawić magnes wzdłuż kierunku pola, ale powoduje on tylko precesję. Jeżeli się chce
zmienić kąt pomiędzy giroskopem a osią z, to musi się wywrzeć nań moment siły wokół
osi z. Jeżeli przyłożyć moment siły o tym samym kierunku co precesja, to kąt giroskopu
się zmieni, tak aby dać mniejszą składową momentu pędu
J w kierunku osi z. Na rysunku 35.3 kąt pomiędzy wektorem
J a osią z zwiększyłby się. Jeżeli spróbujemy powstrzymać
precesję, wektor J przesunie się w kierunku pionu.
W jaki sposób można przyłożyć potrzebny moment siły
w przypadku naszego atomu wykonującego precesję w jedno-
rodnym polu magnetycznym? Odpowiedź brzmi: przy po-
mocy słabego pola magnetycznego, poprzecznego do pola
pierwotnego. Można by w pierwszej chwili pomyśleć, że
kierunek tego dodatkowego pola powinien się obracać wraz
z precesją momentu magnetycznego, tak aby pole to było
zawsze prostopadłe do momentu magnetycznego, jak to
zaznaczono przy pomocy pola B' na rys. 35.4a. Pole
takie będzie swe zadanie spełniało bardzo dobrze, ale
prawie równie dobrze będzie działało poziome pole zmienne.
Jeżeli mamy słabe poziome pole B', które ma zawsze kieru-
35.3. Precesja klasyczna ato-
mu z momentem magne-
tycznym p. i momentem
pędu J
270
35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
b)
35.4. Kąt precesji momentu
magnetycznego można zmie-
nić przy pomocy poziomego
pola magnetycznego, skiero-
wanego zawsze prostopadle
do p, tak jak na części
a) lub przy pomocy pola
oscylującego, tak jak na
części b) rysunku
nek osi x (dodatni lub ujemny) i którego natężenie oscyluje
z częstością cop, to w każdym półokresie moment siły działa-
jący na moment magnetyczny zmienia zwrot, tak że w wy-
padkowym efekcie takie pole jest prawie równie skuteczne
jak obracające się pole magnetyczne. Z klasycznego punktu
widzenia oczekiwalibyśmy wówczas, że w obecności bardzo
słabo oscylującego pola z częstością równą dokładnie w
zmieniałaby się składowa momentu magnetycznego wzdłuż
kierunku z. Oczywiście, według mechaniki klasycznej
moment /zz zmieniałby się w sposób ciągły, ale w mechanice
kwantowej składowa z-owa momentu magnetycznego nie
może się zmieniać w sposób ciągły. Musi ona wykonywać
nagłe skoki od jednej wartości do drugiej. Dokonaliśmy
tu porównania pomiędzy konsekwencjami wynikającymi z
mechaniki klasycznej i z mechaniki kwantowej, aby poka-
zać, co mogłoby się zdarzyć w mechanice klasycznej i jak
to jest związane z tym, co się rzeczywiście dzieje w mecha-
nice kwantowej. Nawiasem mówiąc, można pokazać, że spo-
dziewana częstość rezonansowa jest taka sama w obu
przypadkach.
Jeszcze jedna, dodatkowa uwaga: z tego, co powiedzie-
liśmy o mechanice kwantowej, nie wynikają żadne oczy-
wiste powody, dla których nie miałoby być przejść przy czę-
stości 2wp. Okazuje się, że coś takiego nie może się zda-
rzyć w przypadku klasycznym oraz że takie przejście nie
zachodzi także w mechanice kwantowej — przynajmniej nie
dla tej szczególnej metody wymuszania przejść, którą opi-
saliśmy. Przy oscylującym, poziomym polu magnetycznym
prawdopodobieństwo tego, że częstość 2<op spowoduje prze-
skok od razu o dwa „stopnie”, jest równe zeru. Przejścia do
poziomów wyższych, jak i niższych mogą występować tylko
przy częstości a>p.
Możemy teraz już przystąpić do opisania metody Rabiego
pomiaru momentów magnetycznych. Będziemy tu rozważać
działanie tej metody tylko dla atomów o spinie |. Sche-
mat aparatury pokazano na rys. 35.5. Składa się ona z pieca atomowego, który dostarcza
strumienia obojętnych atomów; strumień ten przechodzi kolejno pomiędzy biegunami
trzech magnesów. Magnes 1 jest takim samym magnesem, jaki był pokazany na rys. 35.2,
i ma pole o dużym gradiencie — z dodatnią, powiedzmy, składową dBJdz. Atomy mające
jakiś moment magnetyczny będą odchylane w dół, w przypadku gdy J2 = +^/2 lub do
góry, wtedy gdy Jz = — h/2 (ponieważ dla elektronów kierunek p jest przeciwny do kie-
runku J). Jeżeli będziemy rozważać tylko te atomy, które mogą się przedostać przez szcze-
linę Sj, to musimy uwzględnić, że atomy takie mogą przejść po dwóch torach, które
35-3. METODA WIĄZEK MOLEKULARNYCH RABIEGO 271
pokazano na rysunku. Atomy o momencie pędu J2 = +^/2 muszą, aby się przedostać
przez szczelinę, poruszać się wzdłuż krzywej a, a torem atomów o momencie pędu J2 =
= — h/2 musi być krzywa b. Atomy, które wystartują z pieca wzdłuż innych torów, przez
szczelinę w ogóle nie przejdą.
Magnes 2 ma pole jednorodne. W obszarze tym na atomy nie działają żadne siły, tak
że atomy te przechodzą na wprost i wchodzą do magnesu 3. Magnes 3 jest podobny do
magnesu 1, ale o polu odwróconym, tak że dBJdz ma tu znak przeciwny (ujemny). Atomy
o J2 ~ H-S/2 (ze spinem, jak to się mówi, „do góry”), a więc te, które doznały odchylenia
w dół w magnesie 1, doznają teraz w magnesie 3 odchylenia ku górze ', podążają więc one
w dalszym ciągu po torze a i przechodzą przez szczelinę S2 do detektora. Atomy o mo-
mencie pędu J2 — —h/2 („ze spinem w dół”) doznają w magnesach 1 i 3 również działania
sił skierowanych przeciwnie i przechodzą wzdłuż krzywej b, która prowadzi je także po-
przez szczelinę S2 do detektora.
Detektor można wykonać na wiele różnych sposobów, w zależności od rodzaju atomu,
który ma być rejestrowany. Tak na przykład dla atomów jakiegoś metalu alkalicznego,
np. sodu, detektorem może być cienki, gorący drut wolframowy, połączony z czułym
przyrządem mierzącym natężenie prądu. Gdy atomy sodu lądują na drucie, zostają wypa-
rowane w postaci jonów Na+, pozostawiając na drucie elektron. W drucie przepływa
prąd proporcjonalny do liczby atomów sodu, przybywających tam w ciągu jednej sekundy.
Pomiędzy biegunami magnesu 2 znajduje się układ cewek, który wytwarza małe, po-
ziome pole magnetyczne B'. Cewki są zasilane prądem zmiennym o częstości a>, którą
można zmieniać. Pomiędzy biegunami magnesu 2 istnieje zatem silne, stałe pole po-
przeczne B i słabe, oscylujące pole poziome B'.
Przypuśćmy teraz, że częstość co oscylującego pola nastawimy na wartość cop — równą
częstości „precesji” atomów w polu B. Pod wpływem zmiennego pola niektóre z przelatu-
jących atomów dokonają przejść — zmieniając wartość swej składowej J2 na inną. Atom,
który miał początkowo spin „do góry” (Z, = -j-ft/2), może zostać przewrócony „na dół”
(J2 = — h/2). Zwrot momentu magnetycznego takiego atomu zostaje odwrócony, w re-
zultacie atom ten dozna w magnesie 3 siły działającej ku dołowi i będzie się poruszał po
torze a, pokazanym na rys. 35.5. Nie przejdzie on więc już przez szczelinę S2 do detek-
35.5. Aparatura używana w metodzie wiązek molekularnych Rabiego
272
35 PARAMAGNETYZM I REZONANS MAGNETYCZNY
35.6. Prąd atomóww wiązce makyc^ady w
tora. Podobnie niektóre z atomów
które początkowo miały spin na dół
(Jz = -h/2) doznają przy przejściu
przez magnes 2 przekręcenia spinów
do góry (Jz = +h/2). Będą się one
wówczas poruszać po torze b' i też nie
przedostaną się do detektora.
Jeżeli oscylujące pole B' ma częstość
v znacznie różniącą się od a>p, nie spo-
woduje ono żadnego przewrócenia spi-
nów i atomy będą się poruszały wzdłuż
swoich „niezaburzonych” torów do de-
tektora. Widać zatem, że częstość pre-
cesji cop atomów w polu magnetycznym B
można znaleźć zmieniając częstość co pola B' aż do momentu, kiedy się zaobserwuje spadek
prądu atomów dopływających do detektora. Spadek prądu nastąpi wtedy, gdy częstość bę-
dzie ,,w rezonansie” z cop. Wykres prądu detektora w funkcji częstości w wygląda tak, jak
to pokazano na rys. 35.6. Znając a>p można określić wartość współczynnika g dla danego
atomu.
Takie doświadczenia z wiązkami atomowymi lub, jak się je często nazywa, z wiązkami
„molekularnymi”, są piękną i precyzyjną metodą pomiaru własności magnetycznych obiek-
tów atomowych. Częstość rezonansu cop można określić z wielką precyzją, w rzeczywistości
z precyzją większą, niż potrafimy zmierzyć pole magnetyczne B, które musimy znać,
aby znaleźć współczynnik g. •
35-4. Paramagnetyzm elementu objętości substancji*)
Chcielibyśmy teraz opisać zjawisko paramagnetyzmu w elemencie objętości substan-
cji**’. Przypuśćmy, że mamy substancję, której atomy mają trwałe momenty magnetyczne,
jak np. kryształ siarczanu miedzi. W krysztale tym znajdują się jony miedzi, których we-
wnętrzne powłoki elektronowe mają pewien wypadkowy moment pędu i pewien wypad-
kowy moment magnetyczny. Jon miedzi jest zatem obiektem, który ma pewien trwały
moment magnetyczny. W związku z tym wypada powiedzieć, które atomy mają momenty
magnetyczne, a które nie. Każdy atom, np. atom sodu, mający nieparzystą liczbę elektro-
nów, będzie miał jakiś moment magnetyczny. Atom sodu na swej niewypełnionej powłoce
ma jeden elektron. Elektron ten wnosi do atomu swój spin i moment magnetyczny. Zwykle
jednak w procesie łączenia się atomów w drobinę te dodatkowe elektrony z powłoki
zewnętrznej zostają związane z innymi elektronami, których spiny mają akurat kierunki
*’ Porównaj: Tom II, cz. 1, rozdz. 11 (Wewnątrz dielektryków).
**’ W oryginale — paramagnetism of bulk materials. Chodzi tu o skończenie wielki element objętości
substancji — o opisanie zjawiska paramagnetyzmu w sensie bardziej „makroskopowym”. (Przyp. tłum-)-
35-4. PARAMAGNETYZM ELEMENTU OBJĘTOŚCI SUBSTANCJI
273
przeciwne, tak że wszystkie momenty pędu i momenty magnetyczne elektronów się zwykle
znoszą. Dlatego właśnie w ogólnym przypadku drobiny nie mają momentu magnetycz-
nego. Oczywiście, jeżeli mamy gaz złożony z atomów sodu, to taka redukcja nie wystę-
puje*’. Również, jeżeli mamy obiekt z nieparzystą liczbą elektronów walencyjnych —
to, co w chemii nazywa się „wolnym rodnikiem” — to wiązania nie są zupełnie wysycone
i jest tam pewien wypadkowy moment pędu.
U większości substancji moment magnetyczny występuje w elemencie objętości tylko
w tym przypadku, jeżeli są tam obecne atomy, których wewnętrzna powłoka elektronowa
nie jest zapełniona. Wówczas może istnieć wypadkowy moment pędu i moment magne-
tyczny. Atomy takie spotyka się w „pierwiastkach przejściowych” układu okresowego —
będą to na przykład takie pierwiastki jak chrom, mangan, żelazo, nikiel, kobalt, pallad
i platyna. Także wszystkie pierwiastki ziem rzadkich mają niezapełnione powłoki wewnę-
trzne i mają trwałe momenty magnetyczne. Jest jeszcze sporo innych dziwnych tworów,
które — jak się okazuje — także mają momenty magnetyczne, tak jak np. ciekły tlen,
ale wyjaśnienie tej sprawy pozostawimy chemikom.
Przypuśćmy teraz, że mamy zbiornik pełen atomów lub drobin z trwałymi momentami
magnetycznymi — niech to będzie gaz, ciecz lub kryształ. Chcielibyśmy wiedzieć, co się
stanie, jeżeli przyłożymy zewnętrzne pole magnetyczne. Bez pola magnetycznego atomy
poruszają się bezładnie w wyniku ruchów cieplnych, a ich momenty magnetyczne układają
się wzdłuż wszystkich możliwych kierunków. Ale jeżeli jest pole magnetyczne, to wystę-
puje tendencja uporządkowania się tych małych magnesów wzdłuż jednej linii. Mamy
wówczas więcej momentów, które się układają wzdłuż linii sił pola niż momentów, których
kierunki są jakieś inne. Substancja jest „namagnesowana”.
Namagnesowanie materiału, M, definiujemy jako wypadkowy moment magnetyczny
na jednostkę objętości, przez co rozumiemy sumę wektorową wszystkich atomowych
momentów magnetycznych w jednostce objętości. Jeżeli w jednostce objętości mamy N
atomów i jeżeli ich średni moment jest równy <p.śr), to namagnesowanie M można zapisać
jako N razy średni moment atomowy:
M = W>śr. (35.8)
Definicja namagnesowania M odpowiada definicji polaryzacji elektrycznej P z rozdz. 10
(t. II, cz. 1).
Klasyczna teoria paramagnetyzmu jest bardzo podobna do teorii stałej dielektrycznej,
którą zamieściliśmy w rozdz. 11 (t. II, cz. 1). Zakłada się, że każdy z atomów ma pewien
moment magnetyczny p, który ma zawsze tę samą wartość bezwzględną, ale może mieć
dowolny kierunek. W polu B energia magnetyczna jest równa —p.- B = — pB cos 0, gdzie 0
jest kątem pomiędzy momentem a polem magnetycznym. Zgodnie z mechaniką statystycz-
ną prawdopodobieństwo względne wystąpienia jakiegoś kąta jest równe e' eners|a/*r, tak
że kąty bliskie zera są bardziej prawdopodobne od kątów bliskich %. Postępując dokładnie
tak samo jak w § 11-3 (t. II. cz. 1) znajdujemy, że dla stałych pól magnetycznych na-
*> Zwykle sód w fazie gazowej jest jednoatomowy, chociaż występuje w niej trochę drobin Na2.
18 — Wykłady z fizyki
274
35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
magnesowanie M jest skierowane równolegle do B, a jego wartość bezwzględna wynosi
M =
Ną2B
3kT
(35.9)
[patrz równanie (11.20)]. Ten przybliżony wzór jest poprawny tylko dla ąBjkT dużo mniej-
szego od jedności.
Okazuje się, że wywołane przez indukcję namagnesowanie, czyli moment magnetyczny
na jednostkę objętości, jest proporcjonalne do pola magnetycznego. Jest to zjawisko
paramagnetyzmu. Można zobaczyć, że zjawisko to jest silniejsze w niższych tempera-
turach, a słabsze w temperaturach wyższych. Jeżeli substancję umieścimy w polu magne-
tycznym, to powstaje w niej moment magnetyczny proporcjonalny, dla małych pól, do
natężenia pola. Stosunek M do B (dla małych pól) nazywamy podatnością magnetyczną.
Chcemy teraz rozpatrzyć paramagnetyzm z punktu widzenia mechaniki kwantowej.
Na początek weźmy przypadek atomu o spinie j. Pod nieobecność pola magnetycznego
atomy mają pewną energię, ale w polu magnetycznym są możliwe dwie energie — po
jednej dla każdej wartości składowej momentu pędu J2. Dla J2 = +H/2 pole magnetyczne
zmienia energię o wartość
AU,
B.
(35.10)
(Przesunięcie energetyczne J U jest dla atomu dodatnie, ponieważ ładunek elektronu jest
ujemny.) Dla Jz = — K/2 zmiana energii wynosi
AU2 = -g
• B.
(35.11)
Aby zaosaoctdzić sobie trochę pisania, przyjmijmy
wówczas
AU=^0B.
(35.12)
(35.13)
Znaczeme ft0 jest jasne: — p0 jest składową z-ową momentu magnetycznego w przypadku
spinu skierowanego „do góry”, a jest składową z-ową momentu magnetycznego
w przypadku spinu „na dół”.
Mechanika statystyczna mówi nam teraz, iż prawdopodobieństwo tego, że atom się
znajduje w danym stanie, jest proporcjonalne do
g—(energia stanu)/fcr
Pod nieobecność pola magnetycznego obydwa stany mają tę samą energię, tak że po usta-
leniu się równowagi w polu magnetycznym prawdopodobieństwa są proporcjonalne do
e-dt//*r
(35.14)
35-4. PARAMAGNETYZM ELEMENTU OBJĘTOŚCI SUBSTANCJI
275
Liczba atomów na jednostkę objętości o spinie skierowanym do góry wynosi
Ntin = a exp(-fi0B/kT), (35.15)
a liczba atomów ze spinem na dół
Ni6t = a exp(+p0B/kT). (35.16)
Stałą a należy określić tak, aby
(35.17)
jadzie N jest całkowitą liczbą atomów w jednostce objętości. Otrzymujemy więc
N
a = ------------------------------. (35.18)
exp(+Ja0^/fc73+exP(—PoBjkT)
l Konkretnie interesuje nas średni moment magnetyczny wzdłuż osi z. Atomy o spinie
Ikierowanym do góry będą miały moment magnetyczny —ji®,- a atomy o spinie na dół
Łędą miały moment magnetyczny +/4q, tak że średni moment wyniesie
, . ^góra(_A‘o)+^Vdół(+Mo) -
</4 =-------------------------• (35.19)
Moment magnetyczny na jednostkę objętości M jest równy Korzystając z rów-
nań (35.15), (35.16) i (35.17) otrzymujemy
., _ Kr exp(+fi0B/kT)-exp(-fi0B[kT)
exp(+fi0B/kT)+exp(—fi0B/kT) *
Jest to kwantowomechaniczny wzór na namagnesowanie M dla atomów o spinie j — Wzór
ten można też zapisać nieco zwięźlej, wprowadzając funkcję tangens hiperboliczny:
i J/ = WMotgh^-. (35.21)
ki
Wykres namagnesowaniaAf jako funkcji pola
B podano na rys. 35.7. Gdy B staje się bardzo
duże, tangens hiperboliczny zbliża się do
jedności, a M zbliża się do wartości granicz-
nej Dla silnych pól następuje zatem
^ysycenie namagnesowania. Można zobaczyć,
dlaczego tak jest; dla dostatecznie silnych pól
wszystkie momenty zostają ułożone wzdłuż
Jednego kierunku. Innymi słowy, wszystkie
atomy znajdują się w stanie ze spinem do dołu
1 każdy z nich daje do średniego momentu
Magnetycznego przyczynek równy +/i0.
35.7. Zależność namagneaowanla panunaina-
tycznego od natężania pdła magMtyatM|O B
276
> 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
W większości przypadków normalnych — powiedzmy dla typowych wartości momen-
tów, temperatury pokojowej i pól, jakie normalnie można otrzymać (rzędu 10000 Gs) —
stosunek wynosi około 0,02. Aby osiągnąć nasycenie, musi się przejść do bardzo
niskich temperatur. Dla normalnych temperatur można zwykle zastąpić tghx przez x
i napisać
Nu2B
M —
kT
(35.22)
Tak samo jak w teorii klasycznej, M jest proporcjonalne do B. W istocie, wzór jest
taki sam, wygląda tylko na to, że brakuje w nim czynnika |. Ale należy jeszcze związać
z naszego wzoru kwantowomechanicznego z p, które się pojawia w wyniku klasycznym
[równanie (35.9)].
We wzorze klasycznym występuje p.2 = p.-p., kwadrat wektora momentu magnetycz-
nego, czyli
(35.23)
W poprzednim rozdziale zwróciliśmy uwagę, że można z dużym prawdopodobieństwem
uzyskać poprawne odpowiedzi z obliczeń klasycznych, zastępując JJ przez j(;+l)S2.
W naszym szczególnym przykładzie j = |, tak że
j(j+W2=tfi2.
Podstawiając to za J-J do równania (35.23) otrzymujemy
lub Wjtażając to poprzez po, zdefiniowane równaniem (35.12),
(*-(* = 3jug.
Podstawienie powyższego wyniku za (u2 we wzorze klasycznym doprowadza nas rzeczy-
wiście do poprawnego wzoru kwantowego [równanie (35.22)].
Teorię kwantową paramagnetyzmu można łatwo rozszerzyć na przypadek atomów
o dowolnym spinie j. Namagnesowanie dla małego pola wynosi
M = Ng----------,
3 kT
gdzie
qK
Z<b = TT”
2m
(35.24)
(35.25)
jest kombinacją stałych, mającą wymiar momentu magnetycznego. Większość atomów
ma momenty tej mniej więcej wielkości. Wielkość fiB nazywamy magnetonem Bohra. Mo-
ment magnetyczny związany ze spinem elektronu jest równy, prawie dokładnie, jednemu
magnetonowi Bohra.
35-5 OZIĘBIENIE PRZEZ ROZMAGNESOWANIE ADIABATYCZNE
277
35-5. Oziębienie przez rozmagnesowanie adiabatyczne " • 1
Paramagnetyzm ma jedno szczególne, bardzo interesujące zastosowanie. W bardzo
niskich temperaturach w silnym polu udaje się uporządkować atomowe momenty magne-
tyczne. Dlatego też można osiągnąć nadzwyczaj niskie temperatury za pomocą procesu
nazywanego rozmagnesowaniem adiabatycznym. Można wziąć jakąś sól paramagnetyczną
(np. taką, która zawiera pewną liczbę atomów ziem rzadkich, powiedzmy azotan amono-
wo-prazeodymowy) i zacząć od oziębienia jej przy pomocy ciekłego helu do 1-2 °K,
w silnym polu magnetycznym. Czynnik iiBIkT jest wówczas większy od 1 i raczej wynosi
około 2 lub 3. Większość spinów jest uporządkowana i namagnesowanie jest prawie na-
sycone. Aby ułatwić sobie sprawę, załóżmy, że pole jest potężne, a temperatura jest bardzo
niska, tak że prawie wszystkie atomy są uporządkowane. Następnie izolujemy cieplnie sól
(np. usuwamy ciekły hel i zostawiamy sól w dobrej próżni) i wyłączamy pole magnetyczne.
Sól oziębi się wówczas jeszcze bardziej.
I Otóż, gdybyśmy nagle wyłączyli pole, drgania i wstrząsy atomów w sieci krystalicznej
(wytrąciłyby stopniowo wszystkie spiny z uporządkowania. Niektóre z tych spinów byłyby
skierowane do góry, a niektóre w dół. Ale jeżeli nie ma pola (i jeżeli pominąć wzajemne
oddziaływania pomiędzy atomowymi momentami magnetycznymi, co prowadzi do po-
pełnienia niewielkiego tylko błędu), takiemu obróceniu atomowych momentów magne-
tycznych nie towarzyszy pobieranie żadnej energii. Atomy będą więc mogły rozrzucić
na chybił trafił swe spiny i nie spowoduje to zmiany energii, a więc i zmiany temperatury.
Przypuśćmy jednak, że wtedy gdy atomowe momenty magnetyczne są przekręcane
przez ruch cieplny, jest jeszcze ciągle trochę pola magnetycznego. Wówczas przekręcenie
tych momentów względem pola wymaga pewnej pracy —. muszą one wykonać pewną
pracę przeciwko polu. Powoduje to odebranie pewnej energii ruchom cieplnym, co obniża
temperaturę. Jeżeli więc usunąć nie za gwałtownie silne pole magnetyczne, to tempera-
tura soli się obniży — sól zostaje oziębiona przez rozmagnesowanie. Z punktu widzenia
mechaniki kwantowej atomy, gdy pole jest silne, są wszystkie w stanie energetycznie naj-
niższym, ponieważ szanse na znalezienie się w jakimś wyższym stanie są wyjątkowo małe.
Ale przy zmaleniu pola staje się coraz bardziej prawdopodobne, że fluktuacje cieplne wy-
trącą jakiś atom do stanu wyższego. Jeżeli coś takiego się stanie, to atom pochłonie ener-
gię AU = p0B. Jeżeli zatem wyłączać pole powoli, przejścia magnetyczne mogą ode-
brać energię drganiom cieplnym kryształu i w rezultacie go oziębić. W ten sposób można
przejść od temperatury kilku stopni Kelvina do temperatury zaledwie kilku tysięcznych
stopnia.
Gdyby ktoś chciał uzyskać jeszcze niższą temperaturę, to okazuje się, że natura zna-
lazła i na to sposób. Wspomnieliśmy już, że jądra atomowe mają także momenty magne-
tyczne. Nasze wzory dla paramagnetyzmu będą się równie dobrze stosować dla jąder,
z tym, że momenty jąder są z grubsza tysiąc razy mniejsze (ich wartość bezwzględna jest
rzędu qh,]2mp, gdzie mp jest masą protonu, tak że momenty jądrowe są mniejsze od mo-
mentów atomowych w takim stosunku, w Jakim się mają do siebie masy elektronu.
> protonu.) Dla takich momentów magnetycznych nawet w temperaturze 2°K czyn-
278
35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
nik fiB/kTiest rzędu jednej tysięcznej. Ale jeżeli skorzysta się z procesu rozmagnesowania
paramagnetycznego i osiągnie się temperaturę kilku tysięcznych stopnia, to p.BjkT stanie
się liczbą bliską 1, czyli przy tych niskich temperaturach można zacząć nasycać magne-
tyczne momenty jądrowe. Daje to możliwość zastosowania adiabatycznego rozmagneso-
wania magnetyzmu jądrowego do osiągnięcia temperatur jeszcze niższych. Tak więc ozię.
bianie magnetyczne można przeprowadzić w dwóch etapach. Najpierw się korzysta z roz-
magnesowania adiabatycznego jonów paramagnetycznych, aby osiągnąć temperaturę
kilku tysięcznych stopnia. Następnie takiej zimnej soli paramagnetycznej można użyć do
oziębienia jakiejś substancji, która ma silny magnetyzm jądrowy. Na koniec, gdy się
usunie od tej substancji pole magnetyczne, to jej temperatura opadnie do milionowych
części stopnia powyżej zera bezwzględnego — pod warunkiem, że wszystko było przepro-
wadzone bardzo dokładnie.
35-6. Magnetyczny rezonans jądrowy
Powiedzieliśmy, że paramagnetyzm atomowy jest bardzo niewielki, a magnetyzm
jądrowy jest jeszcze tysiąc razy mniejszy. Mimo to magnetyzm jądrowy można zaobser-
wować stosunkowo łatwo dzięki zjawisku „magnetycznego rezonansu jądrowego”. Przy-
puśćmy, że weźmiemy substancję taką jak woda, w której wszystkie spiny elektronów
dokładnie się równoważą, tak że ich wypadkowy moment magnetyczny jest równy zeru.
Drobiny wody będą jednak wciąż jeszcze miały bardzo, bardzo maleńki moment magne-
tyczny, pochodzący od jądrowego momentu magnetycznego jąder wodoru. Przypuśćmy,
że małą próbkę wody wstawimy do pola magnetycznego B. Ponieważ protony (wodór)
mają spin |, będą miały dwa możliwe stany energetyczne. Jeżeli woda jest w równowadze
cieplnej, to troszkę więcej protonów będzie w niższych stanach energetycznych — z mo-
mentami skierowanymi równolegle do pola. W jednostce objętości wystąpi więc pewien
mały wypadkowy moment magnetyczny. Ponieważ moment magnetyczny protonu jest
w przybliżeniu równy zaledwie jednej tysięcznej momentu atomowego, to namagnesowanie,
które się zmienia jak p2 [równanie (35.22)] jest z grubsza milion razy słabsze od typowego
paramagnetyzmu atomowego. (Dlatego właśnie musieliśmy wybrać substancję pozbawioną
magnetyzmu atomowego.) Można obliczyć, że na 108 protonów różnica pomiędzy liczbą
protonów ze spinem skierowanym do góry, a liczbą protonów ze spinem na dół wyniesie
tylko 1! Zjawisko to jest więc rzeczywiście bardzo słabe, ale mimo to można je zaobser-
wować w następujący sposób.
Przypuśćmy, że naszą próbkę wody otoczymy małą cewką, która wytwarza niewielkie
oscylujące poziome pole magnetyczne. Jeżeli pole to oscyluje z częstością a>p, to wywoła
ono przejścia pomiędzy dwoma stanami energetycznymi — tak jak to opisaliśmy przy do-
świadczeniu Rabiego w § 35-3. Gdy proton przeskakuje z wyższego stanu energetycznego
do stanu niższego, oddaje energię fitB, która — jak widzieliśmy — jest równa h!<op. Jeśli
proton przechodzi od niższego stanu energetycznego do stanu wyższego, to pochłania on
z cewki energię hwp. Ponieważ jest troszkę więcej protonów w stanie niższym niż wyższym,
to w efekcie nastąpi pewna absorpcja energii z cewki. Chociaż zjawisko to jest bardzo
35-6. MAGNETYCZNY REZONANS JĄDROWY
279
słabe, tę nieznaczną absorpcję energii można dostrzec za pomocą czułego wzmacniacza
elektronicznego.
Tak samo jak w doświadczeniu Rabiego z wiązkami molekularnymi, tę absorpcję
energii będzie można dostrzec tylko wtedy, gdy pole oscylujące będzie w rezonansie,
tzn. gdy
' 4 l r ( f A.', i i
Często wygodniej jest szukać rezonansu zmieniając poi# Ą przy ustaIOM|czC#U>Ści a>
Absorpcja energii pojawi się oczywiście wtedy, gdy > '
2m_
B ==---
Typową aparaturę pomiarową dla magnetycznego rezonansu jądrowego pokazano
na rys. 35.8. Oscylator wielkich częstości zasila małą cewkę, umieszczoną pomiędzy bie-
gunami dużego elektromagnesu. Wokół jego nabiegunników znajdują się dwie pomocnicze
cewki zasilane prądem o częstości 60 Hz, tak że pole magnetyczne „waha się” odrobinę
wokół swej wartości średniej. Tak na przykład prąd główny magnesu może mieć takie
natężenie, że daje pole 5000 Gs, a pomocnicze cewki powodują wahania wokół wartości
o ±1 Gs. Jeżeli nastawi się oscylator na częstość 21,2 MHz, to rezonans protonowy na-
stąpi za każdym razem, gdy pole będzie przechodzić przez wartość 5000 Gs [z równa-
nia (34.13)] z g — 5,58 dla protonu.
Obwód oscylatora jest tak skonstruowany, aby dawał pewien dodatkowy sygnał wyj-
ściowy, proporcjonalny do każdej zmiany
doprowadza się do wzmacniacza odchy-
lenia pionowego oscyloskopu. Napięcie
odchylenia poziomego jest wyzwalane raz
ha każdy okres pola modulującego. (Naj-
częściej stosuje się napięcie odchylające
o amplitudzie proporcjonalnej do natęże-
nia pola modulującego.)
Przed umieszczeniem próbki wody
wewnątrz cewki wielkiej częstości wartość
mocy pobieranej z oscylatora jest cały czas
taka sama (nie zmienia się z polem mag-
netycznym). Jeżeli jednak umieści się
w cewce małą probówkę z wodą, na
oscyloskopie pojawia się sygnał, tak jak
to pokazano na rysunku. Widzimy obraz
mocy pochłanianej podczas przekręcenia
się spinów protonów.
W praktyce jest zwykle trudno ustawić
główny magnes na dokładnie 5000 Gs. Prze-
mocy pochłanianej z oscylatora. Sygnał ten
35.8. Aparatura jądrowego rezonansu magnetycznego
280
35. PARAMAGNETYZM I REZONANS MAGNETYCZNY
ważnie tak długo się zmienia prąd główny, aż na oscyloskopie pojawi się sygnał rezonansu
Okazuje.się, że w tej chwili jest to najdogodniejszy sposób na dokładne mierzenie natęże-
nia pola magnetycznego. Oczywiście, ktoś kiedyś musiał zmierzyć dokładnie pole magne-
tyczne i częstość, aby określić czynnik g protonu. Ale teraz, gdy zostało to już zrobione
aparatura rezonansu protonowego, taka jak ta na rysunku, może być używana jako „re-
zonansowy magnetometr protonowy”.
Należałoby wspomnieć jeszcze o kształcie sygnału. Gdybyśmy modulowali pole magne-
tyczne bardzo powoli, to powinnibyśmy się spodziewać, że ujrzymy zwykłą krzywą rezo-
nansu. Absorpcja energii osiągałaby maksimum wtedy, gdy częstość oscylatora dochodzi-
łaby dokładnie do <op. Dla pobliskich częstości także zajdzie pewna absorpcja (energii),
ponieważ nie wszystkie protony są w dokładnie takim samym polu — a różne pola ozna-
czają trochę różne częstości rezonansowe.
Można by się przy okazji zastanowić, czy przy częstości rezonansu powinno się w ogóle
zaobserwować jakiś sygnał. Czy nie powinno się raczej oczekiwać, że pole wielkiej częstości
wyrówna liczby obsadzeń obu stanów tak, że nie będzie żadnego sygnału — z wyjątkiem
momentu, w którym woda byłaby wstawiana do cewki? Niezupełnie, chociaż bowiem
próbujemy wyrównać obie liczby obsadzeń, ruchy cieplne ze swojej strony próbują utrzy-
mać właściwy stosunek tych liczb dla danej temperatury T. Jeżeli się znajdziemy w rezo-
nansie, to moc, która jest pochłaniana przez jądra, jest właśnie tym, co jest tracone na rzecz
ruchów cieplnych. Istnieje jednak stosunkowo mały „kontakt cieplny” pomiędzy mo-
mentami magnetycznymi protonów a ruchami atomów. Protony są stosunkowo dobrze
izolowane przez otaczające je chmury elektronowe. W czystej zatem wodzie sygnał rezo-
nansu jest w rzeczywistości zwykle za mały, aby go można było zaobserwować. Aby
zwiększyć absorpcję, trzeba koniecznie zwiększyć „kontakt cieplny”. Zwykle się to robi
przez dodanie do wody trochę tlenku żelaza. Atomy żelaza są jak gdyby małymi magne-
sikami; drgając w swoim tańcu cieplnym wytwarzają one maleńkie drgające pola magne-
tyczne, działające na protony. Te zmienne pola „sprzęgają” momenty magnetyczne pro-
tonów z drganiami atomów i dążą do ustalenia równowagi cieplnej. Właśnie dzięki temu
„sprzężeniu” protony w wyższych stanach energetycznych mogą tracić swoją energię,
tak że są one znowu zdolne do pochłaniania energii z oscylatora.
W praktyce sygnał wyjściowy aparatury rezonansu jądrowego nie przypomina zwy-
kłej krzywej rezonansu. Zwykle jest to jakiś bardziej skomplikowany sygnał z oscylacjami,
podobny do sygnału, jaki widzimy na rys. 35.8. Powodem takich kształtów sygnałów
są zmienne pola. Wyjaśnienie to powinno zostać podane na gruncie mechaniki kwanto-
wej, ale można pokazać, że w takich doświadczeniach pojęcia klasyczne momentów magne-
tycznych wykonujących precesję dają zawsze poprawną odpowiedź. Rozumując na grun-
cie fizyki klasycznej powiedzielibyśmy, że „osiągając rezonans zaczynamy równocześnie
sterować całą masą wykonujących precesję momentów”, co powoduje, że zaczynają one
wykonywać precesję wspólnie. Takie jądrowe momenty magnetyczne, wspólnie się obra-
cające, spowodują powstanie przy częstości a>p siły elektromotorycznej w cewce oscylatora.
Ale ponieważ pole magnetyczne rośnie w czasie, to częstość precesji także rośnie i wywo-
łane przez indukcję napięcie ma wkrótce częstość nieco większą od częstości oscylatora.
Jednocześnie gdy indukowana SEM jest na przemian to zgodna, to przeciwna w fazie
35-6 MAGNETYCZNY REZONANS JĄDROWY
281
z oscylatorem, „absorbowana” moc jest na przemian to dodatnia, to ujemna. W oscylo-
skopie zobaczymy zatem dudnienie — pomiędzy częstością protonów, a częstością oscyla-
tora. Ponieważ nie wszystkie częstości protonów są identyczne (różne protony znajdują
się w różniących się trochę polach), a także ze względu na możliwe zakłócenia, pochodzące
od obecności tlenku żelaza, momenty wykonujące swobodną precesję wkrótce przestają
być zgodne w fazie i sygnał dudnień znika.
Te zjawiska rezonansu magnetycznego zostały na wiele sposobów wykorzystane jako
narzędzia w odkrywaniu nowych własności materii — szczególnie w chemii i w fizyce
jądrowej. Nie potrzeba chyba mówić, że wartości liczbowe momentów magnetycznych
jąder mówią nam coś niecoś o ich strukturze. W chemii można wyciągnąć wiele wnio-
sków ze struktury (czyli kształtu) rezonansu; ze względu na pola magnetyczne wytworzone
przez pobliskie jądra dokładne położenie rezonansu jest nieco przesunięte, w zależności
od otoczenia, w jakim się znajduje jakieś konkretne jądro. Pomiar tych przesunięć pomaga
określić, jakie jądra znajdują się blisko siebie, i pomaga wyjaśnić szczegóły struktury
drobin. Równie ważny jest rezonans spinu elektronów wolnych rodników. Chociaż takie
rodniki nigdy nie występują w znacznej mierze w równowadze, to są one często pośrednimi
stanami reakcji chemicznych. Pomiar rezonansu spinu elektronów stanowi precyzyjny
sprawdzian obecności wolnych rodników i stanowi często wskazówkę do zrozumienia
mechanizmu pewnych reakcji chemicznych.
ferromagnetyzm
*, 3 t
36-1. Prądy namagnesowania*1
W rozdziale tym omówimy pewne substancje, w których wypadkowy efekt pochodzący
od obecnych tam momentów magnetycznych jest dużo większy niż w przypadku parama-
gnetyzmu czy diamagnetyzmu. Zjawisko to nazywamy ferromagnetyzmem. W substancjach
paramagnetycznych i diamagnetycznych wywołane przez indukcję momenty magnetyczne
są zwykle tak słabe, że nie musimy się martwić o dodatkowe pola, wytworzone przez
nie. Natomiast dla substancji ferromagnetycznych momenty magnetyczne indukowane
przez przyłożone pola są wręcz olbrzymie i wywierają duży wpływ na te pola zewnętrzne.
Istotnie, indukowane momenty są tak silne, że często one właśnie decydują o formowaniu
się obserwowanych pól. Jedną więc z rzeczy, o którą będziemy się musieli zatroszczyć,
jest teoria matematyczna indukowanych, dużych momentów magnetycznych. Oczywi-
ście, jest to tylko problem formalny — problemem rzeczywistym jest problem następujący:
dlaczego te momenty magnetyczne są tak silne — jak to się wszystko dzieje? Do odpo-
wiedzi na to pytanie dojdziemy za chwilę.
Znajdowanie pól magnetycznych substancji ferromagnetycznych przypomina trochę
znajdowanie pola elektrostatycznego w obecności dielektryków. Pamiętamy, że począ-
tkowo opisywaliśmy właściwości wewnętrzne dielektryka przy pomocy pola wektoro-
wego P, momentu dipolowego na jednostkę objętości. Potem przekonaliśmy się, że skutki
tej polaryzacji są równoważne gęstości ładunku p^, określonej przez dywergencję wektora
polaryzacji P:
ppol — — V-P. (36.D
Całkowity ładunek można w każdej sytuacji zapisać jako sumę tego ładunku polaryza-
*J Porównaj: Tom II, cz. 1, rozdz. 10 (.Dielektryki).
36-1. PRĄDY NAMAGNESOWANIA
283
cyjnego i pozostałych ładunków, których gęstość oznaczymy*’ symbolem Wówczas
równanie Maxwella, które wiąże dywergencję pola E z gęstością ładunku, przybiera postać:
__ Cpol~"t~Cmne
। £0 £0
lub VE = — P- +—.
Co £0
Można teraz oddzielić część polaryzacyjną ładunku i przenieść ją na drugą stronę równa-
nia, tak aby otrzymać nowe prawo
V-(£oE+P) = oinne. (36.2)
To nowe prawo mówi, że dywergencja z wielkości (e0E+P) jest równa gęstości innych
ładunków.
Połączenie z sobą pól E i P, tak jak uczyniliśmy to w równaniu (36.2), jest oczywiście
tylko wtedy pożyteczne, jeżeli znamy pomiędzy nimi jakiś związek. Widzieliśmy, że teo-
ria, która wiązała indukowany elektryczny moment dipolowy z polem elektrycznym
była historią stosunkowo skomplikowaną i można ją było stosować tylko w pewnych pro-
stych sytuacjach, a nawet i wtedy jako przybliżenie. Chcielibyśmy przypomnieć jedno
z tych upraszczających pojęć, jakim się posługiwaliśmy. Aby znaleźć indukowany moment
dipolowy atomu wewnątrz dielektryka, niezbędna jest znajomość pola elektrycznego,
które działa na ten wyodrębniony atom. Zrobiliśmy przybliżenie, które w wielu wypad-
kach nie jest takie złe, że pole działające na atom jest takie samo, jak pole, które znaleźli-
byśmy w środku małego otworu, który pozostałby po wyjęciu atomu (przy pozostawieniu
bez zmian momentów dipolowych wszystkich atomów sąsiednich). Pamiętamy także, że
pole elektryczne w otworze w jakimś dielektryku spolaryzowanym zależy od kształtu tego
otworu. Podsumowanie naszych poprzednich wyników zamieszczamy na rys. 36.1. Dla
wąskiego otworu w kształcie krążka, prostopadłego do wektora polaryzacji, pole elek-
ryczne w otworze jest dane zależnością
Potwór — ^dielektryk *ł* ’
£0
co wykazaliśmy posługując się prawem Gaussa. Z drugiej strony, pokazaliśmy — korzy-
stając z faktu, że rotacja pola E jest równa zeru — iż dla wąskiej szczeliny w kształcie igły,
równoległej do polaryzacji, pola elektryczne wewnątrz i na zewnątrz szczeliny są takie
same. Na koniec znaleźliśmy, że dla otworu kulistego pole elektryczne w otworze było
większe od pola w dielektryku o trzecią część różnicy pomiędzy polami w „krążku”
’ w „igle”:
1 P
Eotwór = Edielektryk+ — — (otwór kulisty). (36.3)
J CQ
*' Jeżeliby wszystkie „inne” ładunki występowały na przewodnikach, to ęr ilrtć taln sama
Jak 6swob z rozdz. 10 (t. II, cz. 1). , -
284
36. FERROMAGNETYZM
36.1. Pole elektryczne we wnęce w dielek-
tryku zależy od kształtu tej wnęki
To właśnie było pole, którym posługiwaliśmy
się w rozważaniach nad tym, co się dzieje
z atomem wewnątrz spolaryzowanego diele-
ktryka.
Teraz powinniśmy omówić odpowiednik
tego wszystkiego dla przypadku magnetyzmu.
Moglibyśmy to zrobić przyjmując, że M
moment magnetyczny na jednostkę objętości,
jest po prostu odpowiednikiem P, dipolowego
momentu elektrycznego na jednostkę obję-
tości i że na skutek tego dywergencja nama-
gnesowania M, wzięta ze znakiem ujemnym,
jest równoważna „gęstości ładunku magnety-
cznego” Qm — bez względu na to, co ta ostat-
nia wielkość może oznaczać. Oczywiście, kło-
pot w tym, że w świecie fizycznym nie istnieje
nic takiego jak „ładunek magnetyczny”. Jak
wiemy, dywergencja pola B jest zawsze równa
zeru. Ale pomimo to nie ma powodu, abyśmy
nie mogli dokonać pewnej sztucznej analogii
i zapisać
-V-M (36.4)
przy czym należy rozumieć, że om jest wiel-
kością czysto matematyczną. Wówczas można
by przeprowadzić zupełną analogię z przypa-
dkiem elektrostatycznym i skorzystać z wszys-
kich naszych starych równań elektrostatyki.
Często robiono takie rzeczy. Tak naprawdę,
to kiedyś nawet wierzono, że ta analogia jest
prawdziwa. Wierzono, że wielkość Qm przed-
stawia gęstość „biegunów magnetycznych’
Obecnie jednak wiemy, że namagnesowanie materiałów pochodzi od krążących wewnątrz
atomów prądów, pochodzących czy to od obrotów elektronów wokół osi, czy to od ru-
chu elektronów w atomie. Dlatego też z punktu widzenia fizyki lepiej jest opisywać zja-
wisko namagnesowania posługując się pojęciem rzeczywistych prądów atomowych, a nie
pojęciem gęstości jakichś mitycznych „biegunów magnetycznych”. Nawiasem mówiąc,
te prądy nazywa się niekiedy „prądami Ampere’a”, bo Ampere pierwszy poddał myśl,
że magnetyzm materii pochodzi od krążących prądów atomowych.
Rzeczywista, mikroskopowa gęstość prądu w namagnesowanej materii jest oczywiście
bardzo złożona. Jej wartość zależy od tego, gdzie jej się będzie szukać w atomie — w nie-
których miejscach w atomie jest duża, a w innych mała; w jednej części atomu prąd prze
pływa w jednym kierunku, a w drugiej części przepływa w kierunku przeciwnym (tak samo
36-1. PRĄDY NAMAGNESOWANIA
285
jak wewnątrz dielektryka mikroskopowe pole elektryczne zmienia się bardzo gwałtownie).
Jednak w wielu zagadnieniach praktycznych interesują nas tylko pola na zewnątrz materii
lub średnie pole magnetyczne wewnątrz materii, gdzie mamy na myśli średnią, wziętą po
wielu, wielu atomach. Tylko dla takich zagadnień makroskopowych wygodnie jest opisy-
wać stan magnetyczny materii poprzez namagnesowanie M, będące średnim momentem
dipolowym na jednostkę objętości. Chcemy teraz pokazać, że prądy atomowe namagneso-
wanej materii mogą wywołać powstanie pewnych prądów na dużą skalę, które są związane
z namagnesowaniem M.
A zatem będziemy teraz próbować rozdzielić gęstość prądu j, która jest rzeczywistym
źródłem pól magnetycznych, na różne części, tak aby jedna z tych części opisywała krążące
prądy atomowych momentów magnetycznych, a pozostałe części opisywały wszystkie
inne prądy, jakie mogą wystąpić. Zwykle najwygodniej jest rozdzielić prądy na trzy części.
W rozdziale 32 dokonaliśmy rozróżnienia pomiędzy prądami, które przepływają swobodnie
w przewodnikach, a prądami, które pochodzą od ruchów drgających ładunków związa
nych w dielektrykach. W § 32-2 napisaliśmy:
J — jpol+jinne’
gdzie jpol reprezentowało prądy pochodzące od ruchów ładunków związanych w dielek-
trykach, a jinne miało się troszczyć o wszystkie inne prądy. Teraz chcemy pójść jeszcze
dalej. Chcemy rozdzielić jinne na jedną część, jmag, która opisuje średnie prądy wewnątrz
substancji namagnesowanych i na drugi, dodatkowy człon, który oznaczymy jprzew,
a który ma zdawać sprawę z tego, co zostało. Ogólnie biorąc, ten ostatni człon będzie się
odnosił do prądów w przewodnikach, ale może on także zawierać w sobie inne prądy,
na przykład prądy od ładunków poruszających się swobodnie w pustej przestrzeni. Całko-
witą gęstość prądu zapiszemy zatem jako
J jpol^Jmag^-Jprzew* , (36.5)
Oczywiście, to właśnie ten całkowity prąd występuje w równaniu Mwwlla na rotację B:
j dE
?VxB= J- + —. - (36.6)
£0 Ot ,
Musimy teraz związać prąd jmag z wektorem namagnesowania M. Aby czytelnik łatwiej
mógł zobaczyć, do czego zmierzamy, powiemy od razu, że w wyniku powinniśmy otrzy-
mać:
jmag = VxM, (36.7)
czyli jeżeli w jakiejś substancji magnetycznej jest wszędzie dany wektor namagnesowa-
nia M, to gęstość prądu krążenia jest dana przez rotację M. Zobaczmy, czy potrafimy
zrozumieć, dlaczego tak jest.
Na początek weźmy przypadek pręta cylindrycznego, który jest namagnesowany
Jednorodnie, przy czym wektor M jest równoległy do jego osi. Z punktu widzenia fizyki
takie jednorodne namagnesowanie oznacza w rzeczywistości, jak wiemy, że wewnątrz
całego ośrodka gęstość krążących prądów atomowych jest stała. Przypuśćmy, że spró-
286
36. FERROMAGNETYZM
36.2. Schematyczny obraz krążących prądów
atomowych na przekroju żelaznego pręta,
namagnesowanego w kierunku osi z
zeru. Nigdzie wewnątrz pręta nie ma
bujemy sobie wyobrazić, jak wyglądają te
rzeczywiste prądy na przekroju pręta. Można
by się spodziewać, że prądy te będą wyglą.
dały mniej więcej tak, jak to pokazano na rys.
36.2. Każdy prąd atomowy przebiega dookoła
po małej pętli i wszystkie te krążące prądy
przebiegają w tym samym kierunku. Jaki
jest teraz wypadkowy prąd czegoś takiego?
No cóż, w całym prawie pręcie wypadkowy
efekt jest równy zeru, bo tuż obok każdego
prądu znajduje się prąd przebiegający w kie-
runku przeciwnym. Jeżeli wyobrazić sobie
małą powierzchnię, ale taką, która jest jeszcze
troszkę większa od pojedynczego atomu,
taką jak powierzchnia zaznaczona na rys.
36.2 linią AB — to wypadkowy prąd przepły-
wający przez tę powierzchnię jest równy
go od zera wypadkowego prądu. Zauważmy
jednak, że na powierzchni pręta znajdują się prądy atomowe, które się nie znoszą
z sąsiednimi prądami — na powierzchni jest pewien prąd wypadkowy, przebiegający
wokół pręta, zawsze w tym samym kierunku. Widać teraz, dlaczego mówiliśmy po-
przednio, że jednorodnie namagnesowany pręt jest równoważny długiemu solenoidowi,
przez który przepływa stały prąd elektryczny.
W jakim stopniu ten obraz zgadza się z opisem matematycznym przedstawionym rów-
naniem (36.7)? Przede wszystkim, wewnątrz substancji namagnesowanie M jest stałe,
tak że jego pochodne są wszystkie równe zeru, co się zgadza z naszym obrazem geome-
trycznym. Jednak na powierzchni wektor M nie jest w rzeczywistości stały — jest on stały
aż do krawędzi, a potem nagle opada do zera. A zatem, na samej powierzchni są ogromne
gradienty, które zgodnie z równaniem (36.7) dadzą dużą gęstość prądu. Przypuśćmy,
że się przyjrzymy temu, co się dzieje w pobliżu punktu C na rys. 36.2. Obierając osie
x i y tak, jak na rysunku, widzimy, że namagnesowanie M ma kierunek osi z. Rozpisu-
jąc równanie (36.7) na składowe mamy
dM,
dy
(36.8)
W punkcie C pochodna dMJdy jest równa zeru, ale dMxfdx jest duża i dodatnia. Z rów-
nania (36.7) wynika, że dla ujemnego kierunku osi y mamy dużą gęstość prądu. To si?
zgadza z naszym obrazem prądu powierzchniowego, opływającego pręt dookoła.
Teraz chcemy znaleźć gęstość prądu dla przypadku bardziej skomplikowanego, w któ-
rym namagnesowanie się zmienia w substancji od punktu do punktu. Łatwo można do-
36-1. PRĄDY NAMAGNESOWANIA
287
strzec jakościowo, że jeżeli namagnesowanie
jest różne w dwóch sąsiednich obszarach, to
nie nastąpi idealne zniesienie się krążących
prądów, tak że w tej objętości substancji będzie
pewien wypadkowy prąd. Właśnie to zjawisko
chcemy prześledzić ilościowo.
Najpierw musimy się powołać na wyniki
z § 14-5, (t. II, cz. 1), że krążący prąd Z ma
moment magnetyczny /z, dany zależnością
p^IA,
(36.9)
gdzie A jest powierzchnią pętli prądu (patrz rys.
36.3). Rozważmy teraz mały prostopadłościan
wewnątrz namagnesowanej substancji, taki jak
to pokazano schematycznie na rys. 36.4. Bie-
rzemy ów „klocek” na tyle mały, aby można
było założyć, że wewnątrz niego namagnesowa-
nie jest stałe. Jeżeli klocek ten ma w kierunku
osi z namagnesowanie Mz, to wypadkowy efekt
będzie taki sam, jak gdyby ścianki pionowe
były opływane przez prąd powierzchniowy, co
już pokazaliśmy. Wielkość tych prądów można
określić z równania (36.9). Całkowity moment
magnetyczny klocka jest równy namagnesowa-
nie razy objętość:
[j, = MĄabc),
36.3. Moment dipolowy, p., pętli z prą-
dem jest równy 1A
36.4. Mały, namagnesowany „klocek” jest
równoważny krążącemu prądowi po-
wierzchniowemu
z czego otrzymujemy (pamiętając, że powierzchnia pętli jest równa ae)
1= Mzb.
Innymi słowy, prąd na jednostkę długości (pionowej) na każdej z pionowych powierzchni
jest równy Mz.
Wyobraźmy sobie dwa małe klocki obok siebie, tak jak to pokazano na rys. 36.5.
Ze względu na to, że klocek 2 jest trochę przesunięty względem klocka 1, będzie on miał
trochę inną składową pionową namagnesowania, którą oznaczymy MZ+AMZ. Całko-
wity prąd na powierzchni pomiędzy klockami będzie się teraz składał z dwóch części.
Klocek 1 wytworzy prąd Ą płynący w dodatnim kierunku osi y, a klocek 2 wytworzy
Prąd powierzchniowy I2, płynący w ujemnym kierunku osi y. Całkowity prąd powierzch-
niowy, płynący w kierunku dodatnim osi y jest sumą:
I = it-i2 = Mzb—(Mz-\-AMz)b = -AMzb.
288
36. FERROMAGNETYZM
36.5. Jeżeli namagnesowanie dwóch sąsiednich klocków nie jest takie samo, to pomiędzy klockami poja-
wia się pewien wypadkowy prąd powierzchniowy
Można zapisać AMZ jako pochodną Mz w kierunku osi x razy przesunięcie wzajemne
klocków 1 i 2, które jest równe po prostu a:
.. , 3M. '
. - JAf, =----a.
। dx
frąd płynący pomiędzy dwoma klockami jest więc równy
“ 8MZ
I=-_—Lab.
i dx
Aby związać prąd I z średnią gęstością objętościową prądu j, należy zdać sobie sprawę,
że ten prąd I jest w rzeczywistości „rozmazany” na powierzchni pewnego przekroju.
Jeżeli wyobrazić sobie, że cała objętość substancji jest wypełniona tego rodzaju małymi
klockami, to z każdym klockiem można związać taką jedną ściankę boczną (prostopadłą
do osi x)*’. Widać teraz, że powierzchnią, którą należałoby związać z prądem Z, jest właśnie
powierzchnia ab jednej z przednich ścianek. Otrzymujemy w wyniku
Z 8MZ
= ---------
ab ox
przynajmniej pierwszy wyraz rotacji wektora M.
Składowa jy powinna zawierać jeszcze jeden wyraz pochodzący od zmiany składowej
x-owej namagnesowania wraz ze zmienną z. Ten przyczynek do prądu j będzie pocho-
dził od powierzchni pomiędzy dwoma klockami, ustawionymi jeden na drugim, tak jak
to pokazano na rys. 36.6. Przeprowadzając identyczne jak poprzednio rozumowanie,
można wykazać, że przyczynek od tej powierzchni do jy jest równy dMJdz. Są to jedyne
•> Albo jeżeli ktoś woli, prąd I na każdej ściance musi być rozdzielony w równych ilościach pomiędzy
klocki znajdujące się po bokach tej ścianki.
36-1. PRĄDY NAMAGNESOWANIA
289
powierzchnie (be i ac), które mogą dać przy-
czynki do składowej y-owej prądu, tak że cał-
kowita gęstość prądu w kierunku osi y jest
równa
. _ 8MX dM2
dz dx
Obliczając prądy na pozostałych ściankach pro-
stopadłościanu albo korzystając z faktu, że
nasz kierunek z był zupełnie dowolny, docho-
dzimy do wniosku, że wektor gęstości prą-
du jest rzeczywiście określony równaniem
j = V xM.
Jeżeli zatem przyjmiemy do opisu sytuacji 36-6- Dwa k*00*0’ Jeden 1141(1 drugim,
. . . .. , , . . mogą także dać przyczynek do jv
magnetycznej w materii sredm moment ma- y
gnetyczny na jednostkę objętości M, to stwierdzi-
my, że krążące prądy atomowe są równoważne średniej gęstości prądu w materii, okre-
ślonej równaniem (36.7). Jeżeli substancja jest ponadto dielektrykiem, to dodatkowo może
wystąpić prąd polaryzacji jpol = <5P/<5r. A jeżeli ośrodek jest także przewodnikiem,
to możemy mieć równie dobrze i prąd przewodnictwa, jprzew. Całkowity prąd można
zatem zapisać jako
dP
j = jprzew+VxM+—• (36.10)
36-2. Pole H
Z kolei chcemy Wstawić prąd określony równaniem (36.10) do równań Maxwella.
Otrzymujemy
J 5E 1 /• „ 3P\ 5E
c2VxB = —+ —=— jprzew+VxM+— + —.
£0 Ot £0 \ Ot I Ot
Wyraz zawierający wektor M można przenieść na lewą stronę:
c2Vx/b—= + — (e+— k (36.11)
\ e0c2/ £0 Ot \ £0/
Jak zaznaczyliśmy w rozdz. 32, wiele osób lubi zapisywać (E4-P/£0) jako nowe pole
wektorowe D/£q. Podobnie, często wygodnie jest zapisywać (B—M/£0c2) jako jedno
pole wektorowe. Postanawiamy zdefiniować nowe pole H jako
H-B-M,. , j (36.12)
£0C2
19 —
Wykłady z fizyki
290
36. FERROMAGNETYZM
Wówczas równanie (36.11) przybiera postać
SD
£0c2VxH = jprzew+—. , .• . (36.13)
Wygląda ono prosto, ale cała jego złożoność jest ukryta właśnie w symbolach D i H.
Musimy teraz ostrzec czytelnika. Otóż większość z tych osób, które używają jedno-
stek MKS postanowiła używać innej definicji pola H. Jeżeli oznaczyć ich pole H' (oczy-
wiście oni oznaczają je w dalszym ciągu H, bez znaku prim), to jego definicja ma postać
H' = £0c2B—M (36.14)
(zwykle również zapisują oni £oc2 jako nową liczbę lf/z0’> mają w ten sposób jeszcze jedną
stałą, o której muszą pamiętać!). Przy tej definicji równanie (36.13) wygląda jeszcze proś-
ciej:
SD
VxH' = jprzew+—. (36.15)
Ale z tą definicją pola H' związane są dwie trudności: po pierwsze — definicja ta nie zga-
dza się z definicją tych osób, które nie używają jednostek MKS, a po drugie — prowa-
dzi ona do tego, że pola H' i B mają różne jednostki. Uważamy, że wygodniej jest, aby
pole H miało takie same jednostki jak pole B, a nie jak namagnesowane M, tak jak to
się dzieje w przypadku pola H'. Ale jeżeli ktoś ma zamiar zostać inżynierem i pracować
przy konstrukcji transformatorów, elektromagnesów itd., to musi uważać. Znajdzie on
wiele książek, w których występuje definicja H zgodna z równaniem (36.14), a nie z na-
szą definicją [równanie (36.12)] i znajdzie też wiele innych książek — szczególnie pod-
ręczników na temat substancji magnetycznych — które tak wiążą pole B i H, jak my to
zrobiliśmy. Trzeba być zawsze ostrożnym i upewnić się, jaką konwencją posługują się
w danej książce.
Jednym ze sposobów na rozstrzygnięcie tego problemu jest zbadanie, jakimi jednost-
kami posługują się w danej książce. Pamiętajmy, że w układzie MKS pole B, a stąd także
i nasze pole H, ma jednostkę: jeden weber na metr kwadratowy, równą 10000 Gs.
W układzie MKS moment magnetyczny (prąd razy powierzchnia) ma jednostkę: 1 amper-
-metr2. Namagnesowanie M ma wówczas jednostkę 1 amper-metr-1. Pole H' ma takie
same jednostki jak namagnesowanie M. Widać, że to się zgadza także z równaniem (36.15),
ponieważ V ma wymiar odwrotności długości. Ci, którzy mają do czynienia z elektro-
magnesami, mają także zwyczaj nazywania jednostki pola H (przy definicji jak dla H )
„jeden amperozwój na metr” — mając na myśli zwoje drutu uzwojenia. Ale „zwój” jest
w rzeczywistości liczbą bezwymiarową, tak że tym się nie musimy martwić. Ponieważ
nasze pole H jest równe Hje0 c2, to H (w Wb/m2) jest równe, jeżeli się używa układu
MKS, 4tt 10-7 H' (w A/m). Wygodniej, być może, jest pamiętać, że H (w Gs) = 0,0126 H
(A/m).
Jeszcze jedna, okropna rzecz. Wielu z tych, którzy używają naszej definicji pola
postanowiło nadać jednostkom H i B różne nazwy! Mimo tego, że pola H i B mają takie
same wymiary, to nazywają oni jednostkę pola B gausem, a jednostkę pola H — erstedem
36-2. POLE H
291
Tabela 36.1
Jednostki wielkości magnetycznych
[5] = weber na metr2 = 104 gausów
[tf] = weber na metr2 = 104 gausów lub 104 erstedów
[M] IH'] = amper na metr = amper na metr Wygodne zamiany
B (gausów) = 104 B (Wb/m2) ’
H (gausów) = H (erstedów) = 0,0126 H* (A/m)
(oczywiście, nazwy pochodzą od nazwisk uczonych: Gaussa i Oersteda). Dlatego też
w wielu książkach można znaleźć wykresy, na których pole B jest wykreślone w gausach,
a pole H — w erstedach. W rzeczywistości jest to jedna i ta sama jednostka równa 10-4
jednostki MKS. Podsumowanie tych kłopotów z jednostkami magnetycznymi zamie-
szczamy w tab. 36.1.
36-3. Krzywa namagnesowania
Przyjrzyjmy się teraz kilku prostym sytuacjom, w których pole magnetyczne jest stałe
lub w których pola zmieniają się na tyle wolno, że można pominąć wyraz dD/dt w porów-
naniu z prądem jprzew. Wówczas pola spełniają równania:
V-B = 0 (36.16)
VxH = jpraw/60c2, ' (36.17)
H = B—M/e0c2. (36.18)
Przypuśćmy, że mamy torus (rurę toroidalną) z żelaza^ owinięty cewką z miedzianego
drutu, tak jak to pokazano na rys. 36.7a. W drucie płynie prąd /. Jakie jest pole magne-
tyczne? Pole magnetyczne będzie głównie zlokalizowane wewnątrz żelaza; linie sił pola
B będą tam okręgami takimi, jak to pokazano na rys. 36.7b. Ponieważ strumień pola B
jest ciągły, dywergencja pola B jest równa zeru i równanie (36.16) jest spełnione. Z kolei
zapiszmy równanie (36.17) w innej postaci, całkując wokół zamkniętej pętli F, pokazanej
na rys. 36.7b. Z twierdzenia Stokesa wynika, że
{h-Js = —fjpraw-nJa, (36.19)
•/ £(\ C J
r $
gdzie całkę z j powinno się wziąć po dowolnej powierzchni S, ograniczonej pętlą F. Każdy
^ój uzwojenia przecina tę powierzchnię jeden raz. Każdy zwój daje do całki przyczy-
nek równy prądowi I i jeżeli liczba zwojów jest równa N, to całka wynosi NI. Z symetrii
292
36. FERROMAGNETYZM
36.7. a. Cewka z izolowanego drutu, nawinięta na żelazny torus. b. Przekrój torusa, pokazujący
linie sił pola
naszego zagadnienia wynika, że pole B jest takie samo wokół całej krzywej P; jeżeli za-
łoży się, że namagnesowanie, a stąd i pole H są także stałe wzdłuż krzywej P, to równanie
(36.19) przybierze postać
(36.20)
gdzie / jest długością krzywej P. Tak więc
1 NI
CQ C l
Właśnie dlatego, że pole H, w przypadkach takich jak ten, jest wprost proporcjonalne
do prądu magnesującego, czasami nazywa się je polem magnesującym.
Potrzebne nam jest .teraz tylko równanie, które wiąże pola H i B. Ale takiego równa-
nia nie ma! Oczywiście, mamy równanie (36.18), ale niewielka z niego pociecha, bo nie
ma jakiegoś bezpośredniego związku pomiędzy namagnesowaniem M i polem B dla ma-
teriału ferromagnetycznego, takiego jak żelazo. Namagnesowanie M zależy od całej
historii żelaza, a nie tylko od wartości pola B w danej chwili.
A jednak nie wszystko jest jeszcze stracone. Można otrzymać rozwiązania dla pew-
nych prostych przypadków. Jeżeli zaczniemy od żelaza nienamagnesowanego, powiedzmy
od żelaza, które zostało wyżarzone w wysokiej temperaturze, to w przypadku torusa
o prostej geometrii całe to żelazo będzie miało taką samą historię magnetyczną. Wówczas
można coś powiedzieć o namagnesowaniu M, a stąd o związku pomiędzy polami B i H
z pomiarów doświadczalnych. Pole H w torusie jest równe [równanie (36.20)] iloczynowi
stałej i prądu I w uzwojeniu. Pole B można zmierzyć całkując względem czasu siłę elektro-
motoryczną w cewce (lub w dodatkowej cewce, nawiniętej na cewce magnesującej, P°"
kazanej na rysunku). Ta siła elektromotoryczna jest równa szybkości zmian strumienia
pola B, tak że całka z SEM względem czasu jest równa iloczynowi pola B i pola powierzch-
ni przekroju torusa.
36-3. KRZYWA NAMAGNESOWANIA
293
Na rysunku 36.8 pokazano zależność pomiędzy polami B i H dla torusa z żelaza mięk-
kiego. Gdy na początku się włącza prąd, pole B rośnie wraz ze wzrostem pola H wzdłuż
krzywej a. Należy zwrócić uwagę na różne skale na osiach B i H; na początku stosunko-
wo małej wartości pola H odpowiada już duże pole B. Dlaczego pole B jest w żelazie tylo-
krotnie większe od pola B, które obserwowaliśmy w powietrzu? Wynika to z istnienia
dużego namagnesowania M, które jest równoważne dużemu prądowi powierzchniowe-
mu w żelazie — pole B pochodzi od sumy tego prądu i prądu przewodnictwa w uzwoje-
Iniu. Później omówimy kwestię dlaczego namagnesowanie M powinno być tak duże.
Dla większych wartości pola H krzywa namagnesowania ma mniejsze nachylenie.
'Mówimy, że żelazo się nasyca. Przy tych skalach, jakie mamy na rysunku, krzywa zaczyna
być prawie równoległa do osi H. W rzeczywistości ona ciągle nieznacznie się podnosi
— dla dużych pól pole B staje się proporcjonalne do pola H, przy czym kąt nachylenia
krzywej, przy jednakowych skalach dla B i H, przyjąłby wartość 45°. Wtedy nie będzie
już dalszego wzrostu namagnesowania M. Nawiasem mówiąc, należy podkreślić, że je-
żeli torus byłby wykonany z jakiejś substancji niemagnetycznej, to namagnesowanie M
byłoby równe zeru i dla wszystkich pól B byłoby równe H.
Pierwszą rzeczą, która się rzuca w oczy, to fakt, że krzywa a na rys. 36.8 — jest to
tak zwana krzywa namagnesowania — me ma w żadnym wypadku przebiegu prostego.
Ale to jeszcze nic; jeżeli po osiągnięciu nasycenia zmniejszymy prąd w cewce, tak aby
pole H powróciło do zera, to pole magnetyczne B będzie opadało wzdłuż krzywej b.
Gdy pole H osiągnie wartość zero, ciągle jeszcze będziemy mieli „trochę” pola B. Nawet
przy nieobecności prądu magnesującego będziemy mieli w żelazie jakieś pole magnetyczne,
a więc żelazo stało się trwale namagnesowane.
ujemny, to krzywa B-H będzie w dalszym
ciągu przebiegać wzdłuż b, aż żelazo zostanie
nasycone w kierunku ujemnym. Jeżeli z po-
wrotem powróci się z prądem do zera, to pole
B będzie przyjmowało wartości położone
wzdłuż krzywej c. Jeżeli będziemy zmieniać
natężenie prądu — pomiędzy dużymi warto-
ściami dodatnimi a ujemnymi — to krzywa
B-H będzie przebiegać tam i z powrotem
prawie dokładnie wzdłuż krzywych b i c.
Jeżeli jednak będziemy zmieniać pole H
w jakiś dowolny sposób, to możemy otrzy-
mać bardziej skomplikowane krzywe, które
będą na ogół leżeć w obszarze pomiędzy krzy-
wymi b i c. Pętlę powstałą na skutek ciągłych
oscylacji pól nazywa się pętlą histerezy.
Widać, że się nie da napisać związku funk-
cyjnego typu B = f(H), ponieważ wartość
Pola B w każdej chwili zależy nie tylko od war-
tości, jaką ma w tej chwili pole H, ale także
Jeżeli teraz podłączy się do cewki prąd
36.8. Typowe krzywe namagnesowania i hi-
sterezy dla miękkiego żelaza
294
36. FERROMAGNETYZM
od wartości pola H we wszystkich chwilach poprzednich. Naturalnie, namagnesowanie
i krzywe histerezy są dla różnych substancji różne. Kształt krzywych zależy w zasadniczy
sposób od składu chemicznego substancji, a także od szczegółów jej przygotowania i na-
stępującej później „obróbki” fizycznej. Niektóre fizyczne wyjaśnienia tych komplikacji
omówimy w następnym rozdziale.
36-4. Indukcyjność cewki z rdzeniem żelaznym
Substancje magnetyczne znajdują jedno ze swych najważniejszych zastosowań w obwo-
dach elektrycznych, np. w transformatorach, w silnikach elektrycznych itd. Jednym z po-
wodów jest to, że za pomocą żelaza możemy „skierowywać” pola magnetyczne dokąd
chcemy, a także otrzymywać dużo większe pola magnetyczne dla tego samego prądu
elektrycznego. Tak na przykład typowa, „toroidalna” cewka indukcyjna przypomina
w dużym stopniu obiekt pokazany na rys. 36.7. Przy tej samej indukcyjności taka cewka
może mieć o wiele mniejszą objętość i jej konstrukcja wymaga o wiele mniejszego zużycia
miedzi niż dla równoważnej jej „cewki powietrznej”. Ptzy tej samej indukcyjności opór
uzwojenia jest o wiele mniejszy i dlatego cewka przypomina bardziej „doskonałą induk-
cyjność” — szczególnie dla małych częstości. Działanie takiej cewki można jakościowo
zrozumieć bardzo łatwo. Jeżeli przez I oznaczymy prąd w uzwojeniu, to wytworzone
wewnątrz pole H jest proporcjonalne do prądu I, tak jak to określa równanie (36.20).
Napięcie pomiędzy końcówkami jest związane z polem magnetycznym B — przy po-
minięciu oporu uzwojenia napięcie "T jest proporcjonalne do 5B/5Z. Indukcyjność
która jest stosunkiem napięciado pochodnej dl/dt (patrz t. II, cz. 1, § 17-7), daje nam
więc zależność pomiędzy polami B i H w żelazie. Ponieważ pole B jest wielokrotnie wię-
ksze od pola H, indukcyjność jest wielkością dużą. Można podać proste fizyczne wy-
jaśnienie dlaczego tak się właśnie dzieje. Otóż mały prąd w cewce, który normalnie wytwo-
rzyłby małe pole magnetyczne, wprowadza ład wśród momentów magnetycznych w żela-
zie, które układają się wszystkie w tym samym kierunku i wytwarzają prąd „magnetyczny”
znacznie większy od zewnętrznego prądu w uzwojeniu. Wygląda to więc tak, jak by w cew-
ce płynął o wiele większy prąd niż w rzeczywistości. Jeżeli zmienić kierunek prądu, to
wszystkie małe „magnesiki” się przekręcą — wszystkie prądy wewnętrzne zmienią kie-
runek — i powstanie wyindukowana SEM, o wiele większa niż w przypadku cewki bez
rdzenia żelaznego. leżelibyśmy chcieli obliczyć indukcyjność, to można to zrobić poprzez
obliczenie energii, tak jak to opisano w § 17-8 (t. II, cz. 1). Szybkość, z jaką energia
jest dostarczana ze źródła prądu, jest równa I"f. Napięcie V równe jest iloczynowi p®'
wierzchni przekroju rdzenia A, liczby zwojów N i pochodnej dBJdt. Z równania (36.20)
I=(e0c2I/N)H. Zatem
dU dB
dt dt
Całkując względem czasu mamy
U = (eoc2lA) f HdB.
(36.21)
36-4. INDUKCYJNOŚĆ CEWKI Z RDZENIEM ŻELAZNYM
295
Zauważmy, że IA jest objętością torusa, tak
więc wykazaliśmy, że gęstość energii, u =
= tT/objętość, w substancji magnetycznej
jest określona przez
u = e0c2$HdB. (36.22)
Warto zwrócić uwagę na pewne ciekawe
zjawisko, które się tu kryje. Jeżeli używamy
prądów zmiennych, to namagnesowanie
żelaza przebiega po pętli histerezy. Ponieważ
pole B nie jest jednoznaczną funkcją pola H,
całka $HdB wokół jednego pełnego obiegu
nie jest równa zeru. Jest ona równa polu
powierzchni ograniczonej na wykresie pętlą
histerezy. Tak więc źródło zasilające dostarcza
w każdym obiegu pewną wypadkową ener-
gię, proporcjonalną do pola powierzchni
ograniczonej pętlą histerezy i energia ta jest
„tracona”. Zostaje ona stracona z przebie-
gów elektromagnetycznych, ale odnajduje się
jako ciepło w żelazie. Nazywa się ona stratą
histerezy. Aby te straty energii były małe,
36.9. Pętla histerezy, która nie osiąga war-
tości nasycenia
pętla histerezy powinna być możliwie jak najwęższa. Jeden ze sposobów na zmniejszenie
pola powierzchni ograniczonej pętlą polega na zmniejszeniu maksymalnego pola B, które
jest osiągane w każdym obiegu. Dla mniejszych wartości maksymalnych pola B krzywa
histerezy wygląda tak, jak na rys. 36.9. Są także wytwarzane specjalne materiały, które
mają bardzo wąską pętlę histerezy. Tak zwane żelaza transformatorowe — stopy żelaza
z małą domieszką krzemu — mają właśnie tę własność.
Dla jakiej cewki indukcyjnej z rdzeniem, „przebiegającej” przez pętlę histerezy, zwią-
zek pomiędzy polami B i H można przybliżyć przy pomocy równania liniowego. Zwykle
się Pisze D U UL
B = fiH. (36.23)
Stała fi nie jest tu, tak jak dawniej, momentem magnetycznym. Nazywa się ją przenikal-
nością magnetyczną żelaza (czasem przenikalnością względną). Przenikalność zwykłego
żelaza jest rzędu kilku tysięcy. Istnieją pewne specjalne stopy, takie jak „supermaloj”,
które mogą mieć przenikalność nawet rzędu miliona.
Jeżeli skorzystać z przybliżenia B = uH w równaniu (36.21), to energię w toroidalnej
cewce indukcyjnej można zapisać jako
U = (e0c2lA)fi J HdH = (eoc2lA)^~
Tak więc gęstość energii jest w przybliżeniu równa
u
e0c2
fiH2.
(36.24)
2
296
36. FERROMAGNETYZM
Można teraz przyrównać energię z równania (36.24) do energii cewki indukcyjnej
i wyliczyć Stąd JP. Otrzymujemy
= (£0c2ZA)/z
Podstawiając Hjl z równania (36.20) mamy
toC2l
(36.25)
Indukcyjność jest proporcjonalna do /z. Jeżeli potrzebne nam są cewki indukcyjne do
takich układów jak wzmacniacze drgań o częstościach akustycznych, to musimy się sta-
rać, by pracować na takiej pętli histerezy, dla której zależność B-H jest możliwie jak naj-
bardziej liniowa. [Pamiętamy, że w rodź. 50 tomu I (cz. 2) mówiliśmy o generacji skła-
dowych harmonicznych w układach nieliniowych.] Dla takich celów równanie (36.23)
jest pożytecznym przybliżeniem. Z drugiej strony, jeżeli się chce generować składowe
harmoniczne, to można używać cewki indukcyjnej, która pracuje celowo w sposób wy-
soce nieliniowy. Wówczas musi się używać pełnych krzywych B-H (tzn. takich, które
osiągają wartość nasycenia) i analizować to, co się dzieje, metodami graficznymi lub nu-
merycznymi.
W „transformatorze” często osadza się dwie cewki na tym samym torusie, czyli rdze-
niu, z materiału magnetycznego. (Dla większych transformatorów wygodniej jest mieć
rdzeń „prostokątny”.) Zmienny prąd w uzwojeniu „pierwotnym” powoduje zmiany pola
magnetycznego w rdzeniu, które z kolei indukują siłę elektromotoryczną w uzwojeniu
„wtórnym”. Ponieważ strumień pola magnetycznego przez każdy zwój obu uzwojeń jest
taki sam, stosunek sił elektromotorycznych w obu uzwojeniach jest równy stosunkowi
liczb zwojów obu uzwojeń. Napięcie przyłożone do uzwojenia pierwotnego zostaje prze-
transformowane w jakieś inne napięcie w uzwojeniu wtórnym. Ponieważ w rdzeniu po-
trzebny jest pewien wypadkowy prąd, aby wytworzyć wymaganą zmianę pola magnetycz-
nego, to suma algebraiczna prądów w obu uzwojeniach ustala się i jest równa pożąda-
nemu prądowi „magnesującemu”. Jeżeli prąd pobierany z uzwojenia wtórnego się zwię-
ksza, to prąd pierwotny musi się też odpowiednio zwiększyć — na równi z transformacją
napięć zachodzi także i „transformacja” prądów.
36-5. Elektromagnesy (
Omówmy teraz pewną sytuację praktyczną, która jest nieco bardziej skomplikowana.
Przypuśćmy, że mamy elektromagnes, o dość standardowym kształcie, taki jak pokazano
na rys. 36.10; jest to jarzmo żelazne, w kształcie litery C, na które nawinięto cewkę o dużej
liczbie zwojów. Jakie jest pole magnetyczne B w szczelinie?
Jeżeli szerokość szczeliny jest mała w porównaniu z innymi wymiarami, to można,
w pierwszym przybliżeniu, założyć, że linie sił pola B przebiegają dookoła jarzma po
pętli, tak samo jak w torusie. Będą one wyglądać mniej więcej tak, jak to pokazano na
36-5. ELEKTROMAGNESY
297
rys. 36.1 la. W samej szczelinie linie mają tendencję do pewnego rozszerzania się, ale je-
żeli szczelina jest wąska, to efekt ten jest mały. Można z powodzeniem założyć, że stru-
mień pola B przez każdy przekrój jarzma jest stały. Jeżeli powierzchnia przekroju jarzma
jest wszędzie taka sama i jeżeli pominąć efekty w szczelinie lub na rogach jarzma, to można
powiedzieć, że pole B jest stałe w całym jarzmie.
Pole B będzie więc miało także tę samą wartość w szczelinie. Wynika to z równania
(36.16). Wyobraźmy sobie zamkniętą powierzchnię S, pokazaną na rys. 36.1 Ib, której
jedna „ścianka” znajduje się w szczelinie, a druga w żelazie. Całkowity strumień pola B
przez tę powierzchnię musi być równy zeru.
Oznaczając przez pole w szczelinie, a przez
B2 pole w żelazie mamy
Bi Ai— B2A2 = 0.
Ponieważ Ai — A2 (w naszym przybliżeniu),
to stąd wynika, że = B2.
Przyjrzyjmy się teraz polu H. Możemy znów
ikorzystać z równania (36.19) biorąc całkę krzy-
woliniową wokół krzywej T przedstawionej na
łys. 36.1 Ib. Tak jak przedtem, po prawej stro-
nie wystąpi NI, iloczyn liczby zwojów i natęże-
nia prądu. Jednakże teraz pole H będzie różne
w żelazie i w powietrzu. Oznaczając przez H2
pole w żelazie, a przez l2 długość krzywej obie-
gającej dookoła jarzmo, otrzymamy, że ta część
36.10. Elektromagnes
36.11. Przekrój elektromagnesu
I
"W"
36. ferromagnetyzm
298
^6.12. Znajdowanie rozwiązania dla pola
elektromagnesie
krzywej da do całki przyczynek H2l2 Ozna-
czając zaś przez Ht pole w szczelinie, a przez
Zi szerokość szczeliny, otrzymujemy od szcze-
liny przyczynek Mamy więc
NI
Hili+H2l2 =-------(36.26)
Ponadto jeszcze wiemy, że namagneso-
wanie w powietrznej szczelinie można pomi-
nąć, tak że = H2. Ponieważ BL = B2,
równanie (36.26) przybiera postać
NI
B2ll+H2l2 =-------(36.27)
C
Ciągle jeszcze mamy dwie niewiadome. Aby
znaleźć pola B2 i H2, potrzebny nam jest
jeszcze jeden związek, a mianowicie zwią-
zek, który określa zależność pomiędzy po-
lami B i H w żelazie.
Gdybyśmy mogli dokonać przybliżenia
B2 = (iH2, potrafilibyśmy rozwiązać równa-
nie (36.27) algebraicznie. Rozwiążmy je jednak dla ogólnego przypadku, w którym
krzywa namagnesowania żelaza wygląda tak, jak krzywa z rys. 36.8. Potrzebne nam jest
rozwiązanie układu równań składającego się z danego graficznie równania funkcyjnego
i z równania (36.27). Można je znaleźć robiąc wykres równania (36.27) na tym samym
wykresie, na którym mamy pętlę histerezy, tak jak to zrobiono na rys. 36.12.'Nasze
rozwiązania odpowiadają punktom przecięcia tych dwóch krzywych.
Dla jakiegoś danego z góry prądu / funkcja (36.27) jest linią prostą, oznaczoną war-
tością parametru I > 0 na rys. 36.12. Prosta ta przecina oś H (B2 = 0) w punkcie H2 =
= NI/e0 c2l2, a jej nachylenie wynosi — /2/Zi. Dla innych prądów prosta ta będzie po pro-
stu przesunięta równolegle. Z rysunku 36.12 widać, że dla danego z góry prądu istnieje
kilka różnych rozwiązań, które zależą od historii elektromagnesu. Jeżeli magnes dopiero
co zbudowaliśmy i włączyliśmy prąd o natężeniu I, to pole B2 (a więc i pole Br) będzie
miało wartość określoną przez punkt a. Jeżeli doszliśmy początkowo do bardzo dużych
wartości prądu, a potem powróciliśmy do I, to pole będzie określone przez punkt 6. Jeżeli
zaś mieliśmy w magnesie najpierw prąd ujemny, a następnie zwiększyliśmy jego natę-
żenie do wartości /, to pole jest dane przez punkt c. Pole w szczelinie będzie więc zależeć
od tego, co „w przeszłości” robiliśmy z elektromagnesem.
Gdy natężenie prądu w magnesie jest równe zeru, to wykresem związku pomiędzy
polami B2 i H2, danego równaniem (36.27), jest prosta oznaczona na wykresie parame-
trem I = 0. I tym razem można mieć różne rozwiązania. Jeżeli jeszcze przedtem żelazo
zostało nasycone, to w magnesie mogło pozostać znaczne pole resztkowe, określone
36-5. ELEKTROMAGNESY
299
przez punkt d. Można wtedy z elektromagnesu zdjąć cewkę i otrzymać trwały magnes.
Widać, że dla dobrego trwałego magnesu potrzebny jest materiał z szeroką pętlą histe-
rezy. Pewne specjalne stopy, takie jak Alnico V, mają pętle bardzo szerokie.
36-6. Namagnesowanie spontaniczne
Przechodzimy teraz do problemu: jak to się dzieje, że małe pole magnetyczne wytwa-
rza tak duże namagnesowanie w materiałach ferromagnetycznych? Za namagnesowanie
materiałów ferromagnetycznych, takich jak żelazo i nikiel, odpowiedzialny jest moment
magnetyczny elektronów z powłoki zewnętrznej atomu. Każdy elektron ma moment
magnetyczny p., równy iloczynowi q)2m, czynnika g elektronu i momentu pędu elektro-
nu J. Dla pojedynczego elektronu, który nie doznaje jakiegoś wypadkowego ruchu orbi-
talnego, g = 2, a składowa momentu pędu J w dowolnym kierunku — powiedzmy
w kierunku osi z — jest równa ±h/2, tak że składowa momentu magnetycznego p wzdłuż
osi z jest równa
u . = — = 0,928-10~23 A-m2. (36.28)
2m
W atomie żelaza w rzeczywistości dwa elektrony dają przyczynki do ferromagnetyzmu;
aby więc uprościć nasze rozważania, będziemy mówić o niklu, który tak jak żelazo, jest
ferromagnetykiem, ale ma tylko jeden elektron w powłoce wewnętrznej (rozważania te
można łatwo rozszerzyć na przypadek żelaza).
Otóż rzecz wygląda tak, że w obecności zewnętrznego pola B atomowe momenty
magnetyczne dążą do ułożenia się wzdłuż linii sił pola, ale są wytrącane z tego uporząd-
kowania przez ruchy cieplne, tak samo jak opisaliśmy to dla substancji paramagnetycz-
nych. W poprzednim rozdziale stwierdziliśmy, że równowaga pomiędzy polem magne-
tycznym, próbującym uporządkować atomowe momenty magnetyczne, i ruchami cieplny-
mi, próbującymi zniszczyć to uporządkowanie, powodowała to, że średni moment magne-
tyczny na jednostkę objętości wynosił
ufi
M = Aptgh-y-^. (36.29)
KI
Przez Ba rozumiemy tu pole działające na atom, a kT jest energią Boltzmanna. W teorii
paramagnetyzmu za Ba wstawialiśmy samo pole B, pomijając działającą na dany atom tę
część pola, za którą były odpowiedzialne atomy sąsiednie. W przypadku ferromagnetyzmu
sprawa się komplikuje. Za Ba — pole działające na pojedynczy atom — nie można tu
już postawić średniego pola magnetycznego w żelazie. Zamiast tego trzeba zrobić tak,
jak to zrobiliśmy w przypadku dielektryków — trzeba znaleźć pole lokalne działające
na pojedynczy atom. Gdyby się chciało przeprowadzić dokładne obliczenia, to powinno
się dodać wszystkie pola działające na dany atom, a pochodzące od wszystkich innych
atomów sieci krystalicznej. Ale tak jak dla dielektryków dokonamy i tu przybliżenia
i przyjmiemy, że pole działające na atom jest takie samo jak pole, które znaleźlibyśmy
300
36 FERROMAGNETYZM
w małym kulistym otworze w materiale — przy założeniu, że obecność tego otworu nie
zmienia momentów magnetycznych atomów sąsiednich.
Można by pomyśleć, że zgodnie z rozważaniami z rozdz. 11 (t. II, cz. 1) powinniśmy
mieć związek
1 M
Botwór = B+ V----2 (fałsz!).
3 e0c2
Ale to nie jest prawdą. Można jednak posłużyć się wynikami rozdz. 11, ale trzeba dokonać
dokładnego porównania równań rozdz. 11 z równaniami niniejszego rozdziału, opisu-
jącymi ferromagnetyzm. Zestawmy odpowiadające sobie równania. Dla obszarów, gdzie
nie ma ani prądów przewodnictwa, ani ładunków, mamy:
' Elektrostatyka Ferromagnetyzm statyczny
(P \
E-|---1 = 0, VB = 0,
«o/
(36.30)
/ M \
i.y . t VxE = 0; Vx|B----------1 = 0.
\ £oc /
Można przyjąć, że te dwa układy równań są analogiczne, jeżeli się dokona następujących
czysto matematycznych przyporządkowań:
M P
E>B---------E+-----------> B.
£0c £o
Jest to równoważąc dokonaniu takiej oto analogii:
’ * E > H, P->M/c2. ‘ (36.31)
Innymi słowy, jeżeli zapisać równania ferromagnetyzmu w postaci
/ M \
V- H+-------- =0,
\ £oC /
(36.32)
VxH = 0,
to będą one przypominać równania elektrostatyki.
Ta czysto algebraiczna odpowiedniość wywołała w przeszłości sporo nieporozumień.
Ludzie byli skłonni uważać, że to właśnie H było „polem magnetycznym”. Ale, jak to
widzieliśmy, polami podstawowymi fizycznie są B i E, a H jest pojęciem pochodnym.
Chociaż zatem równania są analogiczne, to ich treść fizyczna nie jest analogiczna. Nie
powinno to jednak wstrzymywać nas od skorzystania z zasady, że takie same równania
mają takie same rozwiązania.
Można skorzystać z naszych poprzednich wyników dla pola elektrycznego w dielek-
trykach w otworach o różnych kształtach; na rys. 36.1 zamieszczono ich podsumowanie,
by znaleźć pole H w takich samych otworach. Znając pole H można określić pole B-
36-6. NAMAGNESOWANIE SPONTANICZNE
301
Tak na przykład (korzystając z wyników, które zebraliśmy w § 36-1) pole H w cien-
kiej szczelinie, równoległej do namagnesowania M, jest takie samo jak pole H w sub-
stancji,
T_j _____ u
“otwór “substancja •
Ale ponieważ namagnesowanie M w otworze jest równe zeru, to
- M
®otwór ®substancja ~ ‘ (36.33)
E()C
Z kolei, dla otworu w kształcie krążka prostopadłego do namagnesowania M, mamy
_ P
' ^otwór ^dielektryki ’
eO
co można „przetłumaczyć” na
M
T_J _ T_J | ____
’ “otwór “substancja ‘ 2
cqC
lub, wyrażając to poprzez pole B,
® otwór ®substancja • (36.34)
Na koiiiec, dla otworu kulistego, w analogii do równania (36.3), będziemy midi
M
FT = W i __________________
“otwór -“substancja ‘ 2
ÓEqC
lub
®otwór = ®substancja 7 2 ' (36.35)
3 Eo C
Ten ostatni wynik różni się wyraźnie od wyniku, jaki otrzymaliśmy dla pola E w otworze
kulistym.
Można oczywiście te same wyniki otrzymać w sposób bardziej „fizyczny”, a miano-
wicie korzystając bezpośrednio z równań Maxwella. Tak na przykład równanie (36.34)
wynika bezpośrednio z warunku V-B = 0. (Należy wziąć powierzchnię gaussowską,
która w połowie przechodzi wewnątrz substancji, a w połowie na zewnątrz niej.) Podobnie
można dostać równanie (36.33), biorąc całkę krzywoliniową wzdłuż krzywej, która prze-
biega wzdłuż otworu i powraca następnie poprzez wnętrze substancji. Fizycznie rzecz
biorąc, pole w otworze jest zmniejszone ze względu na prądy powierzchniowe, które są
dane przez rotację VxM. Pozostawiamy czytelnikowi wykazanie, że równanie (36.35)
można także otrzymać rozważając efekty prądów powierzchniowych na granicy wnęki
kulistej.
Przy wyznaczaniu z równania (36.29) namagnesowania odpowiadającego równowa-
dze okazuje się, że najwygodniej jest mieć do czynienia z polem H. Przyjmujemy więc
M .
Ba = H+ź--------, (36.36)
302
36. FERROMAGNETYZM
36.13. Rozwiązanie graficzne równań (36.37)
i (36.38)
36.14. Znajdowanie, namagnesowania, gdy pole
H = 0
W przybliżeniu otworu kulistego mielibyś-
my 2 = i, ale jak zobaczymy, będziemy
chcieli później posłużyć się tym wzo-
rem dla pewnej innej wartości, pozosta-
wiamy więc A jako parametr. Weźmiemy
również wszystkie pola w jednym i tym
samym kierunku, wtedy nie będziemy się
musieli troszczyć o kierunki wektorów. Je-
żeli teraz podstawilibyśmy równanie
(36.36) do równania (36.29), to otrzymali-
byśmy jedno równanie, które wiąże ze so-
bą namagnesowanie M i pole magnesu-
jące H:
M = Np tgh
AM/eoc2\
, kT /'
Jest to jednak równanie, którego nie
da się rozwiązać bezpośrednio; zrobimy
to więc graficznie.
Nadajmy naszemu zagadnieniu postać
bardziej ogólną, zapisując równanie (36.29)
jako
—— = tghx, (36.37)
^nas
gdzie Mnas jest wartością namagnesowa-
nia w stanie nasycenia, a mianowicie
Mnas = Np, a x = pBJkT. Zależność
stosunku M/Afnas od x pokazuje krzywa
a na rys. 36.13. Można także wyrazić
zmienną x jako funkcję M, podstawiając
Bo z równania (36.36), a mianowicie
(36.38)
Dla każdej danej z góry wartości pola H zależność pomiędzy A//Mnas a zmienną x jest
dana linią prostą, która przecina oś x dla x — pHjkT i której nachylenie wynosi
E^kTjp/.M^,.. Dla każdego danego z góry pola H będziemy mieli taką linię prostą,
jak prosta oznaczona literą b na rys. 36.13. Punkt przecięcia krzywych a i b daje nam jako
rozwiązanie wartość stosunku Tym samym zagadnienie to zostało rozwiązane.
Zastanówmy się teraz, jak będzie się zmieniać rozwiązanie w zależności od okolicz-
ności. Zacznijmy od przypadku, gdy H = 0. Mogą tu być dwie różne sytuacje, pokazane
przez proste b2 i b2 na rys. 36.14. Z równania (36.38) widać, że nachylenie prostej jest
proporcjonalne do temperatury bezwzględnej T. A zatem, dla wysokich temperatur nue-
36-6. NAMAGNESOWANIE SPONTANICZNE
303
libyśmy tego rodzaju prostą jak br. Nasze rozwiązanie ma wówczas postać Af/Afnas = 0,
czyli gdy pole magnesujące jest równe zeru, to i namagnesowanie jest równe zeru. Ale
dla niskich temperatur powinniśmy otrzymać taką prostą jak b2 — i wówczas będziemy
mieli dwa rozwiązania na Af/Mnas: jedno — to M/Mms = 0, a drugie odpowiada wartoś-
ciom MJMn3S bliskim jedności. Okazuje się, że tylko górne rozwiązanie jest stabilne, co
można sprawdzić rozważając małe odchylenia od wartości tych rozwiązań.
Z tego, co powiedzieliśmy, wynika, że substancja magnetyczna powinna się namagneso-
wać spontanicznie w dostatecznie niskich temperaturach. Krótko mówiąc, gdy ruchy ciep-
lne są dostatecznie małe, sprzężenie pomiędzy atomowymi momentami magnetycznymi
powoduje, że wszystkie te momenty ustawiają się równolegle do siebie. Otrzymujemy wtedy
trwale namagnesowaną substancję, analogiczną do ferroelektryków, które omawialiśmy
w rozdz. 11 (t. II, cz. 1).
Jeżeli zacząć od wysokich temperatur, a następnie przechodzić w stronę niższych
temperatur, to dojdziemy do pewnej temperatury krytycznej, nazywanej temperaturą
Curie, Tc, w której się nagle pojawiają własności ferromagnetyczne. Temperatura ta
odpowiada na rys. 36.14 prostej b3, która jest styczną do krzywej a (w punkcie 0) i wobec
tego jest nachylona do osi x pod kątem 45°. Temperatura Curie jest określona wzorem
e0 c2kTc
(36.39)
Można, jeżeli ktoś ma na to ochotę, zapisać równanie (36.38) prościej, wstawiając doń Tc:
pH
kT
(36.40)
Chcemy teraz zobaczyć, co się dzieje dla małych pól magnesujących H. Można to odczy-
tać z rys. 36.14, jeżeli się przesunie nasze proste trochę na prawo. Dla przypadku niskiej
temperatury punkt przecięcia przesunie się trochę wzdłuż tej części krzywej a, która ma
małe nachylenie, i zmiana namagnesowania M będzie stosunkowo mała. Jednakże dla
przypadku wysokiej temperatury punkt przecięcia przebiega wzdłuż ostro nachylonej
części krzywej a i M będzie się zmieniać stosunkowo dość gwałtownie. Można w istocie
przybliżyć tę część krzywej a linią prostą o nachyleniu 45° i napisać
M
pH Tc I M \
Ir +
Stąd zaś można obliczyć
M pH
~ k(T-TJ
(36.41)
A*
Otrzymaliśmy prawo, które przypomina nieco prawo, jakie mieliśmy dla paramagnetyzmu.
Dla paramagnetyzmu bowiem mieliśmy
f -^nas
(36.42)
304
36. FERROMAGNETYZM
Jedna różnica polega tu na tym, że namagnesowanie jest teraz wyrażone poprzez pole H
które zawiera w sobie część efektów pochodzących od wzajemnego oddziaływania ato-
mowych momentów magnetycznych, ale główną różnicą jest tu fakt, że namagnesowanie
jest odwrotnie proporcjonalne do różnicy pomiędzy T i Tc, a nie do samej temperatury
bezwzględnej. Pominięcie oddziaływań wzajemnych pomiędzy sąsiednimi atomami od-
powiada przyjęciu A = 0, co jak wynika z równania (36.39), odpowiada przyjęciu Tc = o.
Wówczas wyniki są takie same, jak te, które otrzymaliśmy w rozdz. 35.
Nasz obraz teoretyczny można porównać z danymi doświadczalnymi dla niklu. W do-
świadczeniach zaobserwowano, że własności ferromagnetyczne niklu znikają, gdy jego
temperatura przekracza 631° K. Porównajmy tę wielkość z temperaturą Tc, obliczoną
z równania (36.37). Pamiętając, że Mnas = uN mamy
T
c ke0c2
Biorąc gęstość i ciężar atomowy niklu otrzymujemy
N = 9,1 • 1028 m-3.
Podstawiając /z z równania (36.28) i przyjmując A = | otrzymujemy
Tc = 0,24°K.
Mamy rozbieżność o czynnik równy około 2600! Nasza teoria ferromagnetyzmu zupełnie
upada.
Można próbować „podreperować” naszą teorię, tak jak zrobił Weiss, mówiąc, że
z pewnych nieznanych powodów 2 nie jest równe ale |-2600, czyli około 900. Okazuje
się, że podobne wartości dostaje się dla innych substancji, np. dla żelaza. Aby zobaczyć,
co to oznacza, powróćmy do równania (36.36). Widać, że duża wartość 2 oznacza, że Ba —
pole lokalne działające na atom, jest wielokrotnie większe, niż można by się tego spodzie-
wać. W istocie, przyjmując H = B—Mleoc2 mamy
£0<?2
Zgodnie z naszą koncepcją pierwotną, przy 2 = |, namagnesowanie lokalne M zmniejsza
efektywne pole Ba o wartość — j(Af/e0)- Gdyby nawet więc nasz model otworu kulistego
nie był bardzo dobry, to i tak należałoby się spodziewać jakiegoś zmniejszenia pola elek-
trycznego. Zamiast więc próbować tłumaczyć zjawisko ferromagnetyzmu, musimy sobie
wyobrazić, że namagnesowanie pola wielokrotnie zwiększa pole lokalne — gdzieś rzędu ty-
siąc lub jeszcze więcej razy. Wydaje się, że nie ma żadnego sensownego sposobu na wytwo-
rzenie tak olbrzymich pól działających na atom, a nawet pól o właściwym znaku! Widać
jasno, że nasza „magnetyczna” teoria ferromagnetyzmu jest jakimś przygnębiającym nie-
porozumieniem. Musimy zatem dojść do wniosku, że ferromagnetyzm ma coś współ'
nego z jakimś niemagnetycznym oddziaływaniem pomiędzy obracającymi się wokół oSI
elektronami w atomach z sobą sąsiadujących. Te oddziaływania muszą wywołać wśród
pobliskich spinów silną tendencję do ułożenia się wzdłuż jednego kierunku. Przekonamy
się później, że ma to coś wspólnego z mechaniką kwantową i zasadą wykluczania Paulieg0-
i
36-6. NAMAGNESOWANIE SPONTANICZNE
305
36.15. Namagnesowanie spontaniczne jako funk-
cja temperatury (dla niklu)
Na koniec zobaczmy, co się dzieje
w niskich temperaturach — dla T < Tc.
Widzieliśmy, że nastąpi tam namagneso-
wanie spontaniczne — nawet przy H =
= 0 — określone przez punkt przecięcia
się krzywych a i b2 z rys. 36.14. Jeżeli obli-
czy się namagnesowanie M dla różnych
temperatur — a więc zmieniając nachyle-
nie prostej b2 — otrzyma się krzywą teore-
tyczną, pokazaną na rys. 36.15. Ta krzywa
będzie taka sama dla wszystkich substancji
ferromagnetycznych, dla których moment
magnetyczny pochodzi od jednego elek-
tronu. Krzywe dla innych substancji róż-
nią się od niej tylko w niewielkim stopniu.
W granicy dla T dążącego do zera bez-
względnego, Afdąży do Afnas.Ze wzrostem
temperatury namagnesowanie maleje, dochodząc do zera w temperaturze Curie. Punkty
na rys. 36.15 są wynikami doświadczalnymi dla niklu. Pasują onecałkiem dobrze do krzy-
wej teoretycznej. Chociaż więc nawet nie rozumiemy podstawowego mechanizmu zja-
wiska, to wydaje się, że ogólne cechy naszej teorii są poprawne.
Na koniec, w naszych próbach zrozumienia ferromagnetyzmu napotykamy jeszcze
jedną przykrą rozbieżność. Znaleźliśmy, że powyżej pewnej temperatury ośrodek powi-
nien się zachowywać tak, jak substancja paramagnetyczna, z namagnesowaniem M pro-
porcjonalnym do pola H (lub B), a poniżej tej temperatury ośrodek powinien się spon-
tanicznie namagnesować. Ale to się nie zgadza z wynikami naszych pomiarów dla krzy-
wej namagnesowania żelaza. Żelazo stało się trwale namagnesowane dopiero po tym,
jak je „namagnesowaliśmy”. A zgodnie z naszymi dopiero co omówionymi koncepcjami
powinno się ono było samo namagnesować! Coś tu jest nie w porządku. No cóż, okazuje
się, że jeżeli się przyjrzeć dostatecznie małemu kryształowi żelaza lub niklu, to się okaże,
że jest on rzeczywiście całkowicie namagnesowany! Ale w dużych kawałkach żelaza jest
wiele takich małych obszarów czyli „domen”, które są namagnesowane w różnych kierun-
kach, tak że na dużą skalę średnie namagnesowanie jest równe zeru. Jednakże w każdej
małej domenie żelazo ma „wbudowane” namagnesowanie, z M prawie równym
Konsekwencją tej struktury domenowej jest fakt, że własności makroskopowe dużych ka-
wałków substancji różnią się całkowicie od własności mikroskopowych, którymi się w rze-
czywistości zajmowaliśmy. W następnym rozdziale opowiemy o występujących w praktyce
własnościach obiektów makroskopowych, utworzonych z substancji magnetycznych.
20 — Wykłady z fizyki
37
' substancje magnetyczne
i
i
37-1. Istota ferromagnetyzmu*'
W rozdziale tym omówimy zachowanie się i osobliwości substancji ferromagnetycz-
nych i innych dziwnych substancji magnetycznych. Zanim jednak przejdziemy do tego
ostatniego tematu, przypomnimy pokrótce niektóre problemy dotyczące ogólnej teorii
momentów magnetycznych, które poznaliśmy w poprzednim rozdziale.
Przede wszystkim, wyobrażamy sobie, że za magnetyzm są odpowiedzialne prądy ato-
mowe wewnątrz substancji, a następnie prądy te opisujemy przy pomocy objętościowej
gęstości prądu jmag = VxM. Należy jednak podkreślić, że powyższy obraz nie przed-
stawia rzeczywistej sytuacji. Kiedy namagnesowanie jest stałe, prądy w rzeczywistości nie
znoszą się dokładnie, wirujące bowiem prądy elektronu w jakimś atomie i wirujące prądy
elektronu w innym atomie nie nakładają się w taki sposób, że ich suma jest dokładnie
równa zeru. Nawet wewnątrz pojedynczego atomu rozkład magnetyzmu nie jest „gładki”.
Tak na przykład w atomie żelaza namagnesowanie jest rozłożone w mniej lub bardziej
kulistej powłoce, oddalonej nie za blisko, ale i nie za daleko od jądra. Tak więc, magne-
tyzm materii jest rzeczą bardzo skomplikowaną w swych szczegółach; jest on bardzo nie-
regularny. Jesteśmy jednak zmuszeni pominąć teraz te szczegóły prowadzące do złożoności
zjawisk i opisać zjawiska z makroskopowego, „uśrednionego” punktu widzenia. Wówczas
prawdą jest, że w jakimś obszarze wewnętrznym średni prąd przypadający na jakąś skoń-
czoną powierzchnię, która jest duża w porównaniu z atomem, jest równy zeru, gdy M = 0.
Tak więc to, co będziemy rozumieć przez takie pojęcia jak namagnesowanie przypadające
na jednostkę objętości, czy przez gęstość prądu jmag i inne, na rozważanym przez nas obec-
ł) Patrz C. Kittel, Wstęp do fizyki ciała stałego, PWN, Warszawa 1970 (thim. z jęz. angielskiego).
(Przyp. red. wyd. polskiego.)
37-1. ISTOTA FERROMAGNETYZMU
307
| nie poziomie będzie oznaczało średnią po obszarze, który jest duży w porównaniu z ob-
! szarem przestrzeni zajmowanym przez pojedynczy atom.
W poprzednim rozdziale odkryliśmy także, że substancja ferromagnetyczna ma nastę-
pującą interesującą własność: powyżej pewnej temperatury substancja ta nie jest silnie
magnetyczna, podczas gdy poniżej tej temperatury substancja staje się magnetyczna.
Można to łatwo zademonstrować. W temperaturze pokojowej kawałek drutu niklo-
wego jest przyciągany przez magnes. Jeżeli jednak drut ten podgrzewać nad palnikiem
( gazowym powyżej temperatury Curie dla niklu, drut staje się niemagnetyczny i nie jest
, już przyciągany, nawet jeżeli go umieścić bardzo blisko magnesu. Jeżeliby pozostawić
\ ten kawałek niklu w pobliżu magnesu i pozwolić mu się oziębić, to w pewnej chwili jego
temperatura spadnie poniżej temperatury krytycznej i nikiel zostanie nagle znowu przy-
ciągnięty przez magnes!
Ogólna teoria ferromagnetyzmu, którą się będziemy posługiwać, zakłada, że za na-
magnesowanie odpowiedzialny jest spin elektronu. Elektron ma spin połówkowy i niesie
z sobą moment magnetyczny równy jednemu magnetonowi Bohra; /z = /zB = qeTi]2m.
Spin elektronu może być skierowany albo „w górę”, albo „w dół”. Ponieważ ładunek
elektronu jest ujemny, to gdy spin elektronu jest skierowany „w górę”, elektron ma ujemny
moment magnetyczny, a kiedy jego spin jest skierowany ,,w dół” — moment magnetyczny
dodatni. Na podstawie naszych zwykłych umów moment /z elektronu jest liczbą ujemną.
Stwierdziliśmy, że energia orientacji dipola magnetycznego w danym przyłożonym polu B
jest równa — (i-B, ale energia elektronów obracających się wokół osi zależy również od
uporządkowania sąsiednich spinów. Jeżeli w żelazie moment magnetyczny jakiegoś atomu
jest skierowany ,,w górę”, to istnieje bardzo silna tendencja, że moment sąsiadującego
z nim atomu będzie także zwrócony „w górę”. Właśnie dzięki temu żelazo, kobalt i nikiel
są tak silnie magnetyczne — wszystkie momenty magnetyczne chcą być do siebie równo-
ległe i mieć ten sam zwrot. Pierwsze pytanie, jakie się w związku z tym nasuwa: dlaczego
tak jest?
Wkrótce po rozwinięciu się mechaniki kwantowej zauważono., że istnieje bardzo silna
siła pozorna — nie jest to żadna siła magnetyczna ani jakiś inny rodzaj siły rżeczywistej,
lecz tylko pewna siła pozorna, starająca się ułożyć spiny sąsiednich elektronów przeciw-
nie względem siebie. Te siły są ściśle związane z chemicznymi siłami walencyjnymi. Jest
taka zasada w mechanice kwantowej, nazywana zasadą wykluczania, która mówi, że dwa
elektrony nie mogą zajmować dokładnie takiego samego stanu, a więc nie mogą one być
w takich samych warunkach, jeżeli chodzi o lokalizację i orientację spinu*’. Jeżeli na
przykład oba elektrony znajdują się w tym samym punkcie, to muszą mieć spiny ułożone
przeciwnie. Jeżeli zatem w przestrzeni pomiędzy atomami istnieje taki obszar, gdzie elek-
trony chętnie się skupiają (tak jak w wiązaniu chemicznym), i chcemy wprowadzić jeszcze
jeden elektron tam, gdzie już się znajduje jakiś elektron, to można to tylko zrobić tak,
aby spin tego drugiego elektronu był skierowany przeciwnie do spinu elektronu pierwszego.
Zgodne co do zwrotu ułożenie spinów jest niezgodne z tą zasadą, chyba że elektrony są od
*’ Będzie o tym mowa w t. III Wykładów z fizyki (przekład polski w przygotowaniu). (Przyp.
red. wydania polskiego)
308
37. SUBSTANCJE MAGNETYCZNE
siebie oddalone. W wyniku tego para elektronów położonych blisko siebie, o zgodnie
skierowanych spinach, ma o wiele więcej energii niż para elektronów o spinach skierowa-
nych przeciwnie; wypadkowy efekt jest taki, jak gdyby istniała pewna siła próbująca obró-
cić jeden ze spinów o 180°. Czasem tę siłę obracającą spin nazywamy silą wymienną, ale
wówczas cała sprawa wygląda jeszcze bardziej tajemniczo -- nie jest to zbyt dobre określe-
nie. Dążenie elektronów do układania swych spinów w kierunkach przeciwnych wynika
po prostu z zasady wykluczania. W istocie, stanowi to wytłumaczenie braku magnetyzmu
we wszystkich prawie substancjach! Spiny elektronów swobodnych, znajdujących się na
zewnątrz atomów, dążą bardzo silnie do wzajemnego „kasowania się”, ustawiając się
w kierunkach przeciwnych. Problem polega na wyjaśnieniu, dlaczego dla takich substancji
jak żelazo sytuacja jest akurat przeciwna do tej, której należałoby się spodziewać.
Ten domniemany efekt uporządkowania uwzględniliśmy dodając odpowiedni wyraz do
równania energii i twierdząc, że jeżeli „magnesiki” sąsiadujących z sobą elektronów mają
pewne średnie namagnesowanie M, to wówczas moment magnetyczny elektronu dąży sil-
nie do ustawienia się w tym kierunku, który jest kierunkiem średniego namagnesowania
atomów sąsiednich. Tak więc, dla dwóch możliwych,orientacji spinu*’ będą spełnione
następujące związki:
I XM \
energia dla spinu „w górę” = Ą-/J, I HĄ-— |,
\ £oC /
, (37.1)
/ IM \
' energia dla spinu „w dół” = — /z | HĄ--— I.
\ eo C2 I
Kiedy stało się już rzeczą jasną, że mechanika kwantowa może dostarczyć olbrzymiej
siły związanej z orientacją spinu — nawet gdyby znak tej siły miał być zły — wysunięto
hipotezę, że ferromagnetyzm mógłby znaleźć swój początek w tej to właśnie sile, a uwzględ-
nienie złożonej sytuacji w żelazie i dużej liczby elektronów, od których przyczynek jest
istotny, powinno pozwolić na otrzymanie poprawnego znaku energii oddziaływania wza-
jemnego. Od czasu kiedy o tym pomyślano — mniej więcej od roku 1927, kiedy to zaczęto
rozumieć mechanikę kwantową — dokonywano różnych oszacowań i przybliżonych obli-
czeń próbując otrzymać, jaka wartość 2 jest przewidywana przez teorię. Najnowsze obli-
czenia energii oddziaływania pomiędzy dwoma spinami elektronów w żelazie — przy
założeniu, że jest to bezpośrednie oddziaływanie w sąsiadujących ze sobą atomach — dają
ciągle zły znak. Opisując obecnie to zjawisko mówi się, że powodem tej rozbieżności jest
znowu ta „złożoność” sytuacji i że istnieje nadzieja, że ktoś następny, kto dokona obli-
czeń dla bardziej złożonej sytuacji, otrzyma już poprawną odpowiedź!
Istnieje przypuszczenie, że spin „w górę” jednego z elektronów w powłoce wewnętrznej,
właśnie tego elektronu, który „tworzy” magnetyzm, dąży do ustawienia spinów elektro-
nów przewodnictwa, a więc elektronów przepływających na zewnątrz atomu, w kierunku
przeciwnym. Możemy się spodziewać, że tak właśnie się stanie, gdyż elektrony przewod-
♦’ Rówania te zapisujemy posługując się polem H = B—Meoc2, a nie polem B, aby pozostać w zgo-
dzie z tym, co zostało zrobione w poprzednim rozdziale. Można by to zapisać inaczej: U = ±/x5o =
= ±/<(B+A'Af/eoc2), gdzie A' = A —1. Ale to jest takie samo wyrażenie jak (37.1).
37-1. ISTOTA FERROMAGNETYZMU
309
nictwa przebywają w tych samych obszarach, co elektrony „magnetyczne”. Ponieważ
elektrony te poruszają się we wszystkich kierunkach, to mogą one przenosić z sobą nakaz
przeciwnego ustawiania się spinów sąsiadujących z sobą elektronów na następny atom;
a więc jeden elektron „magnetyczny” próbuje zmusić elektrony przewodnictwa do usta-
wienia ich spinów w kierunku przeciwnym do kierunku swego spinu, a następnie taki
elektron przewodnictwa ustawia przeciwnie do siebie następny elektron „magnetyczny”.
To podwójne oddziaływanie jest równoważne oddziaływaniu, które próbuje ułożyć w tym
samym kierunku spiny dwóch elektronów „magnetycznych”. Innymi słowy, dążenie elektro-
nów „magnetycznych” do ustawiania swych spinów w jednym i tym samym kierunku jest
dziełem pewnego „pośrednika” — elektronu przewodnictwa — który w pewnym stopniu
ustawia się antyrównolegle do obu elektronów „magnetycznych”. Ten mechanizm
nie wymaga, aby wszystkie elektrony przewodnictwa były przewrócone „do góry nogami”.
Wystarczy, aby było tylko trochę więcej elektronów przewodnictwa ze spinem w dół,
aby powstała pewna nadwyżka elektronów „magnetycznych” ze spinem w górę. W taki
właśnie mechanizm ferromagnetyzmu wierzą obecnie ci, którzy zajmowali się teoretycz-
nymi rozwiązaniami powstałych tu problemów. Ale należy podkreślić, że jak dotąd nikt
jeszcze nie obliczył wielkości f. opierając się jedynie na fakcie, że substancja ma liczbę
porządkową 26 w układzie okresowym pierwiastków. Krótko mówiąc — zagadnienia tego
dokładnie jeszcze nie rozumiemy.
Będziemy teraz dalej rozwijać naszą teorię, a później powrócimy do omówienia pew-
nego błędu, wynikłego ze sposobu, w jaki ta teoria została zbudowana. Jeżeli moment
magnetyczny pewnego elektronu jest skierowany „w górę”, to energia pochodzi zarówno
od pola zewnętrznego, jak i od dążenia spinów do ustawienia się równolegle do siebie.
Ponieważ energia jest mniejsza, gdy spiny są równoległe, to czasem się mówi, że efekt ten
zachodzi na skutek pewnego „efektywnego pola wewnętrznego”. Pamiętajmy jednak, że
za efekt ten nie jest odpowiedzialna jakaś prawdziwa siła magnetyczna', jest to pewne
oddziaływanie wzajemne, które jest bardziej złożone. W każdym razie, przyjmujemy
wzory (37.1) za wzory na energię dwóch stanów spinowych elektronu „magnetycznego”.
W temperaturze T względne prawdopodobieństwo tych dwóch stanów jest proporcjonalne
do e~energia,<:7’, co można zapisać jako e±JC, z x = (j.{H+XMIe0c2)lkT. Jeżeli więc obliczy-
libyśmy średnią wartość momentu magnetycznego, to stwierdzilibyśmy (tak jak w poprzed-
nim rozdziale), że jest ona równa
M = Np. tghx. (37.2)
Teraz chcielibyśmy obliczyć energię wewnętrzną substancji. Zauważmy, że energia
elektronu jest dokładnie proporcjonalna do jego momentu magnetycznego, tak że obli-
czenia średniego momentu i obliczenia średniej energii są takie same — z tym, że w rów-
naniu (37.2) zamiast /z należałoby napisać —uB, co jest równe — p{H+).MIe0c2}. Średnia
energia jest zatem równa
/ ,
<v\ = -A7/UZ+ —r tghx.
\ «oC /
Ale to nie jest całkiem poprawny wzór. Wyraz ŻAf/e0c2 opisuje oddziaływanie wszyst-
310
37. SUBSTANCJE MAGNETYCZNE
kich możliwych par atomów, a musimy pamiętać, by każdą parę policzyć tylko jeden raz.
(Kiedy rozważamy energię jednego elektronu w polu pozostałych, a następnie energię jn.
nego elektronu w polu pozostałych, to część tej pierwszej energii liczymy dwa razy!) Tak
więc należy podzielić wyraz dotyczący wzajemnego oddziaływania przez dwa i wówczas
nasz wzór na energię przyjmie postać:
<.U\=-Np\HĄ
AM \
2eoc2/
tghx.
(37.3)
W poprzednim rozdziale odkryliśmy pewną interesującą rzecz — że poniżej pewnej
temperatury dla każdego materiału istnieje pewne rozwiązanie równań, w którym moment
magnetyczny nie jest równy zeru, nawet gdy nie ma zewnętrznego pola magnesującego.
Jeżeli w równaniu (37.2) przyjmiemy H — 0, to znajdziemy
(37.4)
gdzie ń/nas = A/z i Tc~ p,AMnJke0c2. Gdy rozwiążemy to równanie (graficznie lub
w jakiś inny sposób), stwierdzimy, że stosunek Af/Afnas jako funkcja TjTc jest taką krzywą
jak ta, którą na rys. 37.1 oznaczono „teoria kwantowa”. Krzywa przerywana, oznaczona
„kobalt, nikiel” pokazuje wyniki doświadczalne dla kryształów tych pierwiastków. Teoria
i doświadczenie zgadzają się z sobą dość dobrze. Na rysunku przedstawiono także wynik
37.1. Namagnesowanie spontaniczne (H — 0) kryształów ferromagnetycznych jako funkcja temperatury
37-2. ISTOTA FERROMAGNETYZMU
311
teorii klasycznej, dla której obliczenia przeprowadzono przy założeniu, że atomowe
momenty magnetyczne mogą mieć wszystkie możliwe orientacje w przestrzeni. Widać,
2e założenie to prowadzi do wyniku, który nawet nie jest zbliżony do faktów doświad-
czalnych.
Nawet teoria kwantowa nie opisuje dostatecznie dokładnie obserwowanych zjawisk,
zarówno dla wysokich, jak i dla niskich temperatur. Powodem tej rozbieżności jest jedno,
dość nieporządne założenie naszej teorii: założyliśmy, że energia atomu zależy od śred-
niego namagnesowania atomów z nim sąsiadujących. Innymi słowy, każdy z tych sąsia-
dujących atomów, który ma moment magnetyczny w tym samym kierunku, co nasz wy-
różniony atom (będziemy mówili o tych atomach — atomy skierowane „w górę”)*’,
będzie dawał pewien przyczynek do energii pochodzący od tego kwantowomechanicz-
nego zjawiska uporządkowania. Ale ile jest tych atomów skierowanych „w górę”? Średnio
biorąc, można by to zmierzyć, mierząc średnie namagnesowanie M, ale tak będzie tylko
w średniej. Jakiś szczególny atom może się znaleźć gdzieś wśród sąsiadów, skierowanych
tylko „w górę”. Wówczas jego energia będzie większa od średniej. Inny zaś atom mógłby
znaleźć część sąsiadów skierowanych „w dół” — obie te części mogą być na przykład sobie
równe i wówczas atom ten nie miałby w energii wyrazu wzajemnego oddziaływania, i tak
dalej. Powinno się użyć tutaj średniej jakiegoś innego, bardziej skomplikowanego typu,
ponieważ atomy będące w różnych miejscach mają różne otoczenia, a liczby sąsiadów skie-
rowanych „w górę” i ,,w dół” są dla różnych atomów różne. Zamiast po prostu brać jeden
atom, poddany jakiemuś uśrednionemu oddziaływaniu, powinno się wziąć każdy atom
w jego sytuacji rzeczywistej, obliczyć jego energię i znaleźć energię średnią. Ale jak się prze-
konać, ile sąsiadów jest skierowanych ,,w górę”, a ile ,,w dół”? Oczywiście, jest to właśnie
to, co próbujemy obliczyć — liczba atomów skierowanych ,,w górę” i „w dół” — tak że
otrzymujemy bardzo złożone i zawikłane zagadnienie korelacji, zagadnienie, którego nikt
dotąd nie rozwiązał. Jest to szalenie ciekawe i intrygujące zagadnienie, na którego temat
już od lat wypowiadało się wielu wielkich fizyków, ale nawet oni nie potrafili go w zupeł-
ności rozwiązać.
Okazuje się jednak, że dla niskich temperatur, kiedy większość atomowych momentów
magnetycznych jest skierowana „w górę”, a tylko kilka ,,w dół”, zagadnienie nasze można
łatwo rozwiązać; a dla wysokich temperatur, dużo powyżej temperatury Curie Tc, kiedy
to prawie wszystkie momenty magnetyczne ustawione są na chybił trafił, też można łatwo
znaleźć odpowiedź. Często można łatwo obliczyć małe odchylenia od jakiejś prostej, wy-
idealizowanej sytuacji, tak więc można zrozumieć, dlaczego dla niskiej temperatury na-
stępują odchylenia od prostej teorii. Z punktu widzenia fizyki można zrozumieć, że ze
względów statystycznych namagnesowanie powinno „zanikać” w wysokich tempera-
turach. Ale to, co się dzieje w pobliżu punktu Curie, nigdy nie zostało dokładnie zba-
dane na drodze teoretycznej. Jest to interesujący problem do opracowania dla kogoś, kto
szuka jakiegoś problemu, który nigdy nie był rozwiązany.
*’ Oczywiście, słowo „skierowane” odnosi się nie tyle do atomów, co do ich momentów magnetycz-
nych. (Przyp. tłum.)
312
37. SUBSTANCJE MAGNETYCZNE
37.2. Energia na jednostkę objętości i ciepło
właściwe kryształu ferromagnetycznego
37*2. Własności termodynamiczne
W poprzednim rozdziale położyliśmy pod-
walmy niezbędne do otrzymania na drodze
teoretycznej własności termodynamicznych
substancji ferromagnetycznych. Własności te
związane są naturalnie z energią wewnętrzną
kryształu, która zawiera w sobie człon od-
powiedzialny za oddziaływania różnych spi-
nów, dane przez równanie (37.3). Dla energii
namagnesowania spontanicznego poniżej pun-
ktu Curie można w równaniu (37.3) przyjąć
H = 0 i zauważając, że tgh x = Af/AfMS, zna-
leźć, że średnia energia jest proporcjonalna
do M2:
N/jAM2
2eoc2Mm
(37.5)
Jeżeli teraz zrobimy wykres energii pocho-
dzącej od magnetyzmu jako funkcji tempera-
tury, to otrzymamy krzywą taką, jak na rys.
37.2a, która jest wykresem funkcji, równej
ujemnemu kwadratowi funkcji opisanej krzy-
wą z rys. 37.1. Jeżeli następnie zmierzylibyśmy
ciepło właściwe naszej substancji, to otrzyma-
libyśmy krzywą będącą wykresem pochodnej
funkcji opisanej wykresem 37.2a. Jest ona po-
kazana na rys. 37.2b. Krzywa ta rośnie powoli
wraz ze wzrostem temperatury, ale dla T =
— Tc spada raptownie do zera. Powodem tego
ostrego spadku, który następuje dokładnie
w punkcie Curie, jest zmiana nachylenia krzy-
_ wej energii magnetycznej (rys. 37.2a). A za-
tem nie przeprowadzając żadnych pomiarów
magnetycznych można by odkryć to, co dzieje
się wewnątrz żelaza lub niklu, mierząc włas-
ności termodynamiczne tych substancji. Je*
dnak zarówno doświadczenie, jak i ulepszona
teoria (uwzględniająca fluktuacje) sugerują,
że ta nieskomplikowana krzywa nie odzwier-
ciedla prawdziwej sytuacji, która jest w rzeczy-
wistości bardziej złożona. Prawdziwa krzywa
37-2. WŁASNOŚCI TERMODYNAMICZNE
313
ma wyżej położone maksimum i spada do zera nieco wolniej. Nawet jeżeli temperatura jest
dostatecznie wysoka, aby — średnio biorąc — spiny się ułożyły zupełnie przypadkowo,
to i tak będą pewne obszary lokalne, w których istnieje pewna polaryzacja i w tych obsza-
rach spiny będą miały trochę dodatkowej energii oddziaływania wzajemnego, która zanika
powoli z dalszym wzrostem temperatury, prowadzącym do coraz to bardziej przypadko-
wego rozłożenia spinów. Dlatego też krzywa rzeczywista wygląda tak jak krzywa na
rys. 37.2c. Jednym z dążeń dzisiejszej fizyki teoretycznej jest znalezienie dokładnego opisu
teoretycznego sposobu zachowania się ciepła właściwego w pobliżu punktu Curie; jest
to bardzo ciekawe zagadnienie, które jeszcze nie zostało rozwiązane. Zagadnienie to jest
naturalnie bardzo ściśle związane z kształtem krzywej namagnesowania w tym samym
obszarze.
Chcemy teraz opisać pewne doświadczenia, już nie termodynamiczne, które pokazują,
że w naszej interpretacji magnetyzmu jest jednak coś słusznego. Kiedy namagnesuje się do
nasycenia substancję w dostatecznie niskiej temperaturze, wtedy namagnesowanie M jest
bardzo bliskie Maas, czyli prawie wszystkie spiny są równoległe, tak samo jak i momenty
magnetyczne. Można to sprawdzić doświadczalnie. Przypuśćmy, że zawiesimy magnes
sztabkowy na cienkiej nici, a następnie otoczymy go cewką, tak że będziemy mogli zmie-
niać zwrot pola magnetycznego nie dotykając magnesu, ani nie przykładając do niego
żadnego momentu sił. Jest to bardzo trudne doświadczenie, ponieważ siły magnetyczne
są tak olbrzymie, że każda nieregularność lub każda niedoskonałość w żelazie wytworzy
przypadkowy moment siły. Doświadczenie jednak wykonano przy zachowaniu wszelkich
środków ostrożności, co pozwoliło na zmniejszenie do minimum takich przypadkowo się
pojawiających momentów sił. Przy pojnocy pola magnetycznego cewki, otaczającej sztab-
kę, obracamy naraz „do góry nogami” wszystkie atomowe momenty magnetyczne.
Zmieniamy przy tym wszystkie spiny, które były skierowane „w górę” na spiny „w dół”
(patrz rys. 37.3). Jeżeli moment pędu ma być zachowany, to wtedy gdy wszystkie spiny się
obrócą „do góry nogami”, reszta sztabki musi
uzyskać jakąś przeciwną zmianę momentu pę-
du, a więc cały magnes zacznie się obracać.
I rzeczywiście, jeżeli przeprowadzimy to do-
świadczenie, to zaobserwujemy niewielkie
obrócenie się magnesu. Można zmierzyć całko-
wity moment pędu przekazany całemu magne-
sowi; jest on równy N razy h, gdzie h jest zmia-
ną momentu pędu spowodowaną zmianą kie-
runku każdego spinu. Stosunek momentu pę-
du do momentu magnetycznego mierzony w
taki właśnie sposób równy jest z dokładnością
do 10 °/0 wynikowi naszych obliczeń. W rzeczy-
wistości nasze obliczenia zakładają, że atomo-
We momenty magnetyczne pochodzą tylko od
spinów elektronów, tymczasem w większości
sytuacji występuje jeszcze pewien ruch orbita-
37.3. Gdy kierunek namagnesowania pręta
zmieni się na przeciwny, pręt uzyskuje pewną
prędkość kątową
314
37. SUBSTANCJE MAGNETYCZNE
lny. Ten ruch orbitalny natrafia na przeszkodę ze strony sieci krystalicznej i ze względu
na to jego udział w magnetyzmie wynosi tylko kilka procentów. Pole magnetyczne, przy
którym następuje nasycenie, wynosi — jeżeli przyjmie się, że Mnas = Np oraz że gęstość
żelaza =-7,9 g/cm 3,a moment magnetyczny obracającego się wokół osi elektronu jest równy p
— około 20000 Gs. Doświadczenie tymczasem daje pole w przybliżeniu równe 21500 Gs.
Istnieje tu typowy błąd — 5 lub 10% — pochodzący od pominięcia przyczynków od orbital-
nych momentów magnetycznych, które w naszym opisie nie zostały uwzględnione; ta niewiel-
ka więc rozbieżność pomiędzy teorią a doświadczeniem „giromagnetycznym” jest całkowicie
zrozumiała. <
37-3. Krzywa histerezy
Nasz teoretyczny opis doprowadził nas do wniosku, że substancja ferromagnetyczna
powinna się poniżej pewnej temperatury namagnesować spontanicznie, tak że jej całe pole
magnetyczne powinno się „uporządkować” wzdłuż jednego kierunku. Ale wiemy, że
powyższe twierdzenie nie jest prawdziwe dla zwykłego kawałka nienamagnesowanego
żelaza. Dlaczego żelazo jako całość nie jest namagnesowane? Można to wyjaśnić przy po-
mocy rys. 37.4. Przypuśćmy, że całe żelazo miałoby postać dużego pojedynczego kryształu,
o kształcie takim, jaki pokazano na rys. 37.4a, i że kryształ ten byłby cały spontanicznie
namagnesowany w jednym kierunku. Byłoby wówczas całkiem spore, zewnętrzne pole
magnetyczne, które miałoby wiele energii. Tę energię pola można zmniejszyć, jeżeli się
sprawi, że jedna połowa naszego żelaznego klocka będzie namagnesowana „w górę”,
a druga „w dół”, tak jak na rys. 37.4b. Wówczas oczywiście pola na zewnątrz żelaza roz-
ciągałyby się na mniejszych obszarach przestrzennych, a więc byłoby tam mniej energii.
Ale uwaga! W warstwie pomiędzy tymi dwoma obszarami mamy elektrony o spinach
w górę, przylegające do elektronów ze spinem w dół. Ale ferromagnetyzm pojawia się
tylko w tych substancjach, w których energia ulega zmniejszeniu, jeżeli spiny elektronów
są równolegle, a nie antyrównoległe. A zatem dodaliśmy trochę dodatkowej energii wzdłuż
37.4. Powstawanie domen w pojedynczym krysztale żelaza (C. Kittel, Introduction to Solid State
Physics, John Wiley and Sons, New York 1956)
37-3. KRZYWA HISTEREZY
315
i, linii przerywanej na rys. 37.4b; energia ta — to energia ściany lub energia bariery. Obszar
i mający tylko jeden kierunek namagnesowania nazywamy domeną. Na powierzchni granicz-
I nej — czyli na ścianie pomiędzy dwiema domenami, w której sąsiedztwie znajdują się atomy
i należące do różnych domen, a więc o spinach ułożonych w różnych kierunkach — mamy
pewną energię na jednostkę powierzchni: energię bariery. Opisaliśmy to tak, jak gdyby dwa
przyległe atomy miały spiny skierowane dokładnie przeciwnie, ale okazało się, że przy-
i roda tak wszystko dopasowuje, że przejście to jest bardziej stopniowe. Ale nie musimy
i się tu martwić o takie subtelności.
ł Powstaje teraz pytanie: kiedy łatwiej, a kiedy trudniej utworzyć taką ścianę? Okazuje
t się, że zależy to od rozmiaru domen. Przypuśćmy, że powiększylibyśmy każdy wymiar
Ś naszego klocka dwa razy. Wówczas objętość obszaru przestrzennego na zewnątrz klocka
I wypełnionego polem magnetycznym o pewnym ustalonym natężeniu byłaby osiem razy
większa, a tym samym energia w polu magnetycznym, jako proporcjonalna do objętości,
byłaby też osiem razy większa. Ale pole powierzchni odgraniczającej poszczególne domeny,
które określa energię bariery, byłoby tylko cztery razy większe. Dlatego też, jeżeli kawałek
żelaza jest dostatecznie duży, to jego rozszczepienie na więcej domen jest energetycznie
bardziej opłacalne. Właśnie dlatego pojedyncze domeny mogą występować jedynie w bar-
dzo maleńkich kryształach. Każdy duży obiekt, którego rozmiar przekracza 0,01 mm,
będzie miał przynajmniej jedną ścianę domenową; a każdy zwykły obiekt „centymetrowy”
będzie rozszczepiony na wiele domen, tak jak to pokazano na rysunku. Rozszczepianie
na domeny będzie zachodziło aż do momentu, kiedy energia potrzebna na wstawienie jeszcze
jednej ściany domenowej zrówna się z energią traconą przez pole magnetyczne na zewnątrz
kryształu.
Okazuje się, że przyroda znalazła jeszcze jeden sposób na obniżanie energii: otóż pole
wcale nie musi się rozprzestrzeniać na zewnątrz kryształu, a można to uzyskać, jeżeli mały
trójkątny obszar będzie namagnesowany na boki, tak jak na rys. 37.4d*>. Wówczas przy
takim ustawieniu jak na rys. 37.4d widać, że nie ma pola zewnętrznego, a zamiast tego
jest tylko trochę więcej ścian domen.
Ale napotykamy tu nowe zagadnienie. Okazuje się, że kiedy pojedynczy kryształ żelaza
jest namagnesowany, to jego długość w kierunku namagnesowania ulega zmianie, tak że
„doskonały” sześcian, który ma kierunek namagnesowania np. „do góry” przestaje być
już sześcianem doskonałym. Wymiar „pionowy” będzie się bowiem różnił od wymiaru
„poziomego”. Zjawisko to nazywamy magnetostrykcją. Z powodu tych zmian geometrycz-
nych małe trójkątne kawałki z rys. 37.4d już nie będą „pasować” do dostępnych im „otwo-
rów” — kryształ w jednym kierunku będzie za długi, a w drugim za krótki. Oczywiście,
w rzeczywistości te kawałki pasują, ale tylko dlatego, że są tam wciśnięte, co prowadzi do
Powstania pewnych naprężeń mechanicznych. Takie więc ułożenie prowadzi także do ••
•• Można by zapytać: w jaki sposób spiny, które muszą być skierowane tylko „w górę” lub „w dół”,
°iogą być także skierowane „na boki”? Jest to słuszne pytanie, ale na razie nie będziemy się o nie martwić.
Po prostu przyjmiemy punkt widzenia fizyki klasycznej i będziemy myśleć o atomowych „magnesikach”
Jak o klasycznych dipolach, które także mogą być spolaryzowane „bocznie”. Mechanika kwantowa wy-
^laga niemałej biegłości, aby zrozumieć, jak pewne obiekty mogą być zarówno skwantowane „góra-dół”
Jak i „prawo-lewo” i to w tym samym czasie.
316
37. SUBSTANCJE MAGNETYCZNE
37.5. Pole magnesujące
H, tworzące pewien kąt
z osią kryształu, będzie
stopniowo zmieniać kie-
runek namagnesowania
nie zmieniając przy tym
jego wartości bezwzględ-
nej
pewnej dodatkowej energii. Dopiero bilans tych wszystkich energii określa ów skomplj.
kowany sposób, w jaki się w końcu ułożą domeny w kawałku nienamagnesowanego
żelaza.
Co się teraz stanie, kiedy włączymy jakieś zewnętrzne pole magnetyczne? Wybierzmy
prosty przypadek, biorąc kryształ, którego domeny wyglądają tak jak na rys. 37.4d. Je-
żeli przyłożymy pole magnetyczne, które ma kierunek „w górę”, to w jaki sposób kryształ
się namagnesuje? Przede wszystkim środkowa ściana domenowa może się przesunąć na
bok (na prawo), co prowadzi do zmniejszenia energii. Ściana się przesuwa tak, aby obszar
„w górę” był większy od obszaru „w dół”. Wówczas więcej elementarnych „magnesików”
będzie ułożonych zgodnie z kierunkiem pola, co spowoduje zmniejszenie się energii. A za-
tem dla kawałka żelaza w słabych polach — na początku procesu magnesowania — ściany
domen zaczynają się przesuwać i „wdzierają się” w obszary, które są namagnesowane
w kierunku przeciwnym do kierunku pola. Z dalszym wzrostem pola cały kryształ prze-
kształca się stopniowo w pojedynczą domenę, spolaryzowaną całą w jednym kierunku
za pomocą pola zewnętrznego. W silnym polu kryształ „lubi” być „ułożony” jako całość
w jednym kierunku, po prostu dlatego, że jego energia będzie
w przyłożonym polu zmniejszona, wtedy bowiem pole zewnę-
trzne samego kryształu nie ma już tak istotnego znaczenia.
A co się dzieje, jeżeli geometria nie jest tak prosta? Co się
dzieje, gdy osie kryształu i jego namagnesowanie spontaniczne
mają jeden kierunek, a przyłożone pole ma jakiś inny kieru-
nek, tworzący np. kąt 45° z kierunkiem Ml Można by po-
myśleć, że domeny tak się zmienią, że ich namagnesowanie
będzie równoległe do pola, a następnie, tak jak to się działo
w poprzednim przypadku, wszystkie te domeny przekształcą
się w jedną domenę. Ale żelazu niełatwo jest tego dokonać,
ponieważ energia potrzebna do namagnesowania kryształu za-
leży od kierunku namagnesowania względem osi kryształu. Sto-
sunkowo łatwo można namagnesować żelazo w kierunku
równoległym do którejś z osi kryształu, ale namagnesowanie
żelaza w jakimś innym kierunku, np. pod kątem 45° wzglę-
dem jednej z osi, wymaga więcej energii. Dlatego jeżeli przy-
łoży się pole magnetyczne w takim właśnie kierunku, począt-
kowo rosną te domeny, które są ułożone wzdłuż jednego
z wyróżnionych kierunków zbliżonych do kierunku przyłożo-
nego pola. Ten wzrost domen trwa dotąd, dopóki całe na-
magnesowanie „ułoży” się wzdłuż takiego kierunku. Na-
stępnie, przy znacznie silniejszych polach, wektor namagne-
sowania stopniowó się przesuwa, tak że staje się bardziej
równoległy do pola, jak to narysowano schematycznie na
rys. 37.5.
Na rysunku 37.6 pokazano kilka otrzymanych z doświad-
czenia krzywych namagnesowania pojedynczego kryształu
37-3. KRZYWA H1STEREZY
317
37.6. Składowa wektora M, równoległa do pola H, dla różnych kierunków pola H (względem osi kryszta*
łu) (F. Bitter, Introduction to Ferromagnetism, McGraw-Hill Book Co., Inc, 1937)
Żelaza. Aby zrozumieć, co te krzywe opisują, musimy najpierw wytłumaczyć zapis,
jakiego się używa do oznaczania kierunków w krysztale. Istnieje wiele sposobów,
jta które można rozciąć kryształ, tak aby przekrój był płaszczyzną utworzoną z ato-
inów. Wie o tym każdy, kto przejeżdżał koło jakiegoś sadu lub winnicy, że jeżeli
spojrzy się w jednym kierunku, widać szeregi drzew, a w innym znowu kierunku
widać inne szeregi drzew — widok wart oglądania. Podobnie kryształ ma pewne okre-
ślone rodziny płaszczyzn, na których się znajduje wiele atomów i płaszczyzny te- mają
taką oto ważną cechę (rozważamy kryształ regularny, aby uprościć sobie sprawę): jeżeli
wyznaczymy punkty przecięcia tych płaszczyzn z trzema osiami współrzędnych, przeko-
namy się, że odwrotności ich trzech odległości od początku układu mają się do siebie tak,
jak proste liczby całkowite. Te trzy liczby całkowite określają już położenie płaszczyzn.
Tak na przykład, na rys. 37.7a pokazano płaszczyznę równoległą do płaszczyzny yz.
Płaszczyznę tę nazywa się płaszczyzną [100] (czytamy: jeden, zero, zero); odwrotności
odległości jej punktów przecięcia się z osiami y i z są obie równe zeru. Kierunek prosto-
padły do takiej płaszczyzny (w krysztale regularnym) jest określony przez ten sam zbiór
liczb. Zapis ten można łatwo zrozumieć w przypadku kryształu regularnego, bo wówczas
wskaźniki [100] oznaczają wektor, który ma jednostkową składową w kierunku osi x,
a którego składowe w kierunkach osi y i z znikają. Kierunek [110] jest kierunkiem, który
tworzy kąt 45° zarówno z osią x, jak i z osią y, tak jak na rys. 37.7b, a kierunek [111]
Jest kierunkiem przekątnej sześcianu, tak jak na rys. 37.7c.
Powróćmy teraz do rys. 37.6; widzimy tam krzywe namagnesowania pojedynczego
kryształu żelaza dla różnych kierunków. Zauważmy po pierwsze, że dla maleńkich pól —
tak słabych, że trudno je nawet zauważyć na osi H — namagnesowanie rośnie wyjątko-
*o gwałtownie, do całkiem dużych wartości. Jeżeli pole ma kierunek [100], czyli jeden
z tych „sympatycznych” i łatwych kierunków namagnesowania, to krzywa pnie się w górę
318
37. SUBSTANCJE MAGNETYCZNE
37.7. Sposób oznaczania płaszczyzn kryształu
do dużej wartości, trochę się zakrzywia, a następnie następuje nasycenie. Powodem ta-
kiego zachowania się krzywej jest to, że domeny, które początkowo były w żelazie, zo-
stały bez żadnego trudu usunięte. Wystarczyło małe pole, aby ściany domen się przesu-
nęły i żeby pochłonęły wszystkie domeny „o złym kierunku”. Pojedyncze kryształy żelaza
obdarzone są ogromną przenikalnością (w sensie magnetycznym), o wiele bardziej niż
zwykłe żelazo polikrystaliczne. Kryształ doskonały magnesuje się wyjątkowo łatwo.
Dlaczego więc krzywa jest w ogóle zakrzywiona? Dlaczego nie przebiega ona prosto do
góry, aż do nasycenia? Nie potrafimy na to dać jakiejś pewnej odpowiedzi — może ktoś
zajmie się kiedyś tym problemem. Potrafimy zrozumieć dlaczego krzywa jest płaska dla
dużych pól. Kiedy cały blok żelaza jest już pojedynczą domeną, to dodatkowe pole ma-
gnetyczne nie może zwiększyć namagnesowania, które osiągnęło już wartość Mnas z wszyst-
kimi spinami elektronów ułożonymi wzdłuż jednego kierunku.
Co się teraz stanie, jeżeli tę samą rzecz zrobimy dla kierunku [11 Oj — tego, który
tworzy kąty 45° z osiami kryształu? Włączamy słabiutkie pole i namagnesowanie szybko
37.8. Krzywe namagnesowania dla pojedynczych kryształów żelaza, niklu i kobaltu (C. Kittel, Introduction
37-3. KRZYWA H1STEREZY
319
wzrasta na skutek rozrastania się domen. Jeżeli teraz będziemy stopniowo zwiększać
pole, przekonamy się, że „zużyjemy” sporo pola, zanim osiągniemy nasycenie, ponieważ
teraz wektor namagnesowania odwraca się od „łatwego” kierunku. Jeżeli wytłumaczenie
to byłoby poprawne, to punkt, w którym krzywa [110] (ekstrapolowana) przecina się
z osią pionową, powinien odpowiadać 1//2 razy wartość nasycenia. Okazuje się rzeczy-
wiście, że punkt ten leży niesłychanie blisko punktu Ma3slVl. Podobnie dla kierunku
[111], który jest kierunkiem przekątnej sześcianu, znajdujemy, tak jak można się było
tego spodziewać, że ekstrapolowana krzywa przecina się z osią pionową w pobliżu M^/^3.
Rysunek 37.8 pokazuje odpowiednie sytuacje dla dwóch innych substancji, niklu
i kobalty. Nikiel różni się od żelaza. Okazuje się, że w niklu kierunek [111] jest „łatwym”
kierunkiem namagnesowania. Kobalt ma kryształy o strukturze heksagonalnej, a przy-
jęty sposób nomenklatury dla tego przypadku został spartaczony. Wprowadzono mia-
| nowicie trzy osie na podstawie sześciokąta
Lj jeszcze jedną oś prostopadłą do tych trzech,
tak że trzeba używać czterech wskaźników.
Cierunek [0001] jest kierunkiem tej prosto-
padłej osi, a kierunek [1010] jest kierunkiem
prostopadłym do tej osi. Widać, że kryszta-
ły różnych metali zachowują się na różne
sposoby.
Musimy omówić teraz przypadek metalu
polikrystalicznego, takiego jak zwykły ka-
wałek żelaza. Wewnątrz takich substancji jest
ogromnie dużo małych kryształów, których
osie krystaliczne mają wszystkie możliwe kie-
runki. Takie kryształy — to już nie to samo
co domeny! Pamiętajmy, że wszystkie do-
meny były częściami pojedynczego kryształu,
a w kawałku żelaza jest natomiast wiele róż-
nych kryształów, o różnych orientacjach osi,
tak jak to pokazano na rys. 37.9. Wewnątrz
każdego z tych kryształów zwykle będą także
pewne domeny. Jeżeli do próbki substancji po-
likrystalicznej przyłoży się słabe pole magne-
tyczne, to ściany domen zaczną się poru-
szać i domeny, które mają korzystny kierunek
••łatwego namagnesowania”, będą rosnąć.
Ten wzrost jest odwracalny tak długo, jak
długo pole jest bardzo słabe; jeżeli więc wy-
uczy się takie pole, to namagnesowanie po-
^róci do zera. Ta część krzywej namagne-
s°wania jest oznaczona literą a na rys. 37.10.
37.9. Struktura mikroskopowa nienamagne-
sowanej substancji magnetycznej. Każde ziar-
no krystaliczne ma pewien „łatwy” kierunek
namagnesowania i jest rozdzielone na domeny,
które są namagnesowane spontanicznie, zwy-
kle równolegle do tego łatwego kierunku
37.10. Krzywa namagnesowania dla żelaza
polikrystalicznego
320
73. SUBSTANCJE MAGNETYCZNE
Dla większych pól — w obszarze b pokazanej krzywej namagnesowania — sytuacja
się mocno komplikuje. W każdym małym krysztale substancji występują odkształcenia
i dyslokacje; są tam zanieczyszczenia, obce atomy i wady sieci. Jeżeli więc pole nie będzie
bardzo małe, to ściany domen poruszając się ugrzęzną tam jak w pułapkach. Pomiędzy
bowiem ścianą domeny i dyslokacją, czy też granicą ziaren, albo też zanieczyszczaniem
występuje pewna energia oddziaływania. Gdy zatem ściana dojdzie do takiej pułapki
ugrzęźnie i będzie tam tkwić w pewnym polu magnetycznym. Ale jeżeli pole się trochę
zwiększy, to ściana z pułapki nagle się wyrwie. A więc ruch ścian domen nie jest już taki
gładki jak w krysztale doskonałym. Ściany coraz to zostają zahamowane, by następnie
poruszać się skokami. Gdybyśmy mogli spojrzeć na namagnesowanie w jakiejś skali mi-
kroskopowej, to zobaczylibyśmy coś takiego jak na powiększonym fragmencie rys. 37.10.
Jest rzeczą ważną, że te skoki w namagnesowaniu mogą spowodować pewną stratę
energii. Po pierwsze, gdy ściana wyminie w końcu przeszkodę, to porusza się ona do na-
stępnej przeszkody bardzo szybko, ponieważ pole przykroczyło już tę wartość, która
byłaby koniecżna dla ruchu swobodnego. Ten gwałtowny ruch oznacza obecność gwał-
townie się zmieniających pól magnetycznych, które wytwarzają w krysztale prądy wirowe.
Te prądy tracą energię na ogrzanie metalu. Drugim efektem jest zmiana wymiarów części
kryształu na skutek magnetostrykcji, przy nagłej zmianie domeny. Każde takie nagłe
przesunięcie ściany domeny wytwarza małą falę dźwiękową, która unosi z sobą pewną
energię. Ze względu na te efekty druga część krzywej namagnesowania jest nieodwracalna
i opisuje proces, w którym zachodzi strata energii. Stanowi to początek zjawiska histerezy,
ponieważ cykl: przesunięcie granicznej ściany do przodu — zderzenie — następnie prze-
sunięcie ściany do tyłu — zderzenie prowadzi w wyniku do sytuacji różnej od sytuacji
wyjściowej. Zachodzi tu zjawisko podobne do „skokowego” tarcia i ono właśnie po-
chłania energię.
W końcu, dla dostatecznie wielkich pól, kiedy już przesunęliśmy wszystkie ściany
domen i namagnesowaliśmy każdy kryształ w jego „najlepszym” kierunku, pozostaje
jeszcze pewna część krystalitów, dla których „łatwe” kierunki namagnesowania nie po-
krywają się akurat z kierunkiem naszego pola zewnętrznego. Wówczas trzeba długo
jeszcze zwiększać pole, aby także obrócić te momenty magnetyczne. A zatem dla wiel-
kich pól namagnesowanie rośnie powoli, ale gładko — opisuje je część c krzywej na ry-
sunku. Namagnesowanie nie osiąga raptownie swej wartości nasycenia, ponieważ na eta-
pie opisanym ostatnią częścią krzywej atomowe momenty magnetyczne obracają się
w silnym polu. Widać zatem, dlaczego krzywa namagnesowania zwykłej substancji poli-
krystalicznej, taka jak na rys. 37.10, najpierw podnosi się nieznacznie i odwracalnie, na-
stępnie rośnie nieodwracalnie i w końcu powoli się zagina. Oczywiście, pomiędzy tymi
trzema obszarami nie ma jakichś wyraźnych punktów granicznych — obszary te stopnio-
wo i gładko przechodzą w siebie.
Nietrudno pokazać, że w środkowej części krzywej namagnesowania proces namagne-
sowania jest naprawdę skokowy — że ściany domen ulegają w trakcie przesuwania się
nagłym skrętom i zderzeniom. Potrzebna do tego celu jest tylko cewka z drutu — o wielu
tysiącach zwojów — połączona z wzmacniaczem i głośnikiem, tak jak to pokazano na
rys. 37.11. Jeżeli w środku cewki umieści się kilka blaszek ze stali krzemowej (podobnych
37-3. KRZYWA HISTEREZY
321
do tych, jakich się używa w transformato-
rach) i będzie się zbliżać do nich powoli ma-
gnes sztabkowy, to nagłe zmiany w namag-
nesowaniu wytworzą impulsy SEM w cewce,
które można usłyszeć jako wyraźne trzaski
w głośniku. Przysuwając coraz to bliżej ma-
gnes, usłyszymy nagły napływ trzasków,
który brzmi trochę podobnie do dźwięku,
jaki wydają ziarenka piasku przesypujące się
w pochylanej puszce. Ściany domen skaczą,
zderzają się i kołyszą się wraz ze wzrostem
pola. Zjawisko to nazywamy efektem Bark-
hausena.
pasek
stali krzemowe.
37.11. Nagłe zmiany namagnesowania paska
stali dają się słyszeć jako trzaski w głośniku
Jeżeli przesunie się magnes jeszcze bliżej
do blaszek stalowych, przez chwilę hałas
będzie stopniowo wzrastać, ale następnie, gdy magnes będzie już bardzo blisko, hałas
stanie się stosunkowo mały. Dlaczego? Ponieważ prawie wszystkie ściany domen prze-
sunęły się o tyle, o ile mogły. Każde większe pole będzie już tylko obracać wektor nama-
gnesowania w każdej domenie, co już jest procesem "gładkim”.
Jeżeli teraz usuniemy magnes, tak aby powrócić do dolnej gałęzi pętli histerezy, wszyst-
kie domeny będą próbowały powrócić znowu do niskiej energii i usłyszymy następny
przypływ trzasków, pochodzących od „skoków” powrotnych. Można także zauważyć,
że jeżeli umieści się magnes w pewnym określonym miejscu, a następnie będzie się nim
troszkę poruszać ruchem wahadłowym, to trzaski będą stosunkowo dość ciche. Można
to znowu porównać z przechylaniem puszki piasku — gdy już raz ziarenka zajmą jakieś
miejsca, to niewielkie ruchy puszki nie będą ich przesuwać. Podobnie małe zmiany pola
magnetycznego w żelazie nie wystarczą, aby przesunąć którąś ze ścian granicznych przez
jakąś z przeszkód.
37-4. Materiały ferromagnetyczne
Chcielibyśmy teraz pomówić o różnych rodzajach spotykanych w świecie technicz-
nym substancji magnetycznych, które technicy nazywają materiałami magnetycznymi,
oraz rozważyć niektóre z zagadnień związanych z projektowaniem materiałów magne-
tycznych dla rozmaitych celów. Przede wszystkim określenie „własności magnetyczne
żelaza”, które często się słyszy, jest terminem błędnym — czegoś takiego w ogóle nie
ma. „Żelazo” nie jest dobrze określonym materiałem; własności żelaza zależą w sposób
krytyczny od liczby zanieczyszczeń i od tego, w jaki sposób żelazo było formowane. Można
przyjąć, że własności magnetyczne będą zależeć od tego, jak łatwo mogą się poruszać
ściany domen, a to jest własnością makroskopową, nie zaś własnością pojedynczych ato-
mów. Praktyczny zatem ferromagnetyzm nie jest w rzeczywistości własnością atomu
żelaza — jest to własność żelaza w stanie stałym o pewnej postaci. Tak na przykład żelazo
21 — Wykłady z fizyki
322
37. SUBSTANCJE MAGNETYCZNE
może przybierać dwie różne postacie krystaliczne. Postać pospolita ma sieć regularną,
centrowaną przestrzennie, ale żelazo może mieć też sieć regularną centrowaną powierzch-
niowo, która jednak jest stabilna tylko powyżej temperatury 1100°C. Oczywiście, w ta-
kiej temperaturze przestrzennie centrowana struktura regularna znajduje się już powyżej
punktu Curie. Jednakże robiąc stop żelaza z niklem i chromem (jedna z możliwych mie-
szanin zawiera 18% chromu i 8% niklu) można otrzymać to, co nazywa się stalą nierdzew-
ną, która, chociaż składa się w większej części z żelaza, zachowuje sieć centrowaną po-
wierzchniowo nawet w niskich temperaturach. Ponieważ struktura krystaliczna tego
stopu jest inna, ma on zupełnie różne własności magnetyczne. Większość z typów stali
nierdzewnej nie jest magnetyczna w jakimś zauważalnym stopniu, chociaż pewne jej
typy są nieco magnetyczne — zależy to od składu stopu. Nawet gdy taki stop ma wła-
sności magnetyczne, to nie jest on /erromagnetykiem, tak jak zwykłe żelazo, mimo tego
że składa się on w większej części z żelaza.
Chcielibyśmy teraz opisać kilka specjalnych materiałów, które zostały wprowadzone
do świata technicznego ze względu na ich szczególne własności magnetyczne. Przede
wszystkim, jeżeli chce się otrzymać trwały magnes, to należy się posłużyć materiałem
o szalenie szerokiej pętli histerezy, wtedy bowiem namagnesowanie pozostanie duże po
wyłączeniu prądu i zlikwidowaniu pola namagnesującego. Dla takich materiałów gra-
nice ziaren powinny być „zamrożone” w miejscu na tyle, na ile się tylko da. Jednym z ta-
kich materiałów jest rewelacyjny stop „Alnico V” (51% Fe, 8% Al, 14% Ni, 24% Co,
3% Cu). (Ten raczej skomplikowany skład stopu wskazuje na to, jak wiele wysiłków i pre-
cyzji włożono w robienie dobrych magnesów. Jakiejż cierpliwości trzeba, aby wymie-
szać razem pięć składników i poddawać takie stopy różnym próbom do momentu, aż
się znajdzie najbardziej doskonałą substancję!) Gdy Alnico krzepnie, następuje wytrą-
cenie tzw. „drugiej fazy”, co powoduje powstanie wielu maleńkich ziaren i bardzo du-
żych naprężeń wewnętrznych. W tym materiale granice domen prawie wcale nie mogą
się poruszać. Oprócz dobrania tak precyzyjnego składu Alnico poddaje się jeszcze me-
37.12. Krzywa histerezy stopu Alnico V
chanicznej „obróbce” w sposób, który sprawia,
że kryształy przyjmują postać długich ziaren
ułożonych wzdłuż tego kierunku, który ma być
kierunkiem przyszłego namagnesowania. Wów-
czas namagnesowanie będzie w sposób natu-
ralny dążyć do ułożenia się wzdłuż tych kie-
runków i nie będzie podlegać wpływom efektów
anizotropowych. Co więcej, materiał jest nawet
podczas procesu produkcji oziębiany w zew-
nętrznym polu magnetycznym, tak że ziarna
będą rosnąć z właściwą orientacją kryształu.
Pętlę histerezy Alnico V pokazano na rys. 37.12.
Widać, że jest ona około 500 razy szersza od
pętli histerezy miękkiego żelaza, którą poka-
zaliśmy w poprzednim rozdziale na rys.
36.8.
37-4. MATERIAŁY FERROMAGNETYCZNE
323
Przejdźmy teraz do innego typu materiału.
Do budowy transformatorów i silników po-
trzebny jest materiał, który jest „miękki” mag-
netycznie, czyli taki, w którym namagnesowanie
można łatwo zmienić, tak że bardzo małe przy-
łożone pola będą dawać w wyniku olbrzymie
namagnesowanie. Aby to uzyskać, musi się mieć
czysty, dobrze wyżarzony materiał, który będzie
miał bardzo mało dyslokacji i zanieczyszczeń,
gdyż ściany domen będą się mogły łatwo poru-
szać. Dobrze by też było uczynić anizotropię
małą. Wówczas nawet jeżeli ziarno materiału jest
ustawione pod złym kątem względem pola, mate-
Tabela 37.1. Własności kilku materia-
łów ferromagnetycznych
Materiał Br pole magne- tyczne szcząt- kowe (Gs) TĄ. koercja (Gs)
Supermaloj (a 5000) 0,004
stal krzemowa 12 000 0,05
żelazo Armco 4000 0,6
Alnico V 13 000 550
riał i tak łatwo się namagnesuje. Powiedzieliśmy już, że żelazo woli się magnesować wzdłuż
kierunku [100], podczas gdy nikiel woli kierunek [111]; tak więc jeżeli będziemy mie-
szać żelazo i nikiel w różnych stosunkach, to możemy się spodziewać, że przy właściwym
stosunku znajdziemy taki stop, który nie będzie „wołał” żadnego z tych kierunków —
kierunki [100] i [111] będą równoważne. Okazuje się, że tak się dzieje dla mieszaniny
zawierającej 70% niklu i 30% żelaza. W dodatku — a jest to być może szczęśliwy traf,
czy też może wynik jakiejś fizycznej zależności pomiędzy anizotropią, a efektami magne-
tostrykcji — okazuje się, że magnetostrykcje żelaza i niklu mają przeciwne znaki. I włas-
ność ta powoduje idealne „skasowanie” się magnetostrykcji w stopie tych dwóch metali,
w którym jest około 80% niklu. A zatem gdzieś pomiędzy 70% a 80% nilku dostaje się
bardzo „miękkie” materiały magnetyczne — stopy; które można bardzo łatwo namagne-
sować. Nazywa się je „permalojami”*). Stopy te używane są w transformatorach
wysokiej jakości (przy niskich poziomach sygnałów), ale zupełnie się nie nadają na magne-
sy trwałe. Proces produkcji takich stopów wymaga dużej dokładności i należy się z nimi
bardzo uważnie obchodzić. Własności magnetyczne kawałka permaloju zmieniają się
krańcowo, jeżeli zostanie on poddany naprężeniom przekraczającym jego granice sprę-
żystości; nie wolno więc go zginać! Przy tym przenikalność magnetyczną permaloju
zmniejszają dyslokacje, pasma poślizgu i inne zjawiska, które powstają na skutek od-
kształceń mechanicznych. Granice ziaren nie mogą się już wówczas łatwo przesuwać.
Wysoką przenikalność można jednak przywrócić przez wyżarzenie w wysokich tempera-
turach.
Często wygodnie jest mieć pewne liczby, które by pozwalały charakteryzować różne
materiały magnetyczne. Dwie takie użyteczne liczby, to punkty przecięcia się pętli histe-
rezy z osiami B i H, tak jak to zaznaczono na rys. 37.12. Te dwa punkty nazywamy polem
magnetycznym szczątkowym Br i koercją Hc. W tabeli 37.1 zamieszczamy te liczby dla
kilku materiałów magnetycznych.
♦’ Jest to termin raczej handlowy, wzięty z języka angielskiego (permalloy — złożenie dwóch słów:
permability — przenikalność i alloy — stop), oznaczający po prostu stop o dużej praenikalności magnetycz-
nej. (Przyp. tłum.)
324
37. SUBSTANCJE MAGNETYCZNE
37-5. Nadzwyczajne materiały magnetyczne
Chcielibyśmy omówić teraz niektóre z bardziej egzotycznych materiałów magnetycz-
nych. W układzie okresowym pierwiastków jest wiele takich, których wewnętrzne powłoki
elektronowe nie są zupełnie zapełnione, wskutek czego pierwiastki te mają atomowe
momenty magnetyczne. Tak na przykład tuż po pierwiastkach ferromagnetycznych,
żelazie, niklu i kobalcie, znajdują się chrom i mangan. Dlaczego te pierwiastki nie są ferro-
magnetykami? Otóż okazuje się, że wyraz z A w równaniu (37.1) ma dla nich znak prze-
ciwny. W sieci krystalicznej chromu, na przykład, spiny atomów chromu zmieniają swój
zwrot od atomu do atomu, tak jak to pokazano na rys. 37.13b. Chrom zatem jest „magne-
tyczny” z własnego punktu widzenia, ale technicznie nie jest on interesujący, ponieważ
nie wykazuje zewnętrznych efektów magnetycznych. Chrom jest więc przykładem materia-
łu, w którym zjawiska kwantowomechaniczne ustawiają spiny na przemian antyrówno-
legle. Taki materiał nazywamy antyferromagnetykiem. Uporządkowanie w materiale
antyferromagnetycznym zależy także od temperatury. Poniżej pewnej temperatury kry-
tycznej wszystkie spiny są ułożone w na przemian antyrównoległy szereg, ale gdy pod-
grzać materiał powyżej tej pewnej temperatury, którą i tym razem nazywamy tempera-
turą Curie, to spiny nagle przyjmują ułożenie całkiem przypadkowe. Wewnątrz ma-
teriału następuje jakieś gwałtowne przejście, które można zobaczyć na wykresie ciepła
właściwego i które także objawia się w postaci pewnych szczególnych zjawisk „magne-
tycznych”. Tak na przykład, istnienie na przemian antyrównoległych spinów można
sprawdzić rozpraszając neutrony na krysztale chromu. Ponieważ neutron ma sam pe-
wien spin (i moment magnetyczny), amplituda rozproszenia neutronu będzie różna w za-
leżności od tego, czy spin jego jest równoległy, czy też antyrównoległy do spinu cząstki
rozpraszającej. Tak więc dostaje się różne obrazy interferencyjne w przypadku, gdy spiny
są ułożone na przemian antyrównolegle i w przypadku, gdy spiny są ułożone na chybił
trafił.
37.13. Wzajemne uszeregowanie spinów w różnych materiałach: a) ferromagnetyk, b) antyferromagnetyk,
c) ferryt, d) stop zelaza i itru. (Strzałki przerywane pokazują kierunek całkowitego momentu pędu zawie-
rającego w sobie orbitalny moment pędu.)
37-5. NADZWYCZAJNE MATERIAŁY MAGNETYCZNE
325
Są jeszcze innego rodzaju substancje, w
których na skutek efektów kwantowomecha-
nicznych spiny są ułożone na przemian anty-
równolegle, ale które mimo to są ferromagne-
tykami — to znaczy ich kryształy mają pewne
wypadkowe trwałe namagnesowania. Struk-
turę krystaliczną takich materiałów pokazano
na rys. 37.14. Rysunek pokazuje strukturę
krystaliczną spinelu (glinianu magnezowego),
który — jak to pokazano — nie jest magne-
tyczny. Tlenek ten ma dwa rodzaje atomów
metali: magnez i glin. Jeżeli teraz zastąpić
magnez i glin dwoma pierwiastkami magne-
tycznymi, na przykład żelazem i cynkiem lub
cynkiem i manganem — innymi słowy, jeżeli
podstawić za atomy niemagnetyczne atomy
magnetyczne — to dzieją się ciekawe rze-
czy. Oznaczmy jeden rodzaj atomów metalu
symbolem a, a drugi rodzaj atomów metalu
symbolem b\ należy wówczas rozważyć na-
37.14. Struktura krystaliczna spinelu
(MgAl2O4,). Jony Mg2+ zajmują położenia
w czworościanach, każdy otoczony przez
cztery jony tlenu. Jony Al3+ zajmują poło-
żenia w ośmiościanach, każdy otoczony przez
sześć jonów tlenu (C. Kittel, Introduction to
Solid State Physics, John Wiley and Sons,
New York 1956)
stępujący układ sił. Mamy oddziaływanie a-b, które próbuje ustawić antyrównolegle
spiny atomów a i b, ponieważ żąda tego zawsze mechanika kwantowa (z wyjątkiem ta-
kich tajemniczych materiałów, jak żelazo, nikiel i kobalt). Następnie mamy oddziały-
wanie bezpośrednie a-a, które próbuje ustawić antyrównolegle spiny atomów a, oraz
oddziaływanie b-b, które próbuje ustawić antyrównolegle spiny atomów b. Oczywiście,
nie można mieć wszystkich spinów wzajemnie antyrównoległych — a antyrównolegle
do b, a antyrównolegle do a i b antyrównolegle do b. Prawdopodobnie ze względu na
odległości pomiędzy atomami rodzaju a i ze względu na obecność tlenu (chociaż tak
naprawdę, to nie wiadomo dlaczego) okazuje się, że oddziaływanie a-b jest silniejsze od
oddziaływania a-a lub b-b. Przyroda wybiera zatem w tym przypadku takie oto rozwiąza-
nie: wszystkie atomy rodzaju a mają spiny równolegle, a także wszystkie atomy rodzaju
b mają spiny równoległe, ale oba te układy są do siebie antyrównolegle. Takie ułożenie
daje najniższą energię ze względu na to, że najsilniejsze jest oddziaływanie a-b. W rezul-
tacie wszystkie atomy typu a mają spiny skierowane w górę, a wszystkie typu b mają
spiny w dół lub, oczywiście, odwrotnie. Ale jeżeli momenty magnetyczne atomów typu a
i atomów typu b nie są sobie równe, to można otrzymać sytuację pokazaną na rys. 37.13c
i w materiale może wystąpić pewne wypadkowe namagnesowanie. Materiał będzie wówczas
ferromagnetykiem, chociaż dość słabym. Takie materiały nazywamy ferrytami. Nie
mają one — z oczywistych względów — tak dużej wartości nasycenia namagnesowania
jak żelazo, dlatego też można ich używać tylko dla mniejszych pól. Ale mają one bardzo
istotną cechę, która różni je od ferromagnetyków — są one izolatorami; ferryty są izo-
latorami ferromagnetycznymi. W polach wielkiej częstości będą się w nich pojawiać bardzo
małe prądy wirowe i dlatego też można je używać na przykład w układach mikrofalo-
326
37. SUBSTANCJE MAGNETYCZNE
wych. Pola mikrofalowe będą się mogły przedostać do wnętrza takiego materiału izo-
lującego, podczas gdy nie przedostaną się one do przewodnika, takiego jak żelazo, ze
względu na płynące w nim prądy wirowe.
Jest jeszcze inna klasa materiałów magnetycznych, która właśnie niedawno została
odkryta; należą do niej substancje z rodziny ortokrzemianów, nazywane gametami. Są to
znowu kryształy, których sieć zawiera dwa rodzaje atomów metalicznych i mamy tu także
taką sytuację, że prawie zupełnie dowolnie można za te dwa rodzaje podstawiać różne ato-
my. Wśród wielu takich zasługujących na uwagę związków jest jeden, który jest całkowicie
ferromagnetyczny. Jego strukturę „garnetową” tworzą itr i żelazo, a jest on ferromagne-
tykiem z bardzo ciekawych przyczyn. Tutaj znowu mechanika kwantowa ustawia anty-
równolegle sąsiadujące z sobą spiny, tak że mamy tu „uwięziony” układ spinów — spiny
żelaza są ułożone w jednym kierunku, a w kierunku przeciwnym spiny itru. Ale atom itru
jest złożony — jest to pierwiastek ziem rzadkich i do jego momentu magnetycznego
duży wkład wnosi ruch orbitalny elektronów. Dla itru wkład do momentu magnetycznego
pochodzący od ruchu orbitalnego ma znak przeciwny niż wkład pochodzący od spinu
oraz jest od niego większy. Tak więc, choć mechanika kwantowa poprzez zasadą wyklu-
czenia ustawia spiny itru przeciwnie do spinów żelaza, całkowity moment magnetyczny
itru jest równoległy do momentu magnetycznego żelaza, ze względu na przyczynek od
ruchu orbitalnego — tak jak to naszkicowano na rys. 37.13d. Związek ten jest więc jak
najprawdziwszym ferromagnetykiem.
Inny ciekawy przykład ferromagnetyzmu występuje u niektórych pierwiastków ziem
rzadkich. Ma to związek z jeszcze bardziej dziwacznym uporządkowaniem spinów. Tego
rodzaju materiał nie jest ferromagnetykiem, ponieważ nie ma wszystkich spinów równo-
ległych, ani nie jest antyferromagnetykiem, ponieważ nie ma spinów ułożonych na prze-
mian antyrównolegle. W kryształach tych wszystkie spiny w jednej warstwie są do siebie
równoległe i leżą w płaszczyźnie tej warstwy. W następnej warstwie wszystkie spiny są
znowu równoległe do siebie, ale ich wspólny kierunek różni się trochę od kierunku spi-
nów pierwszej warstwy. W kolejnej warstwie spiny mają jeszcze inny wspólny kierunek
i tak dalej. W wyniku tego wektor lokalnego namagnesowania zmienia się jak gdyby po
spirali — momenty magnetyczne następujących po sobie warstw obracają się, gdy prze-
suwamy się po linii prostopadłej do warstw. Interesująca może być próba opisu tego,
co się stanie, jeżeli przyłoży się do takiej spirali jakieś pole magnetyczne — opisu wystę-
pujących tam skrętów i obrotów wszystkich tych atomowych momentów magnetycznych.
(Są tacy, którzy lubią się zabawiać teorią tych zjawisk!) Są tam nie tylko przypadki „pła-
skich” spiral, ale także przypadki, w których kierunki momentów magnetycznych na-
stępujących po sobie warstw rozkładają się po stożku, tak że każda warstwa ma składową
„spiralną” momentu magnetycznego, a także pewną stałą składową „ferromagnetyczną”
w jednym kierunku!
Własności magnetyczne materiałów przedstawione w sposób bardziej zaawansowany
od tego, w jaki potrafiliśmy to tu zrobić, fascynowały fizyków wszystkich specjalności.
Przede wszystkim, wymienić należy tu ludzi praktyki, którzy ubóstwiają wynajdywanie
różnych sposobów na robienie rzeczy lepiej — starają się oni wynajdywać coraz to nowe
i coraz to lepsze materiały magnetyczne. Odkrycie takich materiałów jak ferryty, czy też
37-5. NADZWYCZAJNE MATERIAŁY MAGNETYCZNE
327
zastosowanie tych materiałów zachwyca natychmiast tych, którzy chcą znaleźć nowe
sprytne sposoby na robienie różnych rzeczy. Oprócz tego są tacy, których fascynuje ta
olbrzymia złożoność zjawisk, powstających z tych kilku podstawowych praw przyrody.
Zaczynając od jednego i tego samego pojęcia ogólnego natura przechodzi przez ferro-
magnetyzm żelaza i jego domeny do antyferromagnetyzmu chromu, do magnetyzmu
ferrytów i garnetów, do struktury spiralnej pierwiastków ziem rzadkich, coraz to dalej
i dalej. Odkrywanie na drodze doświadczalnej tych wszystkich dziwnych rzeczy, które
się dzieją w tych szczególnych substancjach, jest sprawą fascynującą. Z kolei, jeżeli chodzi
o fizyków teoretyków, ferromagnetyzm ofiaruje im pewną liczbę bardzo interesujących,
nie rozwiązanych i przepięknych zadań. Jedno z tych zadań polega na zrozumieniu, dla-
czego ferromagnetyzm w ogóle istnieje. Inny problem, to określenie statystyki oddziały-
wających z sobą spinów w doskonałej sieci krystalicznej. Nawet jeżeli się pominie wszyst-
kie możliwe komplikacje pochodzące z zewnątrz, to problem ten, jak dotąd, nie został
w pełni zrozumiany. Jest to dlatego tak ciekawy problem, że można go tak prosto sfor-
mułować. Dana jest tu cała masa spinów w regularnej sieci krystalicznej, oddziałujących
z sobą na podstawie takiego a takiego prawa i należy stwierdzić, co się z nimi powinno
dziać. Brzmi to prosto, ale przez wiele lat nie udaje się znaleźć kompletnego opisu tego
problemu. Chociaż został on dość dokładnie opisany dla temperatur niezbyt bliskich
punktu Curie, to teoria nagłego przejścia w punkcie Curie wymaga ciągle jeszcze uzu-
pełnień.
Na koniec, całe to zagadnienie układu obracających się wokół osi atomowych momen-
tów magnetycznych w ferromagnetykach lub paramagnetykach i w magnetyzmie jądro-
wym było też rzeczą fascynującą dla studentów wyższych lat fizyki. Układ spinów może
być „popychany” lub „pociągany” przez zewnętrzne pola magnetyczne, tak żę można tu
robić wiele różnych sztuczek z rezonansami, efektami relaksacji, echem spinowym i z in-
nymi zjawiskami. Taki układ służy za model wielu złożonych układów termodynamicz-
nych. Ale w materiałach paramagnetycznych sytuacja jest często dość prosta i ludzie mieli
masę przyjemności zarówno robiąc eksperymenty, jak i wyjaśniając te zjawiska teore-
tycznie.
Zamykamy na tym naszą naukę o elektryczności i magnetyzmie. Najpierw mówiliśmy
o wielkim postępie, jaki nastąpił od wczesnych odkryć Greków dziwnego zachowania się
bursztynu i magnetytu. Mimo to, w naszych długich i zawikłanych rozważaniach nigdy
nie wytłumaczyliśmy, dlaczego tak to się dzieje, że po potarciu kawałka bursztynu pojawi
się na nim ładunek, ani też nie wyjaśniliśmy, dlaczego magnetyt jest namagnesowany'. I nie
można by tu nawet powiedzieć: „Ach, po prostu nie dostaliśmy poprawnego znaku”.
O nie, sprawa wygląda znacznie gorzej. Nawet gdybyśmy dostali poprawny znak, to i tak
mielibyśmy jeszcze problem: dlaczego kawałek magnetytu w Ziemi jest namagnesowany^!
Oczywiście, Ziemia ma pole magnetyczne, ale skąd się ono bierze? Tak naprawdę to nikt
tego nie wie — jak dotąd stawiano tylko hipotezy — lepsze lub gorsze. Jak widzicie, cała
ta nasza fizyka, to masa blagi, zaczęliśmy od zjawisk magnetytu i bursztynu i skończyliśmy,
nie rozumiejąc dobrze żadnego z nich. Ale za to po drodze uzyskaliśmy ogromnie dużo in-
teresujących i bardzo praktycznych wiadomości!
38
sprężystość
ł , i
38-1. Prawo Hooke’a
Teoria sprężystości zajmuje się zachowaniem się tych substancji, które mają własność
odzyskiwania swych rozmiarów i kształtów po usunięciu sił powodujących odkształcenia.
Tę własność sprężystą mają, do pewnego stopnia, wszystkie ciała stałe. Gdybyśmy mieli
dość czasu, aby omówić obszernie to zagadnienie, to chcielibyśmy rozpatrzyć wiele spraw:
zachowanie się poszczególnych substancji, ogólne prawa sprężystości, ogólną teorię
sprężystości, mechanizm atomowy, który określa własności sprężyste, i na koniec — zakres
stosowalności praw sprężystości, gdy siły stają się tak wielkie, że następuje odkształcenie
plastyczne i złamanie. Dokładne omówienie tych zagadnień zajęłoby więcej czasu, niż go
mamy do dyspozycji, tak że wiele rzeczy będziemy musieli pominąć. Nie omówimy na
przykład zjawiska plastyczności ani ograniczeń możliwości stosowania praw sprężystości.
(Wspomnieliśmy pokrótce o tych zagadnieniach, kiedy mówiliśmy o dyslokacjach w me-
talach.) Nie będziemy też mogli omówić wewnętrznego mechanizmu zjawiska sprężystości,
tak że naszemu podejściu będzie brakowało tej kompletności, którą się staraliśmy uzyskać
w poprzednich rozdziałach. Nasz cel polega głównie na pewnym zaznajomieniu czytelnika
z niektórymi ze sposobów rozwiązywania takich zagadnień praktycznych, jak na przykład
ugięcie belek.
Jeżeli naciskać kawałek jakiejś substancji, to kawałek ten się „poddaje” — substancja
zostaje odkształcona. Jeżeli siły są dostatecznie małe, to przesunięcia względne różnych
punktów w substancji są proporcjonalne do siły działającej; mówimy, że substancja za-
chowuje się sprężyście. Omówimy tylko przypadek zachowania się sprężystego. Najpierw
wypiszemy podstawowe prawa sprężystości, a następnie zastosujemy je do pewnych sytuacji.
Przypuśćmy, że bierzemy prostopadłościenny element substancji o długości /, szero-
kości w i wysokości h, tak jak to pokazano na rys. 38.1. Jeżeli będziemy ciągnąć ten element
38-1. PRAWO HOOKE’A
329
za oba końce z siłą F, to długość jego się zwiększy o wielkość dl. We wszystkich przypad-
kach będziemy zakładać, że zmiana długości jest tylko małym ułamkiem długości począt-
kowej. Prawdę powiedziawszy, takie materiały jak drzewo i stal złamią się, jeżeli zmiana
długości będzie większa niż kilka procentów długości początkowej. Dla dużej liczby ma-
teriałów doświadczenia wykazują, że dla dostatecznie małych wydłużeń siła jest proporcjo-
nalna do wydłużenia:
F~4l. ' (38.1)
Ten związek jest znany jako prawo Hooke’a.
Wydłużenie pręta dl będzie także zależało od jego długości. Można się o tym przekonać
przy pomocy następującego rozumowania. Jeżeli skleimy końcami dwa identyczne ele-
menty, to na każdy z elementów będą działać te same siły; każdy z nich się wydłuży o dl.
Tak więc wydłużenie elementu o długości 21 będzie dwa razy większe od wydłużenia ele-
mentu o tym samym przekroju, ale o długości /. Aby otrzymać pewną liczbę, która jest
bardziej charakterystyczna dla danego rodzaju substancji, w ogóle, a nie dla jakiegoś jej
szczególnego kształtu, będziemy się zajmować stosunkiem dljl — wydłużenia do długości
początkowej. Ten stosunek jest proporcjonalny do siły, ale nie zależy od l:
dl
F~~. (38.2)
Siła F będzie także zależeć od pola powierzchni przekroju elementu poprzecznego
do kierunku jej działania. Przypuśćmy, że zestawimy dwa elementy, bokami do siebie.
Wówczas dla jakiegoś danego wydłużenia mielibyśmy siłę F działającą na każdy element,
czyli dwa razy większą siłę działającą na takie złożenie obu elementów. Dla danego wydłu-
żenia siła musi być proporcjonalna do pola A powierzchni przekroju elementu. Aby otrzy-
mać prawo, w którym współczynnik proporcjonalności nie zależy od rozmiarów ciała,
zapiszmy prawo Hooke’a dla elementu prostopadłościennego w postaci
dl
F=YA—. (38.3)
38.1. Rozciąganie pręta pod wpływem stałego napięcia
^'W + ÓW
330
38. SPRĘŻYSTOŚĆ
(38.4)
Stała Kjest wewnętrzną własnością samej tylko substancji; nazywa się ją modułem Younga.
(Zwykle moduł Younga oznacza się symbolem E. Ale litery E używaliśmy już dla oznacza-
nia pól elektrycznych, energii i sił elektromotorycznych, tak że wolimy tu posłużyć się
inną literą.)
Silę na jednostkę powierzchni nazywa się naprężeniem, a wydłużenie na jednostkę dłu-
gości — wydłużenie względne — nazywa się odkształceniem (względnym). Równanie (38.3)
można dlatego przepisać w sposób następujący:
F Al
— =Kx—,
' Al
naprężenie = (moduł Younga) X (odkształcenie).
Prawo Hooke’a składa się z jeszcze jednej części: jeżeli element substancji rozciąga się
w jednym kierunku, to element ten zwęża się w kierunkach prostopadłych do kierunku
rozciągania. To zwężenie szerokości jest proporcjonalne do szerokości w, a także i do Al'l.
Takie boczne zwężenie względne zachodzi w jednakowym stopniu zarówno dla szerokości,
jak i dla wysokości, i zwykle się je zapisuje w postaci
Aw Ah Al
----= — = —a —
w h r
(38.5)
gdzie stałą a wyrażającą inną własność substancji, nazywa się stalą Poissona. Jest to liczba
zawsze dodatnia i mniejsza od |. (Wydaje się „zrozumiałe”, że a powinno być na ogół
dodatnie, ale nie jest to całkiem jasne, że tak właśnie musi być.)
Te dwie stałe, Y i a, określają w zupełności własności sprężyste substancji jednorodnych
i izotropowych (tzn. niekrystalicznych). W kryształach wydłużenia i skrócenia mogą być
różne w różnych kierunkach i może być tam dużo więcej stałych sprężystych. Chwilowo
nasze rozważania ograniczymy do przypadku substancji jednorodnych i izotropowych,
których własności można opisać tylko przy pomocy Y i a. Jak zwykle, jest kilka różnych
sposobów opisywania tych zjawisk — niektórzy wolą na przykład używać innych stałych
do opisu własności sprężystych substancji. Wśród stałych tych zawsze jednak muszą być
dwie niezależne, które można wyrazić przy pomocy stałych Y i <r.
Ostatnim potrzebnym nam tu ogólnym prawem jest zasada superpozycji. Zasada ta jest
tu spełniona, gdyż oba prawa: (38.4) i (38.5) są liniowe względem sił i przesunięć. Jeżeli
więc jest dany jeden układ sił, które dają pewne przesunięcia, a następnie się doda pewien
nowy układ sił powodujący dodatkowe przesunięcia, to przesunięcia wypadkowe będą sumą
tych przesunięć, które wystąpiłyby przy obu układach sił działających od siebie nieza-
leżnie.
Mamy więc już sformułowane wszystkie ogólne zasady — zasadę superpozycji i rów-
nania (38.4) i (38.5) — i to jest właściwie cała teoria sprężystości. Ale brzmi to tak, jak
powiedzenie, że jak się już raz ma prawa Newtona, to ma się tym samym całą mechanikę.
Albo jeśli dane są równania Maxwella, to dana już jest cała elektryczność. Jest oczywiście
prawdą, że przy pomocy tych zasad można otrzymać bardzo dużo, ponieważ przy naszych
obecnych możliwościach matematycznych potrafimy już wiele zdziałać. Omówimy tu
jeszcze zastosowania tych zasad w kilku szczególnych przypadkach.
38-2. ODKSZTAŁCENIA JEDNORODNE
331
38-2. Odkształcenia jednorodne
Jako nasz pierwszy przykład rozważmy,
co się dzieje z prostopadłościennym elemen-
tem, poddanym działaniu stałego ciśnienia
hydrostatycznego. Wprowadźmy ten element
pod wodę w zbiorniku ciśnieniowym. Na każ-
dą ściankę elementu będzie wówczas działała,
do wewnątrz, siła proporcjonalna do pola
jej powierzchni (patrz rys. 38.2). Ponieważ
ciśnienie hydrostatyczne jest stałe, napręże-
nie (czyli siła na jednostkę powierzchni) dzia-
łające na każdą ściankę elementu jest takie
samo. Znajdźmy najpierw zmianę długości.
Tę zmianę długości elementu można rozpa-
trywać jako sumę zmian długości, jakie na-
stąpią w trzech niezależnych od siebie przy-
padkach, które są schematycznie przedsta-
wione na rys. 38.3.
Przypadek 1. Jeżeli na oba końce ele-
mentu podziałamy ciśnieniem p, powstanie
odkształcenie ściskania, równe p/Y, o znaku
ujemnym:
411 _ _P_
l ~ Y'
Przypadek?. Jeżeli będziemy naciskać na
ściankę górną i dolną elementu ciśnieniem p,
to odkształcenie ściskania i tym razem
wyniesie —p/ Y, a odpowiednie odkształcenie
boczne jest znowu równe ap/ Z. Otrzymujemy
J/2 p
~F - ’7'
Przypadek 3. Jeżeli przyłożymy ciśnie-
nie p do obu ścianek bocznych elementu, to
znowu powstanie odkształcenie ściskania,
równe pl Y, ale potrzebne nam będzie w zasa-
dzie odkształcenie podłużne. Można je
otrzymać mnożąc odkształcenie boczne przez
—<r. Odkształcenie boczne jest więc równe
38.2. Pręt pod wpływem stałego ciśnienia
hydrostatycznego
38.3. Ciśnienie hydrostatyczne jest superpo-
zycją trzech ściskań podłużnych
Jw p
332
38. SPRĘŻYSTOŚĆ
a odkształcenie podłużne
Dodając przyczynki do względnej zmiany długości, otrzymane w tych trzech przy-
padkach — to znaczy przyjmując Al = Ali+A^+Als — otrzymujemy
Al p
— = -^(l-2<7). (38.6)
W zagadnieniu tym wszystkie trzy kierunki są oczywiście równouprawnione; tak więc
również
Aw Ah p
----= — = (38.7)
w h y
Warto się też zainteresować zmianą objętości pod wpływem ciśnienia hydrostatycznego.
Ponieważ V = Iwh, to dla małych przesunięć można przyjąć, że
AV Al Aw Ah
'Stając z zależności (38.6) i (38.7) mamy
AV
__
= -3-|(1-2a).
(38.8)
Niektórzy lubią nazywać AV/V odkształceniem objętościowym i piszą
AV
p = —K---.
* V
Naprężenie objętościowe p jest proporcjonalne do odkształcenia objętościowego — jeszcze
raz mamy więc prawo Hooke’a. Współczynnik K nazywamy modułem ściśliwości; jest on
związany z innymi stałymi przez związek:
Y
3(1—2cr)'
(38.9)
Ponieważ współczynnik K ma pewne znaczenie praktyczne, wiele podręczników podaje
K i y zamiast stałych Y i a. Jeżeli komuś jest potrzebna stała <7, to może ją zawsze otrzymać
z równania (38.9). Z równania (38.9) można także wywnioskować, że stała Poissona o
musi być mniejsza od |. Gdyby tak nie było, moduł ściśliwości K byłby ujemny i substancja
zwiększałaby swoją objętość przy wzroście ciśnienia. Pozwoliłoby to na czerpanie energii
mechanicznej z każdego „starego” elementu, wtedy bowiem taki element byłby w równo-
wadze chwiejnej. Gdyby mianowicie raz zaczął on zwiększać swą objętość, robiłby to już
dalej sam — oddając przy tym pewną energię.
38-2. ODKSZTAŁCENIA JEDNORODNE
333
Chcemy teraz rozważyć, co się stanie, jeżeli
podda się jakiś obiekt odkształceniu „ścinania”.
Przez odkształcenie ścinania rozumiemy ten typ
zniekształcenia, który pokazano na rys. 38.4.
Wstępem do tego zagadnienia jest analiza od-
kształceń w sześcianie utworzonym z substancji
sprężystej, poddanej działaniu sił pokazanych
na rys. 38.5. Problem ten można znowu roz-
bić na dwa przypadki: ściskanie pionowe i roz-
ciąganie poziome. Oznaczając przez A pole
powierzchni ściany sześcianu, dojdziemy, po po-
dobnym do poprzedniego rozumowaniu, że
zmiana długości w kierunku poziomym jest
równa
Al
~T
1 F 1 F 1+<t F
-------)-(T -— —--------------.
Y A Y A Y A
(38.10)
Zmiana wysokości w kierunku pionowym jest
równa po prostu temu samemu wyrażeniu z prze-
ciwnym znakiem.
Przypuśćmy teraz, że ten sam sześcian pod-
damy działaniu sił ścinania, tak jak to pokaza-
no na rys. 38.6a. Zauważmy, że wszystkie siły
muszą tu być sobie równe, gdyż w przeciwnym
przypadku pojawiłyby się wypadkowe momenty
sił i sześcian nie byłby jako całość w równo-
38.4. Sześcian w stanie czystego ścinania
38.5. Sześcian, na którego górną i dolną
ściankę działają siły ściskające, a na dwie
boczne ścianki działają, równe im co do
wielkości, siły rozciągające
38.6. Dwie pary sił ścinających na a) wytwarzają takie samo naprężenie jak siły ściskające i rozciągające
na b)
134
38. SPRĘŻYSTOŚĆ
vadze. (Podobne siły muszą także istnieć na rys^ 38.4, ponieważ przedstawiony
am element jest w równowadze. Siły te pochodzą od „kleju”, przy pomocy którego ele-
nent jest przytwierdzony do stołu.) Mówi się wówczas, że sześcian jest w stanie czystego
.cinania. Ale zauważmy, że jeżeli przetniemy sześcian płaszczyzną pod kątem 45°, np.
jłaszczyzną wzdłuż przekątnej A na rysunku, to całkowita siła działająca poprzez tę płasz-
czyznę jest do niej prostopadła i równa 1^2 G. Pole powierzchni, na której działa ta siła, jest
•ówne 1'2 A; dlatego też naprężenie rozciągające, prostopadłe do tej płaszczyzny, jest po
prostu równe GjA. Podobnie, jeżeli rozpatrzymy inną płaszczyznę tworzącą kąt 45° z kra-
wędzią sześcianu — tę wzdłuż przekątnej B na rysunku — to zobaczymy, że występuje tam
naprężenie ściskające, prostopadłe do tej płaszczyzny i równe —GjA. Widać stąd, że na-
prężenie w „czystym ścinaniu” jest równoważne złożeniu naprężeń rozciągania i ściskania,
prostopadłych do siebie i tworzących kąty 45° z pierwotnymi ściankami sześcianu. Naprę-
żenia wewnętrzne i odkształcenia są takie same, jakie znaleźlibyśmy w jakimś większym
elemencie materiału, poddanym działaniu takich sił jak na rys. 38.6b. Ale zagadnienie
to już rozwiązaliśmy. Zmiana długości przekątnej jest więc dana równaniem (38.10),
AD 1+<t G
~D~ ~ Y ~A‘
(38.11)
38.7. Odkształcenie ścinania 0 jest równe
2AD/D
38.8. Rozciąganie przy uwięzionych ścianach
bocznych (brak przewężeń bocznych)
(Jedna przekątna jest skrócona, druga zaś
wydłużona.)
Często wygodnie jest wyrażać odkształce-
nie ścinania przy pomocy kąta, o jaki sześcian
zostaje skręcony — kąt 6 na rys. 38.7. Z ry-
sunku widać, że przesunięcie poziome górnej
krawędzi, ó, jest równe y2AD. A zatem
0 =
d /2 AD AD
— =--------= 2----.
I l D
(38.12)
Naprężenie ścinania g definiuje się jako siłę
styczną, działającą na jedną ściankę, podzie-
loną przez pole powierzchni tej ścianki;
g = G/A. Podstawiając równanie (38.11) do
równania (38.12) otrzymujemy
0 = 2~~g.
Możemy to zapisać też w postaci „naprę-
żenie = stała razy odkształcenie”:
g = n6. (38.13)
Współczynnik proporcjonalności p nazywa-
my modułem ścinania (lub niekiedy współ-
38-2. ODKSZTAŁCENIA JEDNORODNE
335
czynnikiem sztywności). Można go wyrazić przy pomocy stałych Y i a;
Y
2(1 +<x)
(38.14)
Nawiasem mówiąc, moduł ścinania musi być dodatni, w przeciwnym bowiem wypadku
można by otrzymać energię z bloku, który by samoczynnie ulegał ścinaniu. Z równania
(38.14) wynika zatem, że stała <r musi być większa od —1. Wiemy więc, że współczynnik <r
musi się zawierać pomiędzy —la +|, jednakże w praktyce a jest zawsze większe od zera.
Jako ostatni przykład sytuacji, w której naprężenia są jednorodne w całej substancji,
rozważmy zagadnienie elementu, który jest rozciągany, podczas gdy jednocześnie jego
ściany boczne są uwięzione, tak że nie mogą nastąpić zwężenia boczne. (Technicznie łat-
wiej jest ściskać element i jednocześnie powstrzymywać ściany boczne od wybrzuszania
się — ale to jest to samo zagadnienie.) Co się wtedy dzieje? No cóż, muszą tam być jakieś
siły boczne, nie pozwalające substancji zmienić swej grubości, siły, których tak „od ręki”
nie znamy, ale które będziemy musieli obliczyć. Jest to zagadnienie tego samego typu,
jakie już rozwiązaliśmy — tylko obliczenia będą trochę inne. Wyobrażamy teraz sobie, że
siły działają we wszystkich trzech kierunkach, tak jak to pokazano na rys. 38.8; obliczamy
zmiany rozmiarów, a następnie tak dobieramy siły poprzeczne, aby szerokość i wysokość
elementu pozostały bez zmian. Przeprowadzając te same rozważania, co poprzednio, otrzy-
mujemy wzory na odkształcenia we wszystkich trzech kierunkach:
(38.15)
(38.16)
(38.17)
Ponieważ Aly i zfZz mają teraz być równe zeru, wzory (38.16) i (38.17) dają dwa równania
wiążące Fy i Fz z Fx. Rozwiązując te równania otrzymujemy
F F a F
Ay Az 1—<r Ax
Podstawiając to do równania (38.15) mamy
Alx _ 1 / 2<t2 \ Fx _ 1 Z 1-<T-2<t2 \ Fx
~ 1-<T^ 17 i-<* Z 4?
(38.18)
(38.19)
Często równanie to spotyka się w postaci „odwrotnej”, z trójmianem kwadratowym wzglę-
dem stałej <T przedstawionym w postaci iloczynowej:
F 1—<r JZ
7 “ (14-cr)(l—2ct7 Z ’
(38.20)
336
38. SPRĘŻYSTOŚĆ
<jdy uwięzimy boki, moduł Younga w prawie Hooke’a zostaje przemnożony przez skom-
plikowaną funkcję stałej a. Jak można to najłatwiej zobaczyć z równania (38.19), ten
czynnik przed modułem Tjest zawsze większy od 1. Trudniej jest więc rozciągać element,
gdy jego boki są uwięzione — co także oznacza, że element jest bardziej wytrzymały wtedy,
gdy jego boki są uwięzione, niż gdy są one swobodne.
38-3. Skręcanie pręta; fale ścinania*1
Zwróćmy teraz naszą uwagę na pewien przykład, który jest bardziej złożony, ponieważ
naprężenia są różne w różnych częściach substancji. Będziemy rozważać pręt podlegający
skręcaniu, taki jaki można znaleźć w wale napędowym w maszynach lub w zawieszeniu
przy pomocy włókna kwarcowego w instrumentach precyzyjnych. Czytelnicy pamiętają
zapewne z doświadczeń z wagą skręceń, że moment sił działający na skręcony pręt jest
proporcjonalny do kąta, przy czym stała proporcjonalności zależy oczywiście od długości
pręta, od jego promienia i od własności materiału. Pytaąie brzmi: Dlaczego tak jest? Teraz
jesteśmy w stanie odpowiedzieć na to pytanie; to tylko kwestia przeprowadzenia pewnych
rozważań geometrycznych.
Na rysunku 38.9a pokazano cylindryczny pręt o długości L i o promieniu a, którego
jeden koniec jest skręcony względem końca drugiego o kąt <p. Jeżeliby chcieć powiązać
odkształcenia z tym, co już wiemy, to można przyjąć, że pręt składa się z wielu cylindrycz-
nych współosiowych warstw, i oddzielnie rozpatrywać, co się z każdą z tych warstw dzieje.
Zacznijmy od rozpatrzenia cienkiej, krótkiej warstwy cylindrycznej o promieniu r (mniej-
szym od a) i o grubości Jr — tak jak to przedstawiono na rys. 38.9b. Jeżeli weźmiemy teraz
pod uwagę fragment tej warstwy, który był początkowo małym kwadratem, to widać,
38.9. a. Cylindryczny pręt poddany skręcaniu, b. Warstwa cylindryczna poddana skręcaniu, c. Każdy
kawałek tej cylindrycznej warstwy doznaje ścinania
1 Porównaj: Tom I, cz. 2, rozdz. 47 (Dźwięk).
dr
38-3. SKRĘCANIE PRĘTA; FALE ŚCINANIA
337
że został on przekształcony w równoległobok. Każdy taki element warstwy doznaje ści-
nania, przy czym kąt ścinania 6 jest równy
Naprężenie g ścinania w substancji jest więc równe [z równania (38.13)]
„ r<P
g = ^ = F~-- (38>2i)
La
Naprężenie ścinania jest równe sile stycznej AF, działającej na brzeg kwadratu, po-
dzielonej przez pole powierzchni brzegu równe Al Ar (patrz rys. 38.9c)
AF
8~ Al Ar'
Siła AF, działająca na brzeg takiego kwadratu, daje moment siły At względem osi pręta,
równy
At = r AF = rgAl Ar. (38.22)
Całkowity moment t jest sumą takich momentów sił po pełnym obwodzie cylindra. Skła-
dając zatem razem dostateczną liczbę tego rodzaju fragmentów, tak aby ich elementy Al
dały w sumie 27tr, stwierdzamy, że całkowity moment skręcający dla pustej w środku rury
jest równy
rg(27rr) Ar (38.23)
lub, po skorzystaniu z wzoru (38.21),
r3Ar a>
r = 2~p- _ (38.24)
La
Otrzymaliśmy więc, że sztywność na skręcanie, T/<p, pustej w środku rury jest proporcjo-
nalna do sześcianu jej promienia r i do grubości jej ścianki Ar, a odwrotnie proporcjonalna
do długości L.
Można sobie teraz wyobrazić, że pełny pręt składa się z ciągu takich współśrodkowych
rur, z których każda jest skręcona o ten sam kąt <p (chociaż naprężenia wewnętrzne są
dla każdej rury różne). Całkowity moment sił jest sumą momentów potrzebnych do obró-
cenia każdej powłoki; dla pręta pełnego
przy czym całkujemy tu w granicach od r = 0 do r = o, gdzie a jert promieniem pręta.
Po scałkowaniu
tc a4
* = <p. (38.25)
£La
W przypadku pręta poddanego skręcaniu moment sił jest proporcjonalny do kąta i do
czwartej potęgi średnicy, czyli 2 razy grubszy pręt jest 16 razy bardziej „sztywny” na skrę-
canie.
22 — Wykłady z fizyki
338
38. SPRĘŻYSTOŚĆ
38.10. a. Fala skrętna w pręcie, b. Element objętości pręta
Zanim zakończymy omawiać zagadnienie skręcania, spróbujmy jeszcze zastosować
nabyte wiadomości do interesującego problemu rozchodzenia się fal skrętnych. Jeżeli
wziąć długi pręt i nagle skręcić jeden z jego końców, to przez pręt, na całej jego długości,
przejdzie fala skręcania, jak to schematycznie przedstawiono na rys. 38.10a. Jest to zagad-
nienie trochę ciekawsze od zagadnienia skręcania statycznego. Zobaczmy, czy potrafimy
określić, co się tu dzieje.
Niech z będzie odległością jakiegoś punktu pręta od skręconego końca. Przy skręca-
niu statycznym moment sił jest taki sam wzdłuż całego pręta i jest on proporcjonalny do
<p/L — stosunku całkowitego kąta skręcenia do całkowitej długości. Substancja doznaje
na skutek skręcania odkształcenia lokalnego, które, jak można wykazać, jest równe Syjdz.
Dla skręcania, które nie jest takie samo wzdłuż całego pręta, równanie (38.25) powinno
się zastąpić równaniem
7ta4 cm , „
*(*) = -z-« (38.26)
2 oz
Zobaczmy teraz, co się dzieje z pewnym elementem o długości dz, pokazanym w powięk-
szeniu na rys. 38. lOb. Na jeden koniec, 1, małego „plasterka” pręta działa moment siły t(z),
a na drugi koniec, 2, działa inny moment siły t(z-J-Az). Jeżeli dz jest dostatecznie małe,
to można się posłużyć rozwinięciem Taylora i zapisać
' / dv\
t(z+Az) — t(z)+ I—Idz, (38.27)
\oz /
Wypadkowy moment skręcający At, działający na mały kawałek pręta pomiędzy z
a z+Az jest oczywiście równy różnicy pomiędzy t(z) i t(z-^-Az), czyli równy At =
= (5r/5z) Az. Różniczkując równanie (38.26) względem z otrzymujemy
= (38.28)
2 oz2
W wyniku działania tego wypadkowego momentu skręcającego nasz plasterek pręta
uzyskuje pewne przyspieszenie kątowe. Masa tego plasterka wynosi
AM = (na2Az)g,
38-3. SKRĘCANIE PRĘTA; FALE ŚCINANIA
339
gdzie o jest gęstością substancji. W rozdziale 19 tomu I (cz. 1) wyprowadziliśmy wzór na
moment bezwładności walca kołowego: Z = mr2/2; oznaczając moment bezwładności
naszego plasterka przez Al mamy
Al = — ga*dz.
(38.29)
Prawo Newtona mówi, że moment sił jest równy momentowi bezwładności rajy przyspie-
szenie kątowe, czyli
52®
Z1t= Al—i-.
dt2
Reasumując, otrzymujemy
łtfl4 d2<p
M 2 Iź2"
7t . d2<P
czyli
32ę>
Q d2<p _ q
Sz2 /i dt2
(38.30)
(38.31)
Łatwo poznać, że jest to jednowymiarowe równanie fali. Znaleźliśmy więc, że fale skręca-
nia przemieszczają się wzdłuż pręta z prędkością
(38.32)
Im większą pręt ma zatem gęstość — przy takiej samej jego sztywności — tym wolniejsze
będą fale, a im sztywniejszy jest pręt, tym szybciej będą się fale wzdłuż niego rozchodzić.
Prędkość ta nie zależy od średnicy pręta.
Fale skrętne są szczególnym przykładem fal ścinania. Ogólnie, fale ścinania są to takie
fale, w których odkształcenia nie zmieniają objętości żadnej części ośrodka. W falach skręt-
nych występuje szczególny rozkład naprężeń ścinających; są tu one mianowicie rozło-
żone na kole. Ale dla każdego rozkładu naprężeń ścinających fale będą się rozchodzić
z tą samą prędkością, ókreśloną równaniem (38.32). Tak na przykład, sejsmologowie
stwierdzają, że fale ścinania rózchodzą się we wnętrzu Ziemi.
W ośrodkach sprężystych, będących ciałami stałymi, mogą występować fale jeszcze
innego typu. Wywierając nacisk na pewną część ośrodka można dać początek falom „po-
dłużnym”, nazywanym także falami „ściskania”. Przypominają one fale dźwiękowe w po-
wietrzu lub w wodzie — kierunek przesunięć jest w nich taki sam jak kierunek rozchodze-
nia się fali. (Na powierzchniach ciał sprężystych mogą być także inne typy fal, nazywane
„falami Rayleigha” lub „falami Love’a”. W tych falach odkształcenia nie są ani czysto
podłużne, ani czysto poprzeczne. Nie mamy jednak czasu, aby omówić te fale.)
Ponieważ już zaczęliśmy mówić o falach, to zastanówmy się jeszcze, jaka jest pręd-
kość czystych fal ściskania w dużym ciele stałym, takim np. jak Ziemia? Mówimy „dużym”,
ponieważ prędkość dźwięku w grubym ciele jest różna od prędkości dźwięku, np. w cien-
kim pręcie. Przez „grube” ciało rozumie się taki obiekt, którego wymiary poprzeczne
340
38. SPRĘŻYSTOŚĆ
są dużo większe od długości fali dźwiękowej. Wówczas, gdy w takim obiekcie wywrze się
w pewnym miejscu nacisk, nie może się on rozszerzać na boki — może on tylko ulegać
ściskaniu w jednym wymiarze. Na szczęście, omówiliśmy już szczególny przypadek ściska-
nia „uwięzionej po bokach” substancji sprężystej. W rozdziale 47 tomu I (cz. 2) wypro-
wadziliśmy także wzory na prędkość fal dźwiękowych w gazie. Przeprowadzając takie
same rozważania można się przekonać, że prędkość dźwięku w ciele stałym jest równa
}/ Y'/q, gdzie Y' jest „modułem podłużnym”, czyli ciśnieniem podzielonym przez względną
zmianę długości, dla przypadku „uwięzionych ścian bocznych”. Prędkość ta równa jest
po prostu stosunkowi Alfl do F/A, który otrzymaliśmy już w równaniu (38.20). A zatem
prędkość fal podłużnych jest określona wzorem
_ Y' _ 1—<r Y
podto- e ~ (1+cr)(1_2ff) Q
(38.33)
Dopóki a jest większe od zera, a mniejsze od moduł ścinania /i jest mniejszy od
modułu Younga, a także Y' jest większe od Y, tak że
H < Y <Y'.
Oznacza to, że fale podłużne poruszają się prędzej od fal ścinania. Jeden z najdokładniej-
szych sposobów pomiaru stałych sprężystych substancji polega na mierzeniu ich gęstości
oraz prędkości tych dwóch typów fal. Z wyników tych pomiarów można wyznaczyć
zarówno Y, jak i <r. Nawiasem mówiąc, właśnie mierząc różnice w czasach przybycia tych
dwóch typów fal od miejsca, w którym nastąpiło trzęsienie Ziemi, sejsmolog może osza-
cować — nawet z sygnałów dochodzących do jednej tylko stacji — odległość do miejsca
trzęsienia.
38-4. Ugięcie belki ’
Chcemy teraz rozpatrzyć jeszcze jedno zagadnienie praktyczne — zginanie pręta lub
belki. Jakie siły występują przy zginaniu pręta o pewnym dowolnym przekroju? Nasze
rozważania przeprowadzimy przy założeniu, że przekrój belki jest kołem, ale otrzymana
odpowiedź będzie dotyczyła przekroju o dowolnym kształcie. Aby jednak zaoszczędzić
trochę czasu, poczynimy pewne uproszczenia, tak że teoria, którą wyprowadzimy, będzie
stanowić tylko przybliżenie. Nasze wyniki będą słuszne jedynie wtedy, gdy promień zgi-
nania będzie dużo większy od grubości belki.
Przypuśćmy, że ktoś chwyci oba końce prostego pręta i wygnie go — na przykład tak,
jak to pokazano na rys. 38.11. Co się dzieje wewnątrz pręta? No cóż, jeżeli pręt jest zakrzy-
wiony, to znaczy, że substancja po wklęsłej stronie krzywej jest ściśnięta, a pó jej wypukłej
stronie jest rozciągnięta. Istnieje więc pewna powierzchnia, która przebiega mniej lub więcej
równolegle do osi pręta, która ani nie jest ściśnięta, ani rozciągnięta. Nazywa się ją po-
wierzchnią neutralną. Można by się spodziewać, że ta powierzchnia będzie blisko „środka”
przekroju. Można wykazać (ale nie będziemy tego tu robić), że w przypadku małego wy-
38-4. UGIĘCIE BELKI
341
gięcia nieskomplikowanej belki powierzchnia
neutralna przechodzi przez „środek ciężkości”
przekroju. Jest to prawdą tylko dla „czystego”
zginania, tzn. gdy belka nie jest jednocześnie
rozciągana lub ściskana.
Przy czystym zatem zginaniu cienki, poprze-
czny plasterek pręta zostaje odkształcony, tak
jak to pokazano na rys. 38.12a. Substancja po-
niżej powierzchni neutralnej doznaje odkształ-
cenia ściskania i odkształcenie to jest proporcjo-
nalne do odległości od powierzchni neutralnej:
38.11. Ugięcie belki
a substancja powyżej tej powierzchni jest roz-
ciągana także proporcjonalnie do swej odległo-
ści od powierzchni neutralnej. A więc wydłuże-
nie podłużne Al jest proporcjonalne do wysokości y. Stała proporcjonalności jest po
prostu równa stosunkowi l do promienia krzywizny pręta (patrz rys. 38.12):
Al _ y
~T~T‘
Tak więc siła na jednostkę powierzchni — naprężenie — w małym „pasku” na wyso-
kości y jest także proporcjonalna do odległości od powierzchni neutralnej:
AF
~AA
y
R
(38.34)
Przypatrzmy się teraz silom, które wywołują takie odkształcenie. Na rysunku 38.12
pokazano mały wycinek pręta wraz z działającymi nań siłami. Przez dowolny poprzeczny
przekrój pręta siły działające powyżej płaszczyzny neutralnej mają jeden kierunek, a po-
niżej tej płaszczyzny mają kierunek przeciwny. Siły te występują parami i tworzą „moment
T
38.12. a. Mały wycinek ugiętej belki, b. Przekrój belki
342
38. SPRĘŻYSTOŚĆ
38.13. Belka typu „I”
38.14. Belka-dźwigar, z zawieszonym na
jednym jej końcu ciężarem
i)
zginający” SUł, przez co się rozumie moment sił
względem linii neutralnej. Całkowity moment
można obliczyć całkując iloczyn siły i odległości
od powierzchni neutralnej dla jednej ze ścianek
wycinka z rys. 38.12:
3Jl= f ydF. (38.35)
po powierzchni
przekroju
Z równania (38.34) dF = Y(y/R)dA, tak że
Y C ,
Wl = - y2dA.
J\ J
Całka z y2dA określa to, co się nazywa „mo-
mentem bezwładności” przekroju geometrycz-
nego względem osi poziomej, przechodzącej
przez „środek masy” przekroju*’; ten „mo-
ment bezwładności” oznaczamy przez Z:
= —, (38.36)
R
I = jy2dA. (38.37)
Równanie (38.36) daje nam więc zależność
pomiędzy momentem zginającym SUł a krzy-
wizną l/R belki. „Sztywność” pręta jest proporcjonalna do modułu Younga Y i do mo-
mentu bezwładności I, Innymi słowy, jeżeli się chce mieć możliwie jak najsztywniejszą
belkę wykonaną z danej ilości np. aluminium, to należy możliwie jak najwięcej tego alu-
minium umieścić jak tylko się da najdalej od płaszczyzny neutralnej, aby belka miała duży
moment bezwładności. Nie można jednak z tym przesadzać, bo wówczas belka nie bę-
dzie się wyginała, tak jak to powinna robić, lecz będzie się wybaczać lub skręcać i znowu
się stanie słaba. Ale widać teraz, dlaczego belki budowlane robi się w postaci litery I lub H,
tak jak to pokazano na rys. 38.13.
Jako przykład zastosowania równania (38.36) znajdźmy odchylenie belki-dźwigaru, na
której wolny koniec działa jakaś skoncentrowana siła W, tak jak to pokazano na rys. 38.14.
(Przez „dźwigar” rozumie się po prostu taką belkę, która jest tak podtrzymywana, że
zarówno położenie, jak i nachylenie belki są ustalone na jednym jej końcu, np. zacemento-
wanym w betonowej ścianie.) Jaki jest kształt takiej belki? Oznaczmy przez z odchylenie
na odległości x od zamocowanego końca; chcemy znaleźć z(x). Rozważania przepro-
wadzimy tylko dla małych odchyleń. Założymy także, że długość belki jest duża w porów-
naniu z jej przekrojem. Otóż, jak Czytelnik wie z wykładów matematyki, krzywizna 1/R
*’ W rzeczywistości jest to oczywiście moment bezwładności plasterka, którego gęstość powierzch-
niowa jest równa jedności.
38-4. UGIĘCIE BELKI
343
(38.38)
dowolnej krzywej z(x) jest dana wzorem
1 d2zfdx2
~R ~\l+(dzldx)2]212 '
Ponieważ interesują nas tylko małe odchylenia, jak to zwykle bywa w przypadku kon-
strukcji budowlanych, pominiemy tu wyraz (Jz/Jx)2 w porównaniu z 1 i przyjmiemy
1 d2z
R dx2
(38.39)
Musimy także znać moment zginający 3Jł. Jest on funkcją x, ponieważ jest on równy mo-
mentowi sił względem osi neutralnej każdego przekroju. Pomińmy ciężar belki i uwzględ-
nijmy tylko siłę W, działającą ku dołowi na koniec belki. (Czytelnik może spróbować
przeprowadzić obliczenia z uwzględnieniem ciężaru belki.) Wówczas moment zginający
w punkcie x jest równy
SJl(x) = W(L-x),
ponieważ jest on równy momentowi sił względem punktu x, jaki wywiera ciężar W, czyli
momentowi sił, jaki belka „odczuwa” w punkcie x. Otrzymujemy
W(L-x)
czyli
d2z
dx2
Można to bez żadnych specjalnych sztuczek scałkować; otrzymujemy
d2z
YIIX2’
YI
~R
W
=----(L—x).
YI
(38.40)
korzystając z naszych założeń, że z(0) = 0 i że dzfdx jest także równe zeru dla x = 0.
Taki właśnie jest kształt belki. Odchylenie końca wynosi
W L2
z{L) = ~—- (38.42)
odchylenie końca belki rośnie więc wraz z sześcianem długości belki.
Przy wyprowadzaniu naszej przybliżonej teorii belki założyliśmy, że podczas zginania
belki jej przekrój się nie zmieniał. Gdy grubość belki jest mała w porównaniu z promie-
niem krzywizny, przekrój się zmienia bardzo mało i nasz wynik jest w porządku. Jednakże
w ogólnym przypadku tego efektu nie należy pomijać, jak to każdy sam może łatwo wy-
kazać, zginając w palcach miękką gumkę do mazania. Jeżeli początkowo przekrój gumki
był prostokątem, to po zgięciu gumki okaże się, że przekrój wybrzusza się ku dołowi (patrz
rys. 38.15). Dzieje się tak, ponieważ przy ściskaniu podstawy gumki materiał rozszerza się
na boki — tak jak to opisaliśmy przy pomocy stałej Poissona. Gumę można łatwo zginać
344
38. SPRĘŻYSTOŚĆ
38.15. a. Ugięcie gumki do mazania,
b. Przekrój
38.16. Belka wyboczona
i rozciągać, ale przypomina ona trochę ciecz,
w której trudno jest zmienić objętość, co widać
pięknie przy zginaniu gumki do mazania. Dla
nieściśliwej substancji stała Poissona byłaby do-
kładnie równa | — dla gumy jest ona zaś bar-
dzo bliska tej wartości.
38-5. Wyboczenie
Chcemy teraz przy pomocy naszej teorii bel-
ki zrozumieć teorię „wyboczenia” belek, słupów
lub prętów. Rozważmy sytuację taką, jak np.
na rys. 38.16, kiedy to pręt, który normalnie
byłby prosty, jest utrzymywany w swoim wygię-
tym kształcie przez dwie przeciwnie skierowa-
ne siły, które naciskają oba jego końce. Chcieli-
byśmy wyznaczyć kształt pręta i wielkości sił
działających na końce.
Niech y(x) będzie odchyleniem pręta od li-
nii prostej, łączącej oba końce, przy czym x jest
odległością od jednego z końców. Moment
zginający 33? w punkcie P na rysunku jest rów-
ny sile F pomnożonej przez ramię tej siły, które
jest odległością „prostopadłą” y
9R(x) = Fy. (38.43)
Korzystając z równania (38.36) dla belki otrzymujemy
(38.44)
Dla małych odchyleń można przyjąć, że 1/R = —d2y/dx2 (znak minus ze względu na to,
że krzywizna jest „wypukła”). Otrzymujemy równanie
d2y _ F
77 ~ ~yi y’
(38.45)
które jest równaniem różniczkowym fali sinusoidalnej. A więc dla małych odchyleń krzywa
takiej zgiętej belki jest krzywą sinusoidalną. „Długość fali” ź tej fali sinusoidalnej jest
równa podwojonej odległości Spomiędzy końcami. Jeżeli ugięcie jest małe, to ź jest jedno-
cześnie równe podwójnej długości pręta nieugiętego. A zatem szukana krzywa ma rów-
nanie
y = K sin mc/L.
38-5. WYBOCZENIE
345
Biorąc drugą pochodną, otrzymujemy
d2y r.2
~d^~ = ~7Jy'
Porównując to z równaniem (38.45) widzi-
my, że siła jest równa
F=tz2
YI
T2'
Dla małych ugięć siła ta jest niezależna od
przesunięcia y, opisującego ugięcie belki\
Mamy zatem następujący obraz fizyczny.
Jeżeli siła jest mniejsza od siły F, określonej
równaniem (38.46), ugięcie wcale nie nastą-
pi. Ale jeżeli siła będzie troszkę większa niż
siły F, belka zostanie nagle ugięta i to dość
znacznie, tzn. dla sił powyżej siły granicznej
7r217/L2 (często nazywanej „siłą Eulera”) bel-
ka będzie ulegała wyboczeniu. Jeżeli obcią-
żenie na drugim piętrze jakiegoś budynku
przekroczy siłę Eulera dla podtrzymujących
słupów, to budynek się zawali. Siła wybo-
czenia jest także bardzo ważna w konstrukcji
rakiet kosmicznych. Z jednej strony rakieta
musi być dostatecznie sztywna, by utrzymać
swój ciężar na wyrzutni i wytrzymać naprę-
żenia powstające podczas jej przyspieszania,
a z drugiej strony ważną rzeczą jest ograni-
czenie ciężaru tej „budowli” do minimum, tak
aby ciężar jej ładunku i ilość paliwa były
(38.46)
38.18. Kształty ugiętego pręta
F2 Fz
możliwe jak największe.
W rzeczywistości belka nie musi się całkiem załamać, gdy siła przekroczy siłę Eulera.
Gdy przesunięcia staną się duże, siła Eulera będzie większa, niż to obliczyliśmy, ze względu
na wyrazy, które pominęliśmy w wyrażeniu na 1/7? danym równaniem (38.38). Aby znaleźć
siły przy dużym wyboczeniu belki, należy powrócić do dokładnego równania, równania
(38.44), które było niezależne od przybliżonego związku pomiędzy R i y. Równanie (38.44)
ma dość prostą własność geometryczną*’. Jej dowód jest trochę skomplikowany, ale jest
ona raczej interesująca. Zamiast opisywać krzywą za pomocą zmiennych x i y można użyć
*> Nawiasem mówiąc, to samo równanie pojawia się również w innych sytuacjach fizycznych, np.
dla memsku cieczy zawartej pomiędzy dwiema równoległymi płaszczyznami i można tam posługiwać się
tym samym opisanym tu rozwiązaniem geometrycznym.
346
38. SPRĘŻYSTOŚĆ
dwóch nowych zmiennych: S, długości łuku krzywej, i 6, kąta nachylenia stycznej do krzy-
wej (patrz rys. 38.17). Krzywizna jest równa „szybkości” zmiany kąta z odległością:
1 dd
Dokładne równanie (38.44) można zatem zapisać w postaci
de F
y
dS-------YI
Biorąc tu stronami pochodną względem S i zastępując dyjdS przez sinfl dostajemy
d2e F
— = (38.47)
[Jeżeli 0 jest małe, to stąd dostaniemy z powrotem równanie (38.45). Wszystko jest więc
w porządku.]
Może Cię to Czytelniku ucieszy (a może i nie), że równanie (38.47) jest dokładnie takim
samym równaniem, jakie się otrzymuje dla wahadła, wahającego się z dużą amplitudą —
z F/YI zastąpionym oczywiście jakąś inną stałą. W rozdziale 9 tomu I (cz. 1) nauczyliśmy
się, jak takie równanie rozwiązywać numerycznie*’. W wyniku otrzymuje się pewne fan-
tastyczne krzywe. Rysunek 38.18 pokazuje trzy takie krzywe dla różnych wartości FjYI.
*’ Rozwiązania tego zagadnienia można także wyrazić przez pewne funkcje, nazywane „eliptycznymi
funkcjami Jacobiego”, których wartości zostały już kiedyś obliczone.
39
ośrodki sprężyste
39-1. Tensor odkształceń
W poprzednim rozdziale mówiliśmy o zniekształceniach pewnych szczególnych obiek-
tów sprężystych. W tym rozdziale chcemy rozpatrzyć, co się może ogólnie rzecz biorąc
dziać wewnątrz ośrodka sprężystego. Chcielibyśmy umieć opisać warunki naprężeń i od-
kształceń wewnątrz jakiejś dużej bryły galarety, skręconej i zgniecionej w pewien skompli-
kowany sposób. Aby to zrobić, musimy znać opis odkształceń lokalnych w każdym punkcie
ciała sprężystego; opis taki sprowadza się do przyporządkowania każdemu punktowi
zbioru sześciu liczb, będących składowymi tensora symetrycznego. Poprzednio mówiliśmy
o tensorze naprężeń (rozdz. 31); teraz potrzebny nam jest tensor odkształceń.
Wyobraźmy sobie, że za punkt wyjścia przyjmiemy ośrodek początkowo nie odkształ-
cony i będziemy obserwować, jak się przesuwa mała, osadzona wewnątrz ośrodka plamka
„zanieczyszczenia”, gdy ośrodek doznaje odkształcenia. Plamka, która była w punkcie P,
znajdującym się w r = (x, y, z), przesuwa się do nowego położenia P', w r' — (%', y', z'),
tak jak to pokazano na rys. 39.1. Wektor przesunięcia od punktu P do P' oznaczamy
przez u. Wówczas
u = r'—r. (39.1)
Przesunięcie u zależy oczywiście od punktu, z którego wystartowaliśmy, tak że u jest
funkcją wektorową zmiennej r albo, co na jedno wychodzi, funkcją zmiennych x,y,z.
Rozpatrzmy najpierw prostą sytuację, gdy odkształcenie jest stałe w całym ośrodku;
mamy wówczas tzw. odkształcenie jednorodne. Przypuśćmy na przykład, że mamy jakiś
element ośrodka i że będziemy go równomiernie rozciągać. Będziemy po prostu równo-
miernie zmieniać jego rozmiary w jednym kierunku, na przykład w kierunku x, tak jak to
pokazano na rys. 39.2. Droga ux plamki, która się początkowo znajdowała w punkcie x,
348
39. OŚRODKI SPRĘŻYSTE
39.1. Plamka zlokalizowana w ośrodku w punkcie P w nieodkształconym bloku ośrodka przesuwa
się do punktu P' po odkształceniu
39.2. Jednorodne odkształcenie typu
rozciągania
jest proporcjonalna do x. W istocie
Al
X l
ux będziemy zapisywać w taki oto sposób:
ux =
Stała proporcjonalności exx jest oczywiście do-
kładnie tym samym co Aljl. (Wkrótce zoba-
czymy, dlaczego użyliśmy podwójnego wskaź-
nika.)
Jeżeli odkształcenie nie jest równomierne, to
związek pomiędzy ux i x będzie się zmieniać
w ośrodku od miejsca do miejsca. Dla sytuacji
ogólnej exx definiujemy jako pewien rodzaj lokal-
nego odkształcenia Al[l, a mianowicie
exx— dujdx. (39.2)
Ta liczba, która jest teraz funkcją x, y i z, opi-
suje jak wielkie jest rozciąganie w kierunku x
W kawałku galarety. Oczywiście, może
tam także zachodzić rozciąganie w kierunkach y
i z. Opisujemy je liczbami
du du2
fi ~ _____- fi ~_______
w dy ’ " dz
/
/
(39.3)
Powinniśmy także móc opisać odkształcenia typu ścinania. Weźmy na przykład mały
39-1. TENSOR ODKSZTAŁCEŃ
349
39.3. Jednorodne odkształcenie typu ścinani*
sześcian znajdujący się w niezdeformowanej początkowo galaretce. Jeżeli zmienimy kształt
galaretki, to sześcian ten może się zmieniać w równoległościan, tak jak to naszkicowano
na rys. 39.3*’. Przy takim odkształceniu przesunięcie w kierunku osi x każdej cząstki jest
proporcjonalne do jej współrzędnej y,
ux = -^y. . ' (39.4)
Mamy tu też ruch w kierunku y, w którym droga jest proporcjonalna do x,
0
uy = -x. (39.5)
Takie więc odkształcenie ścinania można opisać wzorami
"x &xyy ’
uy = eyxx, r , s
przyjmując w nich
, , 0
exy ~ eyx
Można by teraz sądzić, że gdy odkształcenia nie są jednorodne, to uogólnione odkształ-
cenia ścinania można by opisać definiując wielkości exy i eyx jako
*> Na chwilę rozdzielimy całkowity kąt ścinania 0 na dwie równe części i założymy, że odkształce-
nie jest symetryczne względem x i y.
350
39. OŚRODKI SPRĘŻYSTE
39.4. Obrót jednorodny, przy którym nie ma odkształcenia
Ale jest tu jedna trudność. Przypuśćmy, że przesunięcia ux i uy byłyby określone nastę-
pująco:
0 ff
= uy = -—x.
Równania te są bardzo podobne do równań (39.4) i (39.5), z tym że znak przy uy został
zmieniony na przeciwny. Przy takich przesunięciach mały sześcian w galaretce zostaje po
prostu przesunięty o kąt 0/2, tak jak to pokazano na rys. 39.4. Nie ma tu wcale żadnego
odkształcenia, mamy tylko obrót w przestrzeni. Ośrodek nie zostaje w ogóle zniekształ-
cony; względne bowiem położenia wszystkich atomów wcale nie ulegają zmianie. Musimy
tak podobierać nasze definicje, aby definicje odkształcenia ścinania nie zawierały w sobie
czystych obrotów. Kluczowym punktem jest tu fakt, że jeżeli dujdy i duy/8x są sobie równe
i mają znaki przeciwne, to wówczas nie ma żadnego odkształcenia; można więc uporząd-
kować nasze definicje przyjmując, że
e*? = eyx = i(8uy/dx+dux/8y).
Dla czystego obrotu obie te wielkości są równe zeru, ale dla czystego ścinania exy jest
równe eyx, zgodnie z tym, co chcielibyśmy otrzymać.
W najbardziej ogólnie pojętym odkształceniu, które może ’ zawierać rozciąganie lub
ściskanie na równi ze ścinaniem, stan odkształcenia określamy przez podanie dziewięciu
liczb:
<3u,
>
dx
du
eyy = ’
oy
eXy = Wu^+dujdy),
(39.7)
39-1. TENSOR ODKSZTAŁCEŃ
351
Są to wyrazy tensora odkształceń. Ponieważ jest to tensor symetryczny — z naszych de-
finicji wynika, że exy = eyx — więc w rzeczywistości jest tu tylko sześć różnych liczb.
Pamiętamy (rozdz. 31), że zgodnie z własnością ogólną tensora jego wyrazy transformują
się jak iloczyny składowych dwóch wektorów. (Jeżeli A i B są wektorami, to Cfj — AtBj
jest tensorem.) Każdy z wyrazów eu jest iloczynem (lub sumą takich iloczynów) składo-
wych wektora u = (ux, uy, uz) i składowych operatora V = (d!dx, djdy, d/dz), który —
jak wiemy — transformuje się tak jak wektor. Zastąpmy współrzędne x, y i z współrzęd-
nymi x15 x2 i x3, a składowe ux, uy i u. składowymi u2, u2 i u3; wówczas ogólny wyraz
tensora odkształceń można zapisać jako
= }(8uj[dxi+8uil8x}), (39.8)
gdzie i oraz j mogą być równe 1, 2 lub 3.
Dla odkształcenia jednorodnego, które może zawierać zarówno rozciąganie, jak i ści-
nanie, wszystkie wyrazy e/y są stałymi i można napisać
= exxx+e^y+e„z. (39.9)
[Początek naszego układu (x,y,z) obieramy w takim punkcie, w którym u jest równe
zeru.] W tym przypadku tensor odkształceń daje zależność pomiędzy dwoma wekto-
rami: wektorem położenia r = (x, y,z) i wektorem przesunięcia u = (ux, uy, uz).
Gdy odkształcenia nie są jednorodne, każdy kawałek galaretki może zostać także
nieco skręcony — będzie zachodzić pewien obrót lokalny. Jeżeli wszystkie odkształcenia
są małe, to
AXj, (39.10)
i
gdzie (Ojj jest tensorem mtysymetrycznym
~ i(t>u}ldxi~Sui/dx}), (39.11)
który opisuje obrót. Nie będziemy się jednak już więcej troszczyć o obroty, a zajmiemy się
tylko takimi odkształceniami, które są opisane przez tensor symetryczny e^.
39-2. Tensor sprężystości ,
Teraz, gdy już opisaliśmy odkształcenia, chcielibyśmy powiązać je z siłami wewnętrz-
nymi — z naprężeniami w ośrodku. Zakładamy, że dla każdego małego elementu ośrodka
jest słuszne prawo Hooke’a i przyjmujemy, że naprężenia są proporcjonalne do odkształ-
ceń. W rozdziale 31 zdefiniowaliśmy tensor naprężeń S,7 jako i-tą składową siły działają-
cej poprzez jednostkową powierzchnię, prostopadłą do osi x. Prawo Hooke’a mówi, że
każda składowa jest zależna liniowo od każdej ze składowych odkształcenia. Ponieważ
5 i e mają po dziewięć składowych, istnieje 9-9 = 81 możliwych współczynników, które
opisują własności sprężyste ośrodka. Te współczynniki są stałymi, jeżeli sam ośrodek
352
39. OŚRODKI SPRĘŻYSTE
jest jednorodny. Zapisuje się je jako CiJlcl, a definiuje się je przy pomocy równania
^CiJklekl, (39.12)
*,z
gdzie i,j, k, l przyjmują wartości 1, 2, lub 3. Ponieważ współczynniki Cijkl wiążą z sobą
dwa tensory, to tworzą one także tensor — tensor czwartego rzędu. Można go nazwać
tensorem sprężystości.
Załóżmy, że wszystkie współczynniki Cijkl są znane i że do jakiegoś obiektu, o pewnym
dziwacznym kształcie, przykładamy jakąś skomplikowaną siłę. Będą tam wszystkie typy
odkształceń i nasz obiekt przybierze w końcu jakiś „wykrzywiony” kształt. Jakie są prze-
mieszczenia w tym obiekcie? Widać, że zagadnienie jest dość złożone. Gdybyśmy znali
odkształcenia, moglibyśmy znaleźć naprężenia z równania (39.12) — lub odwrótnie. Ale
te naprężenia i odkształcenia, które się na koniec ustalają w każdym punkcie, zależą od
tego, co się dzieje w reszcie ośrodka. Najprostszy sposób na „dobranie się” do tego zagad-
nienia polega na rozpatrzeniu energii. Jeżeli mamy siłę F proporcjonalną do przesunięcia,
powiedzmy F — kx, to praca wymagana do wykonania przesunięcia x jest równa kx2f2.
W podobny sposób, praca w, wykonywana w każdej jednostkowej objętości odkształco-
nego materiału, jest równa
w = ł Cijkieaeki- (39.13)
ijkl
Całkowita praca W potrzebna do odkształcenia ciała jest równa całce Z w po objętości
ciała:
— f i ^vkieijekidV. (39.14)
ijkl
Praca ta jest równa energii potencjalnej zmagazynowanej w naprężeniach wewnętrznych
ośrodka. Jeżeli teraz ciało jest w równowadze, to ta energia wewnętrzna musi przyjmować
minimum. Zagadnienie znalezienia odkształceń w ciele można zatem rozwiązać znajdując
taki układ przesunięć u w całym ciele, przy którym energia W przyjmie minimum. W roz-
dziale 19 tomu II (cz. 1) podaliśmy kilka ogólnych pojęć rachunku wariacyjnego, których
się używa w takich zagadnieniach szukania minimum. Niestety, tego zagadnienia nie mo-
żemy rozpatrzyć tu bardziej szczegółowo.
Przede wszystkim interesuje nas teraz to, co potrafimy powiedzieć o ogólnych włas-
nościach tensora sprężystości. Jest rzeczą jasną, że w rzeczywistości tensor Cijkt nie jest
wcale scharakteryzowany przez 81 różnych wyrazów. Ponieważ zarówno Sb, jak i ei}
są tensorami symetrycznymi, z których każdy ma tylko 6 różnych wyrazów, to w C,jk
może być najwyżej 36 różnych wyrazów. Zwykle jednak jest ich o wiele mniej.
Rozpatrzmy szczególny przypadek kryształu regularnego. Dla takiego kryształu gęstość
energii w ma następującą postać:
+ ^xxxy ^xx ^xy 4“ ^xxxz &xx &xz4"
’~^~^~'xxyx^xx^yx~^'^-'xxyy^xx^yy^~r** •••4“
+ Cwwe^+... itd.... itd.... itd. ...). (39.15)
39-2. TENSOR SPRĘŻYSTOŚCI
353
W sumie 81 wyrazów! Ale kryształ regularny ma pewne symetrie. W szczególności, jeżeli
obróci się kryształ o 90 °, to jego własności fizyczne nie ulegną zmianie. Ma on więc taką
samą sztywność na rozciąganie w kierunku y, co na rozciąganie w kierunku x. Dlatego
też jeżeli zmienić naszą definicję kierunków osi współrzędnych x i y w równaniu (39.15),
to dla dowolnych przesunięć energia się nie zmieni. A więc dla kryształu regularnego muszą
zachodzić związki:
(39.16)
Z kolei można pokazać, że takie wyrazy jak Cxxxy muszą być równe zeru. Kryształ
regularny ma bowiem tę własność, że jest on symetryczny wobec odbicia względem każdej
płaszczyzny prostopadłej do jednej z osi. Jeżeli więc zastąpi się y przez — y, to nic się nie
zmieni. Ale zamiana y na — y zmienia exy na — exy — przesunięcie, które było w kie-
runku +y, jest teraz w kierunku — y. Jeżeli energia ma się nie zmienić, to przy odbiciu
współczynnik musi przejść w — Cxxxy. Ale odbity kryształ jest taki sam, jaki był
przed odbiciem, tak że Cyyyj, musi być takie samo jak — Cxxxy, a to się może stać tylko
wtedy, gdy oba współczynniki C są równe zeru.
„No, dobrze — powiecie — ale takie same rozważania wykażą, że Cyyyy = 0!” Nie,
ponieważ tu są cztery wskaźniki y. Znak się zmienia raz dla każdego y, a cztery minusy
dają w wyniku plus! Jeżeli więc mamy dwa lub cztery wskaźniki, to odpowiedni wyraz nie
musi być równy zeru. Wyraz taki jest równy zeru tylko wtedy, gdy ma jeden lub trzy wskaź-
niki y. A zatem, dla kryształu regularnego każdy niezerowy współczynnik C będzie miał
tylko parzystą liczbę wskaźników identycznych. (Rozważania przeprowadzone tu dla y
stosują się oczywiście także dla x i dla z.) Powinny by więc wystąpić tu tylko takie wyrazy,
jak Cxw, Cxyxy, Cxyyx i tak dalej. Ale pokazaliśmy już, że jeżeli zmieni się każde y na x
i odwrotnie (lub każde z na x itd), to musi się otrzymać — dla kryształu regularnego —
znowu ten sam współczynnik. Oznacza to, że są tylko 3 różne niezerowe możliwości:
(39.17)
A zatem gęstość energii kryształu regularnego będzie miała postać następującą:
2 Cxxyy (exx eyy 4- eyy e2Z 4- eZ2 &yy) 4~
+ 4CXyxy (exy + e>z + ezx)] .
(39.18)
Dla materiału izotropowego, tzn. niekrystalicznego, symetria ta jest jeszcze wyższa.
Wszystkie współczynniki C muszą być takie same dla każdego wyboru układu współrzęd-
nych. Okazuje się, że mamy wtedy jeszcze jeden związek pomiędzy współczynnikami C,
a mianowicie
(39.19)
23 — Wykłady z fizyki
354
39. OŚRODKI SPRĘŻYSTE
Można się o tym przekonać przy pomocy następującego ogólnego rozumowania. Ten-
sor naprężeń Sy musi być powiązany z tensorem ev w sposób, który nie zależy wcale od
kierunków współrzędnych — musi on być powiązany tylko przez wielkości skalarne.
„To proste” — powiecie. „Jedyny sposób na otrzymanie Sy z sprowadza się do po-
mnożenia ey przez jakąś stałą skalarną. To jest po prostu prawo Hooke’a. Musi więc
zachodzić związek Sy — (stała)-ey.” Ale to nieprawda; mógłby tu jeszcze wystąpić
tensor Jednostkowy dy, pomnożony przez jakiś skalar, wyrażony liniowo poprzez etj.
Jedynym, jaki można utworzyć, niezmiennikiem liniowym w wyrazach jest £eu. (Trans-
formuje się on jak x2+y2+z2, a więc tak jak skalar). A zatem najbardziej ogólną postacią
dla równania wiążącego Sy z etj — dla ośrodków izotropowych — jest związek
5(/ = 2(we<,.+A(2/?^)<5,r
(39.20)
(Pierwszą stałą zapisuje się zwykle jako 2p; wówczas współczynnik p jest równy modułowi
ścinania, który zdefiniowaliśmy w poprzednim rozdziale.) Stałe p i 2 nazywamy stałymi
sprężystymi Lamego. Porównując równanie (39.20) z równaniem (39.12) widzimy, że
Cjayy —
(39.21)
C™* — 2^4-2.
Udowodniliśmy zatem, że równanie (39.19) jest rzeczywiście prawdziwe. Widać także,
że własności sprężyste ośrodka izotropowego są w pełni określone dwiema stałymi, jak
już to stwierdziliśmy w rozdziale poprzednim.
Tensor sprężystości można także wyrazić przy pomocy dwóch dowolnych stałych
sprężystości, spośród tych, którymi posługiwaliśmy się poprzednio, na przykład przy
pomocy modułu Younga Y i stałej Poissona a. Pozostawiamy czytelnikowi wykazanie, że
C*w 1-j-tr
39-3. Ruchy w ciele sprężystym
Wykazaliśmy, że dla ciała sprężystego w równowadze naprężenia wewnętrzne tak się
wzajemnie dopasowują, że energia przyjmuje minimum. Chcemy się teraz przyjrzeć temu,
co się dzieje, gdy siły wewnętrzne nie są w równowadze. Powiedzmy, że wyodrębnimy mały
element ośrodka, ograniczony pewną powierzchnią A (patrz rys. 39.5). Jeżeli element ten
39-3. RUCHY W CIELE SPRĘŻYSTYM
355
jest w równowadze, to całkowita działająca nań siła
F musi być równa zeru. Siłę tę można rozłożyć na
dwie części. Jedna z tych części może pochodzić od sił
„zewnętrznych”, takich jak siła ciężkości, które dzia-
łają z pewnej odległości na materię w tym elemencie,
tak aby wytworzyć pewną siłę na jednostkę objętości,
fzewn. Całkowita siła zewnętrzna FMwn będzie równa
całce z fzewn po objętości tego elementu:
Fzewn = f 4ewn<^. (39.23)
W równowadze siła ta powinna być zrównoważona
przez całkowitą siłę Fwewn, pochodzącą od materii
w sąsiedztwie naszego elementu i działanie tej siły
powinno być przekazywane przez powierzchnię A.
Gdy jednak rozważany element ośrodka nie jest
w równowadze, to znaczy jeżeli się porusza, suma
będzie równa iloczynowi masy i przyspieszenia. Będziemy więc mieli
39.5. Mały element objętości V
ograniczony powierzchnią A
siły wewnętrznej i zewnętrznej
F,ewn + Fwewn = faldV,
(39.24)
gdzie q jest gęstością ośrodka, a r jest jego przyspieszeniem. Można teraz równania (39.23)
i (39.24) zebrać razem pisząc:
Fwewn J ( ^zewn + t? f)dF.
V
Uprościmy nasz zapis wprowadzając oznaczenie
ś ^zewn 4" J? t.
Wówczas równanie (39.25) można zapisać w postaci:
Fwewn= ffdV.
V
<39.25)
(39.26)
(39.27)
Siła, którą oznaczyliśmy F^, wiąże się z naprężeniami w materiale. Zgodnie z de-
finicją tensora naprężeń Sl} (rozdz. 31) x-owa składowa siły dF działającej poprzez element
powierzchni da o jednostkowej normalnej n jest dana wzorem
dFx = (S^+S^+S^Jda. (39.28)
Składowa .r-owa siły Fwewn, działająca na nasz mały element, jest zatem równa całce
z dFx po powierzchni A. Uwzględniając ten wynik i wypisując x-ową składową równa-
nia (39.27) otrzymujemy
f (^xxflx+^xyfly~^^xini)^a — J fx^‘ (39.29)
356
39. OŚRODKI SPRĘŻYSTE
Mamy całkę powierzchniową związaną z całką objętościową, a to przypomina nam coś,
o czym mówiliśmy w elektryczności. Zauważmy, że gdyby nie zwracać uwagi na pierwszy
wskaźnik x w każdym z S-ów po lewej stronie równania (39.29), to lewa strona wygląda-
łaby tak, jak całka z wielkości ,,S”n, tzn. z normalnej składowej jakiegoś wektora, po
powierzchni A. Całka taka byłaby równa strumieniowi „S” z tej objętości. A to można
by zapisać, korzystając z prawa Gaussa, w postaci całki objętościowej z dywergencji ,,S”.
Ale twierdzenie Gaussa jest prawdziwe niezależnie od tego, czy będzie tam ten wskaźnik x,
czy też nie; jest to po prostu twierdzenie matematyczne, które się otrzymuje całkując przez
części. Innymi słowy, równanie (39.29) można zamienić na
* , CldSXx dSxv dSxz\ , C ,
\ . \^dV- (39.30)
\J \ dx dy dz / J
Teraz, korzystając z dowolności obszaru całkowania, można odrzucić znaki całek obję-
tościowych i zapisać równanie różniczkowe dla ogólnej składowej f:
V SSij
<39-31)
j j
Równanie to mówi nam, jak siła na jednostkę objętości jest związana z. tensorem naprę-
żeń Stj.
Aby sformułować teorię ruchów wewnątrz ciał stałych, należy przeprowadzić na-
stępujące postępowanie: przyjmując za punkt wyjścia znajomość przesunięć początkowych,
określonych na przykład przez wektor u, można znaleźć składowe tensora odkształceń etj.
Z odkształceń można wyznaczyć naprężenia przy pomocy równania (39.12). Mając na-
prężenia można przy pomocy równania (39.31) otrzymać gęstość siły f. Znając zaś f można
otrzymać z równania (39.26) przyspieszenie r ośrodka, które pozwoli nam określić zmianę
przesunięć w czasie. Wykonując to wszystko po kolei, dostaje się dość nieprzyjemne rów-
nanie ruchu dla sprężystych ciał stałych. Podamy tu tylko wyniki tego postępowania i to
jedynie dla ośrodka izotropowego. Korzystając z równania (39.20) na Stj i wyrażając
jako \{duildxj+dujldx^, dostanie się na koniec równanie wektorowe:
f = (A+/z)V(V • u)+/zV2u. (39.32)
Można jednak bezpośrednio stwierdzić, że równanie wiążące z sobą f i u musi mieć
taką właśnie postać. Siła musi bowiem zależeć od drugich pochodnych przesunięć u. Ja-
kie zaś drugie pochodne u mogą być wektorami? Jedną z nich jest V(V-u) (jest to praw-
dziwy wektor), a drugą (i ostatnią) jest V2u. A zatem najogólniejszą możliwą postacią
jest związek
f = nV(V-u)+óV2u,
który jest w zasadzie identyczny z równaniem (39.32), gdyż różni się od niego tylko ozna-
czeniami stałych. Można by zapytać: dlaczego nie mamy trzeciego wyrazu postaci Vx
xVxu, który jest także wektorem? Ale pamiętamy, że VxVxu jest równe V2u—
—V(V-u), a więc jest liniową kombinacją tych dwóch wyrazów, które już mamy. Dodając
39-3. RUCHY W CIELE SPRĘŻYSTYM
357
więc V x V x u nie dodalibyśmy nic nowego. Jeszcze raz zatem udowodniliśmy, że ośrodek
izotropowy ma tylko dwie stałe sprężyste.
Aby otrzymać równanie ruchu ośrodka, można przyrównać równanie (39.32) do
Qd2uldt2 — pomijając na razie wszystkie siły objętościowe, takie jak siła ciężkości —
i wówczas
<52u
= (A+/z)V(V-u)+/zV2u. (39.33)
ot
Przypomina to trochę równanie falowe, które mieliśmy w elektromagnetyzmie, z tą różnicą,
że mamy tu pewien dodatkowy, złożony wyraz. Dla ośrodków, których własności sprę-
żyste są wszędzie takie same, można w następujący sposób stwierdzić, jak wygląda rozwią-
zanie ogólne. Pamiętamy, że każde pole wektorowe można zapisać jako sumę dwóch
wektorów: jednego, którego dywergencja jest równa zeru, i drugiego, którego rotacja
jest równa zeru. Innymi słowy, można przyjąć
u = Ui+u2, (39.34)
gdzie
V-U1=0, Vxu2 = 0. (39.35)
Podstawiając sumę Uj+u2 za pole wektorowe u do równania (39.33) otrzymujemy
d2
q— (01+u2) - (A+/z)V(V-u2)+/zV2(u1+u2). (39.36)
dr
Pole wektorowe Ui można wyeliminować, biorąc dywergencję obu stron tego równania:
o2
Q— (Vu2) =
ot
Ponieważ kolejność operatorów (V2) i (V) można dowolnie zmieniać, to można operator
dywergencji wyciągnąć przed nawias:
r 52u2 i
V- L——(A+2/z)V2u2 = 0. ; (39.37)
L ot2 j
Ponieważ zaś Vxu2 jest z definicji równe zeru, rotacja z wyrażenia znajdującego się
w nawiasie kwadratowym jest także równa zeru; tak więc nawias ten sam musi tożsamoś-
ciowe znikać i
52u2
= (A+2/z)V2u2. (39.38)
ot
Jest to wektorowe równanie fali dla fal rozchodzących się z prędkością C2 = v'(2+2/i)/q.
Ponieważ rotacja wektora u2 jest równa zeru, fali tej nie towarzyszy żadne ścinanie i jest
ona tylko falą ściskania, czyli typem fali dźwiękowej, którą opisaliśmy w poprzednim roz-
dziale, a jej prędkość jest równa znalezionej tam właśnie prędkości CpodlU2.
W podobny sposób — biorąc rotację z równania (39.36) — można pokazać, że wek-
358
39. OŚRODKI SPRĘŻYSTE
poddany naprężeniom
39.6. Mierzenie naprężeń wewnętrznych przy po-
mocy światła spolaryzowanego
39.7. Model z plastyku, w którym panują naprę-
żenia, widziany pomiędzy dwoma skrzyżowany-
mi polaroidami. [Z pracy F. W. Sears, Optics,
Addison-Wesley Publishing Co., Reading, Mass.,
1949.]
tor spełnia równanie
52iii
e^-=juV2u1. (39.39)
Ot
Jest to znowu wektorowe równanie fali
dla fal o prędkości C2 = Ponie-
waż V-Uj jest równe zeru, przesunięcie
Uj nie powoduje żadnych zmian objętoś-
ci; wektor uŁ odpowiada zatem fali po-
przecznej (fali ścinania), którą omawialiś-
my w poprzednim rozdziale i C2 =
= c
'“-'ścinania •
Gdyby ktoś chciał znaleźć naprężenie
statyczne w jakimś ośrodku izotropowym,
to mógłby w zasadzie je znaleźć rozwią-
zując równanie (39.32) z siłą f równą zeru
lub równą statycznym siłom objętościo-
wym ciążenia, takim jak <?g. Równanie
(39.2) należałoby przy tym rozwiązać przy
pewnych warunkach brzegowych, które
byłyby określone przez siły działające na
powierzchni ograniczającej cały element
ośrodka sprężystego. Zagadnienie to jest
nieco trudniejsze do rozwiązania niż odpo-
wiadające mu zagadnienie elektromagne-
tyki. Jest ono trudniejsze, gdyż, po pierw-
sze, rozwiązywanie występujących tu rów-
nań sprawia troszkę więcej kłopotu, a po
drugie, kształty ciał sprężystych, które
nas zwykle interesują, są przeważnie o wie-
le bardziej skomplikowane. W elektroma-
gnetyzmie interesuje nas często rozwiąza-
nie równań Maxwella wokół obiektów
o stosunkowo prostych kształtach geo-
metrycznych, takich jak walce, kule itd.,
ponieważ są to dogodne kształty dla urzą-
dzeń elektrycznych. W teorii sprężystości
obiekty, które chciałoby się opisać, mają
zwykle kształty dość skomplikowane, jak
np. hak dźwigu, wał korbowy samochodu
albo wirnik turbiny gazowej. Takie zagad-
nienia można czasem rozwiązać w przybli-
żeniu przy pomocy metod numerycznych,
39-3. RUCHY W CIELE SPRĘŻYSTYM
359
korzystając z zasady minimum energii, o której to zasadzie wspomnieliśmy już poprze-
dnio. Inny jeszcze sposób polega na wykonaniu modelu obiektu i na doświadczalnym
zmierzeniu odkształceń wewnętrznych; używa się do tego celu światła spolaryzowanego.
Robi się to tak: gdy przezroczysty ośrodek izotropowy, np. taki przezroczysty materiał
jak lucyt, zostaje poddany naprężeniom, staje się on materiałem dwójłomnym. Jeżeli
przepuści się przez taki ośrodek światło spolaryzowane, to płaszczyzna polaryzacji zo-
stanie obrócona o pewien kąt, proporcjonalny do naprężenia; mierząc więc ten obrót,
można zmierzyć naprężenie. Rysunek 39.6 pokazuje, jak może wyglądać takie urządzenie,
fotografia zaś 39.7 przedstawia model fotosprężysty, o skomplikowanym kształcie, pod-
dany naprężeniom.
39-4. Zachowanie się niesprężyste
We wszystkim, co dotąd zostało powiedziane, zakładaliśmy, że naprężenie jest pro-
porcjonalne do odkształcenia; ogólnie, nie jest to jednak prawdą. Na rysunku 39.8 po-
kazano typową krzywą, przedstawiającą naprężenie jako funkcję odkształcenia dla ja-
kiegoś materiału plastycznego. Dla małych odkształceń naprężenie jest proporcjonalne
do odkształcenia. Jednakże później, po przekroczeniu pewnego odkształcenia, ten zwią-
zek pomiędzy naprężeniem i odkształceniem przestaje już być opisywany przez funkcję
liniową. Dla wielu materiałów, tych, które nazwalibyśmy „łamliwymi”, odkształcenia
powodują złamanie się takiego obiektu tuż powyżej tego punktu, w którym krzywa za-
czyna się pochylać. Ponadto w ogólnym przypadku w tym związku naprężenie-odkształ-
cenie pojawiają się jeszcze inne komplikacje. Tak na przykład, jeżeli będzie się odkształ-
cać jakiś obiekt, to naprężenia mogą być od razu duże, ale później będą rosły powoli
z czasem. W innych natomiast przypadkach, jeżeli przejdzie się do dużych naprężeń,
ale jeszcze poniżej punktu „złamania”, a następnie się zmniejszy odkształcenia, to naprę-
żenia „powrócą” wzdłuż innej krzywej. Zachodzi tu, chociaż w niewielkim stopniu, zja-
wisko histerezy (przypominające związek pomię-
dzy polami B i H w materiałach magnetycznych).
Naprężenie, przy którym materiał się łamie,
różni się znacznie w zależności od materiału.
Niektóre materiały będą się łamać, gdy maksy-
malne naprężenie rozciągające osiągnie pewną
wartość. Inne zaś materiały się „rozlecą”, gdy
maksymalne naprężenie ścinające osiągnie pewną
wartość. Kreda jest przykładem takiego materia-
łu, który jest o wiele mniej wytrzymały na
rozciąganie niż na ścinanie. Jeżeli naciśnie się na
końce kawałka kredy do pisania, to złamie się
ona prostopadle do kierunku przyłożonego na-
prężenia, tak jak to pokazano na fot. 39.9a. Kre-
da łamie się prostopadle do przyłożonej siły, po-
39.8. Typowa zależność naprężenie-od-
kształcenie dla dużych odkształceń
I
360
39. OŚRODKI SPRĘŻYSTE
39.9. Kawałek kredy a) złamany przez nacisk na oba
końce, b) złamany przez skręcenie
nieważ w tym przypadku trzeba
rozerwać tylko niewielką grupę
upakowanych wspólnie cząstek,
co można łatwo zrobić. Materiał
ten jest jednak o wiele bardziej
odporny na ścinanie, ponieważ
wówczas cząstki stają sobie
wzajemnie na drodze. Pamięta-
my teraz, że gdy mieliśmy pręt,
który był skręcany, to cały pręt
był dookoła poddany ścinaniu.
Pokazaliśmy także, że ścinanie
było równoważne złożeniu roz-
ciągania i ściskania pod kątem
45°. Z tych to powodów, jeżeli
się skręci kawałek kredy, złamie
się on wzdłuż pewnej skompliko-
wanej powierzchni, która na po-
czątku złamania tworzy z osią
kredy kąt 45°. Kawałek kredy
złamany w taki właśnie sposób
pokazano na fot. 39.9b. Kreda
się łamie tam, gdzie w materiale
powstaje największe naprężenie.
Inne materiały zachowują się
w sposób dziwny i skompliko-
wany. Im bardziej złożona jest
struktura materiału, tym bar-
dziej interesująco się on za-
chowuje. Jeżeli wziąć arkusz
„Saran-Wrap”*’, zmiąć go w kulę i rzucić na stół, to arkusz ten powoli się rozłoży
i powróci do swej pierwotnej, płaskiej formy. Na pierwszy rzut oka mogłoby się wydawać,
że to bezwładność powstrzymuje materiał od powrotu do pierwotnej postaci. Jed-
nakże prosty rachunek wykazuje, że bezwładność jest o kilka rzędów wielkości za mała,
aby mogła powodować to zjawisko. Są tam widocznie dwa ważne, konkurujące z sobą
efekty: „pewne czynniki” wewnątrz materiału „pamiętają” jego pierwotny kształt i „pró-
bują” do niego powrócić, ale „inne czynniki” „wolą” ten nowy kształt i „opierają” się
powrotowi do starego kształtu.
*’ Jest to produkowana w USA cienka folia plastykowa, w której prawdopodobnie „zamrożono”
elektryczne momenty dipolowe. Służy ona głównie do opakowywania produktów żywnościowych, do któ-
rych ścisłe przylega i samoczynnie się nie odwija. W opisanym doświadczeniu arkusz folii „usiłuje” na ma-
ksymalnej swej powierzchni przylgnąć do powierzchni stołu. (Przyp. red. wyd. polskiego.)
39-4. ZACHOWANIE SIĘ NIESPRĘŻYSTE
361
Nie będziemy usiłowali opisywać mechanizmu tej zabawy z folią Saran, ale nastę-
pujący model może nam pomóc w zrozumieniu, skąd się takie zjawisko może wziąć.
Wyobraźmy sobie materiał utworzony z długich, giętkich, ale mocnych włókien wymie-
szanych wraz z jakimiś komórkami, wypełnionymi jakąś lepką cieczą. Wyobraźmy sobie
też, że pomiędzy poszczególnymi komórkami są jakieś wąskie „ścieżki”, tak że ciecz może
przeciekać powoli z jednej komórki do drugiej. Mnąc arkusz czegoś takiego odkształci
się te długie włókna, w jednym miejscu wypychając ciecz z komórek i wpychając ją do
innych komórek, które są w trakcie tego procesu rozciągane. Gdy zostawimy taki zmięty
w kulę arkusz w spokoju, te długie włókna będą się starały powrócić do swego pier-
wotnego kształtu. Ale aby to zrobić, muszą one przepchać ciecz do jej położenia pier-
wotnego, co będzie się działo stosunkowo dość wolno, ze względu na lepkość. Siły, które
my przykładamy mnąc arkusz, są o wiele większe od sił wywieranych przez włókna.
Można zmiąć arkusz szybko, ale powrót do pierwotnego kształtu nastąpi o wiele wol-
niej. W Saran-Wrap musi bez wątpienia być jakaś kombinacja dużych a sztywnych i mniej-
szych a ruchliwych cząsteczek, która jest odpowiedzialna za zachowanie się tego mate-
riału. Do tej koncepcji pasuje też fakt, że materiał powraca do swego pierwotnego kształ-
tu szybciej, gdy go podgrzać — ciepło zwiększa ruchliwość (zmniejsza lepkość) tych mniej-
szych cząsteczek.
Chociaż omawialiśmy właśnie, jak to prawo Hooke’a się załamuje, to jednak najdzi-
wniejszą rzeczą jest nie to, że prawo Hooke’a nie ma zastosowania do dużych odkształ-
ceń, ale to, że jest ono tak uniwersalne. Można podać pewną próbę wytłumaczenia tego,
rozpatrując energię odkształcenia w ośrodku. Powiedzenie, że naprężenie jest propor-
cjonalne do odkształcenia, jest równoznaczne powiedzeniu, że energia odkształcenia
zmienia się jak kwadrat odkształcenia. Przypuśćmy, że mamy pręt i że skręcimy go o mały
kąt 0. Jeżeli prawo Hooke’a ma tu mieć zastosowanie, to energia odkształcenia powinna
być proporcjonalna do kwadratu 0. Przypuśćmy, że energia jest jakąś dowolną funkcją
kąta; moglibyśmy ją wówczas wyrazić w postaci rozwinięcia w szereg Taylora wokół
kąta 0 = 0.
U(ff) = t7(0)+ C7'(O)0+it7"(O)024-C7'"(O)03... (39.40)
Moment sił r jest równy pochodnej U względem kąta; tak więc dla założonego przez
nas przypadku
t(0) = C/'(O)+C/''(O)0+lt7"'(O)02+... . (39.41)
Jeżeli teraz będziemy mierzyć kąty, licząc je od położenia równowagi, to pierwszy wyraz
w rozwinięciu Taylora (39.40) jest równy zeru. A zatem, jako pierwszy pozostaje wyraz
proporcjonalny do 0; i dla dostatecznie małych kątów będzie on znacznie większy od wy-
razu z 02. [W rzeczywistości występujące w przyrodzie substancje są dostatecznie symetrycz-
ne wewnętrznie, tak że r(0) = — r(—0); wyraz w szeregu (39.40) z 02 będzie więc równy
zeru i odchylenie od liniowości będzie pochodzić tylko od wyrazu z 03. Nie ma jednakże
żadnego powodu, aby to miało być prawdą dla ściskania i rozciągania.] Nie wytłuma-
czyliśmy tutaj jednej rzeczy, a mianowicie tego, dlaczego materiały zwykle się łamią,
wkrótce po tym jak wyrazy wyższych rzędów zaczynają mieć istotne znaczenie.
362
39. OŚRODKI SPRĘŻYSTE
39-5. Obliczanie stałych sprężystości
Naszym ostatnim tematem ze sprężystości będzie pokazanie, jak można próbować
obliczać stałe sprężystości jakiejś substancji, biorąc za punkt wyjścia znajomość własności
atomów, z których dana substancja jest zbudowana. Rozpatrzmy tylko prosty przypadek
regularnego kryształu jonowego, takiego jak np. chlorek sodu. Gdy kryształ taki zostaje
odkształcony, jego objętość lub jego kształt ulega zmianie. W wyniku tych zmian rośnie
energia potencjalna kryształu. Aby obliczyć zmianę energii odkształcenia, musi się wie-
dzieć, dokąd każdy z atomów przechodzi. W kryształach złożonych atomy będą się prze-
suwać w sieci w jakiś bardzo skomplikowany sposób, tak aby całkowita energia stała
się możliwie jak najmniejsza. Utrudnia to w znacznym stopniu obliczanie energii od-
kształcenia. Jednak w przypadku prostego kryształu regularnego można łatwo przewi-
dzieć, co się będzie działo. Odkształcenia wewnątrz kryształu będą geometrycznie podobne
do odkształceń zewnętrznych ścian i krawędzi kryształu.
Stałe sprężyste kryształu regularnego można zatem obliczyć w następujący sposób.
Po pierwsze, zakłada się jakieś prawo oddziaływania pomiędzy każdą parą atomów w krysz-
tale. Następnie oblicza się zmianę energii wewnętrznej kryształu, w przypadku gdy zo-
stanie on odkształcony i straci swój kształt równowagi. To daje nam pewien związek
pomiędzy energią i odkształceniami. Związek ten jest formą kwadratową ze względu na
wszystkie odkształcenia. Porównując energię otrzymaną w ten sposób z równaniem (39.13)
można zidentyfikować współczynniki przy każdym z wyrazów ze stałymi sprężystości Cijkl.
Dla naszego przykładu założymy proste prawo oddziaływania: siła pomiędzy sąsied-
nimi atomami jest siłą centralną, przez co się rozumie, że działa ona wzdłuż linii łączącej
39.10. a. Siły międzyatomowe, które uwzględniamy w naszych obliczeniach, b. Model, w którym atomy
są połączone z sobą przy pomocy sprężyn
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI
363
oba atomy. Można się spodziewać, że takie właśnie będą siły w kryształach jonowych,
ponieważ siły te są przede wszystkim określone przez prawo Coulomba. (Siły wiązań
kowalencyjnych są zwykle bardziej złożone, ponieważ mogą one nadać atomowi znaj-
dującemu się w pobliżu jakiś „prztyczek” w bok; tę komplikację pominiemy.) Będziemy
też uwzględniać tylko te siły, które działają pomiędzy każdym atomem, a jego najbliż-
szym i drugim z kolei sąsiadem. Innymi słowy, dokonamy takiego przybliżenia, które
pomija wszystkie siły pochodzące od dalszych jeszcze sąsiadów. Te siły, które będziemy
uwzględniać, dla płaszczyzny xy pokazano na rys. 39.10a. Należy też uwzględnić odpo-
wiednie siły działające w płaszczyznach yz i zx.
Ponieważ interesują nas tylko te współczynniki sprężystości, które mają zastosowanie
do niewielkich odkształceń, i — co na jedno wychodzi — ponieważ chcemy mieć w ener-
gii tylko te wyrazy, które się zmieniają jak kwadraty odkształceń, możemy sobie wyobra-
zić, że siła pomiędzy każdą parą atomów zmienia się liniowo z przesunięciem. Można
zatem wyobrazić sobie, że każda para atomów jest połączona idealną sprężyną, tak jak
to pokazano na rys. 39.10b. Wszystkie sprężyny łączące poszczególne atomy sodu z ato-
mami chloru powinny mieć tę samą stałą sprężyny, nazwijmy ją k\. Sprężyny łączące
dwa atomy sodu i sprężyny łączące dwa atomy chloru mogłyby mieć stałe różne, ale
uprościmy nasze rozważania i przyjmiemy, że te stałe są sobie równe; oznaczymy je k2.
(Można by po zobaczeniu, jak wyglądają obliczenia, cofnąć się i dokonać zróżnicowania
tych stałych.)
Zakładamy teraz, że kryształ jest odkształcony i że odkształcenie jest jednorodne,
opisane przez tensor odkształceń e^. W ogólnym przypadku będziemy mieli składowe
opatrzone wskaźnikami x, y i z; ale teraz będziemy rozważać tylko odkształcenie o trzech
składowych exx, exy i eyy, tak aby można było je sobie łatwiej wyobrazić. Jeżeli obrać
jeden atom za początek naszego układu, to przesunięcie każdego innego atomu jest dane
przez dostosowane do poczynionych uproszczeń równanie (39.9):
= exxx+exyy,
(39.42)
m, = eyxx+eyyy.
Nazwijmy atom znajdujący się w punkcie x = y = 0 „atomem 1” i ponumerujmy jego
sąsiadów na płaszczyźnie xy, tak jak to pokazano na rys. 39.11. Oznaczając stałą sieci
przez a otrzymujemy składowe przesunięcia w kierunkach x i y, ux i uy, zamieszczone
w tab. 39.1.
Teraz można obliczyć energię zmagazynowaną w sprężynach, która dla każdej sprę-
żyny jest równa k2/2 razy kwadrat wydłużenia. Tak na przykład, energia w poziomej sprę-
żynie łączącej atom 1 z atomem 2 jest równa
k1(exxa)2
- ~2 (39.43)
Zauważmy, że przesunięcie w kierunku osi y atomu 2 nie zmienia, z dokładnością do
wyrazów pierwszego rzędu, długości sprężyny łączącej atom 1 z atomem 2. Aby jednak
otrzymać energię odkształcenia w sprężynie wzdłuż przekątnej, takiej jak pomiędzy ato-
364
39 OŚRODKI SPRĘŻYSTE
35.11. Przesunięcia najbhzszydi i drugich z kolei sąsiadów atomu 1 (przejaskrawione)
Tabela 39.1
Atom Usytuowanie x/y Ux Uy k
1 o, o 0 0 —
2 ' a, o exxa eyxa
3 a, a ^xx+eXy>a (eyx+eyy)<l ^2
4 , 0, a exya eyya ^1
5 —a, a <—exx~eXy>a ( ’eyx~^~eyy)a k2
6 —a, 0 —exxa €yXQ kl
7 —4(j —a —(eXX—exy>a —(eyx+eyy)a k2
8 0, —a - cxya eyya kl
9 a, —a (exx exy)a (eyx eyy)a k2
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI
363
mami 1 i 3, należy obliczyć zmianę długości, pochodzącą zarówno od przesunięcia po-
ziomowego, jak i od przesunięcia pionowego. Dla małych odchyleń od pierwotnego
sześcianu tę zmianę odległości atomu 3 można zapisać jako sumę składowych ux i uy
w kierunku przekątnej, a mianowicie jako
1
F2
Podstawiając za ux i uy wartości z tabeli otrzymujemy energię
= ^-(.exx+eyx+exy+eyy)2. (39.44)
Aby otrzymać całkowitą energię wszystkich sprężyn w płaszczyźnie xy, należy dodać
do siebie 8 wyrazów, takich jak (39.43) i (39.44). Oznaczając tę energię Uq otrzymujemy
a2 r , Z ,
^0 = — l^lgxx+ y \eXX+eyX+eXy+eyy) +
k
+k1eyy+ — (exx—eyx+exy— eyy)2+
H"^l®XxH y XX~^~ yx~^~ xy~^~ yy) H-
+ k1e2y+^(exx-eyx+exy-eyy)2^. ' (39.45)
Aby otrzymać całkowitą energię wszystkich sprężyn połączonych z atomem 1, musimy
jeszcze coś dodać do równania (39.45). Chociaż w grę wchodzą tylko x-owe i j-owe skła-
dowe odkształcenia, to mimo to są jeszcze pewne energie, związane z najbliższymi są-
siadami atomu 1, leżącymi poza płaszczyzną xy. Ta dodatkowa energia jest równa
k2(e^a2+e2ya2).
(39.46)
Stałe sprężystości są związane z gęstością energii w za pomocą równania (39.13). Ener-
gia, którą obliczyliśmy, jest energią związaną z jednym atomem, a właściwie jest to po-
dwojona wartość energii przypadającej na jeden atom, ponieważ energia sprężyny jest
rozdzielona po połowie pomiędzy oba atomy, które ta sprężyna łączy. Ponieważ w jednost-
kowej objętości jest 1 /a3 atomów, to wielkości w i Uo są związane z sobą zależnością
«. Aby znaleźć stałe sprężystości CiJkl, należy tylko wykonać przekształcenie algebra-
i$Ene w równaniu (39.45), dodać doń wyrazy z (39.46) i porównać współczynniki stojące
366
39. OŚRODKI SPRĘŻYSTE
przy z odpowiednimi współczynnikami w równaniu (39.13). Wykonując odpowied-
nie obliczenia możemy stwierdzić, że na przykład, przed wyrazem exx i e2y występuje
czynnik
(k1+2k2)a2,
czyli
C _k^lk*
^xxxx '''yyyy *
Dla pozostałych wyrazów sprawa się nieco komplikuje. Ponieważ nie da się rozróżnić
iloczynu dwóch wyrazów, takiego jak na przykład exxeyy i eyyexx, współczynnik przy
takich wyrazach w wyrażeniu na energię jest równy sumie dwóch wyrazów z równania
(39.13). Współczynnikiem przy exxeyy w równaniu (39.45) jest 2k2a2, tak że
2k2
Cyyxx) ~ •
Ale ze względu na symetrię naszego kryształu C^y = i dlatego
k2
C = C = —
^xxyy yyxx •
Przy pomocy podobnego postępowania można także otrzymać
fc2
C = C = —
^xyxy yxyx ♦
Łatwo też można dostrzec, że każdy wyraz, który zawiera albo x, albo y tylko jeden raz
jest równy zeru, tak jak to udowodniliśmy już poprzednio na gruncie rozważań o syme-
trii. Podsumujmy nasze wyniki:
_ c _ *i+2fc2
^xxxx ^yyyy »
V ('• < a
1 k2
C = C = —
^'xyxy ^yxyx >
(39.47)
^yyxx ^xyyx •
Cxxxy = cxyyy = itd. = 0.
Potrafiliśmy zatem związać stałe sprężystości elementu objętości substancji z włas-
nościami atomowymi, których odzwierciedleniem są stałe ki i k2- W naszym szczegól-
nym przypadku Cxyxy = Cxxyy. Okazuje się, jak z pewnością czytelnik zauważył, śle-
dząc tok obliczeń, że te wyrazy są zawsze sobie równe dla kryształu regularnego, bez
względu na to, ile sił się weźmie pod uwagę, jeżeli tylko siły te będą działały wzdłuż pro-
stych łączących poszczególne pary atomów, to znaczy wtedy tylko, gdy siły działające
pomiędzy atoniami będą przypominały sprężynki, a nie będą zawierały jakichś wyrazów
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI
367
Tabela 39.2. Współczynniki sztywności sprężystej kryszta-
łów regularnych w 1012 dyn/cm2*’
Cxxxx ^xxyy ^xyxy
Na 0,055 0,042 0,049
K 0,046 0,037 0,026
Fe 2,37 1,41 1,16
diament 10,76 1,25 5,76
Al 1,08 0,62 0,28
LiF 1,19 0,54 0,53
NaCl 0,486 0,127 0,128
KC1 0,40 0,062 0,062
NaBr 0,33 0,13 0,13
KJ 0,27 0,043 0,042
AgCl 0,60 0,36 0,062
Z książki C. Kittel, Introduction to Solid State Physics, John
Wiley and Sons, Inc. New York 1956, str. 93.
powodujących odchylenia na boki, tak jak to się na przykład dzieje w przypadku belki,
której jeden koniec jest zamurowany. (Takie siły działające na bok występują w wią-
zaniach kowalencyjnych.)
Wniosek ten można sprawdzić posługując się wynikami pomiarów doświadczalnych
stałych sprężystości. W tabeli 39.2 podajemy wartości obserwowane trzech współczyn-
ników sprężystości dla kilku kryształów regularnych*’. Zauważmy, że na ogół
i Cxyxy nie są sobie równe. Powodem tego jest fakt, że w takich metalach jak sód i potas
siły międzyatomowe nie działają wzdłuż linii łączących atomy, tak jak to założyliśmy
w naszym modelu. Diament też się „nie słucha” tego prawa, ponieważ siły w diamencie
są siłami kowalencyjnymi i mają pewne własności kierunkowe — wiązania wolą zwykle
tworzyć czworościany. Kryształy jonowe, takie jak fluorek litu, chlorek sodu itd., mają
prawie wszystkie te własności fizyczne, które zakładał nasz model i tabela pokazuje, że
stałe Cxxyy i Cxyxy są sobie prawie równe. Nie bardzo natomiast jest jasne, dlaczego wa-
runek, że Cxxyy = Cxyxy, nie jest spełniony dla chlorku srebra.
*’ W literaturze przedmiotu często można się spotkać z innym zapisem. Tak na przykład, zwykle
się pisze Cxxxx — Cllt C^y — C12 i Cxyxy = C44..
40
j
przepływ „suchej wody”
40-1. Hydrostatyka
Zagadnienie przepływu różnych cieczy, a szczególnie wody fascynuje każdego czło-
wieka. Każdy z nas chyba pamięta, jak, będąc dzieckiem, bawił się tym dziwnym „two-
rem” w wannie czy też w błotnistej kałuży. Gdy już trochę podrośniemy, obserwujemy
strumienie, wodospady i wiry i jesteśmy zafascynowani tą substancją, która się wydaje
być prawie żywa w porównaniu z ciałami stałymi. Zachowanie się cieczy jest w wielu
przypadkach zupełnie nieoczekiwane i interesujące — i to właśnie będzie tematem tego
i następnego rozdziału. Wysiłki dziecka próbującego zagrodzić tamą mały strumień pły-
nący ulicą i jego zdziwienie na widok tego dziwnego sposobu, w jaki woda przedziera się
przez tamę, mają swój odpowiednik w naszych wieloletnich próbach zrozumienia prze-
pływu cieczy. Próbowano już zatamować wodę — w naszym pojęciu — przy pomocy
praw i równań, które miały opisywać jej przepływ. Te próby opiszemy w tym rozdziale.
W następnym rozdziale opiszemy ten jedyny w swoim rodzaju sposób, w jaki to woda
przerwała tamę i wymknęła się naszym próbom zrozumienia jej przepływu.
Zakładamy, że czytelnikowi są już znane elementarne własności wody. Taką główną
własnością, która odróżnia ciecz od ciała stałego, jest to, że w cieczy nie może się utrzy-
mywać przez żaden skończony czas naprężenie ścinające. Jeżeli poddamy ciecz naprę-
żeniom ścinającym, spowodują one jej ruch. Płyny gęstsze, takie jak miód, poruszają się
przy tym z większą trudnością niż takie płyny jak powietrze lub woda. Miarą tej trudności,
z jaką dana ciecz przepływa, jest jej lepkość. W tym rozdziale będziemy rozważać tylko
takie sytuacje, w których zjawisko lepkości będzie można pominąć. Skutkami lepkości
zajmiemy się w następnym rozdziale.
Zaczynamy od hydrostatyki, teorii cieczy znajdujących się w spoczynku. Gdy ciecz
jest w spoczynku, to nie mogą wystąpić żadne siły ścinania (nawet dla cieczy lepkich).
40-1. HYDROSTATYKA
369
Prawo hydrostatyki mówi zatem, że na-
prężenia są zawsze prostopadłe do każ-
dej powierzchni wewnątrz cieczy. Tę
prostopadłą siłę na jednostkę powierzchni
nazywamy ciśnieniem. Z faktu, że w cie-
czy statycznej nie ma ścinania, wynika,
że naprężenie ciśnienia jest we wszystkich
kierunkach takie samo (rys. 40.1). Do-
wód tego pozostawiamy czytelnikowi.
Dokładniej, chodzi o wykazanie, że jeżeli
na żadnej płaszczyźnie w cieczy nie ma
ścinania, to ciśnienie musi być we wszy-
stkich kierunkach takie samo.
Ciśnienie w cieczy może się zmieniać
od miejsca do miejsca. Tak na przykład
w cieczy statycznej na powierzchni Ziemi
ciśnienie będzie się zmieniało z wysoko-
ścią, ze względu na ciężar cieczy. Jeżeli
gęstość cieczy q będzie się uważać za
stałą i jeżeli ciśnienie na jakimś dowolnie
obranym poziomie zerowym oznaczy się
p0 (rys. 40.2), to wówczas ciśnienie p na
wysokości h powyżej tego punktu będzie
równe p = p0—Qgh, gdzie g jest siłą gra-
witacyjną działającą na jednostkę masy
(czyli przyspieszeniem ziemskim). Suma
P+Qgh
jest więc w cieczy statycznej stała. Zwią-
zek ten jest nam znany, ale teraz wypro-
wadzimy pewien ogólniejszy wynik, któ-
rego szczególnym przypadkiem jest właś-
nie powyższy związek.
Jeżeli wyodrębnimy w myśli mały sześ-
cian wody, to jaka wypadkowa siła, po-
chodząca od ciśnienia, będzie na niego
działała? Ponieważ w każdym punkcie ciś-
40.1. W cieczy statycznej siła działająca na do-
wolną powierzchnię jednostkową jest prostopa-
dła do tej powierzchni i jest taka sama dla do-
wolnej orientacji powierzchni
40.2. Ciśnienie w cieczy statycznej
nienie jest takie samo we wszystkich kierunkach, wypadkowa siła będzie różna od zera tylko
dlatego, że ciśnienie się zmienia od punktu do punktu. Przypuśćmy, że ciśnienie się zmienia
w kierunku osi x, i obierzmy kierunki osi współrzędnych równolegle do krawędzi sześcianu.
Ciśnienie na ściankę w punkcie x wywołuje siłę p dy Jz (rys. 40.3). a ciśnienie na ściankę
w punkcie x-f-zlx daje siłę — [p-r(ćp/cx)dx]dy dz, tak że wypadkowa siła jest równa
— (cp!cx)dx dy dz. Jeżeli rozpatrzymy pozostałe pary ścianek sześcianu, to łatwo zo-
24 — wykłady z fizyki
370
40. PRZEPŁYW „SUCHEJ WODY”
40.3. Wypadkowa — pochodząca od ciśnienia —
siła, która działa na sześcian, jest równa —
na jednostkę objętości
cieczy, to siła na jednostkę objętości wynosi
dzałająca na jednostkę objętości dodana do
od ciśnienia musi dać zero:
baczymy, że wywołana przez ciśnienie si-
ła na jednostkę objętości jest równa —Vp.
Jeżeli oprócz ciśnienia są jeszcze inne si-
ły, np. siła ciężkości, to ciśnienie musi je
zrównoważyć, tak aby się ustaliła równo-
waga.
Weźmy taki przypadek, w którym tę
dodatkową siłę można opisać przy pomo-
cy energii potencjalnej, tak jak to się
czyni dla siły ciężkości; niech ę? oznacza
energię potencjalną na jednostkę masy.
(Dla siły ciężkości, na przykład, <p = gz.)
Siła działająca na jednostkę masy jest
dana przez — V<p, a jeżeli q jest gęstością
-oV<p. Aby się ustaliła równowaga, ta siła
siły na jednostkę objętości pochodzącej
—V/>—Q^(p = 0.
(40.1)
Równanie (40.1) jest równaniem hydrostatyki. W ogólnym przypadku nie ma ono roz-
wiązań. Jeżeli bowiem gęstość się zmienia w przestrzeni w jakiś dowolny sposób, to nie
ma na to sposobu, aby siły się równoważyły, i ciecz nie może być w równowadze statycz-
nej — powstaną wtedy prądy konwekcyjne. Można to stwierdzić na podstawie równania,
ponieważ wyraz z ciśnieniem jest czystym gradientem, podczas gdy drugi wyraz, w przy-
padku zmiennej gęstości q, już na ogół czystym gradientem być nie może. Wyraz z ener-
gią potencjalną jest czystym gradientem tylko w pewnych sytuacjach, na przykład wtedy,
gdy gęstość q jest stała. Wówczas rozwiązaniem równania (40.1) jest
p+gę? = const.
Inna możliwość, dopuszczająca równowagę hydrostatyczną, pojawia się wtedy, gdy gę-
stość q jest funkcją tylko ciśnienia p. Zagadnieniem hydrostatyki nie będziemy się jednak
zajmować, ponieważ nie jest ono tak ciekawe, jak sytuacja gdy ciecze są w ruchu.
40-2. Równania ruchu
Najpierw omówimy ruchy cieczy w pewien czysto abstrakcyjny, teoretyczny sposób,
a później rozważymy kilka szczególnych przykładów. Aby opisać ruch jakiejś cieczy,
musi się podać jej własności w każdym punkcie. Tak na przykład woda (nazywajmy
tę naszą ciecz „wodą”) porusza się w różnych miejscach z różnymi prędkościami. Aby
więc scharakteryzować przepływ, musi się podać trzy składowe prędkości w każdym
punkcie i w każdej chwili. Jeżeli będziemy potrafili znaleźć równania, które określają
prędkość, to będziemy już wiedzieć, jak się ciecz przez cały czas porusza. Jednakże pręd-
kość nie jest jedyną zmieniającą się od punktu do punktu własnością, która daną ciecz cha-
40-2. RÓWNANIA RUCHU
371
rakteryzuje. Przed chwilą właśnie omawialiśmy zmianę ciśnienia od punktu do punktu.
Ponadto mogą tu wystąpić jeszcze inne zmienne wielkości. Może więc zmieniać się od
punktu do punktu na przykład gęstość. Oprócz tego, ciecz może dodatkowo być prze-
wodnikiem i przenosić prąd elektryczny, którego gęstość j też będzie zmieniała się od
punktu do punktu, zarówno co do wielkości jak i co do kierunku. W cieczy może też
zmieniać się od punktu do punktu jej temperatura albo pole magnetyczne i szereg innych
wielkości. Liczba pól potrzebnych zatem do opisu kompletnej sytuacji zależy od tego
z jak skomplikowanym zagadnieniem będziemy mieli do czynienia. Istnieją interesujące
zjawiska, gdy dominującą rolę odgrywają prądy elektryczne i magnetyzm w określaniu
zachowania się cieczy; zagadnienia takie są przedmiotem magnetohydrodynamiki, której
obecnie poświęca się wiele uwagi. Jednakże nie będziemy tu rozważać tych bardziej zło-
żonych sytuacji, ponieważ interesujące zjawiska znajdziemy już na niższym szczeblu
„złożoności”, a nawet ten bardziej elementarny poziom będzie wystarczająco skompli-
kowany.
Zajmiemy się sytuacją, w której nie ma pola magnetycznego ani przewodnictwa i nie
będziemy się martwić o temperaturę, ponieważ będziemy zakładać, że gęstość i ciśnienie
określają w sposób jednoznaczny temperaturę w każdym punkcie. Pójdziemy nawet
dalej i uprościmy naszą pracę, zakładając, że gęstość jest stała, a założenie takie oznacza,
że ciecz jest zupełnie nieściśliwa. Innymi słowy, będziemy brali pod uwagę tak małe
zmiany ciśnienia, że wywołane przez nie zmiany gęstości będziemy mogli pominąć. Gdy-
byśmy nie przyjęli tego założenia, to oprócz zjawisk, które tu będziemy omawiać, natknę-
libyśmy^się na dodatkowe zjawiska, na przykład na zjawisko.rozchodzenia się fal dźwię-
kowych lub fal uderzeniowych. Rozchodzenie się tych fal już częściowo omówiliśmy w 2
części tomu I, tak że teraz pominiemy w naszych rozważaniach hydrodynamicznych te
„dodatkowe” zjawiska właśnie zakładając, że gęstość q jest stała. Łatwo można określić,
kiedy to przybliżenie będzie dobre. Nie trzeba się mianowicie martwić o zmiany gęstości
wtedy, gdy prędkości przepływu będą o wiele mniejsze od prędkości fali dźwiękowej
w danej cieczy. To, że woda się wymyka naszym próbom zrozumienia jej przepływu, nie
jest związane z przybliżeniem stałej gęstości. Komplikacje, które powodują tę ucieczkę,
będą omówione w następnym rozdziale.
Ogólną teorię cieczy trzeba zacząć od równania stanu, które w danej cieczy wiąże ciś-
nienie z gęstością. W naszym przypadku tym równaniem stanu jest po prostu warunek
q = const.
Jest to zatem pierwszy związek, jaki muszą spełniać nasze zmienne. Następny związek
wyraża zasadę zachowania materii — jeżeli stwierdzimy, że z jakiegoś punktu materia
wypływa, to jej ilość, jaka w tym punkcie pozostaje, musi maleć. Jeżeli prędkość cieczy
wynosi v, to masa, która w jednostce czasu przepływa przez jednostkową powierzchnię,
jest równa składowej @v, normalnej do tej powierzchni. Podobny związek mieliśmy w elek-
tryczności. Z elektryczności wiemy także, że dywergencja takiej wielkości jest równa
prędkości malenia gęstości. Z podobnych powodów możemy twierdzić że równanie
do
= (40.2)
372
40. PRZEPŁYW „SUCHEJ WODY”
wyraża zasadę zachowania masy dla cieczy; jest to hydrodynamiczne równanie ciągłości.
W naszym przybliżeniu, które jest przybliżeniem cieczy nieściśliwej, q jest pewną stałą
i równanie ciągłości przechodzi po prostu w równanie
Vv = 0. (40.3)
Prędkość płynu v ma tu więc — podobnie jak i pole magnetyczne B — dywergencję równą
zeru. (Równania hydrodynamiki są często ścisłymi odpowiednikami równań elektrody-
namiki; dlatego właśnie najpierw się uczyliśmy elektrodynamiki. Niektórzy rozumują
akurat odwrotnie: uważają, że najpierw powinno się poznać hydrodynamikę, aby potem
łatwiej móc zrozumieć elektryczność. Ale elektrodynamika jest, tak naprawdę, znacznie
łatwiejsza od hydrodynamiki.)
Następne nasze równanie otrzymamy z prawa Newtona, które określa jak się zmienia
prędkość na skutek działania sił. Masa pewnego elementu objętości cieczy pomnożona
przez jego przyspieszenie musi być równa sile działającej na ten element. Biorąc element
o objętości jednostkowej i oznaczając siłę na jednostkę objętości (czyli gęstość siły) przez
f, mamy
q • (przyspieszenie) = f.
Gęstość siły przedstawimy w postaci sumy trzech wyrazów. Rozważaliśmy już pochodzą-
cą od ciśnienia siłę na jednostkę objętości, — Vp. Poza tą siłą mogą jeszcze występować
siły „zewnętrzne”, które działają na odległość, takie jak siła ciężkości czy siła Coulomba.
Jeżeli będą to siły zachowawcze, o potencjale (na jednostkę masy) równym <p, to dadzą
one gęstość siły —oV<p. (Gdyby siły zewnętrzne nie były siłami zachowawczymi, to siłę
zewnętrzną działającą na jednostkę objętości musielibyśmy zapisać po prostu jako fzewn.)
Jest tu jednak jeszcze jedna siła „wewnętrzna”, której istnienie wiążesię z faktem, że w prze-
pływającej cieczy może też wystąpić naprężenie ścinające. Siłę tę nazywamy siłą lepkości;
oznaczamy ją flepk. Nasze równanie ruchu ma zatem postać:
o (przyspieszenie) = — Vp—J?V<p+flepk. (40.4)
W tym rozdziale będziemy zakładać, że ciecz jest „rzadka” w tym sensie, że dla jej
ruchu lepkość nie jest istotna i w równaniu (40.4) możemy siłę flepk opuścić. Trzeba jednak
pamiętać, że jeżeli się odrzuca wyraz z siłą lepkości, to dokonuje się przybliżenia, które
opisuje jakiś twór doskonały, a nie rzeczywistą wodę. John von Neumann zdawał sobie
dobrze sprawę z olbrzymiej różnicy, jaką stwarza obecność siły lepkości, a także zdawał
sobie sprawę z tego, że podczas największego rozwoju hydrodynamiki, aż do roku około
1900, największy nacisk położono na rozwiązywanie pięknych problemów matematycz-
nych przy pominięciu lepkości cieczy, które to problemy nie miały prawie nic wspólnego
z rzeczywistymi cieczami. On to właśnie nazwał teoretyków, którzy się zajmowali takim
opisem, ludźmi zajmującymi się „suchą wodą”. Taki bowiem opis pomija najbardziej
zasadniczą własność cieczy. Właśnie dlatego, że pomijamy tę własność w rachunkach
tego rozdziału, daliśmy mu tytuł: „Przepływ suchej wody”. Rozważania na temat wody
rzeczywistej odkładamy natomiast do następnego rozdziału.
Jeżeli opuścimy siłę flepk, to jedyną jeszcze rzeczą potrzebną nam do napisania rów-
40-2. RÓWNANIA RUCHU
373
40.4. Przyspieszenie cząstki cieczy
nania (40.4) w jawnej postaci będzie wyrażenie na przyspieszenie. Można by sądzić, że
wzór na przyspieszenie cząstki cieczy powinien być bardzo prosty. Wydaje się bowiem,
że jeżeli v jest prędkością cząstki cieczy znajdującej się gdzieś tam w cieczy, to jej przyspie-
szenie będzie równe 8y/dt. Tak jednak nie jest — i to z dość subtelnych powodów. Po-
chodna cy/ct jest równa szybkości, z jaką prędkość y(x, y, z, t) zmienia się w pewnym
ustalonym punkcie przestrzeni. Tymczasem musimy wiedzieć jak szybko się zmienia pręd-
kość poszczególnej cząstki cieczy. Wyobraźmy sobie, że jedną z kropli wody oznaczyliśmy
kolorową plamką i możemy ją obserwować. W małym przedziale czasu, At, ta kropla
przesunie się do jakiegoś nowego miejsca. Jeżeli kropla się porusza po pewnym torze,
takim na przykład jak na rys. 40.4, to w chwili At przesunie się ona od punktu PY do
P2. W istocie przesunie się ona w kierunku x o „odcinek” vxAt, w kierunku y o vyAt
i w kierunku z o vzAt. Widać stąd, że jeżeli v(x, y, z, t) jest prędkością cząstki płynu,
która się znajduje w chwili t w punkcie (x, y, z), to prędkość tej samej cząstki w chwili
t+At jest dana przez y(x-pAx, y+Ay, z-pAz, t-pAt), przy czym
Ax — vxAt, Ay = vyAt, Az = vzAt.
Z definicji pochodnych cząstkowych [patrz równanie (2.7), t. U, cz. 1] mamy z dokład-
nością do wyrazów pierwszego rzędu,
y(x-pvxAt, y+vyAt, z+vzAt, t+At) = v(x, y, z, t)+
dy 5v dy dy
+ —vxAt+—vAt+-—vzAt+ — At.
dx dy dz dt
Przyspieszenie Ay/At jest więc równe
dy dy dy dy
dx dy dz dt
Można to symbolicznie zapisać — traktując operator V tak jak wektor — jako
dy
(v.V)v+--. ' (40.5)
ot
374
40. PRZEPŁYW „SUCHEJ WODY"
Zauważmy, że przyspieszenie może być różne od zera nawet wtedy, gdy <3v/dt = O, a więc
wtedy, gdy prędkość w danym punkcie się nie zmienia. Tak na przykład, woda płynąca
po kole ze stałą prędkością doznaje przyspieszenia, chociaż prędkość w danym punkcie
nie ulega zmianie. Oczywiście, przyspieszenie to istnieje dlatego, że prędkość pojedynczej
cząstki wody, która początkowo jest w jednym punkcie koła, ma w chwilę później inny
kierunek; przyspieszenie jest tu przyspieszeniem dośrodkowym.
Reszta naszej teorii — to już tylko matematyka: szukanie rozwiązań równania ruchu,
które otrzymujemy wstawiając przyspieszenie (40.5) do równania (40.4). Równaniem
ruchu jest więc
dv , „ Vp „
—- +(v V)v =-----------V<p, (40.6)
Ot Q
przy czym została w nim pominięta lepkość. Równaniu temu można nadać nieco inną
postać, korzystając z następującej tożsamości analizy wektorowej:
(v-V)v = (V Xv)xv+|V(vv).
Jeżeli teraz zdefiniuje się nowe pole wektorowe Si, jako rotację v,
S2 = V xv, (40.7)
to tę tożsamość wektorową można zapisać w postaci
(v V)v = S2 xv+|Vr2,
i nasze równanie ruchu (40.6) przybierze postać
dv
---pS2xv+|Vr2=-------------V®. (40.8)
dt q
Czytelnik może sam sprawdzić, że równania (40.6) i (40.8) są sobie równoważne, spraw-
dzając, że składowe obu stron równania są sobie równe, jeśli się skorzysta z definicji
(40.7).
Pole wektorowe S2 nazywamy gęstością wirów. Jeżeli gęstość wirów jest wszędzie
równa zeru, to mówimy, że przepływ jest bezwirowy. W § 3-5 (t. II, cz. 1) zdefiniowaliśmy
pojęcie krążenia pola wektorowego. Krążenie wokół każdej zamkniętej pętli w cieczy jest
równe całce krzywoliniowej z prędkości cieczy, w danej chwili, wokół tej pętli:
(krążenie) = J vds.
Krążenie na jednostkę powierzchni dla nieskończenie małej pętli jest więc — korzystając
z twierdzenia Stokesa — równe Vxv. Gęstość wirów £2 jest zatem równa krążeniu wokół
jednostkowej powierzchni (prostopadłej do kierunku £2). Wynika też stąd, że jeżeli wpro-
wadzi się do cieczy jakieś źdźbło „brudu”, lecz nie nieskończenie mały punkt!, to będzie
się on obracał z prędkością kątową £2/2. Spróbuj to Czytelniku udowodnić. Można
także sprawdzić, że dla wiadra wody, postawionego na stoliku obrotowym, £2 jest równe
podwojonej lokalnej prędkości kątowej wody.
Jeżeli interesuje nas tylko pole prędkości, to można z naszych równań wyeliminować
40-2. RÓWNANIA RUCHU
375
ciśnienie. Biorąc rotację po obu stronach równania (40.8) oraz pamiętając, że gęstość Q
jest stała i że rotacja każdego gradientu jest równa zeru, a ponadto korzystając z równa-
nia (40.3) otrzymujemy
o £2
— + V x(£2 xv) = 0. (40.9)
dt
Równanie to wraz z równaniami
£2 = Vxv (40.10)
oraz
V-v = 0, (40.11)
opisuje w zupełności pole prędkości v. Mówiąc „matematycznie” — jeżeli znamy £2 w ja-
kiejś chwili, to znamy rotację wektora prędkości, ponieważ ponadto wiemy, że dywer-
gencja wektora prędkości jest równa zeru, a więc dla danej sytuacji fizycznej mamy już
to wszystko, co może być potrzebne do określenia prędkości v w każdym punkcie. (Przy-
pomina to sytuację w magnetyzmie, gdzie mieliśmy V-B = 0 i VxB = j/e0c2). Znajo-
mość zatem gęstości wirów £2 pozwala określić prędkość v, podobnie jak znajomość gę-
stości prądu j określała pole B. Następnie, gdy znamy już prędkość v, równanie (40.9)
wyznacza nam szybkość zmian £2, z której można dostać nową gęstość wirów £2 dla chwili
następnej. Korzystając z równania (40.10) znajdujemy znowu nową prędkość v i tak dalej.
Widać, że znajomość tych równań pozwala na rozwiązanie zagadnienia przepływu. Zau-
ważmy jednak, że równania te dają tylko pole prędkości; straciliśmy całą informację do-
tyczącą ciśnienia.
Zwróćmy uwagę na jedną ważną konsekwencję tych równań. Jeżeli wszędzie i w każdej
chwili t wektor £2 = 0, to GSŁjct także znika, tak że £2 w dalszym ciągu jest wszędzie równe
zeru w chwili t-j-Jt. Mamy więc jedno rozwiązanie naszego równania: przepływ jest trwale
bezwirowy. Jeżeli w takim przepływie na początku gęstość wirów była równa zeru, to
będzie ona równą zeru w dowolnej chwili w przyszłości. Równania, jakie wówczas należy
rozwiązać, sprowadzają się do następujących:
V-v = 0, Vxv —0.
Są to równania analogiczne do równań dla pól elektrostatycznych lub magnetycznych
w przestrzeni swobodnej. Powrócimy do nich trochę później i rozpatrzymy wtedy ich
pewne szczególne przypadki.
40-3. Przepływ ustalony — twierdzenie Bernonlliego
Chcemy teraz powrócić do równania ruchu (40.8), ale ograniczyć się do sytuacji, w któ-
rych przepływ jest „ustalony”. Mówimy, że przepływ jest ustalony, jeżeli w każdym miejscu
w cieczy prędkość się nigdy nie zmienia. W każdym punkcie ciecz zostaje zawsze zastępo-
wana nową cieczą, poruszającą się dokładnie w taki sam sposób. Obraz prędkości wygląda
wtedy zawsze tak samo, czyli v jest statycznym polem wektorowym. Tak samo, jak ryso-
376
40 PRZEPŁYW „SUCHEJ WODY”
40.5. Linie prądu w przepływie ustalo-
nym
waliśmy „linie sił pola” w magnetostatyce, można
teraz narysować linie, które są zawsze styczne do
prędkości cieczy, tak jak to pokazano na rys. 40.5.
Linie te nazywamy liniami prądu. Dla przepływu
ustalonego są one oczywiście rzeczywistymi torami
cząstek cieczy. (W przepływie nieustalonym obraz
linii prądu zmienia się w czasie; linie prądu
w jakiejś chwili nie reprezentują torów cząstek
cieczy.)
Gdy przepływ jest ustalony, to wcale nie ozna-
cza, że nic się nie dzieje, wtedy bowiem atomy
cieczy poruszają się i zmieniają swoje prędkości.
Oznacza to tylko, że <3v/<3t = 0. Jeżeli teraz rów-
nanie ruchu pomnoży się skalarnie przez v, to wyraz v(S2xv) znika i zostaje nam
/ p 1 \
rVi----FgH---v21 = 0.
2 /
(40.12)
Równanie to głosi, że dla małego przesunięcia w kierunku prędkości cieczy wielkość we-
wnątrz nawiasów nie ulega zmianie. Otóż w przepływie ustalonym wszystkie przesunięcia
zachodzą wzdłuż linii prądu, a więc równanie (40.12) mówi nam, że dla wszystkich punktów
wzdłuż linii prądu można napisać:
p 1
, ----1---o2 + q> = const (wzdłuż linii prądu). (40.13)
q 2
Jest to twierdzenie Bernoulliego. W ogólnym przypadku występująca tu stała może być
różna dla różnych linii prądu; wiemy tu bowiem tylko, że lewa strona równania (40.13)
jest stała wzdłuż danej linii prądu. Przy okazji możemy zauważyć, że dla ustalonego ruchu
bezwirowego, dla którego gęstość wirów £2 = 0, równanie ruchu (40.8) daje nam związek:
(n 1 \
— + — v2+p] = 0,
Q 2 I
tak że ’
' ’’ i
---1--r2+?> = const (wszędzie). (40.14)
6 2
Związek ten jest całkiem podobny do równania (40.13), z tym że teraz występuje w nim
stała, która ma tę samą wartość w całym płynie.
Twierdzenie Bernoulliego w gruncie rzeczy nie jest niczym innym jak zasadą zacho-
wania energii. Tego typu zasada zachowania daje nam bardzo dużo informacji o przepły-
wie, nie wymagając przy tym od nas rozwiązania szczegółowych równań. Twierdzenie Ber-
noulliego jest tak ważne i tak proste, że chcielibyśmy również pokazać, jak można Je
wyprowadzić w pewien inny sposób, różny od użytych powyżej formalnych rachunków.
Wyobraźmy sobie wiązkę przylegających do siebie linii prądu, które tworzą „rurkę
4C-3 PRZEPŁYW USTALONY — TWIERDZENIE BERNOULLIEGO
377
prądu”, tak jak to naszkicowano na rys. 40.6. Ponieważ ścianki rurki składają się z linii
prądu, to przez taką ściankę nie może przepłynąć ani odrobina cieczy. Oznaczmy pole
powierzchni przekroju rurki na jednym jej końcu przez , w tym samym miejscu mamy
ponadto daną prędkość cieczy , jej gęstość i jej energię potencjalną . Dla drugiego
końca rurki mamy odpowiednie wielkości ?t2, v2, q2 i <?2- Po krótkim odstępie czasu At
płyn znajdujący się na powierzchni Ax przesunął się o odległość v±At, a płyn z powierzch-
ni A2 przesunął się o odległość v2At (rys. 40.6b). Z zasady zachowania masy wynika, że
masa, która dopływa do rozważonego obszaru przez powierzchnię At musi być równa
masie, która wypływa przez A2. Te dwie masy muszą na obu końcach być takie same:
AM = Q1A1v1At = ()2A2v2At.
Mamy zatem rowność
= Q2A2v2. ' ' (40.15)
Z równości tej wynika, że jeżeli o jest stałe, to prędkość się zmienia odwrotnie proporcjo-
nalnie do powierzchni przekroju rurki prądu.
Obliczmy teraz pracę wykonaną przez ciśnienie cieczy. Praca wykonana na cieczy
wpływającej przez powierzchnię A2 jest równa p1A1v1At, a praca oddana przez ciecz na
powierzchni /t2 jest równap2A2v2At. Wypadkowa praca wykonana na cieczy pomiędzy
Ar i ?12 jest więc równa
piA1v1 At—p2A2v2At
i musi się równać przyrostowi energii masy AM cieczy, przy przejściu od powierzchni AY
do ?12. Innymi słowy,
p1A1v1At—p2A2v2At = AM{E2—E1), (40.16)
40.6. Ruch cieczy w rurce prądu a) b) -rr" V \ f i KU'"’ v24t^ 1 \ 1 1 s ul V \
378
40. PRZEPŁYW „SUCHEJ WODY"
/
/
gdzie E2 jest energią przypadającą na jednostkę masy na powierzchni Alt a E2 odpo-
wiednią energią na A2. Całkowitą energię przypadającą na jednostkę masy cieczy można
przedstawić w postaci sumy
E = %v2 + q>+U,
gdzie %v2 jest energią kinetyczną jednostki masy, <p — energią potencjalną jednostki masy,
a U jest dodatkowym wyrazem, który przedstawia energię wewnętrzną jednostki masy
cieczy. Energia wewnętrzna mogłaby odpowiadać na przykład energii cieplnej w cieczy
ściśliwej lub energii chemicznej. Wszystkie te wielkości mogą się zmieniać od punktu do
punktu. Podstawiając tę postać energii do równania (40.16) mamy
PiA^At p2A2v2At 1 1 2
AM
Ale widzieliśmy, że AM = (>AvAt, tak więc
p, 1 , p2 1 ,
— +^v2+q>1+U1^ — + — v2A-(p2+U2, (AGAT)
(?i 2 o2 2
co jest w zasadzie prawem Bernoulhego, z tym że mamy tu dodatkowy wyraz odpowia-
dający energii wewnętrznej. Jeżeli ciecz jest nieściśliwa, to wyraz ten jest taki sam po obu
stronach równania i wobec tego równanie (40.14) jest słuszne wzdłuż każdej Unii prądu.
Rozważymy teraz kilka prostych przykładów, w których całka Bemoulliego daje nam
opis przepływu. Przypuśćmy, że mamy wodę wypływającą z otworu znajdującego się w po-
bliżu dna zbiornika, tak jak to pokazano na rys. 40.7. Bierzemy pod uwagę taką sytuację,
w której prędkość wypływu rwypl w otworze jest znacznie większa od prędkości przepływu
w pobliżu górnej powierzchni płynu; innymi słowy, wyobrażamy sobie, że średnica zbior-
nika jest tak duża, że można pominąć opadanie poziomu cieczy. (Można by, gdyby ktoś
chciał, zrobić bardziej dokładne obliczenia.)
nieniu atmosferycznemu p0, a ciśnienie po
40.7. Wypływ ze zbiornika
U szczytu zbiornika ciśnienie jest równe cis-
obu stronach wypływającej strugi także wy-
nosi p0. Wypiszemy teraz równanie Ber-
noulhego dla pewnej linii prądu, takiej jak
to pokazano na rysunku. Przyjmujemy, że
prędkość v jest równa zeru u szczytu zbior-
nika, oraz że także potencjał grawitacyjny
<p jest tam równy zeru. Prędkość na dole
przy otworze jest równa vwypi i potencjał
= —gh, tak że
Po = Po-ri^^-pgh,
czyli
Pwypł = ^2gh. (40.18)
Jest to taka sama prędkość, jaką miałoby
ciało swobodne, spadające z wysokości h. Nie
40-3. PRZEPŁYW USTALONY — TWIERDZENIE BERNOULLIEGO
379
40.8. Przy cofniętej w głąb naczynia rurze
wypływu powierzchnia strugi zwęża się tak,
źe stanowi połowę powierzchni otworu
spustowego
jest to zbyt wielką niespodzianką, ponieważ
woda przy wyjściu zwiększa swą energię kine-
tyczną kosztem energii potencjalnej wody na
górze. Niech jednak Czytelnik nie wyobraża
sobie, że można by obliczyć wydatek, z ja-
kim woda wypływa ze zbiornika, mnożąc tę
prędkość przez powierzchnię otworu. Pręd-
kości cieczy, w momencie gdy struga opuszcza
otwór, nie są do siebie równolegle, ale mają
składowe skierowane do wnętrza, do środka
strugi — struga się zwęża. Po przebyciu przez
strugę pewnej, niewielkiej drogi przestaje się
ona zwężać i prędkości stają się do siebie
równoległe. A zatem całkowity wypływ jest
równy iloczynowi prędkości i pola powie-
rzchni w tym punkcie, w którym prędkości
stają się równoległe. Okazuje się, że jeżeli
otwór spustowy ma kształt koła o ostrej krawędzi, to struga się zwęża tak, że pole po-
wierzchni jej przekroju jest równe 62 % powierzchni otworu. Ta zredukowana, efektywna
powierzchnia wypływu zmienia się dla różnych kształtów otworów wylotowych, a doś-
wiadczalnie mierzone zwężenia strugi można znaleźć w tabelach współczynników wypływu.
Jeżeli ciecz wypływa przez rurę, która jest cofnięta w głąb naczynia, tak jak to pokazano
na rys. 40.8, można udowodnić w przepiękny sposób, że współczynnik wypływu wynosi
•dokładnie 50 %. Podamy tylko pewną wskazówkę do tego dowodu. Posłużyliśmy się za-
sadą zachowania energii, aby otrzymać prędkość [równanie (40.18)], ale przecież jest jeszcze
zasada zachowania pędu! Ponieważ w wypływającej strudze zachodzi wypływ pędu, to na
powierzchni poprzecznego przekroju strugi musi działać jakaś siła. Skąd się ta siła bierze?
Musi ona pochodzić od ciśnienia na ścianki. Dopóty, dopóki otwór wypływu jest mały
i oddalony od ścianek, prędkość cieczy w pobliżu ścianek zbiornika będzie bardzo mała.
Dlatego też ciśnienie na każdą ściankę jest prawie takie samo, jak ciśnienie statyczne
w cieczy znajdującej się w spoczynku — równanie (30.14). A zatem ciśnieniu statycznemu,
•działającemu na każdy punkt ściany bocznej zbiornika, musi odpowiadać równe mu ciś-
nienie, działające na leżący vis a vis punkt ścianki przeciwległej, z wyjątkiem tych punktów,
które leżą naprzeciwko rury wypływu. Jeżeli obliczy się pęd, jaki wypływa przez ten
otwór na skutek działania tego ciśnienia, to się okaże, że współczynnik wypływu wynosi
Metody tej nie można jednak zastosować do otworu takiego, jak ten na rys. 40.7, ponieważ
wzrost prędkości wzdłuż ścianek będących w bezpośrednim sąsiedztwie powierzchni
wypływu daje pewien spadek ciśnienia, którego nie potrafimy obliczyć.
Rozpatrzmy jeszcze jeden przykład — poziomą rurę o zmieniającym się przekroju,
tak jak to pokazano na rys. 40.9, z przepływającą w niej wodą. Z zasady zachowania
energii, czyli z wzoru Bernoulliego wynika, że ciśnienie jest mniejsze tam, gdzie powierzch-
nia przekroju jest mniejsza, a więc tam, gdzie prędkość jest większa. Zjawisko to można
łatwo wykazać, mierząc ciśnienia dla różnych przekrojów przy pomocy małych, piono-
380
40. PRZEPŁYW „SUCHEJ WODY’.
40.9. Ciśnienie jest najmniejsze tam, gdzie
prędkość jest największa
wych słupków wody, dołączonych do rury
przepływu poprzez otwory, które są na tyle
małe, że nie zakłócają przepływu. Miarą ciś-
nienia jest w tym przypadku wysokość tych
słupków wody. Okazuje się, że ciśnienie jest
mniejsze przy przewężeniu niż po obu jego
stronach. Jeżeli powierzchnia przekroju za
przewężeniem powraca do tej samej wartości,
jaką miała przed przewężeniem, to ciśnienie
znowu się zwiększa. Ze wzoru Bernoulliego
wynikałoby, że ciśnienie cieczy, która już
przepłynęła przez przewężenie, powinno być
takie samo jak przed przewężeniem, ale w
rzeczywistości to ciśnienie pod koniec przewę-
żenia jest w sposób zauważalny mniejsze.
40.10. Dowód, że prędkość v nie jest równa
Wniosek ten jest niesłuszny dlatego, że pomi-
nęliśmy siły tarcia, czyli siły lepkości, które po-
wodują spadek ciśnienia wzdłuż rury. Pomimo
tego spadku ciśnienia ciśnienie jest wyraźnie
mniejsze w przewężeniu niż po obu jego
stronach, tak jak to przepowiedział Bernoulli.
Prędkość t>2 musi być oczywiście większa
od vL , aby ta sama ilość wody przeszła przez
węższą rurę. Woda doznaje zatem przyspie-
szenia przechodząc od części szerokiej do
wąskiej. Siła, która daje to przyspieszenie, po-
chodzi od spadku ciśnienia.
O słuszności naszych wyników można się
również przekonać za pomocą jeszcze jednego
prostego doświadczenia. Przypuśćmy, że ma-
my zbiornik, którego rura wylotowa wyrzuca
strugę wody do góry, tak jak to pokazano
na rys. 40.10. Gdyby prędkość wypływu była
dokładnie równa V2gh, to wypływająca woda powinna dotrzeć aż do poziomu powierzchni
wody w zbiorniku. Tymczasem doświadczenie pokazuje, że woda aż tak wysoko nie do-
ciera. Nasze przewidywania są z grubsza słuszne, ale znowu lepkość, której nie uwzględ-
niliśmy w naszej zasadzie zachowania energii, spowodowała pewną stratę energii.
Czy ktoś trzymał kiedyś blisko siebie dwie kartki papieru i próbował je rozdzielić wdmu-
chując pomiędzy nie strumień powietrza? Spróbujcie! Kartki przylgną do siebiel Powodem
tego jest oczywiście to, że powietrze ma większą prędkość przechodząc przez ściśniętą
przestrzeń pomiędzy arkuszami, niż gdy przechodzi na zewnątrz arkuszy. Ciśnienie po-
między arkuszami jest więc mniejsze od ciśnienia atmosferycznego, tak że arkusze się bar-
dziej przycisną do siebie, a nie rozdzielą.
40-4. KRĄŻENIE
381
40-4. Krążenie
Na początku poprzedniego paragrafu stwierdziliśmy, że jeżeli mamy płyn nieściśliwy
którego krążenie jest równe zeru, to przepływ spełnia następujące dwa równania:
V-v = 0, Vxv = 0.
(40.19)
Są to takie same równania jak równania elektrostatyki lub magnetostatyki w przestrzeni
swobodnej. Dywergencja pola elektrycznego jest przecież równa zeru, gdy nie ma ładun-
ków, a rotacja pola elektrostatycznego jest zawsze równa zeru. Podobnie rotacja pola
magnetycznego jest równa zeru, gdy nie ma prądów, a dywergencja pola magnetycznego
jest zawsze równa zeru. Dlatego też równania (40.19) mają takie same rozwiązania, jak
równania na pole E w elektrostatyce lub równania na pole B w magnetostatyce. Prawdę
mówiąc, rozwiązaliśmy już zagadnienie opływu kuli, posługując się odpowiednikiem elek-
trostatycznym w § 12-5 (t. II, cz. 1). Tym odpowiednikiem elektrostatycznym było je-
dnorodne pole elektryczne plus pole dipola. To pole dipola jest tak dobrane, że prędkość
przepływu ma normalną składową do powierzchni kuli równą zeru. To samo zagadnie-
nie w przypadku opływu walca można roz-
wiązać w podobny sposób posługując się do-
branym odpowiednio jednorodnym rozkła-
dem momentu dipolowego wzdłuż linii prostej
oraz jednorodnym polem prędkości przepły-
wu. To rozwiązanie opisuje sytuację, w której
prędkość cieczy na dużych odległościach od
opływanego obiektu jest stała — zarówno co
do wartości bezwzględnej, jak i co do kie-
runku. Rozwiązanie zostało naszkicowane na
rys. 40.1 la.
Opływ walca ma jeszcze inne rozwiązanie,
w przypadku gdy warunki są takie, że ciecz
w dużych odległościach porusza się po okrę-
gach wokół walca. Przepływ jest więc wszędzie
kołowy, tak jak to pokazano na rys. 40.1 Ib.
Dla takiego przepływu nie znika krążenie
wokół walca, chociaż V xv jest w dalszym
ciągu równe zeru w każdym punkcie w cieczy.
Jak może istnieć krążenie przy znikającej ro-
tacji? Otóż krążenie wokół walca nie znika,
bo całka krzywoliniowa z pola prędkości v
wokół każdej pętli otaczającej walec nie jest
równa zeru. Jednocześnie całka krzywoliniowa
z v wokół każdej drogi zamkniętej, która nie
obejmuje walca, jest równa zeru. Z tym sa-
mym zjawiskiem zetknęliśmy się przy szukaniu
40.11. a. Opływanie walca przez ciecz dosko-
nałą. b. Krążenie wokół walca, c. Złożenie
a) i b)
382
40. PRZEPŁYW „SUCHEJ WODY”
40.12. Woda, w któ-
rej nie znika krążenie,
wypływająca ze zbior-
nika
pola magnetycznego wokół drutu. Rotacja pola B była wtedy
równa zeru na zewnątrz drutu, chociaż całka krzywoliniowa
z pola B wokół pętli otaczającej drut wcale nie znikała. Pole pręd-
kości w bezwirowym krążeniu wokół walca jest dokładnie takie
samo, jak pole magnetyczne wokół drutu. Dla drogi kołowej
o środku leżącym na osi walca całka krzywoliniowa z prędkości
jest równa
y vds = 2nrv.
Dla przepływu bezwirowego całka ta musi być niezależna od r,
czyli musi być równa stałej, którą oznaczamy C. Wówczas
C
v — ——, (40.20)
2w
gdzie v jest prędkością styczną do okręgu o promieniu r i o środku
leżącym na osi walca.
Istnieje ładny sposób zademonstrowania krążenia cieczy wokół
otworu. Należy mianowicie wziąć przezroczysty, cylindryczny
zbiornik z otworem spustowym w samym środku dna zbiornika.
Zbiornik ten napełnia się wodą, następnie mieszając patykiem
wzbudza się jakieś krążenie i wyciąga zatyczkę z otworu. Widzi się wówczas piękne zjawisko,
takie jak na rys. 40.12. (Każdy z nas widział podobną rzecz wiele razy w wannie!) Chociaż
na początku wprowadzono pewną prędkość kątową w, to prędko zamiera ona ze względu
na lepkość i przepływ staje się bezwirowy, mimo że wokół otworu będzie ciągle istniało
pewne krążenie.
Teoria pozwala obliczyć kształt wewnętrznej powierzchni wody. Gdy jakaś cząstka
wody porusza się do wewnątrz, jej prędkość rośnie. Z równania (40.20) widać, że prędkość
styczna zmienia się tak jak 1/r; wynika to po prostu z zasady zachowania momentu pędu,
tak samo jak to, że łyżwiarka zaczyna się szybciej obracać, gdy ściągnie ramiona do siebie.
Prędkość radialna także się zmienia jak 1/r. Pomijając ruch styczny, mamy wodę, która
biegnie radialnie w kierunku otworu; z faktu, że V • v = 0, wynika, że prędkość radialna
jest proporcjonalna do 1/r. Całkowita prędkość także rośnie zatem jak 1/r i woda do-
pływa do otworu wzdłuż spirali Archimedesa. Na całej powierzchni woda-powietrze pa-
nuje ciśnienie atmosferyczne i dla powierzchni tej — na podstawie równania (40.14) —
musi być spełniony związek:
gz+imt)2 = const.
Ale prędkość v jest proporcjonalna do 1/r, czyli kształt powierzchni jest określony rów-
naniem
k
(z-z0) = —.
r2
Jeszcze jedna interesująca uwaga, która jednak nie jest ogólnie prawdziwa, lecz tylko
dla przepływu nieściśliwego i bezwirowego. Otóż jeżeli mamy jedno rozwiązanie opisujące
40-4. KRĄŻENIE
383
pewien przepływ i jakieś inne rozwiązanie, to ich suma także będzie rozwiązaniem. Rów-
nania (40.19) są bowiem równaniami liniowymi. Równania opisujące natomiast w pełni
hydrodynamikę — (40.8)-(40.10) — nie są liniowe, co stanowi olbrzymią różnicę. Jednakże
w przypadku bezwirowego opływu walca można nałożyć przepływ z rys. 40.1 la na prze-
pływ z rys. 40.1 Ib i otrzymać nowy obraz przepływu, pokazany na rys. 40.lic. Przepływ
ten zasługuje na szczególną uwagę. Prędkość przepływu jest tu większa na górnej ściance
walca niż na ściance dolnej. Ciśnienia są zatem mniejsze na ściance górnej niż na ściance
dolnej. Jeżeli mamy zatem superpozycję krążenia wokół walca oraz poziomego (w nie-
skończoności) przepływu, to na walec działa wypadkowa siła poprzeczna, nazywana siłą
nośną lub siłą wyporu. Oczywiście, jeżeli krążenie znika, to na żadne ciało nie działa żadna,
tego rodzaju siła wypadkowa, zgodnie z naszą teorią „suchej wody”.
40-5. Linie wiru
Wypisaliśmy już ogólne równania dla przepływu cieczy nieściśliwej, w której może
nie znikać gęstość wirów. Są to równania:
I. V-v = 0,
II. £2 = Vxv,
c£2
III. — + V X (£2 xv) = 0.
Ot
Zawartość fizyczną tych równań opisał słownie Helmholtz w postaci trzech twierdzeń.
Po pierwsze, wyobraźmy sobie, że w cieczy potrafilibyśmy narysować linie wiru zamiast
linii prądu. Przez linie wiru rozumiemy linie sił pola, które mają kierunek wektora £2,
a których gęstość jest w każdym obszarze proporcjonalna do wartości bezwzględnej £2.
Z równania II wynika, że dywergencja wektora £2 jest zawsze równa zeru [pamiętamy —
§3-7 (t. II, cz. 1) — że dywergencja rotacji jest zawsze równa zeruj. Linie wiru zatem przy-
pominają linie sił pola B, gdyż nigdzie się nie zaczynają oraz nigdzie nie kończą i mają ten-
dencję do przebiegania wzdłuż zamkniętej pętli. Helmholtz podał ponadto słowne sfor-
mułowanie równania III w postaci następującego twierdzenia: linie wiru poruszają się
wraz z cieczą. Oznacza to, że gdybyśmy oznaczyli jakoś cząstki cieczy znajdujące się wzdłuż
linii wiru — zabarwiając je np. atramentem — to gdy ciecz podczas ruchu będzie je prze-
nosiła wraz z sobą, cząstki te będą zawsze określać nowe położenie linii wiru. Niezależnie
od tego, w jaki sposób będą się poruszały atomy cieczy, linie wiru będą się poruszać wraz
z zabarwionymi cząstkami. Oto jeden ze sposobów na wyrażenie słowne praw hydrody-
namiki.
Nasuwa to także pewną metodę rozwiązywania dowolnych zagadnień sprowadzają-
cych się do równań I-III. Jeśli dany jest początkowy obraz przepływu, powiedzmy pręd-
kość v w każdym punkcie, można obliczyć gęstość wirów £2. Znając prędkość v można,
także powiedzieć, gdzie w chwilę później znajdą się linie wiru, gdyż poruszają się one właś-
nie z prędkością v. Mając nową gęstość wirów £2 można posłużyć się równaniami I i II,
384
40. PRZEPŁYW „SUCHEJ WODY”
aby znaleźć nową prędkość v. (Przypomina to dokładnie zagadnienie szukania pola B,
jeśli są określone prądy.) Jeżeli więc dany jest obraz przepływu w jednej chwili, to w zasa-
dzie można go obliczyć dla każdej chwili późniejszej. Postępowanie takie pozwala zatem
znaleźć ogólne rozwiązanie dla przepływu nielepkiego.
Chcielibyśmy pokazać, jak można, przynajmniej częściowo, zrozumieć twierdzenie
Helmholtza opisane równaniem III. W rzeczywistości przedstawia ono po prostu zasadę
zachowania momentu pędu, zastosowaną do cieczy. Przypuśćmy, że w myśli wyodręb-
nimy z cieczy mały walec, którego oś jest równoległa do linii wiru, tak jak przedstawiono
40.13. a. Grupa linii wiru w chwili t.
b. Te same linie w chwili późniejszej t'
to na rys. 40.13a. W chwilę później ta sama por-
cja cieczy będzie już gdzie indziej. W ogólnym
przypadku będzie ona jednak też zajmowała
jakiś walec o innej średnicy i zlokalizowany
oczywiście w innym miejscu. Ten nowy walec
może mieć też jakąś inną orientację, na przy-
kład taką, jak na rys. 40.13b. Jeżeli jednak
średnica się zmieniła, to długość walca też musi
się zmienić, tak aby objętość cieczy pozostała
stała (zakładamy bowiem, że ciecz jest nie-
ściśliwa). Także, ponieważ linie wiru są zwią-
zane z substancją tworzącą ciecz, ich gęstość
będzie rosnąć ze zmniejszaniem się pola po-
wierzchni przekroju walca. Iloczyn gęstości wi-
rów £2 i pola powierzchni A walca będzie po-
zostawał stały, a zatem według Helmholtza
powinniśmy mieć
12^2 = 12^!. (40.21)
Zauważmy teraz, że w cieczy nielepkiej
wszystkie siły działające na powierzchni tego
walca (lub nawet na powierzchni dowolnego
obszaru, jaki możemy wyodrębnić w myśli
z cieczy) są prostopadłe do powierzchni. Siły
ciśnienia mogą spowodować przemieszczanie
rozważanego obszaru z miejsca do miejsca lub
zamianę jego kształtu; ale wobec braku sił stycz-
nych wartość momentu pędu substancji będącej
wewnątrz walca nie może się zmienić. Moment
pędu cieczy w małym walcu jest w przybliżeniu
równy iloczynowi jego momentu bezwładności I
i prędkości kątowej cieczy, która jest propor-
cjonalna do gęstości wirów Q. Moment bez-
władności walca jest proporcjonalny do mr1. Z za-
sady zachowania momentu pędu wnioskujemy
40-5. LINIE WIRU
385
zatem, że
40.14, Wytwarzanie podróżujących pierścieni wiru
(MlR2^Qt = (M2R22-)Q2.
Masy są tu jednak takie same, AĄ = M2, a pola powierzchni są proporcjonalne do R2,
czyli znowu otrzymaliśmy równanie (40.21). Twierdzenie Helmholtza, będące słownym
sformułowaniem prawa III, jest po prostu konsekwencją faktu, że w cieczy nielepkiej mo-
ment pędu dowolnego elementu cieczy nie może się zmienić.
Istnieje ładny sposób doświadczalnego zademonstrowania poruszającego się wiru,
dający się wykonać za pomocą prostej aparatury przedstawionej na rys. 40.14. Mamy tu
„bęben” o średnicy 60 cm i o takiej samej wysokości, powstały w wyniku naciągnięcia
grubej powłoki gumowej na otwartym końcu walcowatego „pudła”. „Dno” tego pudła —
bęben jest przewrócony na bok—jest sztywne, a do-
kładnie w jego środku znajduje się otwór o średnicy
7,5 cm. Jeżeli się gwałtownie uderzy ręką w gumową
przesłonę, to z otworu wyleci wir powietrza w kształ-
cie pierścienia. Chociaż wir taki jest niewidzialny, to
można się przekonać o jego istnieniu, ponieważ po-
trafi on zdmuchnąć świecę umieszczoną w odległości
3-6 m od bębna. Ponieważ zgaśnięcie świecy nastąpi
z pewnym opóźnieniem, można wnioskować, że „coś”
podróżuje z pewną skończoną prędkością. Zjawisko
to można lepiej zaobserwować, jeżeli najpierw wdmu-
chnie się do pudła trochę dymu. Wówczas można zo-
baczyć wir w postaci pięknego okrągłego „kółka
dymu”.
To kółko dymu jest wiązką linii wiru o kształcie
toroidalnym, taką właśnie jak przedstawiona na rys.
40.15a. Ponieważ gęstość wirów £2 = V xv, to linie
wiru przedstawiają także krążenie prędkości v, tak jak
to pokazano na części b rysunku. Ruch do przodu
pierścienia można zrozumieć w następujący spo-
sób: prędkość krążąca wokół „dna” pierścienia
przesuwa się ku „wierzchołkowi” pierścienia, co
powoduje ruch pierścienia do przodu. Ponieważ linie
40.15. Poruszający się pierścień
wiru (pierścień dymu), a. Linie
wiru. b. Przekrój pierścienia
25 — Wykłady z fizyki
386
40. PRZEPŁYW „SUCHEJ WODY”
\
wiru £2 poruszają się wraz z płynem, to poruszają się one do przodu także z prędkością
v. (Oczywiście, krążenie prędkości v wokół górnej części pierścienia jest odpowiedzialne
za ruch do przodu linii wiru będących na „dnie” pierścienia.)
Musimy jeszcze wspomnieć o pewnej poważnej trudności. Zauważyliśmy już, iż z rów-
nania (40.9) wynika, że jeżeli gęstość wirów £2 była pierwotnie równa zeru, to będzie ona
już zawsze równa zeru. Wynik ten stanowi piętę achillesową teorii „suchej wody”, gdyż
oznacza on, że jeśli gęstość wirów £2 na początku była zerem, to już zawsze będzie ona
równa zeru — co oznacza, że w żadnej sytuacji nie można wytworzyć żadnej nie
znikającej gęstości wirów. Tymczasem w naszym prostym doświadczeniu z bębnem udało
nam się wytworzyć pierścień wiru w powietrzu, które początkowo było w spoczynku.
(Na pewno bowiem v = 0 i £2 = 0 wszędzie w pudle, zanim się je uderzy.) Wiemy także,
że można wytworzyć posługując się wiosłem pewną gęstość wirów na powierzchni wody
jeziora. Widać więc jasno, że aby w pełni zrozumieć zachowanie się cieczy, należy przejść
do teorii „mokrej” wody.
Jeszcze jeden nieprawdziwy punkt w naszej teorii „suchej wody”, to przypuszczenie,
dotyczące przepływu na granicy pomiędzy cieczą a powierzchnią jakiegoś ciała stałego.
Kiedy omawialiśmy opływ walca — taki na przykład jak na rys. 40.11 — pozwoliliśmy
cieczy „ślizgać” się po powierzchni ciała stałego. W naszej teorii prędkość na powierzchni
ciała stałego mogła mieć każdą wartość, w zależności od tego, jakie były warunki począt-
kowe na ruch, a ponadto nie rozważaliśmy żadnego „tarcia” pomiędzy cieczą a ciałem
stałym. Tymczasem z doświadczenia wynika, że na powierzchni ciał stałych prędkość cie-
czy rzeczywistej zawsze spada do zera. Dlatego też nasze rozwiązanie opisujące opływ
walca z krążeniem czy bez, nie jest zgodne z rzeczywistością — tak samo zresztą, jak i nasz
wynik dotyczący wytwarzania gęstości wirów. W następnym rozdziale opowiemy o teo-
riach, które są już bardziej poprawne.
9
41
przepływ „mokrej wody”
41-1. Lepkość
W poprzednim rozdziale omówiliśmy zachowanie się wody, pomijając zjawisko lep-
kości. Teraz chcielibyśmy opisać zjawiska przepływu cieczy już z uwzględnieniem skut-
ków lepkości. Chcemy więc rozpatrzyć rzeczywiste zachowanie się cieczy. Podamy jakoś-
ciowy opis rzeczywistego zachowania się cieczy w kilku różnych sytuacjach, tak aby czy-
telnik mógł się nieco zaznajomić z zagadnieniami, jakie tu mogą się pojawiać. Chociaż więc
zobaczymy tu kilka skomplikowanych równań i dowiemy się o kilku skomplikowanych
sprawach, to jednak nie zakładamy, że czytelnik będzie uczył się tych wszystkich rzeczy
z tego rozdziału. Jest to w pewnym sensie rozdział „poglądowy”, w którym zamierzamy
dać pewne pojęcie o tym, jaki jest otaczający nas świat. Jeden tylko punkt będzie tu wart
nauczenia się, a jest nim prosta definicja lepkości, do której za chwilę dojdziemy. Cała
reszta ma służyć tylko „celom rozrywkowym”.
W poprzednim rozdziale stwierdziliśmy, że prawa ruchu cieczy są dane takim oto rów-
naniem :
~+(v-V)v= -3L±_Vę>+-^. (41.1)
St e Q
Przyjmując przybliżenie „suchej wody” opuściliśmy ostatni wyraz, pomijając przez to
wszelkie zjawiska „lepkie”. Czasami także robiliśmy dodatkowe założenie, uważając ciecz
za nieściśliwą; wówczas mieliśmy jeszcze dodatkowe równanie
V-v = 0.
To ostatnie założenie jest często zupełnie dobre, szczególnie wtedy, kiedy prędkości prze-
pływu są dużo mniejsze od prędkości dźwięku. Ale dla cieczy rzeczywistych prawie nigdy
nie jest prawdą, że można pominąć tarcie wewnętrzne, które nazywamy lepkością; więk-
szość interesujących zjawisk, które tam zachodzą, jest w taki czy inny sposób związana
388
41. PRZEPŁYW „MOKREJ WODY”
właśnie z lepkością. Widzieliśmy na przykład, że w „suchej” wodzie krążenie nigdy się
nie zmienia — jeżeli nie było go na początku, to nigdy ono się nie pojawi. Tymczasem
krążenie w cieczach jest zjawiskiem spotykanym codziennie. Należy więc naszą teorię
poprawić.
Zaczniemy od pewnego ważnego faktu doświadczalnego. Kiedy rozważaliśmy przepływ
„suchej” wody wokół walca, tzw. przepływ potencjalny, nie mieliśmy żadnych powodów,
aby wykluczyć z naszych rozważań takie przepływy, podczas których woda mogła mieć
prędkość styczną do powierzchni; tylko składowa normalna musiała być równa zeru.
Nie wzięliśmy bowiem pod uwagę możliwości, że pomiędzy cieczą a ciałem stałym mogą
występować siły ścinania. Okazuje się — chociaż nie jest to wcale oczywiste — że we wszyst-
kich przypadkach, które były sprawdzone doświadczalnie, prędkość cieczy na powierzchni
ciała stałego jest dokładnie równa zeru. Bez wątpienia czytelnik miał okazję zaobserwować,
że na łopatkach wentylatora może się gromadzić cienka warstwa kurzu, która nie będzie
przez powietrze usunięta podczas pracy wentylatora. To samo zjawisko można zaobser-
wować nawet na dużym wentylatorze w tunelu aerodynamicznym. Dlaczego kurz nie
zostaje przez powietrze zdmuchnięty? Pomimo tego, że taka łopatka wentylatora porusza
się z wielką prędkością w powietrzu, prędkość powietrza względem łopatki będzie na
samej powierzchni wentylatora dążyła do zera. Dlatego te najmniejsze cząstki kurzu są
pozostawione w spokoju*’. Należy więc tak zmienić naszą teorię, aby zgadzała się ona
z tym faktem doświadczalnym, że we wszystkich zwykłych cieczach drobiny będące w bez-
pośrednim sąsiedztwie ciała stałego mają prędkość (względem powierzchni) równą zeru**’.
W początkowo przyjętej przez nas charakterystyce cieczy przyjmowaliśmy, że jeżeli
przyłoży się do cieczy naprężenie ścinające — nawet jak najmniejsze — to ustąpi ona pod
tym naciskiem i zacznie płynąć. W sytuacjach statycznych rzeczywiście nie ma naprężeń
ścinania. Ale zanim równowaga zostanie osiągnięta — dopóty, dopóki będą działały siły
powodujące ruch cieczy — mogą występować siły ścinające. Lepkość opisuje właśnie te
siły ścinania, które istnieją w poruszającej się cieczy. Aby się przekonać, jaka jest wielkość
tych sił ścinania podczas ruchu cieczy, rozważmy takie oto doświadczenie. Przypuśćmy,
że mamy dwie płaskie płytki, zrobione z jakiegoś ciała stałego, a pomiędzy nimi wodę,
tak jak to przedstawiono na rys. 41.1 i że jedną z tych płytek utrzymujemy w spoczynku,
podczas gdy drugą przesuwamy równolegle do niej z niewielką prędkością v0. Jeżeli
zmierzy się siłę, jaka jest potrzebna do podtrzymania ruchu górnej płytki, to przekona-
my się, że siła ta jest proporcjonalna do pola powierzchni płytki i do stosunku vojd, gdzie
d jest odległością pomiędzy płytkami. A zatem naprężenie ścinania, FjA, jest proporcjo-
nalne do v$ld:
F v0
Stałą proporcjonalności rj nazywa się współczynnikiem lepkości.
♦’ Można zdmuchnąć z powierzchni stołu duże cząstki kurzu, ale nie te najmniejsze. Te duże cząstki
„wystają” nieco nad powierzchnią stołu i dlatego podmuch może je porwać ze sobą.
Można sobie wyobrazić takie okoliczności, kiedy to nie jest prawdą: szkło teoretycznie jest „cie-
czą”, ale na pewno można je zmusić do „ślizgania się” wzdłuż stalowej powierzchni. To nasze twierdzenie
musi się zatem gdzieś załamywać.
41-1. LEPKOŚĆ
389
pole powierzchni = A
, .V - F
d l / •. • •. u 1 v / • płyn V
v=0
41.1. Siła lepkości pomiędzy dwiema równoległymi płaszczyznami
Jeżeli mamy jakąś bardziej złożoną sytuację,
to zawsze można rozważać małą, płaską i pro-
stokątną ,,komórkę” w wodzie, o ściankach rów-
noległych do przepływu, tak jak na rys. 41.2.
Siła ścinania działająca na tę komórkę jest dana
przez
AF Avx dvx
U “ V ~Ay ~ ^1/'
(41.2)
Pochodna 8vx[dy jest tu szybkością zmian od-
kształcenia ścinania, które zdefiniowaliśmy w rozdz.
38, tak więc dla cieczy naprężenie ścinania jest
proporcjonalne do szybkości zmian odkształce-
nia ścinania.
W przypadku ogólnym piszemy
41.2. Naprężenie ścinania w cieczy
lepkiej
/ cv., dvx \
Sxv = fl —- H-1 •
xy \dx dy)
(413)
Jeżeli mamy jednostajny obrót cieczy, to dvjdy
równe jest ć)vy/8x ze znakiem ujemnym i Sxy jest
równe zeru — tak jak być powinno, ponieważ
w obracającej się ruchem jednostajnym cieczy
nie ma żadnych naprężeń (podobną sytuację mie-
liśmy przy definicji exy w rozdz. 39). Istnieją oczy-
wiście odpowiednie wyrażenia na Syz i Szx.
Jako przykład zastosowania tych pojęć rozważ-
my ruch cieczy pomiędzy dwoma współosiowy-
mi walcami. Niech walec wewnętrzny ma promień
a i prędkość obwodową va, a zewnętrzny
- - promień b i prędkość vb (patrz rys. 41.3). Moż-
na by zapytać: jaki jest rozkład prędkości pomiędzy
tymi walcami? Aby odpowiedzieć na to pytanie,
41.3. Przepływ pomiędzy dwoma
współśrodkowymi walcami, obracają-
cymi się z różnymi prędkościami ką-
towymi
390
41. PRZEPŁYW „MOKREJ WODY”
zacznijmy od znalezienia wzoru na naprężenie ścinające spowodowane lepkością cieczy, w
odległości r od osi. Ze względu na symetrię zagadnienia można założyć, że istnieje tu tylko
przepływ w kierunku prostopadłym do płaszczyzn przechodzących przez oś walców i że
jego wielkość zależy tylko od promienia r; v = v(r). Jeżeli obserwować pyłek poruszają-
cy się wraz z wodą, w odległości r od osi, to jego współrzędne jako funkcja czasu są równe
x = r cos (ot,
. y = r sincot,
gdzie o>~ v/r. Składowe prędkości w kierunkach x i y są zatem równe
vr = — r(o sincot = — wy,
(41.4)
vy — rco cos cot = (ox.
Z (41*3) mamy
f 8 8 I f 8(o dwl
sxy= v —y-r- • (4i-5)
z \_8x dy J [ & 8yj
Dla punktu o współrzędnej y — 0, C(o)Cy = 0 i x8a>]ox jest równe rdco/dr. Dla tego
zatem punktu
(5xA-o = w—r- <41-6)
(Powyższy wynik, że 5 zależy od ćw/5r, jest zgodny z intuicją, gdyż jeśli (o się nie zmienia
wraz z r, to ciecz podlega jednostajnemu obrotowi i wszystkie naprężenia powinny zni-
kać.)
Naprężenie, które obliczyliśmy, jest naprężeniem ścinającym w kierunku prostopa-
dłym do płaszczyzny przechodzącej przez oś walca i prostą y = 0 (oś x). Ze względu na
symetrię zagadnienia nic się nie zmieni, jeśli za oś x przyjmiemy dowolną prostą prosto-
padłą do osi i dlatego naprężenie to jest takie samo wokół całego walca. Moment siły,
działający na powierzchnię walca utworzonego z cząstek cieczy w odległości r od osi,
można otrzymać mnożąc naprężenie ścinające przez ramię r i powierzchnię 2~rl. Otrzy-
mujemy
dco
r = 2nr2l(SX]/)0 = 2nt]lr3 —. (41.7)
ar
Ponieważ ruch wody jest jednostajny — nie ma przyspieszenia kątowego — wypad-
kowy moment działający na cylindryczną warstwę wody zawartą pomiędzy r a r-\-dr,
musi być równy zeru; a to znaczy, że moment siły działający w r musi być równoważony
przez równy mu i skierowany przeciwnie moment siły w r+dr, czyli r musi być niezależne
od r. Innymi słowy, r^dajdr jest równe jakiejś stałej, np. A i
d(o A
~dT = V'
(41.8)
41-1. LEPKOŚĆ
391
Całkując znajdujemy, że w zmienia się z r jak
u>=-^+B. (41.9)
Stałe A i B należy tak określić, ąby spełnione zostały warunki: <o = <oa dla r — a i a> = <o6
dla r = b. Dostajemy więc
2a2b2 ,
_ b2mb-a2ma
b2—a2
Znamy zatem a> jako funkcję r, a stąd v — a>r.
Z równań (41.7) i (41.8) możemy otrzymać moment siły:
t = 2izr]lA,
47rł?/a2ń2 z
czyli T = —------r- (<O4 - <oj. (41.11)
b —a
Moment siły jest proporcjonalny do względnej prędkości kątowej obu walców. W opar-
ciu o ten wynik konstruuje się jeden z typów powszechnie dziś używanej aparatury do
pomiaru współczynników lepkości. Jej podstawową częścią są dwa współosiowe walce.
Jeden z walców, na przykład ten zewnętrzny, jest osadzony na osiach, ale utrzymuje go
w stałym położeniu sprężyna, która jednocześnie mierzy działający na ten walec moment
siły, podczas gdy walec wewnętrzny obraca się ze stałą prędkością kątową. Współczyn-
nik lepkości można wówczas określić z równania (41.11).
Z definicji widać, że jednostką r] jest N-s/m2. Dla wody w temperaturze 20°C
T) = 103 N-s/m2.
Zwykle wygodniej jest używać lepkości właściwej, która jest równa rj podzielonemu przez
gęstość q. Wówczas wartości tych współczynników dla wody i dla powietrza są porówny-
walne :
woda (20 °C) n/o = 10~6 m2/s,
(41.12)
powietrze (20°C) y/g = 15-I0-6m2/s.
Współczynniki lepkości zależą zwykle silnie od temperatury. Tak na przykład dla wody,
tuż powyżej punktu krzepnięcia, r//g jest 1,8 razy większe niż w temperaturze 20 °C.
41-2. Przepływ lepki
Przechodzimy teraz do ogólnej teorii przepływu lepkiego — w jej najogólniejszej dziś
znanej postaci. Dowiedzieliśmy się już, że składowe naprężenia ścinania są proporcjo-
nalne do pochodnych przestrzennych różnych składowych prędkości, takich jak dvjdy
392
41. PRZEPŁYW „MOKREJ WODY”
lub dv>.ldx. Jednak w ogólnym przypadku cieczy ściśliwej w naprężeniu występuje jeszcze
jeden wyraz, który zależy od pozostałych pochodnych przestrzennych prędkości (np.
takich jak Svjdx...). Wyrażenie ogólne ma postać
15vi 5v,\ .
' (41.13)
\dXjCXjl
gdzie -v, oznacza dowolną z współrzędnych prostokątnych (x = xlty = ylf z = z,),
a V/ jest odpowiadającą jej składową prędkości w prostokątnym układzie współrzędnych.
(Symbol jest deltą Kroneckera, która jest równa 1, gdy i — j, a 0, gdy i / j.) Ten
dodatkowy wyraz dodaje ?;'V-v do wszystkich elementów diagonalnych tensora naprężeń
S,7. Dla cieczy nieściśliwej (V v = 0) ten dodatkowy wyraz się nie pojawia. Ma on
zatem coś wspólnego z siłami wewnętrznymi, pojawiającymi się podczas ściskania. A pa-
tena do opisu cieczy potrzebne są dwie stałe, podobnie jak dwie stałe były potrzebne do
opisu jednorodnego ciała sprężystego. Współczynnik r/ jest tym „zwykłym” współczyn-
nikiem lepkości, z którym się już spotkaliśmy w poprzednim paragrafie. Nazywa się go
także pierwszym współczynnikiem lepkości lub „współczynnikiem lepkości przy ścinaniu”,
a nowy współczynnik rj' nazywa się drugim współczynnikiem lepkości.
Chcemy teraz określić siłę lepkości na jednostkę objętości, flepk, po to abyśmy mogli
ją wstawić do równania (41.1) i otrzymać równanie ruchu cieczy rzeczywistej. Siła, jaka
działa na mały sześcienny element cieczy, jest wypadkową sił działających na wszystkie
sześć ścianek. Biorąc po dwie z tych sił jednocześnie otrzymamy ich różnice, które zależą
od pochodnych naprężeń, a więc od drugich pochodnych prędkości. To bardzo dobrze,
bo prowadzi nas to z powrotem do równania wektorowego. Składowa siły lepkości
na jednostkę objętości w kierunku współrzędnej prostokątnej xi wynosi
(Uk).= = (4L14)
P Z-/ CX; ć-j OX. 1 \ CX: OXj / J oxi
J=1 J /=! J - ' 1 J '
Zmiana współęzynników lepkości wraz z położeniem zwykle nie jest znaczna i można ją
pominąć. Wówczas siła lepkości na jednostkę objętości zawiera tylko drugie pochodne
prędkości. W rozdziale 39 widzieliśmy, że najogólniejszą postacią drugich pochodnych,
jaka może występować w równaniu wektorowym, jest suma wyrazu z laplasjanem
(V-Vv = V2v) i wyrazu z gradientem dywergencji [V(V-v)]. Równanie (41.14) jest
właśnie taką sumą ze współczynnikami i) i (>?+)/). Otrzymujemy:
f)epk = »?V2v+(ł?+ł?')V(V-v). (41.15)
W przypadku cieczy nieściśliwej V v = 0 i siła lepkości na jednostkę objętości wynosi
po prostu ?;V2v. Niektórzy zadowalają się takim przybliżeniem, jednakże jeżeli ktoś
chciałby obliczyć absorpcję dźwięku w cieczy, to byłby mu wtedy potrzebny również
drugi wyraz z równania (41.15).
- Możemy teraz uzupełnić nasze ogólne równanie ruchu dla cieczy rzeczywistej. Pod-
41-2 PRZEPŁYW LEPKI
393
stawiając równanie (41.15) do równania (41.1) otrzymujemy
eHy -r(v-V)v
Ct
= —V/>-oV<^^-z/V2v:-(z/ + z/)V(V-v).
To dość skomplikowane równanie. Ale taka już jest przyroda.
Jeżeli wprowadzimy, tak jak poprzednio, gęstość wirów Si = Vxv, to nasze równanie
będzie można zapisać w postaci
IdN \ '
q I—--FS2xv+1Vd2| = — V/>—oVę>+>jV2v+(?;+^')V(V-v). (41.16)
Zakładamy znowu, że jedyne siły objętościowe, jakie działają z zewnątrz na ciecz, są si-
łami zachowawczymi, takimi jak siła ciężkości. Aby zobaczyć, co oznacza tu nowy wyraz
ze współczynnikiem lepkości, rozpatrzmy przypadek płynu nieściśliwego. Otóż, jeżeli
wziąć rotację z równania (41.16), otrzyma się
cSl ri
—-+Vx(Słxv) = - V2S2. (41.17)
Ot Q
Przypomina to równanie (40.9), z tym że po prawej stronie występuje teraz nowy wyraz.
Gdy prawa strona była równa zeru, to mieliśmy twierdzenie Helmholtza mówiące, że
gęstość wirów jest podczas ruchu cieczy zachowana. Teraz po prawej stronie mamy dość
złożony wyraz, który ma jednak bezpośrednie następstwa fizyczne. Jeżeli na chwilę po-
miniemy wyraz Vx(S2xv), to będziemy mieli równanie dyfuzji. Ten nowy wyraz ozna-
cza, że gęstość wirów SI ulega dyfuzji w cieczy. Jeżeli gradient gęstości wirów jest duży,
to wiry rozprzestrzeniają się na ciecz znajdującą się w pobliżu.
Ten to właśnie „nowy" wyraz powoduje, że nasze kółko dymu staje się coraz grubsze
w miarę posuwania się do przodu. Skutki tego wyrazu dają się też wyraźnie odczuć, je-
żeli wyśle się „czysty" wir („bezdymny” pierścień, wytworzony przez aparaturę opisaną
w poprzednim rozdziale) przez chmurę dymu. Pierścień ten przechodząc przez chmurę
zabiera z sobą trochę dymu i po wyjściu z chmury można go zobaczyć w postaci pustego
w środku kółka, otoczonego z zewnątrz mgiełką dymu. Część gęstości wirów SI przeszła
w wyniku dyfuzji na zewnątrz do dymu, zachowując cały czas swój ruch do przodu wraz
z wirem.
41-3. Liczba Reynoldsa
Opiszemy teraz zmiany, jakim ulega charakter przepływu cieczy na skutek wystę-
powania nowego wyrazu opisującego lepkość. Rozpatrzymy tu dość szczegółowo dwa
zagadnienia. Pierwszym z nich jest opływ walca, który próbowaliśmy opisać w poprzed-
nim rozdziale opierając się na teorii przepływu nielepkiego. Rozwiązania ruchu cieczy
lepkiej znane są dziś tylko w kilku szczególnych przypadkach. Dlatego też część tego,
o czym będziemy mówić, opiera się na pomiarach doświadczalnych — przy założeniu,
że model doświadczalny spełnia równanie (41.17).
394
41. PRZEPŁYW „MOKREJ WODY"
Problem matematyczny wygląda następująco: szukamy rozwiązania opisującego prze-
pływ nieściśliwy, lepkiego płynu, opływającego długi walec o średnicy D. Przepływ powi-
nien być określony równaniem (41.17) przez związek
SI = V xv (41.18)
i przez warunki brzegowe, że prędkość na dużych odległościach jest stała, równa np. V
(równoległa do osi x) oraz że prędkość na powierzchni walca jest równa zeru. Drugi
z tych warunków sprowadza się do żądania, aby
vx = vy = vz = 0 (41.19)
dla
D2
x2+y2 = —
4
Powyższy zespół równań i warunków brzegowych określa w pełni nasz problem mate-
matyczny.
Jeżeli przyjrzymy się równaniom, to stwierdzimy, że występują w nich cztery różne
parametry określające nasze zagadnienie: r[, q, D i V. Można by sądzić, że powinniśmy
rozpatrzyć szereg przypadków dla różnych V, dla różnych D i tak dalej. Nie jest to jednak
prawdą. Wszystkie różne, możliwe tu rozwiązania odpowiadają różnym wartościom tylko
jednego parametru} Jest to najważniejsza z ogólnych własności, które potrafimy wywnio-
skować z równań ruchu przepływu lepkiego. Aby zobaczyć, dlaczego tak jest, zauważmy
najpierw, że lepkość i gęstość pojawiają się tylko w stosunku rj/g — jako lepkość właści-
wa. Zmniejsza to liczbę niezależnych parametrów do trzech. Przypuśćmy teraz, że wszyst-
kie odległości będziemy mierzyć w jednostkach określonych przez jedyną „długość”,
jaka się pojawia w tym zagadnieniu, a więc w stosunku do średnicy walca D; sprowadza
się to do zastąpienia współrzędnych x, y, z nowymi zmiennymi x', y , z', przy czym
x = x'D,
y = y'D,
z = z'D.
Wówczas w warunkach (41.19) nie będzie występował parametr D. W ten sam sposób
możemy wyrazić wszystkie prędkości w jednostkach określonych przez V, czyli jeżeli
przyjmiemy v — v'V, pozbędziemy się parametru V, a nowa prędkość v' będzie na dużych
odległościach po prostu równa 1. Ponieważ ustaliliśmy już jednostki długości i prędkości,
naszą jednostką czasu jest teraz D/V; tak więc powinniśmy przyjąć
r = f'y. (41.20)
Po wprowadzeniu naszych nowych zmiennych musimy pochodne w równaniu (41,18)
zmienić z 5/dx na (1/D)d/Sx' i tak dalej; tak że równanie (41.18) przybiera postać
£2 = Vxv = —V'xv' = —£2'. (41.21)
D D
41-3. LICZBA REYNOLDSA
395
Nasze główne równanie (41.17) ma teraz postać
3S2' ri
—- + V' x(£2' xv') = ——
dt' qVD
Wszystkie stałe możemy zebrać w jeden czynnik, który zgodnie z tradycją oznaczymy 1/^:
o
% = — VD. (41.22)
Jeżeli będziemy pamiętać, że wszystkie nasze równania należy' zapisać wyrażając wszyst-
kie wielkości w nowych jednostkach, to można opuścić wszystkie znaki prim. Naszymi
równaniami przepływu są zatem
„ 1
—-+Vx(Słxv) = — V2£2 (41.23)
ot
oraz
£2 = V xv
z warunkami
v = 0
dla
x2+y2 = J (41.24)
oraz
vy = vz = Q
dla
x2+y2+z2^> 1.
Wszystko to ma bardzo interesujący sens fizyczny. Wynika stąd na przykład, że jeżeli
rozwiążemy zagadnienie przepływu przy jakiejś prędkości V\ i jakiejś średnicy , a na-
stępnie jeżeli się zainteresujemy przepływem jakiejś innej cieczy, przy jakiejś innej śred-
nicy walca Z>2, to ten nowy przepływ będzie taki sam jak stary, jeżeli za pomocą jego
prędkości Vz można utworzyć tę samą liczbę Reynoldsa, to znaczy, jeżeli
Pi Po
= — ki Dl = = — V2D2. (41.25)
Dla każdych dwóch sytuacji, które mają tę samą liczbę Reynoldsa, przepływy będą „wy-
glądać” tak samo — jeśli wyrazi się je przez odpowiednio przeskalowane zmienne x,
y', z' i t'. Jest to podstawowe twierdzenie, ponieważ z niego wynika, że można określić
jak powietrze będzie opływało skrzydło samolotu, nie potrzebując do tego wcale budować
samolotu i wypróbowywać go. Zamiast tego można zrobić model samolotu i zrobić po-
miary przy prędkości, która daje tę samą liczbę Reynoldsa. Zasada ta pozwala nam sto-
sować wyniki pomiarów z małymi samolocikami w tunelu aerodynamicznym lub po-
miarów z małymi modelami statków w basenie modelowym do obiektów o naturalnej
wielkości. Pamiętajmy jednak, że można to zrobić tylko przy założeniu, że ściśliwość
cieczy można pominąć. W przeciwnym bowiem wypadku pojawia się nowa wielkość —
396
41. PRZEPŁYW „MOKREJ WODY”
prędkość dźwięku, a różne sytuacje będą naprawdę odpowiadały sobie tylko wtedy, gdy
stosunek V do prędkości dźwięku będzie także taki sam. Ten ostatni nazywamy liczbą
Macha. A zatem dla prędkości bliskich prędkości dźwięku lub większych przepływy
w różnych sytuacjach są takie same, jeżeli zarówno liczba Macha, jak i liczba Reynoldsa
są dla obu tych sytuacji takie same.
41-4. Opływ walca kołowego
Powróćmy do zagadnienia przepływu prawie nieściśliwej cieczy, która z niewielką
prędkością opływa walec. Podamy jakościowy opis przepływu cieczy rzeczywistej. Wiele
jest rzeczy, które chcielibyśmy wiedzieć o takim przepływie, na przykład, z jaką siłą ciecz
pociąga walec za sobą? Na rysunku 41.4 podano wykres siły, z jaką ciecz pociąga walec,
jako funkcji liczby Reynoldsa która, jeżeli pozostałe parametry są ustalone, jest pro-
porcjonalna do prędkości V cieczy. W rzeczywistości, na rysunku podano wykres tzw.
współczynnika oporu czołowego CD, który jest liczbą bezwymiarową, równą sile podzie-
lonej przez V2Dł, gdzie D jest średnicą, a l — długością walca, podczas gdy o jest gę-
stością cieczy:
F
Cd~ \qV2DI’
Współczynnik oporu czołowego zmienia się w sposób raczej dość skomplikowany, dając
nam wskazówkę, że z przepływem dzieje się coś dość interesującego i skomplikowanego.
41.4. Współczynnik oporu czołowego dla walca kołowego jako funkcja liczby Reynoldsa
41-4. OPŁYW WALCA KOŁOWEGO
397
Opiszemy teraz charakter przepływu dla różnych „zakresów” liczby Reynoldsa. Naj-
pierw, gdy liczba Reynoldsa jest bardzo mała, przepływ jest zupełnie ustalony, to znaczy
prędkość jest stała w każdym miejscu i' ciecz przepływa symetrycznie po obu stronach
walca. Rzeczywisty rozkład linii przepływu nie jest jednak taki sam jak w przepływie po-
tencjalnym. Linie te stanowią tu rozwiązania zmienionego nieco równania. Gdy prędkość
jest bardzo mała lub, co na to samo wychodzi, gdy lepkość jest bardzo duża, tak że ciecz
przypomina miód, to wyrazy „bezwładności” można pominąć i przepływ jest opisany
równaniem
V2ft = o.
Równanie to zostało pierwszy raz rozwiązane przez Stokesa. Rozwiązał on również to
samo zagadnienie dla kuli. Jeżeli mamy małą kulę poruszającą się w takich warunkach
scharakteryzowanych przez małą liczbę Reynoldsa, to siła oporu jest równa
gdzie a jest promieniem kulki, a V jest jej prędkością. Jest to bardzo pożyteczny wzór,
ponieważ mówi on nam, z jaką prędkością poruszają się w cieczy maleńkie ziarenka ja-
kiegoś zanieczyszczenia (lub inne cząstki, które z pewnym przybliżeniem można uznać
za kule) na skutek działania pewnej określonej siły — takiej na przykład jak w wirówce
lub w procesie dyfuzji, albo podczas wytrącania się jakiegoś osadu. W obszarze małej
liczby Reynoldsa — dla 31 mniejszych od 1 — linie sił pola prędkości v wokół walca wv-
glądają tak jak na rys. 41.5.
Jeżeli zwiększymy nieco prędkość cieczy, tak aby dostać liczbę Reynoldsa trochę
większą od 1, przekonamy, się że przepływ ma już inny charakter. W obszarze za kulą
pojawi się krążenie, tak jak pokazano na rys. 41.6b. Ciągle jeszcze pozostaje otwartą
kwestia, czy krążenie to istniejezzawsze, nawet przy najmniejszych liczbach Reynoldsa,
czy też pojawia się ono nagle przy pewnej wartości liczby Reynoldsa. Dawniej myślano,
że krążenie narasta tu w sposób ciągły. Ale teraz uważa się, że pojawia się ono nagle,
a jest rzeczą pewną, że wzrasta ono z JC. W każdym razie przepływ zmienia swój charak-
ter dla wartości liczby Reynoldsa 3ł w przedziale od 10 do 30. W obszarze za walcem po-
jawia się para wirów.
Gdy dojdziemy do liczby Reynoldsa 3% ® 40, przepływ się znowu zmienia — nagle
następuje zupełna zmiana charakteru ruchu. Otóż jeden z wirów znajdujących się za wal-
cem staje się tak długi, że odrywa się i zaczy-
na płynąć z prądem, a w cieczy za walcem za-
czyna się tworzyć nowy wir. Wiry odrywają
się na przemian po obu stronach i „migaw-
kowy” obraz przepływu wygląda z grubsza
tak, jak to narysowano na rys. 41.6c. Tę
strukturę wirów nazywamy „ścieżką wirów
Karmana”. Pojawiają się one zawsze dla
Si > 40. Przepływ taki przedstawia fot. 41.7.
Takie dwa przepływy — ten z rys. 41.6c,
z jednej, i dowolny z przedstawionych na
rys. 41.6a lub b z drugiej strony — mają zu-
41.5. Przepływ lepki (małe prędkości) wokół
walca kołowego
398
41. PRZEPŁYW „MOKREJ WODY”
41.6. Opływ walca dla różnych Eczb Reynoldsa
pełnie odmienną naturę. Na rysunku 41.6a lub b prędkość jest stała, podczas gdy na rys.
41,6c prędkość w każdym punkcie się zmienia z czasem. Powyżej wartości Sfc = 40 — zazna-
czonej na rys. 41.4 linią przerywaną — rozwiązanie ustalone już nie istnieje. Dla tych wyż-
szych liczb Reynoldsa przepływ się zmienia z czasem, ale w sposób regularny, okresowy.
Można spróbować wytłumaczyć z fizycznego punktu widzenia, w jaki sposób są te
wiry wytwarzane. Wiemy, że prędkość cieczy na powierzchni walca musi być równa zeru
41-4 OPŁYW WALCA KOŁOWEGO
399
i że prędkość ta gwałtownie rośnie przy oddalaniu się od tej powierzchni. Właśnie na
skutek tej dużej, lokalnej zmiany prędkości cieczy tworzy się gęstość wirów. Otóż gdy
prędkość głównej strugi jest dostatecznie mała, to gęstość wirów ma dość czasu, aby
przedyfundować z wąskiego obszaru w pobliżu powierzchni (zwanego warstwą gra-
niczną), gdzie została ona wytworzona, i rozprzestrzenić się na duży obszar. Ten fizyczny
obraz powinien przygotować nas na następną zmianę charakteru przepływu w przypadku,
gdy prędkość głównej strugi, a więc i liczba Reynoldsa & się jeszcze zwiększy.
Gdy prędkość jeszcze bardziej rośnie, to gęstość wirów ma coraz to mniej czasu na
przedyfundowame do większego obszaru cieczy. Gdy dochodzimy do liczby Reynoldsa
rzędu kilkuset, gęstość wirów zaczyna wypełniać wąskie pasmo, tak jak to pokazano na
rys. 41.6d. W warstwie tej przepływ jest chaotyczny i nieregularny. Obszar ów nazywa
się turbulentną warstwą graniczną, która ze wzrostem śł przesuwa się coraz to dalej w górę
prądu W tym burzliwym obszarze (zwanym też obszarem turbulentnym) prędkości są
bardzo nieregularne i nieuporządkowane; również przepływ przestaje już być dwuwy-
miarowy, ale wygina się i wykręca we wszystkich trzech wymiarach. Na ruch burzliwy
jest tu w dalszym ciągu nałożony pewien ruch regularnie zmienny.
Jeżeli w dalszym ciągu będzie się zwiększać liczbę Reynoldsa, to obszar burzliwy
będzie się dalej przesuwał do przodu, aż dotrze do punktu, w którym linie prądu opuszcza-
ją walec — dla przepływów z wartością Si nieco większą od 105. Przepływ wygląda tak
jak na rys. 41.6e i w obszarze za ciałem pojawia się tzw. ślad turbulentny. Zachodzi tu
także drastyczna zmiana siły oporu czołowego (tzw. kryzys oporu); siła ta wielokrotnie
się zmniejsza, jak to pokazano na rys. 41.4. W tym obszarze prędkości w rzeczywistości
siła oporu maleje ze wzrostem prędkości. Wydaje się, że nie ma tu zbyt wiele śladów ja-
kiejś okresowości.
Co się dzieje przy jeszcze większych liczbach Reynoldsa? Gdy będziemy w dalszym
ciągu zwiększać prędkość, rozmiary śladu turbulentnego jeszcze bardziej się zwiększą,
a także zwiększy się siła oporu czołowego. Najnowsze doświadczenia, w których £% do-
chodzi mniej więcej do 107, wykazują, że w śladzie pojawia się jakaś nowa okresowość,
41.7. Sfotografowana przez Prandtla „ścieżka wirów” w przepływie za walcem
400
41. PRZEPŁYW „MOKREJ WODY”
czy to dlatego, że cały ślad oscyluje tam i z powrotem w jakimś totalnym ruchu, czy też
dlatego, że wraz z nieregularnym, burzliwym ruchem (stanowiącym swego rodzaju tło)
pojawia się pewien nowy rodzaj wiru. Te szczegóły nie są dotąd jasne i ciąglp jeszcze są
badane doświadczalnie.
41-5. Granica lepkości zerowej
Chcielibyśmy podkreślić, że żaden z opisanych tu przepływów nie przypomina w ża-
dnym stopniu rozwiązania dającego przepływ potencjalny, które znaleźliśmy w poprzed-
nim rozdziale. Na pierwszy rzut oka wydaje się to dość dziwne. Przecież mimo wszystko
liczba Reynoldsa Sfc jest proporcjonalna do I/77. Dążenie więc ze współczynnikiem lep-
kości t) do zera jest równoważne z przechodzeniem liczby Reynoldsa do nieskończo-
ności. Przechodząc zaś w równaniu (41.23) do granicy dla dużych wartości pozbędzie-
my się jego prawej strony i otrzymamy po prostu równania poprzedniego rozdziału.
Tymczasem wydaje się nieprawdopodobne, aby ten wysoce burzliwy przepływ dla war-
tości rzędu 107 miał dążyć do gładkiego przepływu, będącego rozwiązaniem równań
„suchej wody”. Jak to się dzieje, że przechodząc z liczbą Reynoldsa Sł do nieskończo-
ności otrzymujemy równanie (41.23), którego rozwiązaniem jest przepływ burzliwy, a więc zu-
pełnie różny od rozwiązania, które otrzymaliśmy przyjmując w tym równaniu od samego po-
czątku r/ = 0? Odpowiedź jest bardzo interesująca. Zauważmy, że po prawej stronie rów-
nania mamy iloczyn liczby 1/'^ i drugich pochodnych przestrzennych prędkości. Te po-
chodne mają jednak rząd wyższy od każdej innej pochodnej w tym równaniu. Chociaż
więc współczynnik 1 /j? jest bardzo mały, w przestrzeni w pobliżu powierzchni zachodzą
bardzo gwałtowne zmiany Si. Te gwałtowne zmiany kompensują wpływ małego współ-
czynnika 1 i wspomniany iloczyn nie dąży do zera dla rosnących wartości 2%. Omówio-
ne w poprzednim paragrafie rozwiązania wcale nie dążą zatem do przypadku granicz-
nego, odpowiadającego zerowaniu się współczynnika V2S2.
Można by zapytać: „Czym więc jest ta drobnoziarnista turbulencja i w jaki sposób
ona się podtrzymuje? Jak może gęstość wirów, powstająca gdzieś na krawędzi walca,
spowodować takie zamieszanie na »drugim planie«?” I tym razem odpowiedź jest intere-
sująca. Gęstość wirów wykazuje tendencję do wzmacniania się — sama przez się. Jeżeli
na chwilę zapomnimy o dyfuzji gęstości wirów, która powoduje straty energii, to prawa
przepływu stwierdzają (tak jak to widzieliśmy), że linie wiru są unoszone przez ciecz z pręd-
kością v. Można sobie wyobrazić pewną liczbę linii sił pola Si, które są zniekształcone
i skręcone na skutek skomplikowanego obrazu przepływu linii sił pola v. Powoduje to,
że linie zbliżają się do siebie i mieszają się z sobą. Linie, które poprzednio były prostymi,
nieskomplikowanymi liniami, zostają poplątane i ściśnięte razem. Będą one dłużej prze-
bywać blisko siebie. Natężenie gęstości wirów będzie rosło i jej nieregularności — plusy
i minusy — będą w ogólnym przypadku też rosły. W rezultacie będzie wzrastał moduł
wektora gęstości wirów w trzech wymiarach, jeżeli będzie się ciecz wzburzać.
Można by równie dobrze zapytać: „W jakich warunkach przepływ potencjalny będzie
w ogóle dostarczał teoretycznie zadowalającego opisu?” Przede wszystkim będzie on za-
41-5. GRANICA LEPKOŚCI ZEROWEJ
401
dowalający w obszarze, gdzie nie dotarła na skutek dyfuzji, w znacznym przynajmniej
stopniu, gęstość wirów. Sporządzając ciała o kształtach opływowych można obszar burzli-
wy uczynić możliwie jak najmniejszym; przepływ wokół skrzydeł samolotu, które są
w odpowiedni sposób skonstruowane, jest prawie całkowicie prawdziwym przepływem
potencjalnym.
41-6. „Przepływ wstęgowy”
Można pokazać, że ten złożony i zmieniający się charakter opływu walca nie jest
niczym szczególnym, ale że ta wielka rozmaitość możliwości przepływu zachodzi ogólnie.
W § 41-1 wyprowadziliśmy rozwiązanie dla przepływu lepkiego pomiędzy dwoma wal-
cami i otrzymane tam wyniki możemy porównać z tym, co się dzieje rzeczywiście. Jeżeli
weźmie się dwa współśrodkowe walce, wypełni się przestrzeń pomiędzy nimi olejem i wpro-
wadzi się do niego trochę drobnego proszku aluminiowego, to łatwo można zobaczyć,
jaki charakter będzie miał przepływ. Jeżeli zewnętrzny walec będzie się powoli obracać,
to nic nieoczekiwanego się nie będzie działo; patrz rys. 41.8a. Podobnie, jeżeli będzie się
obracać powoli walec wewnętrzny, to też nic bardzo uderzającego się nie będzie działo.
Jeżeli jednak zaczniemy obracać walec wewnętrzny szybciej, to czeka nas niespodzianka.
Płyn rozdzieli się na poziome pasma, tak jak to pokazano na rys. 41.8b. Gdy natomiast
obraca się z podobną szybkością walec zewnętrzny, to takie zjawisko nie występuje. Skąd
się bierze ta różnica pomiędzy przypadkiem, w którym obracamy walec zewnętrzny,
a przypadkiem, w którym obracamy walec wewnętrzny? Przecież charakter przepływu,
tak jak to wyprowadziliśmy w § 41-1, zależał tylko od różnicy a>b—a>a. Odpowiedź na
to można otrzymać po przyjrzeniu się przekrojowi, pokazanemu na rys. 41.9. Jeżeli war-
stwy wewnętrzne cieczy poruszają się szybciej od warstw zewnętrznych, to te warstwy
wewnętrzne dążą do przesuwania się na zewnątrz — siła odśrodkowa jest większa od* ciś-
nienia, które utrzymuje te warstwy na miejscu. Cała jednak warstwa nie może się jedno-
cześnie przesunąć, ponieważ na przeszkodzie stoją jej warstwy zewnętrzne. Taka warstwa
musi się więc rozpaść na „komórki”, w których zachodzi krążenie cieczy, tak jak to po-
41.8. Obrazy przepływu cieczy pomiędzy dwoma przezroczystymi, obracającymi się walcami
26 — Wykłady z fizyki
402
41. PRZEPŁYW „MOKREJ WODY”
41.9. Wyjaśnienie dlaczego przepływ rozdziela się na „wst^i”
kazano na rys. 41.9b. Przypomina to prądy konwekcyjne w pokoju, w którym blisko po-
dłogi jest gorące powietrze. Gdy walec wewnętrzny pozostawimy w spoczynku, a walco-
wi zewnętrznemu nadamy dużą prędkość, to siły odśrodkowe wytworzą pewien gradient
ciśnienia, który utrzyma wszystko w równowadze — patrz rys. 41.9c (tak jak w pokoju,
w którym gorące powietrze jest przy suficie).
Zwiększmy teraz prędkość walca wewnętrznego. Początkowo liczba pasm będzie
wzrastać. Potem nagle zobaczymy, że pasma te stają się faliste, tak jak na rys. 41.8c i utwo-
rzą fale przebiegające dookoła walca. Prędkość tych fal można łatwo zmierzyć. Dla
dużych prędkości obrotu prędkość fal dąży do | prędkości walca wewnętrznego.
I nikt nie wie dlaczego! To dopiero jest wyzwanie dla fizyków! Taka prosta liczba jak
| i nikt tego nie potrafi wytłumaczyć. W istocie, cały mechanizm formowania się
fal nie jest bardzo dobrze zrozumiany; w każdym razie jest to ustalony przepływ
laminarny.
Jeżeli teraz zacząć także obracać walec zewnętrzny', ale w przeciwnym kierunku, to
obraz przepływu zaczyna się zmieniać. Otrzymujemy obszary faliste na zmianę z obsza-
rami pozornie spokojnymi (rys. 41.8d), układające się w postaci spirali. Można się jednak
przekonać, że w tych spokojnych obszarach przepływ jest w rzeczywistości całkiem nie-
regularny; jest on w istocie zupełnie burzliwy. W obszarze falistym także pojawia się nie-
regularny przepływ burzliwy. Jeżeli obracać walce jeszcze szybciej, to cały przepływ się
stanie chaotycznie turbulentny.
W tym prostym doświadczeniu widzimy wiele interesujących struktur przepływu,
które się zupełnie między sobą różnią, a mimo to wszystkie one są zawarte w naszym
prostym równaniu, dla różnych wartości parametru SI. W doświadczeniu z obracającymi
się walcami dostrzeżemy wiele z tych efektów, które występują przy opływie walca: naj-
pierw jest przepływ ustalony; następnie pojawia się przepływ, który się zmienia z czasem,
ale w sposób regularny, gładki; na koniec przepływ się staje zupełnie nieregularny. Każdy
z nas widział te same efekty w kolumnie dymu unoszącej się z papierosa w spokojnym
powietrzu — najpierw jest gładki, nieruchomy słup dymu, następnie strumień dymu
41-6. „PRZEPŁYW WSTĘGOWY”
403
zaczyna się rozrywać, układając się w szereg zakrętasów, które na koniec przechodzą
w nieregularną, kłębiącą się chmurę dymu.
Z tego wszystkiego należy wyciągnąć taką oto zasadniczą nauczkę — w pros-
tym układzie równań (41.23) kryje się olbrzymia liczba różnorodnych sytuacji. Wszy-
stkie rozwiązania odnoszą się do tych samych równań, a różnią się jedynie wartoś-
ciami Si. Nie ma powodu, aby myśleć, że w równaniach tych brakuje jeszcze jakichś wy-
razów. Jedyna trudność polega na tym, że dzisiaj nie mamy możliwości matematycznych,
aby te równania zanalizować, z wyjątkiem bardzo małych liczb Reynoldsa, to znaczy dla
przypadku zupełnie „lepkiego”. Wypisanie równań przepływu nie usuwa jeszcze z prze-
pływu płynu jego uroku, tajemniczości, czy też jego niespodzianek.
Jeżeli taka różnorodność jest możliwa w tak prostym równaniu z jednym parametrem,
to jakaż dopiero różnorodność jest możliwa przy bardziej złożonych równaniach! Być
może, że hipotetyczne równanie fundamentalne, które opisuje wirujące mgławice i zgę-
szczające się, obracające się i eksplodujące gwiazdy i galaktyki jest właśnie tym prostym
równaniem hydrodynamiki, opisującym zachowanie się prawie czystego gazu wodoro-
wego. Często ludzie na skutek jakiegoś nieuzasadnionego lęku przed fizyką mówią, że
nie da się wypisać równania dla życia. No cóż, może się i da. Prawdę mówiąc, to bardzo
możliwe, że już mamy takie równanie stanowiące dostatecznie dobre przybliżenie. Jest
nim być może równanie mechaniki kwantowej:
S dw
Hv =---------
Y i dt
Widzieliśmy już, że złożona natura rzeczy potrafi tak łatwo i tak dramatycznie wymknąć
się prostocie opisujących te rzeczy równań. Często człowiek nieświadomy zasięgu prostych
równań dochodził do wniosku, że do wytłumaczenia złożonej natury świata konieczny
jest sam Bóg, a nie same zwykłe równania.
Wypisaliśmy równania przepływu wody. Na podstawie doświadczenia doszliśmy do
pewnego zbioru pojęć i przybliżeń, których należy użyć do opisu rozwiązania — takich
pojęć jak ścieżki wiru, ślady turbulentne, czy warstwy graniczne. Gdy podobne równania
mamy w sytuacji mniej nam znanej i takiej, dla której nie potrafimy jeszcze przeprowa-
dzić doświadczeń, próbujemy te równania rozwiązać w sposób prymitywny, niezgrabny
i zawikłąny, chcąc na takiej to podstawie określić, jakie mogą się pojawić nowe pojęcia
jakościowe, czyli określić, jakie nowe formy jakościowe są konsekwencją tych równań.
Nasze równania dla Słońca, na przykład, opisujące je jako kulę wodoru, opisują Słońce
bez plam słonecznych, bez drobnoziarnistej struktury powierzchni, bez prominencji i bez
koron słonecznych. A przecież wszystkie te zjawiska w rzeczywistości tkwią w tych rów-
naniach; tylko że nie znaleźliśmy sposobu, aby je stamtąd wydobyć.
Są ludzie, którzy się będą czuli rozczarowani, gdy na innych planetach nie znaj-
dziemy życia. Ja nie — ja chcę, aby takie poszukiwania międzyplanetarne jeszcze raz
mnie zachwyciły, olśniły i przypomniały o nieskończonej różnorodności i nowości zjawisk,
które mogą się zrodzić z tak prostych zasad. Sprawdzianem nauki jest jej zdolność do
przepowiadania. Gdyby ktoś z was nigdy nie był na Ziemi, to czy potrafiłby przepowie-
dzieć burzę z piorunami, wulkany, fale oceanu, tęcze i barwne zachody Słońca? Jakże
404 41. PRZEPŁYW „MOKREJ WODY”
pożyteczna to będzie lekcja, kiedy się dowiemy o wszystkim, co się dzieje na każdej z tych
martwych planet — na tych ośmiu czy dziesięciu kulach, z których każda jest otoczona
taką samą chmurą pyłu i z których każda jest posłuszna dokładnie tym samym prawom
fizyki.
Zbliżająca się wielka era rozbudzenia się umysłu ludzkiego może z powodzeniem
wytworzyć metodę zrozumienia zawartości jakościowej równań. Dzisiaj tego me potra-
fimy. Dzisiaj nie potiafimy zobaczyć, czy równania przepływu wody zawierają w sobie
takie rzeczy jak wstęgową strukturę turbulencji, jaką można zaobserwować pomiędzy
dwoma obracającymi się walcami. Dzisiaj nie potrafimy zobaczyć, czy równanie Schródin-
gera zawiera w sobie — czy też nie — żaby, kompozytorów muzycznych lub moralność.
Nie potrafimy powiedzieć, czy poza takim równaniem potrzebne jest — czy też nie —
coś takiego jak Bóg. I dlatego każdy z nas może mieć na ten temat swoją własną, zdecy-
dowaną opinię.
42
przestrzenie zakrzywione
42-1. Przykłady dwuwymiarowych przestrzeni zakrzywionych
Newton nauczył nas, że dowolne ciało we Wszechświecie jest przyciągane przez każde
inne ciało siłą proporcjonalną do kwadratu jego odległości oraz że każde ciało doznaje
przyspieszenia wprost proporcjonalnego do sił nań działających. Taka jest właśnie treść
newtonowskiego prawa powszechnego ciążenia i newtonowskich praw ruchu. Prawa te,
jak wiemy, pozwalają nam zdać sprawę z ruchów piłek, planet, ich satelitów, galaktyk
i wielu innych obiektów.
Odmienną interpretację prawa powszechnego ciążenia podał natomiast Einstein.
Według niego przestrzeń i czas — rozpatrywane łącznie jako czasoprzestrzeń — są w po-
bliżu ciężkich mas zakrzywione. Ciała zaś wykonują obserwowane przez nas ruchy tylko
dzięki ich tendencji do poruszania się w tej zakrzywionej czasoprzestrzeni wzdłuż „linii
prostych”. Jest to naprawdę niezwykle zawiła koncepcja. W bieżącym rozdziale przed-
stawimy jej najistotniejszą treść i to tylko w zarysie.
W rozważaniach naszych zwrócimy uwagę na trzy odmienne aspekty tego zagadnie-
nia. Pierwszy dotyczy samego zjawiska ciążenia, drugi zawiera omówioną już przez nas
koncepcję czasoprzestrzeni, a trzeci jest związany z problemem krzywizny czasoprze-
strzeni. We wstępnych rozważaniach uprościmy nasze podejście i nie będziemy się przej-
mować ani grawitacją, ani też pojęciem czasu — zajmiemy się po prostu przestrzenią
zakrzywioną. Pozostałe aspekty tego zagadnienia zostaną wyłożone w następnych pa-
ragrafach, teraz zaś zajmiemy się wyłącznie pojęciem krzywizny przestrzeni; spró-
bujemy wyjaśnić: co się w ogóle rozumie przez przestrzeń zakrzywioną oraz co się
rozumie mówiąc o pojęciu przestrzeni krzywej w szczególnym przypadku wspomnianego
zastosowania tego pojęcia przez Einsteina. Nawet tak ograniczone zagadnienie okazuje
się jeszcze zbyt trudne w przypadku trzech wymiarów. Będziemy więc musieli zawęzić
406
42. PRZESTRZENIE ZAKRZYWIONE
43.1. t/fk na płaszczyźnie
nasze zagadnienie jeszcze bardziej i wyja-
śnić znaczenie słów „przestrzeń zakrzywiona”
przede wszystkim w odniesieniu do dwóch
wymiarów.
Aby zrozumieć koncepcję przestrzeni za-
krzywionej w dwóch wymiarach, musimy się
odwołać do ograniczonego punktu widzenia
istot, które by taki dwuwymiarowy świat
zamieszkiwały. Wyobraźmy sobie, na przy-
kład, pozbawionego oczu żuka, który żyje
na płaszczyźnie, i którego przedstawiliśmy na rys. 42.1. Żuk ten może poruszać się tylko
na płaszczyźnie i nie ma żadnych możliwości dowiedzenia się, że poza jego płaszczyzną
istnieje jakikolwiek „świat zewnętrzny”. (Nie ma on bowiem Twojej Czytelniku wyobraźni.)
Zamierzamy oczywiście oprzeć nasze rozumowanie na analogii. To właśnie my żyjemy
w trójwymiarowym świecie i to właśnie nasza wyobraźnia nie dopuszcza możliwości
wzniesienia się z naszego trójwymiarowego świata w jakimś nowym kierunku; dlatego
też musimy przedstawić całą sprawę odwołując się do analogii. Jesteśmy w podobnej
sytuacji jak żuki żyjące na płaszczyźnie, dla których przestrzeń w kierunkach wyprowadza-
jących poza płaszczyznę nie istnieje. Dlatego też będziemy śledzić w naszym rozumowaniu
najpierw postępowanie żuka, pamiętając, że może on żyć tylko na określonej powierzchni
i nie może tej powierzchni opuszczać.
Innym przykładem żyjącego w świecie dwuwymiarowym żuka, którego postępowanie
będziemy śledzić, będzie żuk żyjący na powierzchni kuli. Tutaj również wyobrażamy sobie,
że żuk ten może spacerować po powierzchni kuli, jak to przedstawiliśmy na rys. 42.2, lecz
nie istnieją dla niego takie pojęcia jak „góra” lub „dół”, ani w ogóle pojęcie kierunku
wyprowadzającego na zewnątrz z zamieszkałej przez niego powierzchni,.
W rozważaniach naszych potrzebny nam będzie jeszcze trzeci rodzaj stworów tego
typu. Będą to też żuki, podobne do poprzednich; tak samo będą żyły na płaszczyźnie,
lecz tym razem będzie to płaszczyzna szczególnego rodzaju. Na płaszczyźnie tej w różnych
miejscach będzie występowała różna temperatura. Zakładamy, że zarówno sam żuk, jak
i pręty miernicze, którymi będzie się on posługiwał, są zbudowane z substancji tego sa-
mego rodzaju, o tym samym współczynniku
rozszerzalności cieplnej. Jeśli nasz żuk prze-
niesie pręt mierniczy w celu wykonania po-
miaru do dowolnego miejsca na płaszczyźnie,
pręt natychmiast, na skutek rozszerzalności
cieplnej, zmieni swoją długość na taką, jaka
odpowiada temperaturze w danym miejscu.
W podobny sposób będą się zmieniały roz-
miary każdego obiektu — samego żuka,
pręta mierniczego, trójkąta czy czegokolwiek
innego — gdyż obiekt taki będzie natychmiast
zmieniał swe rozmiary na skutek rozszerzał-
42.2. Żuk na powierzchni kuli
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI
407
ności cieplnej. Każdy przedmiot będzie dłuż-
szy w miejscach gorących niż w miejscach
zimnych, a wszystko będzie miało taki sam
współczynnik rozszerzalności cieplnej. Miej-
sce zamieszkania naszego trzeciego żuka na-
zwiemy ,.rozgrzaną płytą”. Będziemy mieli
przy tym na myśli specjalny rodzaj rozgrzanej
płyty, która będzie zimna w pewnym punkcie
środkowym i będzie się stawała coraz bardziej
gorąca w miarę posuwania się w kierunku
krawędzi (rys. 42.3).
Przypuśćmy, że nasze żuki rozpoczną
badanie podstaw geometrii. Chociaż założy-
liśmy, że żuki te są ślepe i nie mogą widzieć
niczego co się dzieje w „zewnętrznym” świecie,
mogą one jednak wykonać szereg czyn-
ności za pomocą swoich nóżek i czułków.
Mogą one rysować linie krzywe i mierzyć
ich długości za pomocą sporządzonych przez
siebie prętów mierniczych. Przypuśćmy, że
najpierw zajmą się one najbardziej podstawo-
wymi pojęciami geometrii.Nauczą się więc,jak
prowadzić linię prostą, którą będą określały
jako najkrótszą krzywą łączącą dwa dane
punkty. Nasz pierwszy żuk (por. rys. 42.4)
nauczy się prowadzić bardzo ładne linie pro-
ste. Co natomiast uczyni żuk na powierzchni
kuli? Jego linia prosta będzie charakteryzo-
wała się najkrótszą — z jegopunktu widzenia —
odległością pomiędzy dwoma punktami, jak
to widzimy na rys. 42.5. Z naszego punktu
widzenia będzie to oczywiście linia krzywa,
żuk jednak nie może opuścić powierzchni kuli
i stwierdzić, że „w rzeczywistości” istnieje
inna krzywa, wzdłuż której odległość między
danymi dwoma punktami jest krótsza. Zgo-
dnie z jego informacjami długość mierzona
wzdłuż dowolnej innej krzywej leżącej w jego
świecie będzie zawsze dłuższa niż wzdłuż
jego linii prostej. Pozostawmy go więc z jego
linią prostą zdefiniowaną jako łuk o naj-
krótszej długości łączący dwa punkty. (Bę-
dzie to oczywiście część hiku koła wielkiego.)
42.3. Żuk na rozgrzanej płycie
42.4. Konstrukcja „linii prostej” na płaszczyźnie
42.5. Konstrukcja „linii prostej” na powierz-
chni kuli
408
42 PRZESTRZENIE ZAKRZYWIONE
42 6 Konstrukcja „linii prostej” na
rozgrzanej płycie
Również nasz trzeci żuk — ten z rys. 42.3 —
będzie kreślił „linie proste”, które my uznalibyśmy
za krzywe. Tak na przykład, najkrótszą odległoś-
cią pomiędzy punktami A i B przedstawionymi
na rys. 42.6 będzie odległość mierzona wzdłuż
krzywej w rodzaju krzywej przedstawionej na
rysunku. Dlaczego? Otóż jego lima powinna się wy-
ginać w kierunku cieplejszych części rozgrzanej
płyty, gdyż w częściach tych pręty miernicze się
wydłużą (z naszego wszechwiedzącego punktu
widzenia) i wystarczy pręty te odłożyć mniejszą
liczbę razy, by przemierzyć drogę od A do B. Dla niego więc krzywa taka będzie limą pro-
stą, nie dysponuje on bowiem żadnym innym sposobem dowiedzenia się, że na zewnątrz,
w dziwnym trójwymiarowym świecie, istnieje ktoś, kto uznałby mną za krzywą hmę
prostą.
W tym miejscu czytelnik może przypuszczalnie dojść do wmosku, że również dalsza
część analizy, którą żuk poprowadzi, uwieńczona zostanie wnioskami słusznymi jedynie
z punktu widzenia szczególnej powierzchni dwuwymiarowej i nie mającymi nic wspólnego
z naszym punktem widzenia. Pamiętając o tej konkluzji, zobaczmy, jakie nowe fakty po-
jawią się w geometrii naszego żuka. Przypuśćmy, że żuki nauczyły się konstruować dwie
proste prostopadłe. (Czytelnik może sam uzupełnić szczegóły tego rodzaju konstrukcji.)
Nasz pierwszy żuk (mieszkający na zwyczajnej płaszczyźnie) dojdzie wtedy do interesują-
cego wniosku. Jeżeli on wyjdzie z ustalonego punktu A i odbędzie spacer wzdłuż odcin-
ka linii prostej o długości 250 cm, po czym wykona skręt pod kątem prostym w prawo
i odmierzy następne 250 cm wzdłuż linii prostej, wykona następny skręt w prawo i przej-
dzie następne 250 cm, i po raz trzeci zrobi skręt o 90° w prawo i po raz czwarty odmierzy
250 cm wzdłuż linii prostej, to zakończy swój spacer dokładnie w punkcie wyjścia, co po-
kazuje rys. 42 7a Jest to własność jego świata — jeden z faktów jego‘„geometrii”.
Potem dokona on innego interesującego odkrycia. Jeżeli skonstruuje on trójkąt,
tzn. figurę, której bokami będą odcinki trzech jego linii prostych, to suma wszystkich
42 7 Kwadrat, trójkąt i okrąg w przestrzeni płaskiej
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI
409
kątów będzie wynosiła 180°, czyli będzie równa sumie dwóch kątów prostych (por.
rys. 42.7b).
Następnym jego odkryciem będzie okrąg. Jakie jest określenie okręgu? Aby skon-
struować okrąg, należy przez ustalony punkt poprowadzić wiele linii prostych i od-
mierzyć na tych prostych odcinki o jednakowej długości, których jeden koniec umieś-
cimy w ustalonym poprzednio punkcie (patrz rys. 42.7c). (Musimy tu bardzo starannie
prześledzić określenia tych pojęć, gdyż powinniśmy umieć wykonać analogiczne konstruk-
cje środkami dostępnymi naszym żukom.) Inny, równoważny powyższemu sposób kon-
strukcji będzie polegał na zakreśleniu linii krzywej jednym końcem pręta mierniczego,
którego drugi koniec będzie umocowany w ustalonym punkcie. Tak czy inaczej, żuk
nasz nauczy się konstruować okręgi. Mając zaś okrąg, prędzej czy później pomyśli o zmie-
rzeniu jego obwodu. Wykona pomiary dla kilku różnych okręgów i znajdzie przyjemny
związek: obwód okręgu jest zawsze tą samą wielokrotnością jego promienia r (który jest
oczywiście równy odległości od środka do hiku okręgu). Stosunek obwodu i promienia
będzie więc dla każdego okręgu taki sam — w przybliżeniu równy 6,283.
Zastanówmy się teraz, do jakich wniosków o swych geometriach dojdą pozostałe
żuki. Jak więc żukowi żyjącemu na powierzchni kuli powiedzie się konstrukcja „kwadra-
tu”? Jeżeli wykona on wszystko zgodnie z podanymi przez nas poprzednio wskazówkami,
pomyśli prawdopodobnie, że dla takiego rezultatu
nie warto było zawracać sobie głowy. Przybliżo-
nym bowiem obrazem figury, jaką powinien otrzy-
mać, jest figura z rys. 42.8. Końcowy punkt B
tej figury nie pokrywa się tu z punktem wyjścia A.
Figura jego nie będzie zatem wielobokiem ogra-
niczonym krzywą zamkniętą. Czytelnik może to łat-
wo sprawdzić na modelu kuli. Podobnie poto-
czą się sprawy naszego przyjaciela na rozgrzanej
płycie. Jeżeli odłoży on cztery jednakowe odcin-
ki prostoliniowe — jednakowe w sensie pomiarów
wykonanych za pomocą rozszerzających się prę-
tów — tworzące z sobą kąty proste, to otrzyma
figurę, której obraz podaliśmy na rys. 42.9.
Przypuśćmy z kolei, że każda z populacji na-
szych żuków ma swego Euklidesa, który powie
jej, jaka powinna być geometria. Wykonując nie-
zbyt dokładne pomiary i to na małą skalę, żuki
mogą sprawdzić słuszność reguł geometrii eukli-
desowej. Wykonując natomiast precyzyjniejsze
pomiary, w dużej skali, i próbując skonstruo-
wać dokładne kwadraty dojdą one do wniosku,
że coś nie jest w porządku. Istota rzeczy polega tu
właśnie na tym, że wyłącznie za pomocą pomia-
rów geometrycznych odkryją one dziwne własności
42.8. Próba konstrukcji „kwadratu”'
na powierzchni kuli
42.9. Próba konstrukcji „kwadratu”
na rozgrzanej płycie
410
42. PRZESTRZENIE ZAKRZYWIONE
swych przestrzeni. Przestrzenią zakrzywioną nazwiemy przestrzeń, której geometria różni
się od geometrii płaszczyzny. Geometria żuków żyjących na powierzchni kuli lub na gorą-
cej płycie jest właśnie geometrią przestrzeni zakrzywionej. Zawodzą w niej bowiem reguły
geometrii euklidesowej. Widzimy więc, że zdolność unoszenia się ponad płaszczyzną nie
jest wcale rzeczą konieczną, aby stwierdzić, że otaczający nas świat jest zakrzywiony. Nie
trzeba więc wcale opływać globu dookoła, aby przekonać się, że jest on kulą. O tym,
że żyjemy na kuli, możemy się przekonać za pomocą próby skonstruowania kwadratu.
Jeżeli kwadrat będzie bardzo mały, potrzebna będzie przy tym duża precyzja, w przypadku
zaś dużych kwadratów można poprzestać na mniej dokładnych pomiarach.
Przeprowadźmy na przykład porównanie własności trójkątów na różnych powierzch-
niach. W trójkącie na płaszczyźnie suma kątów jest równa 180°. Nasz przyjaciel na po-
wierzchni kuli może natomiast otrzymać bardzo dziwne trójkąty. Może on, na przykład,
konstruować trójkąty, w których wszystkie trzy kąty będą kątami prostymi. Jest to w isto-
cie prawda! Jeden z takich trójkątów przedstawiono na rys. 42.10. Przypuśćmy bowiem,
że żuk nasz wyruszy z bieguna północnego i będzie posuwał się wzdłuż linii prostej aż do
równika. Tam wykona on zwrot pod kątem prostym i odmierzy linię prostą o tej samej co
poprzednio długości. Postępowanie to powtórzy on raz jeszcze i po przebyciu odcinka
o tej wybranej, bardzo specjalnej długości dotrze on dokładnie do swego punktu wyjścia,
przecinając swą pierwszą prostą dokładnie pod kątem prostym. Tak więc z punktu
widzenia jego geometrii trójkąt ten ma bez wątpienia dokładnie trzy kąty proste,
czyli suma jego kątów wynosi 270°. Okazuje się, że suma kątów w trójkątach, jakie mo-
że on konstruować, zawsze będzie większa niż 180°. Co więcej, nadwyżka kątowa
(która jest równa sumie kątów w trójkącie minus 180°, a więc we wspomnianym przy-
padku jest równa 90°) jest proporcjonalna do pola powierzchni trójkąta. Jeżeli więc trój-
kąt na powierzchni kuli będzie bardzo mały, suma jego kątów będzie prawie równa 180°
i nadwyżka kątowa będzie liczbą bardzo małą. Będzie ona jednak wzrastała wraz ze wzro-
stem trójkąta. Podobne własności będą wykazywały trójkąty konstruowane przez żuka
na rozgrzanej płycie.
Zwróćmy z kolei uwagę, do jakich wniosków co do swych kół dojdą pozostałe żuki.
Pozwólmy im skonstruować okręgi i zmierzyć ich obwody. Tak na przykład, żuk na po-
wierzchni kuli mógłby skonstruować taki okrąg, jaki pokazaliśmy na rys. 42.11. Odkryłby
on wtedy, że obwód jest mniejszy od iloczynu 2k razy promień. (Czytelnik może się łatwo
przekonać, dysponując wiedzą istot trójwymiarowych, że to co żuk nazywa „promieniem”
jest lukiem krzywej, który jest oczywiście dłuższy niż prawdziwy promień okręgu.) Jeśliby
żuk na powierzchni kuli czytał dzieła Euklidesa, mógłby spróbować obliczyć przewidy-
wany promień, dzieląc obwód C przez 2k; otrzymałby wtedy
_ C
rprzew ~ 2^'
(42.1)
Stwierdziłby więc, że mierzony przez niego promień jest większy niż przewidywany. Mógłby
on nazwać różnicę pomiędzy tymi promieniami „nadwyżką promienia” i napisać
'"mierz '"przew '"nadwyż >
(42.2)
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI
411
a następnie badać jak nadwyżka promienia bę-
dzie zależała od rozmiarów okręgu.
. Żuk na rozgrzanej płycie spotkałby się z po-
dobnym zjawiskiem. Przypuśćmy, że narysował
on okrąg o środku w najzimniejszym miejscu pły-
ty, jak na rys. 42.12. Gdybyśmy obserwowali jego
czynności, zauważylibyśmy, że jego pręty mier-
nicze byłyby krótkie w pobliżu środka i wydłu-
żałyby się w miarę ich przenoszenia do punktów
oddalonych od środka, chociaż żuk oczywiście
o tym by nie wiedział. Podczas pomiaru obwodu
pręt mierniczy byłby cały czas stały i dlatego
również ten żuk stwierdziłby, że jego mierzony
promień jest dłuższy niż promień przewidywany,
równy C/2k. Tak więc żuk na rozgrzanej płycie
także otrzymałby „nadwyżkę promienia”. Wiel-
kość tej nadwyżki znowu zależałaby od długości
promienia okręgu.
Przestrzenią zakrzywioną nazwiemy więc taką
przestrzeń, w której wystąpi jeden z następujących
rodzajów odstępstw geometrycznych: Suma ką-
tów w trójkącie różni się od 180°; stosunek ob-
wodu okręgu i liczby 2tt nie jest równy promienio-
wi; podana przez nas reguła konstruowania kwa-
dratu nie prowadzi do krzywej zamkniętej. Czy-
telnik mógłby rozszerzyć tę listę odstępstw o jesz-
cze inne.
Podaliśmy tu dwa odmienne przykłady prze-
strzeni zakrzywionej: powierzchnię kuli i rozgrza-
ną płytę. Jest rzeczą interesującą, że przy odpowied-
nim dobraniu zmian temperatury jako funkcji odle-
głości na rozgrzanej płycie, geometrie na obu tych
powierzchniach będą dokładnie takie same. Jest to
dość zabawne. Można tak dobrać warunki, aby żuk
na rozgrzanej płycie otrzymywał we wszystkich
przypadkach dokładnie te same odpowiedzi co żuk
na powierzchni kuli. Tym z czytelników, którzy
lubią geometrię i zadania geometryczne, powiemy
jak można tego dokonać. Jeżeli się przyjmie, że dłu-
gość nieskończenie małych prętów mierniczych
pod wpływem temperatury zmienia się o czyn-
nik równy jedności plus iloczyn pewnej stałej razy
kwadrat odległości od środka, wtedy okaże się,
42.10. Na powierzchni kuli można
skonstruować „trójkąt”, którego każ-
dy z kątów będzie równy 90°
42.11. Konstrukcja okręgu na po-
wierzchni kuli
42.12. Konstrukcja okręgu na roz-
grzanej płycie
412
42. PRZESTRZENIE ZAKRZYWIONE
42.13. „Okrąg” na powierzchni
siodłowej
że geometria na takiej rozgrzanej płycie będzie we wszystkich szczegółach dokładnie taka
sama jak geometria na powierzchni kuli.
Istnieją oczywiście również inne rodzaje geometrii. Moglibyśmy na przykład rozważać
geometrię żuka, który żyje na powierzchni gruszki, a więc na powierzchni, która w pewnych
swych miejscach ma większą krzywiznę niż w innych, wtedy nadwyżka kątowa w trójką-
tach będzie zależała od tego, w jakich miejscach swego świata żuk będzie trójkąty te kon-
struował. Innymi słowy, krzywizna przestrzeni może zmieniać się od miejsca do miejsca.
Takie przestrzenie krzywe są prostym uogólnieniem poprzedniej definicji. Można je rów-
nież imitować za pomocą odpowiedniego rozkładu temperatury na rozgrzanej płycie.
Chcielibyśmy również zwrócić uwagę, że są możliwe przypadki, w których odstępstwa
od geometrii euklidesowej będą miały znak przeciwny
niż w powyższych przykładach. Można więc, na przy-
kład, znaleźć powierzchnie, na których suma kątów
w dużych trójkątach będzie mniejsza niż 180°. Na pier-
wszy rzut oka może się to wydawać rzeczą niemożliwą,
ale tak nie jest. Przede wszystkim moglibyśmy mieć roz-
grzaną płytę, na której temperatura malałaby w miarę
oddalania się od środka. Wtedy wszystkie zmiany mia-
łyby kierunek przeciwny. Tego rodzaju przykład może-
my jednak otrzymać również na czysto geometrycznej
drodze, rozważając na przykład dwuwymiarową geome-
trię na powierzchni siodła. Wyobraźmy sobie siodłową
powierzchnię w rodzaju tej, którą naszkicowaliśmy na
rys. 42.13. Narysujmy na niej „okrąg”, określony jako
miejsce geometryczne punktów równoodległych od pew-
nego środka. Tego rodzaju okrąg będzie oscylującą krzy-
wą, stanowiącą brzeg powichrowanej powierzchni. Jego
obwód będzie więc większy niż 2w. Tak więc C/2tt jest te-
raz mniejsze niż r. „Nadwyżka promienia” jest tu zatem
ujemna.
Powierzchnie kul i gruszek są przykładami powierz-
chni o dodatniej krzywiźnie: w ostatnim zaś przykładzie
spotkaliśmy się z powierzchnią o krzywiźnie ujemnej.
W ogólnym przypadku, dwuwymiarowa przestrzeń może
mieć krzywiznę zmieniającą się od miejsca do miejsca
i może być przestrzenią o dodatniej krzywiźnie w pew-
nych punktach, a o ujemnej w innych. Przestrzenią
zakrzywioną nazywamy ogólnie taką przestrzeń, w której
po prostu reguły geometrii Euklidesa załamują się nie-
zależnie od znaku występujących tu odstępstw od geo-
metrii euklidesowej. Wartość krzywizny przestrzeni —
określona, na przykład, za pomocą nadwyżki promie-
nia — może się zmieniać od punktu do punktu.
42.14. Dwuwymiarowa przestrzeń
o znikającej krzywiźnie wewnętrz-
42-1. przykłady dwuwymiarowych przestrzeni
413
Zwróćmy uwagę, że zgodnie z naszą definicją krzywizny powierzchnia walca, wbrew
wszelkim oczekiwaniom, nie jest przestrzenią krzywą. Żuk żyjący na powierzchni walca,
jak to przedstawiliśmy na rys. 42.14, stwierdziłby, że jego trójkąty, kwadraty i okręgi
mają wszystkie własności dokładnie takie same jak na płaszczyźnie. Można się z tym łatwo
zgodzić, jeśli uprzytomnimy sobie, jak te wszystkie figury będą wyglądały po rozwinięciu
powierzchni walca na płaszczyznę. Wtedy wszystkie te figury geometryczne będą identyczne
z ich odpowiednikami w geometrii płaskiej. Dlatego też żuk żyjący na powierzchni walca
(przy założeniu, że nie będzie on walca obchodził dookoła, lecz wykonywał jedynie po-
miary lokalne) nie możne w żaden sposób stwierdzić, że jego przestrzeń jest zakrzywiona.
Przyjmując więc punkt widzenia oparty na podanych tu konstrukcjach, musimy przyjąć,
że jego przestrzeń nie jest przestrzenią zakrzywioną. Przedmiotem naszych rozważań bę-
dzie bowiem to, co bardziej precyzyjnie jest nazywane krzywizną wewnętrzną przestrzeni;
czyli krzywizną, której istnienie można stwierdzić jedynie za pomocą pomiarów przepro-
wadzanych w lokalnym otoczeniu danego punktu. (Powierzchnia walca nie ma więc krzy-
wizny wewnętrznej.) To właśnie znaczenie krzywizny miał na myśli Einstein twierdząc,
że przestrzeń nasza jest przestrzenią krzywą. Na razie jednak podaliśmy tylko definicję
dwuwymiarowej przestrzeni krzywej; musimy więc z kolei zastanowić się jakie znaczenie
może mieć to pojęcie w przestrzeni o trzech wymiarach.
42-2. Krzywizna w przestrzeni trójwymiarowej '
Jesteśmy istotami żyjącymi w przestrzeni trójwymiarowej i zamierzamy rozważyć
możliwość, że nasza trójwymiarowa przestrzeń jest zakrzywiona. Czytelnik mógłby za-
pytać: „W jaki sposób jednak możemy sobie wyobrazić, że nasza przestrzeń jest w jakimś
kierunku wygięta?” Otóż wcale nie musimy sobie wyobrażać, że nasza przestrzeń wygina
się w jakimkolwiek kierunku, gdyż nasza wyobraźnia do tego się nie nadaje. (Być może,
że dokładnie z takich samych powodów nie możemy wyobrażać sobie zbyt dużo, z jakich też
nie możemy za bardzo się wyzwolić od rzeczywistego świata.) Krzywiznę możemy jednak
określić bez możliwości wychodzenia z naszego trójwymiarowego świata. Wszystko to,
o czym mówiliśmy, posługując się dwuwymiarowymi przykładami, było po prostu ćwi-
czeniem, które miało doprowadzić nas do sposobu określania krzywizny, niezależnie od
możliwości uzyskania „wglądu” od zewnątrz.
Możemy więc stwierdzić I(pzy świat nasz jest zakrzywiony, czy też nie, postępując do-
kładnie tak samo jak osobnicy, którzy żyli na powierzchni kuli lub na rozgrzanej płycie.
Nie mamy, być może, sposobu rozróżnienia pomiędzy tymi dwoma przypadkami, lecz
z pewnością możemy odróżnić oba te przypadki od przestrzeni płaskiej, od zwyczajnej
płaszczyzny. Jak możemy to uczynić? Bardzo prosto: możemy odłożyć trójkąt i zmierzyć
jego kąty. Możemy też skonstruować wielki okrąg i zmierzyć stosunek jego obwodu do
jego promienia. Możemy także próbować utworzyć dokładne kwadraty lub skonstruować
sześcian. Każdy z tych przypadków dostarczy nam sprawdzianu słuszności praw geo-
metrii. Jeżeli prawa te nie będą spełnione, mówimy, że nasza przestrzeń jest krzywa. Jeżeli
więc utworzymy duży trójkąt i stwierdzimy, że suma jego kątów przewyższa 180°, dowiemy
414
42. PRZESTRZENIE ZAKRZYWIONE
42.15. Nadwyżka promie- •
ni a może być różna dla
okręgów o różnej orientacji
w przestrzeni
się, że nasza przestrzeń jest zakrzywiona. Tak samo to,
że zmierzony promień okręgu nie będzie równy ilorazowi
jego obwodu i liczby 2k, będzie dowodem, że nasza prze-
strzeń jest krzywa.
Czytelnik łatwo może zauważyć, że w trzech wymia-
rach będziemy mieli znacznie bardziej skomplikowaną sy-
tuację niż w przypadku dwuwymiarowym. W każdym
punkcie przestrzeni dwuwymiarowej występowała pewna
krzywizna. W przestrzeni trójwymiarowej natomiast mogą
występować różne składowe krzywizny. Jeśli skonstruujemy
trójkąt na pewnej płaszczyźnie, możemy otrzymywać różne
odpowiedzi w zależności od różnych orientacji tej płasz-
czyzny. Do tego samego wniosku doprowadzą nas rozwa-
żania związane z okręgiem. Przypuśćmy więc, że narysowa-
liśmy pewien okrąg, zmierzyliśmy jego promień i otrzymaliśmy w wyniku liczbę różną od
Cj2n, otrzymaliśmy więc pewną nadwyżkę promienia. Przypuśćmy dalej, że w płaszczyźnie
prostopadłej do płaszczyzny pierwszego okręgu narysowaliśmy inny okrąg (por. rys. 42.15).
Nie ma żadnego powodu, aby nadwyżka promienia była dla obu okręgów taka sama. Wię-
cej nawet, jeden z tych okręgów mógłby mieć dodatnią nadwyżkę, a drugi pewien ubytek
promienia (czyli nadwyżkę ujemną).
Uważny czytelnik może w tym miejscu zaproponować lepsze wyjście z sytuacji: Czy
nie moglibyśmy uniknąć tych wszystkich składowych, posługując się kulą w trzech wymia-
rach? Możemy przecież wziąć pod uwagę powierzchnię pewnej kuli, będącą zbiorem wszyst-
kich punktów równoodległych od pewnego danego punktu w przestrzeni. Następnie może-
my przecież zmierzyć pole jej powierzchni przez utworzenie na tej powierzchni bardzo drob-
nej prostokątnej siatki i zsumowanie przyczynków pochodzących od pól poszczególnych
oczek. Zgodnie z geometrią euklidesową całkowite pole A powierzchni kuli powinno być
równe iloczynowi liczby 4rc i kwadratu promienia kuli, możemy więc określić „przewidy-
wany promień”, który powinien być równy ^/4rr. Promień możemy jednak zmierzyć
również bezpośrednio przez wywiercenie na przykład w kuli otworu sięgającego do jej
środka i zmierzenie odpowiedniej odległości. Możemy wtedy znowu wziąć różnicę po-
między zmierzonym promieniem i przewidywanym i nazwać ją nadwyżką promienia:
mierzone pole \1/2
nadwyż 'mierz
4k
nadwyżka ta powinna być całkowicie wystarczającą miarą krzywizny. Ma ona tę wielką
zaletę, że nie zależy od orientacji trójkąta lub okręgu.
Tak określona nadwyżka promienia ma również pewną wadę; nie dostarcza ona peł-
nej charakterystyki przestrzeni. Jest ona miarą wielkości, którą zwykle nazywa się średnią
krzywizną przestrzeni trójwymiarowej, gdyż związany jest z nią pewien proces średniowania
ze względu na różne krzywizny. Ponieważ jednak jest ona pewną średnią wielkością, nie
rozwiązuje w sposób zupełny zagadnienia określenia geometrii. Jeśli jest znana tylko ta
liczba, nie można przewidzieć wszystkich własności geometrii przestrzeni, gdyż nie można
42-2. KRZYWIZNA W PRZESTRZENI TRÓJWYMIAROWEJ
415
na przykład powiedzieć, co się będzie działo z okręgami mającymi różne orientacje w prze-
strzeni. Pełna definicja krzywizny wymaga podania sześciu „współczynników krzywizny”
w każdym punkcie przestrzeni. Matematycy naturalnie wiedzą, jak wyznaczyć te wszyst-
kie współczynniki. Kiedyś w przyszłości, za pośrednictwem odpowiednich podręczników
matematycznych, czytelnik zapozna się zapewne z bardziej eleganckimi i bardziej zaawan-
sowanymi sposobami opisu krzywizny, warto jednak znać również mniej precyzyjny, ale
za to bardziej poglądowy sposób opisu tych pojęć. Dla większości naszych celów będzie
nam wystarczało pojęcie średniej krzywizny*'.
42-3. Nasza przestrzeń jest zakrzywiona
Stajemy teraz przed podstawowym pytaniem. Czy to wszystko jest prawdą? Czy na-
prawdę rzeczywista trójwymiarowa przestrzeń fizyczna, w której żyjemy, jest przestrzenią
zakrzywioną? Skoro umysł ludzki miał już dość wyobraźni, aby uzmysłowić sobie możli-
wość występowania przestrzeni zakrzywionych, to musiał naturalnie zadać sobie pytanie,
czy rzeczywisty świat jest czy też nie jest zakrzywiony. Zaprojektowano wiele bezpośred-
nich pomiarów geometrycznych, które miały udzielić odpowiedzi na to pytanie i nie stwier-
dzono żadnych odchyleń od geometrii euklidesowej. Z drugiej jednak strony, w wyniku
rozważań dotyczących grawitacji, Einstein doszedł do wniosku, że przestrzeń jest zakrzy-
wiona. Chcielibyśmy podać tu einsteinowskie prawo określające wielkość tej krzywizny
oraz przedstawić w krótkim zarysie sposób, w jaki doszedł on do sformułowania tego
prawa.
Einstein orzekł, że przestrzeń jest zakrzywiona i że źródłem jej krzywizny jest materia.
(Materia jest również źródłem grawitacji, a więc grawitacja i krzywizna przestrzeni są
z sobą powiązane — do tego jednak aspektu zagadnienia dojdziemy w następnych częściach
tego rozdziału.) Aby uprościć nieco to zagadnienie, załóżmy, że materia jest rozłożona
w sposób ciągły, z pewną gęstością, która może się przy tym zmieniać od punktu do punktu
przestrzeni**’. Einstein podał następującą regułę dotyczącą krzywizny przestrzeni: Jeśli
w przestrzeni mamy obszar wypełniony materią i weźmiemy w tym obszarze tak małą
kulę, że gęstość o materii we wnętrzu tej kuli jest praktycznie stała, wtedy nadwyżka pro-
mienia tej kuli będzie proporcjonalna do zawartej w niej masy. Korzystając z definicji
ł) Dla zupełności chcielibyśmy jeszcze zwrócić uwagę na pewien dodatkowy szczegół. Gdybyśmy
chcieli przenieść do trzech wymiarów model zakrzywionej przestrzeni jako rozgrzanej płyty, musielibyśmy
założyć, że długość pręta mierniczego zależy nie tylko od miejsca, w którym się go przykłada, lecz także
od orientacji pręta w tym miejscu. Stanowiłoby to uogólnienie prostego przypadku, w którym długość
pręta zależałaby tylko od tego, gdzie on się znajduje i byłaby taka sama dla jego wszystkich możliwych
kierunków. Tego rodzaju uogólnienie jest konieczne, jeśli chce się za pomocą takiego modelu opisać trój-
wymiarową przestrzeń o dowolnej geometrii, nie było ono natomiast potrzebne w przypadku dwuwymia-
rowym.
*ł) Nikt — nawet Einstein — nie wie, jak można to zrobić, jeśli masa jest skoncentrowana w pewnych
punktach.
416
42. PRZESTRZENIE ZAKRZYWIONE
nadwyżki promienia, mamy
G
nadwyżka promienia = 1/--------rmierz = (42.3)
r 4ir 3c2
Współczynnik G jest tu stałą grawitacji (tą samą co w teorii Newtona), c jest prędkością
światła, a M = 4rtpr3/3 jest masą materii znajdującej się wewnątrz kuli. Jest to einsteinow-
skie prawo określające średnią krzywiznę przestrzeni.
Dla przykładu weźmy pod uwagę Ziemię i dla uproszczenia załóżmy, że jej gęstość jest
stała, wtedy nie będziemy musieli obliczać żadnych całek. Przypuśćmy, że bardzo starannie
zmierzyliśmy pole powierzchni Ziemi, a następnie wywierciliśmy szyb sięgający do jej
środka i zmierzyliśmy promień Ziemi. Znając pole powierzchni możemy obliczyć przewi-
dywany promień Ziemi, przyjmując że pole to jest równe 4nr2. Gdybyśmy porównali
przewidywany promień z jej rzeczywistym promieniem, stwierdzilibyśmy, że rzeczywisty
promień jest większy od promienia przewidywanego właśnie o wielkość daną w równa-
niu (42.3). Stała G/3c2 jest w przybliżeniu równa 2,5-10“29 cm na gram, czyli nadwyżka
promienia odpowiadająca jednemu gramowi materii jest równa 2,5-10~29cm. Biorąc zaś
masę Ziemi, która jest w przybliżeniu równa 6-1027 g, możemy obliczyć, że rzeczywisty
promień Ziemi jest o 1,5 mm większy niż jej promień przewidywany*’. Przeprowadzając
ten sam rachunek dla Słońca, możemy stwierdzić, że nadwyżka promienia Słońca jest
równa pół kilometra.
Należy zauważyć, że zgodnie ze wspomnianym prawem, średnia krzywizna wokół
fikcyjnej kuli ponad powierzchnią Ziemi jest równa zeru. Wcale to jednak nie oznacza, że
wszystkie składowe krzywizny są tam równe zeru. Również w obszarach ponad powierzch-
nią Ziemi może występować — i w rzeczywistości występuje — pewna krzywizna prze-
strzeni. Jeżeli w obszarze takim weźmie się pod uwagę leżący w pewnej płaszczyźnie okrąg,
to dla pewnych orientacji płaszczyzny okrąg taki będzie miał nadwyżkę promienia o jakimś
znaku, a dla innych orientacji o znaku przeciwnym. Średnia krzywizna wokół jakiejś kuli
znika tylko wtedy, gdy we wnętrzu tej kuli nie znajdują się żadne masy. Można dodać,
że różne składowe krzywizny są zależne od zmian średniej krzywizny przestrzeni. Jeżeli
więc dana jest średnia krzywizna w całej przestrzeni, można na podstawie tej zależności
wyznaczyć samą krzywiznę w dowolnym punkcie przestrzeni. W obszarach ponad po-
wierzchnią Ziemi średnia krzywizna zmienia się z wysokością, czyli w obszarach tych
przestrzeń jest zakrzywiona. Istnienie tej właśnie krzywizny manifestuje się w postaci siły
grawitacyjnej.
Powróćmy do przykładu z żukiem na płaszczyźnie i załóżmy, że na „płaszczyźnie”
tej występują niewielkie lokalne wzniesienia. Ilekroć nasz żuk natrafi na takie wzniesienie,
będzie wnioskował, że natrafił na mały lokalny obszar, w którym jego przestrzeń jest
zakrzywiona. Z podobnym zjawiskiem spotykamy się w trzech wymiarach. W miejscach,
gdzie występują grudki materii, nasza trójwymiarowa przestrzeń ma lokalną krzywiznę —
występuje tam trójwymiarowy odpowiednik lokalnego wzniesienia.
*’ Oszacowanie to jest oczywiście przybliżone, gdyż w rzeczywistości gęstość Ziemi zależy od jej
promienia.
42-3. NASZA PRZESTRZEŃ JEST ZAKRZYWIONA
417
Jeżeli na „płaszczyźnie” będziemy mieli wiele wybojów, może tam wystąpić pewna
globalna krzywizna poza jej lokalnymi fluktuacjami w postaci małych wzniesień — możemy
wtedy zamiast płaszczyzny otrzymać na przykład powierzchnię kuli z niewielkimi wznie-
sieniami. Byłoby rzeczą interesującą, gdybyśmy wiedzieli, czy nasza przestrzeń ma obok
lokalnych wzniesień spowodowanych przez takie grudki materii jak Ziemia lub Słońce
również pewną globalną średnią krzywiznę. Na pytanie to próbują odpowiedzieć astro-
fizycy wykonując pomiary i obserwacje bardzo odległych galaktyk. Gdyby na przykład
liczba galaktyk obserwowanych w sferycznej warstwie o bardzo dużym promieniu różniła
się od tego, czego moglibyśmy oczekiwać na podstawie znajomości promienia takiej war-
stwy, to otrzymalibyśmy tym samym miarę nadwyżki promienia gigantycznej kuli. Na pod-
stawie takich pomiarów ma się nadzieję, iż uda się rozstizygnąć czy cały nasz Wszech-
świat jest średnio rzecz biorąc płaski, czy też zakrzywiony — czy jest „zamknięty” jak
powierzchnia kuli, czy też „otwarty” jak płaszczyzna. Czytelnik spotkał się już zapewne
z dyskusjami na ten temat. Cała sprawa jest ciągle jeszcze dyskusyjna, gdyż pomiary
astronomiczne są ciągle jeszcze nieprzekonywąjące’; dane eksperymentalne nie są jesz-
cze wystarczająco dokładne, aby można było na ich podstawie dać jednoznaczną odpo-
wiedź. Nie mamy więc, niestety, najmniejszego pojęcia, jaka jest globalna krzywizna ca-
łego naszego Wszechświata.
42-4. Geometria czasoprzestrzeni '
Musimy wreszcie wziąć pod uwagę również pojęcie czasu. Jak wiemy ze szczególnej
teorii względności, pomiary wielkości przestrzennych oraz pomiar czasu są z sobą ściśle
związane. Nie jest więc do pomyślenia, aby sama przestrzeń mogła ulegać pewnym zmia-
nom, a czas byłby od tych zmian niezależny. Jak pamiętamy, pomiar czasu zależał od
prędkości, z jaką poruszał się obserwator. Dla obserwatora mijającego nas na przykład
w pojeździe kosmicznym wszystkie procesy przebiegają wolniej niż dla nas. Jeśli taki
obserwator wystartuje w podróż kosmiczną i powróci po 100 sekundach wyznaczonych
przez nasze zegarki, czas na jego zegarku może wynosić na przykład 95 sekund. W porów-
naniu z naszymi zegarami jego zegarek — tak jak i przebieg wszystkich innych procesów,
na przykład bicie jego serca — będzie miał zwolniony rytm.
Spróbujmy rozpatrzyć następujące, interesujące zagadnienie. Przypuśćmy, że znaj-
dujemy się w rakiecie kosmicznej. Na dany sygnał mamy wystartować i mamy powrócić
do miejsca naszego startu dokładnie wtedy, gdy zostanie tam nadany następny sygnał —
po czasie dokładnie równym, powiedzmy, 100 sekundom według wskazań zegara w spo-
czynku. Mamy ponadto tak zaplanować wycieczkę, aby zgodnie z naszym zegarem upłynął
możliwie najdłuższy czas. W jaki sposób powinniśmy się poruszać? Otóż powinniśmy
stać w miejscu. Jeśli bowiem będziemy się w ogóle poruszać, nasz zegar wskaże po powro-
cie zawsze mniej niż 100 sekund.
Wprowadźmy jednak w tym zagadnieniu pewną drobną zmianę. Przypuśćmy, że mamy
wystartować z pewnego punktu A na dany sygnał i mamy dotrzeć do innego punktu B
(oba punkty spoczywają w pewnym ustalonym układzie); mamy przy tym tak zaplanować
27 — Wykłady z fltykl
418
42. PRZESTRZENIE ZAKRZYWIONE
naszą podróż, aby dotrzeć do celu właśnie w chwili nadania tam drugiego sygnału (np.
po upływie 100 sekund po pierwszym sygnale według wskazań zegara spoczywającego
wraz z oboma punktami). Mamy ponadto tak zaplanować podróż, aby podróżujący z nami
zegar wskazał w chwili przybycia możliwie największy upływ czasu. W jaki sposób możemy
to osiągnąć? Dla jakiego toru ruchu i dla jakiego rozkładu jazdy zegar nasz wskaże możli-
wie najdłuższy czas podróży? Okazuje się, że podróż nasza będzie trwała najdłużej, z na-
szego punktu widzenia, jeśli odbędziemy ją podróżując ruchem jednostajnym po linii
prostej. Wtedy bowiem każdy dodatkowy ruch i każda dodatkowa prędkość zwolnią bieg
naszego zegara. (Ponieważ zaś odchylenie czasu zależy od kwadratu prędkości, tego co
stracimy idąc trochę prędzej na pewnym odcinku naszej podróży nigdy nie będziemy
mogli odrobić, niezależnie od tego jak wolno próbowalibyśmy poruszać się w innych
okresach podróży.)
Z rozważań tych wynika przede wszystkim, że również w czasoprzestrzeni możemy
określić pojęcie „Unii prostej”. Odpowiednikiem linii prostej w przestrzeni jest w przypadku
czasoprzestrzeni ruch z jednostajną prędkością w stałym kierunku.
Odpowiednikiem krzywej o najkrótszej odległości w przestrzeni jest w czasoprzestrzeni
nie ruch w najkrótszym możliwie czasie, lecz ruch z najdłuższym czasem własnym, a jest
to związane z odmiennym znakiem, jaki towarzyszy w teorii względności wielkościom
czasowym. Ruch „prostoliniowy” — będący odpowiednikiem „ruchu ze stałą prędkością
wzdłuż linii prostej” — jest teraz tym ruchem, podczas którego zegar zostaje tak przenie-
siony z jednego punktu i odpowiadającej mu chwili czasu do innego punktu w innej chwili,
że czas podróży wskazany przez ten zegar będzie możliwie najdłuższy. To właśnie jest
naszą definicją odpowiednika linii prostej w czasoprzestrzeni.
42-5. Grawitacja i zasada równoważności
Jesteśmy już przygotowani, aby przystąpić do dyskusji nad prawami grawitacji. Ein-
stein podjął szereg prób, aby sformułować taką teorię grawitacji, która byłaby zgodna
z poprzednio przez niego podaną teorią względności. Borykał się on z tym zagadnieniem
dość długo, aż w końcu przyjął pewną ważną zasadę, która doprowadziła go do otrzymania
poprawnych praw. Podstawą tej zasady jest obserwacja, że we wnętrzu swobodnie spada-
jącego przedmiotu wszystko wydaje się być w stanie nieważkości. Tak na przykład, znaj-
dujący się na orbicie satelita Ziemi spada swobodnie w polu ciężkości Ziemi i dlatego
znajdujący się w nim astronauta będzie odczuwać stan nieważkości. Koncepcja ta, sfor-
mułowana z większą precyzją, jest nazywana einsteinowską zasadą równoważności. Jest
ona związana z faktem, że wszystkie przedmioty spadają z dokładnie tym samym przyspie-
szeniem, niezależnym ani od ich masy, ani też od ich wewnętrznej struktury. Jeśli weźmiemy
pod uwagę lecący z wyłączonymi silnikami pojazd kosmiczny, czyli spadający swobodnie
statek, i znajdującego się w jego wnętrzu człowieka, wtedy zarówno ruch człowieka, jak
i pojazdu będzie powodowany przez dokładnie te same prawa. Skoro więc człowiek ów
umieści się w środkowym punkcie pojazdu, będzie on tam pozostawał. Nie będzie spadał
42-5. GRAWITACJA I ZASADA RÓWNOWAŻNOŚCI
419
na żadną ze ścian statku. Taką właśnie sytuację mamy na myśli, mówiąc że pozostaje
on w „stanie nieważkości”.
Przypuśćmy teraz, że znajdujemy się w poruszającej się ruchem przyspieszonym rakie-
cie kosmicznej. Względem czego jednak porusza się ona ruchem przyspieszonym? Uj-
mijmy to inaczej i powiedzmy, że silniki rakiety pracują wytwarzając siłę ciągu, wskutek
czego jej ruch nie jest już spadkiem swobodnym. Przypuśćmy także, że znajdujemy się
dość daleko w pustej przestrzeni kosmicznej, gdzie praktycznie na pojazd nie działają
żadne siły grawitacyjne. Jeśli pojazd będzie miał przyspieszenie równe „Ig”, będziemy
mogli stać na „podłodze” i będziemy odczuwali nasz normalny ciężar. Gdybyśmy również
podrzucili do góry piłkę, zaczęłaby ona „spadać” na podłogę. Dlaczego? Otóż dlatego,
że pojazd porusza się ruchem przyspieszonym „ku górze”, a na piłkę nie będą natomiast
działały żadne siły i nie będzie ona brała udziału w tym ruchu przyspieszonym; nie będzie
ona więc nadążała za pojazdem. Ze względu na wnętrze pojazdu piłka będzie poruszała się
pozornym ruchem przyspieszonym w dół, o przyspieszeniu równym „Ig”.
Porównajmy to teraz z sytuacją, w której pojazd kosmiczny będzie spoczywał na po-
wierzchni Ziemi. Wszystkie tego typu zjawiska będą miały przebieg dokładnie taki sam jak
poprzednio! Pasażerowie będą odczuwali nacisk w kietunku podłogi, piłka będzie spadać
z przyspieszeniem równym Ig itd. Czy jest więc możliwe, żeby ktoś siedzący wewnątrz
pojazdu kosmicznego mógł powiedzieć, czy spoczywa na powierzchni Ziemi, czy też
porusza się ruchem przyspieszonym w przestrzeni kosmicznej? Zgodnie z einsteinowską
zasadą równoważności tego nie można w ogóle rozstrzygnąć, jeśli korzysta się tylko z po-
miarów wykonanych we wnętrzu pojazdu!
Dla ścisłości należy stwierdzić, że jest to prawdą tylko w przypadku pomiarów wy-
konywanych w dokładnie jednym punkcie wewnątrz pojazdu. Pole grawitacyjne Ziemi
nie jest bowiem dokładnie jednorodne i spadająca w nim swobodnie piłka będzie dla dwóch
sąsiednich torów miała trochę różne przyspieszenia — o różnych kierunkach i o różnych
wartościach bezwzględnych. Gdybyśmy mieli natomiast ściśle jednorodne pole grawita-
cyjne, moglibyśmy je zastąpić układem odniesienia poruszającym się ruchem jedno-
stajnie przyspieszonym. W stwierdzeniu tym zawarta jest właśnie podstawowa treść za-
sady równoważności.
42-6. Rytm zegarów w polu grawitacyjnym
Posłużymy się teraz zasadą równoważności, aby rozważyć dziwne zjawiska, które
mogą zachodzić w polu grawitacyjnym. Zwrócimy więc uwagę na pewne zjawisko
w rakiecie kosmicznej, którego możliwości istnienia w polu grawitacyjnym czytelnik
prawdopodobnie by nie oczekiwał. Przypuśćmy, że jeden zegar umieściliśmy w „głowicy”
rakiety kosmicznej, tzn. w jej przedniej części, a drugi, identyczny zegar — w jej tylnej
części, jak to przedstawiono na rys. 42.16. Oznaczmy te zegary odpowiednio literami A i B.
Jeśli porównamy wskazania tych zegarów podczas przyspieszonego ruchu pojazdu, to
się okaże, że zegar na przodzie pozornie idzie szybciej niż zegar w tyle. Aby się o tym prze-
420
42. PRZESTRZENIE ZAKRZYWIONE
42.16. Poruszający się ru-
chem przyspieszonym po-
jazd rakietowy z dwoma ze-
garami na pokładzie
następnymi błyskami. Dlatego obserwator
konać, przypuśćmy, że przedni zegar wysyła co sekundę
błysk światła, a z tyłu rakiety znajduje się obserwator,
który porównuje częstość przybywających błysków światła
ze wskazaniami zegara B. Niech rakieta będzie na przykład
w położeniu oznaczonym literą a na rys. 42.17’ wtedy, gdy
zegar A wysyła błysk światła, a w położeniu b, gdy błysk ten
dotrze do zegara B. Następny z kolei błysk zegar A wyśle
wtedy, gdy pojazd będzie znajdował się w położeniu c, a w
położeniu d błysk ten będzie odebrany przez obserwatora
znajdującego się przy zegarze B.
Pierwszy błysk przebędzie odległość Z-j, a następny przej-
dzie krótszą już odległość L2. Odległość ta będzie krótsza,
gdyż pojazd porusza się ruchem jednostajnie przyspieszonym
i w chwili wysłania drugiego błysku będzie miał już większą
prędkość. Widać więc stąd, że dwa błyski wysłane przez
zegar A w odstępie jednosekundowym dotrą do zegara B
w odstępie krótszym od jednej sekundy, gdyż drugi z kolei
błysk nie będzie potrzebował na przebycie swej drogi tak
dużo czasu, jak pierwszy. To samo będzie się również działo
ze wszystkimi
znajdujący się w tyle statku dojdzie do wniosku, że zegar A
idzie prędzej niż zegar B. Gdybyśmy przeprowadzili podobne
doświadczenie myślowe odwracając rolę obu zegarów —
pozwolili emitować światło zegarowi B i obserwowali je przy
zegarze A — doszlibyśmy do wniosku, że zegar B idzie wolniej
niż A. Oba więc wnioski byłyby z sobą zgodne i nic w tym nie
byłoby tajemniczego.
Weźmy teraz pod uwagę pojazd kosmiczny spoczywający w polu grawitacyjnym Ziemi.
Przypuśćmy, te przeprowadzamy to samo doświadczenie. Siedzący więc na podłodze obser-
wator z jednym zegarkiem w ręku i patrzący na drugi identyczny zegar umieszczony na
wysokiej półce powinien by dojść do wniosku, że zegar na półce spieszy się w porównaniu
z zegarem na podłodze! Czytelnik może w tym miejscu zaprotestować: „Wniosek ten
musi być błędny. Wskazania obu zegarów powinny być takie same. Jeśli zegary nie wyko-
nują ruchów przyspieszonych, nie ma powodów, aby ich rytmy były niezgodne.” Tak
jednak być musi, jeśli zasada równoważności jest słuszna. Einstein chciał zaś koniecznie,
aby zasada ta była słuszna, i zgodnie z tym żądaniem odważnie i logicznie kontynuował
swe rozumowanie. Zaproponował, aby uznać, że zegary umieszczone w różnych punktach
w polu grawitacyjnym muszą pozornie chodzić różnie. Jeśli przy tym różnica ich wskazań
będzie się stale zwiększać, należy uznać, że mają one odmienne rytmy.
Widać teraz ścisłą analogię pomiędzy zegarami w polu grawitacyjnym i rozszerzającym
się pod wpływem ciepła prętem mierniczym, o którym mówiliśmy poprzednio, kiedyśmy
się zajmowali żukiem na rozgrzanej płycie. Wyobrażaliśmy sobie, że pręty, żuki, jak
i wszystkie inne przedmioty jednakowo zmieniały swe długości pod wpływem zmian tem-
42-6. RYTM ZEGARÓW W POLU GRAWITACYJNYM
421
peratury i dlatego żuki nie miały możliwości stwierdzenia, że ich pręty miernicze zmieniały
swą długość podczas ich przesuwania po rozgrzanej płycie. To samo dzieje się z zegarami
w polu grawitacyjnym. Każdy zegar umieszczony na wyższym poziomie wydaje się spie-
szyć. Przyspieszeniu ulega wtedy zarówno rytm bicia serca, jak i przebieg wszystkich
innych procesów.
Gdyby tak nie było, istniałaby możliwość odróżnienia pola grawitacyjnego od porusza-
jącego się ruchem przyspieszonym układu odniesienia. Jest to trudna do przyjęcia koncep-
cja, że czas może się zmieniać od miejsca do miejsca, ale jest to koncepcja, którą Einstein
posługiwał się w swych rozumowaniach, i — wierzcie mi lub nie — jest ona poprawna.
Posługując się zasadą równoważności możemy obliczyć
jak zmienia się prędkość chodu zegara w zależności od
jego wysokości w polu grawitacyjnym. W tym celu rozwa-
żymy po prostu pozorną rozbieżność wskazań dwóch zega-
rów w poruszającej się ruchem przyspieszonym rakiecie
kosmicznej. Najprościej możemy to zrobić powołując się
na wyniki otrzymane w rozdz. 34 tomu 1 (cz. 2) dla zja-
wiska Dopplera. Stwierdziliśmy tam (por. równanie 34.14),
że jeśli v jest względną prędkością źródła i odbiornika,
odbierana częstość co jest związana z nadawaną częstością
o>o wzorem
1-f-n/c
CO = CO0 —=. =.- - .
^\—V2!c2
Teraz, w przypadku przedstawionej na rys. 42.17 rakiety,'
poruszającej się ruchem przyspieszonym, odbiornik i nadaj-
nik poruszają się w danej chwili z jednakowymi prędkościa-
mi. W tym jednak czasie, w którym sygnał świetlny prze-
chodzi od zegara A do zegara B, pojazd przyspiesza. Przy-
rost jego prędkości jest więc wtedy równy gt, gdzie g jest
przyspieszeniem, a t — czasem, jaki światło potrzebuje
do przebycia odległości H od punktu A do B. Czas ten jest
w przybliżeniu równy H/c. Wtedy więc, gdy sygnał dociera
do punktu B, statek ma nową prędkość powiększoną o wiel-
kość gH/c. Ten przyrost prędkości reprezentuje względną
prędkość odbiornika i nadajnika w chwilach wysłania i ode-
brania sygnałów. Prędkość tę należy podstawić do wzoru
(42.4) na przesunięcie Dopplera. Zakładając, że przyspie-
szenie i długość pojazdu kosmicznego są tak małe, że odpo-
wiadający im przyrost prędkości jest znacznie mniejszy
od prędkości światła, możemy pominąć wyraz proporcjo-
nalny do v2/c2.
42.17. Zegar umieszczony
na przodzie poruszającego
się ruchem przyspieszonym
pojazdu rakietowego ma po-
zornie przyspieszony rytm
w porównaniu z zegarem
umieszczonym w tyle po-
jazdu
422
42. PRZESTRZENIE ZAKRZYWIONE
Mamy więc
/ gH\
« = 1+Ą-L (42.5)
\ c2 f
Tak więc pomiędzy dwoma zegarami w rakiecie kosmicznej zachodzi związek
/ gff\
i (rytm odbierany) = (rytm nadawany) 11 --I, (42.6)
t ' c2 /
gdzie 27 jest różnicą w wysokości nadajnika i odbiornika.
Z zasady równoważności wynika, że ten sam rezultat musi być słuszny dla dwóch zegarów
umieszczonych na różnych wysokościach, o różnicy H, w polu grawitacyjnym, w którym
przyspieszenie ciał spadających jest równe g.
Rezultat ten jest tak ważny, że chcielibyśmy pokazać również, jak wynika on z innego
prawa fizyki — z zasady zachowania energii. Jak wiemy, siła grawitacyjna działająca na
dowolny obiekt jest proporcjonalna do jego masy M, która z kolei jest związana z jego
całkowitą energią wewnętrzną E wzorem M = E/c2. Tak na przykład, masy jąder atomo-
wych otrzymane na podstawie tego wzoru z energii jądrowych reakcji przemiany danego
jądra w inne, są zgodne z masami otrzymanymi z ich ciężarów atomowych.
Weźmy teraz pod uwagę atom, który może znajdować się albo w stanie całkowitej
energii Eq, będącym jego najniższym stanem energetycznym, albo też w wyższym stanie
energii E^. Na skutek przejścia ze stanu do stanu Eo atom ten emituje światło. Czę-
stość co tego światła będzie równa
hw — Et— Eq. (42.7)
Przypuśćmy teraz, że atom ten jest w stanie Et oraz że umieściliśmy go na podłodze.
Przenieśmy go następnie z podłogi na pewien poziom o wysokości H. Aby to uczynić,
musimy wykonać pracę polegającą na przeniesieniu masy mt = EJc2 przeciwko sile pola
grawitacyjnego. Praca ta jest równa
^-gH. (42.8)
c
Po przeniesieniu go pozwólmy atomowi wyemitować foton, co spowoduje jego przejście
do niższego stanu energii Eo. Następnie przenieśmy atom z powrotem na podłogę. Prze-
nosimy teraz jednak masę równą E0[c2‘, zyskamy więc energię
—^gH. (42.9)
c2
Całkowita praca, jaką musieliśmy wykonać przy przenoszeniu atomu, jest więc równa
AU- E1~E° gH. (42.10)
c2
Podczas emisji atom oddał fotonowi energię równą Et— Eo. Przypuśćmy teraz, że
42-6. RYTM ZEGARÓW W POLU GRAWITACYJNYM
423
również foton powrócił na podłogę i został tu zaabsorbowany. Jak duża będzie energia,
dostarczona przez foton w momencie absorpcji? W pierwszej chwili mogłoby się wydawać,
że energia ta będzie po prostu równa Et— Eo. Tak jednak być nie może, jeśli energia jest
zachowana. Powinno nas o tym przekonać następujące rozumowanie. Na początku mie-
liśmy energię Et atomu na podłodze. Na końcu, całkowita energia na podłodze była
równa sumie energii Eo atomu w jego najniższym stanie i energii Ef otrzymanej od fotonu.
Podczas procesu musieliśmy dostarczyć dodatkowej energii AU danej równaniem (42.10).
Z zasady zachowania energii wynika, że energia końcowa powinna być równa sumie energii
początkowej i wykonanej pracy. Musimy więc mieć
Ey+Eo ~ EiĄ- AU,
czyli
E^ = Et—E0+AU. (42.11)
Stąd więc wynika, że energia fotonu na podłodze nie była po prostu równa Et— Eo, lecz
była od tej wielkości większa. W przeciwnym bowiem przypadku część energii zostałaby
stracona. Jeśli do równania (42.11) podstawimy otrzymane na AU wyrażenie (42.10),
stwierdzimy, że energia, z jaką foton przybył na podłogę, była równa
Ef = (Er-£0)i 1+^rl- (42.12)
Foton o energii Ef ma jednak częstość a> = Ef/H. Jeśli przez a>0 ożnaczymy częstość, z jaką
foton był emitowany, to równanie (42.12) staje się identyczne ze związkiem (42.5) pomiędzy
częstością fotonu ulegającego absorpcji na podłodze i częstością fotonu podczas jego
emisji.
Związek ten możemy otrzymać jeszcze w inny sposób. Foton o częstości oj0 ma ener-
gię Eo = Ha>0. Ponieważ energii Eo odpowiada masa grawitacyjna E0/c2, foton ma masę
(która nie jest jego masą spoczynkową) równą Hw0/c2 i jest przez Ziemię „przyciągany”.
Spadając z wysokości H uzyska on energię równą (Tkwolc2)gH i przybędzie na podłogę
z energią
/ gH\
E — h<oQ l+Ą-
\ c2 I
Ponieważ zaś jego częstość po spadku jest równa E/Jl, w wyniku otrzymujemy znowu
równanie (42.5). Widzimy, że wiele koncepcji dotyczących względności, fizyki kwantowej
oraz zasady zachowania energii będzie z sobą zgodnych tylko wtedy, gdy przewidziane
przez Einsteina zachowanie zegarów w polu grawitacyjnym będzie poprawne. Rozważane
tu zmiany częstości są w normalnych warunkach bardzo małe. Tak na przykład, 20-me-
trowej różnicy wzniesień na powierzchni Ziemi odpowiada względna różnica częstości
równa 2 10-15. Dokładnie taka właśnie zmiana częstości została niedawno stwierdzona
doświadczalnie za pomocą zjawiska Mossbauera*1. Einstein miał więc absolutną rację.
1 R. V. Pound i G. A. Rebka, Jr., Physical Review Letters 4, 337 (1960).
424
42. PRZESTRZENIE ZAKRZYWIONE
H
a)
H
A
C) , 100 m
-•»
t
42.18. Próba konstrukcji prostokąta w czaso-
przestrzeni
42-7. Krzywizna czasoprzestrzeni
Teraz chcemy powiązać otrzymane
powyżej wyniki z koncepcją krzywej czaso-
przestrzeni. Stwierdziliśmy już powyżej,
że istnieje analogia pomiędzy różnicą
w chodzie zegarów w różnych miejscach
i występowaniem krzywizny przestrzeni na
rozgrzanej płycie. Jest to jednak czymś
więcej niż analogią; jest to stwierdze-
niem, że czasoprzestrzeń jest zakrzywio-
na. Spróbujmy spojrzeć na czasoprze-
strzeń z punktu widzenia geometrycznego.
Może to z początku brzmieć nieco dziw-
nie, przypomnijmy sobie jednak, że już
dość często podawaliśmy diagramy czaso-
przestrzeni, na których na jednej osi była
odmierzona odległość, a na drugiej od-
stępy czasu. Przypuśćmy, że chcemy skon-
struować w czasoprzestrzeni pewien pro-
stokąt. Próbę jego konstrukcji przedsta-
wimy za pomocą wykresu przedstawiają-
cego wysokość H w zależności od czasu t,
w układzie o osiach jak na rys. 42.18a.
Aby wykonać podstawę naszego prosto-
kąta, weźmiemy pewien przedmiot w spo-
czynku, znajdujący się na wysokości
i podążymy wzdłuż jego linii świata przez
100 s. Otrzymamy w ten sposób odcinek
BD na części b) wykresu, równoległy do
osi t. Weźmy teraz pod uwagę inny przed-
miot, znajdujący się 100 m wyżej niż pierw-
szy, w czasie t — 0. Niech przedmiotowi
temu w chwili t — 0 odpowiada punkt A
na rys. 42.18c. Podążmy teraz za tym
przedmiotem wzdłuż jego linii świata
przez 100 s zmierzonych przez zegar
w punkcie A. W tym czasie przedmiot
przejdzie od punktu A do C w czaso-
przestrzeni, co zostało pokazane w części
d) wykresu. Ponieważ jednak na obu tych
wysokościach czas biegnie inaczej — za-
42-7. KRZYWIZNA CZASOPRZESTRZENI
425
kładamy bowiem, że istnieje tu pole grawitacyjne — punkty C i D nie przedstawiają
zdarzeń jednoczesnych. Gdybyśmy więc spróbowali uzupełnić kwadrat przez pociągnięcie
linii prostej do punktu C, znajdującego się 100 m powyżej punktu D w tym samym
czasie (por. rys. 42.18e), nie otrzymalibyśmy krzywej łamanej zamkniętej. Fakt ten jest
równoważny stwierdzeniu, że czasoprzestrzeń jest zakrzywiona.
42-8. Rnch w czasoprzestrzeni zakrzywionej
Rozważmy teraz pewną interesującą zagadkę.
Przypuśćmy, że mamy dwa identyczne zegary, A i B, znajdujące się na powierzchni Ziemi.
Przypuśćmy dalej, że unieśliśmy zegar A na pewną wysokość H, potrzymaliśmy go tam
przez chwilę i opuściliśmy go z powrotem na powierzchnię Ziemi dokładnie wtedy, gdy
zegar B odmierzył odstęp czasu równy 100 s. Odpowiedni odstęp czasu, odmierzony przez
zegar A, będzie wynosił wtedy, na przykład 107 sekund, gdyż na skutek uniesienia go
w powietrze rytm tego zegara był przyspieszony. I teraz właśnie możemy postawić naszą
zagadkę. Jaki ruch musi wykonać zegar A, jeśli odmierzony przez niego odstęp czasu ma
być możliwie największy — przy założeniu, że zegar A będzie zawsze powracał wtedy, gdy
zgodnie z zegarem B upłynie 100 s? Czytelnik mógłby na przykład tak odpowiedzieć:
„Sprawa jest prosta. Należy unieść zegar A po prostu tak wysoko, jak jest tylko możliwe.
Wtedy zegar A maksymalnie przyspieszy swój rytm, i po powrocie wykaże możliwie naj-
większy upływ czasu.” Rozumowanie takie jest jednak błędne. Czytelnik bowiem tu za-
pomina, iż mamy do dyspozycji tylko 100 s ńa to, by wznieść nasz zegar i opuścić go z po-
wrotem. Jeśli uniesiemy go bardzo wysoko, będziemy musieli spowodować bardzo szyb-
ki jego ruch w obie strony, aby zdążyć w przeciągu 100 s. Musimy przy tym pamiętać
o tym, że zgodnie ze szczególną teorią względności, rytm poruszającego się zegara ulegnie
zwolnieniu w stosunku FI—v2/c2. Gdybyśmy wzięli pod uwagę tylko tę poprawkę rela-
tywistyczną, okazałoby się, że odstęp czasu mierzony przez zegar A jest mniejszy niż od-
powiedni odstęp mierzony przez zegar B. Mamy więc tu do czynienia ze swego rodzaju
grą. Jeśli pozostawimy zegar A w spokoju, odmierzy on 100 s. Jeśli zaś będziemy go po-
woli unosić, osiągając raczej małą wysokość, a następnie powoli sprowadzimy go na po-
wierzchnię Ziemi, wskaże nam on trochę więcej niż 100 s. Jeżeli natomiast uniesiemy go
jeszcze trochę wyżej, nie wykluczone, że jeszcze bardziej na tym zyskamy. Jeśli jednak
będziemy chcieli unieść go zbyt wysoko, będziemy musieli się spieszyć, aby zdążyć to
wykonać; może to spowodować tak duże zwolnienie rytmu zegara, że po powrocie
będzie wskazywał on mniej niż 100 s. Jaki więc powinniśmy przygotować program
zmian wysokości w czasie, tzn. jaką powinniśmy dobrać wysokość i prędkość do-
tarcia do niej, abyśmy zdążyli powrócić do zegara B wtedy, gdy odmierzony przez
niego odstęp czasu będzie wynosił 100 s, a odstęp czasu odmierzony przez zegar A
będzie możliwie największy?
Odpowiedź: Należy wyznaczyć, z jaką prędkością początkową powinno się wyrzucić
piłkę pionowo w górę, aby powróciła ona na powierzchnię Ziemi po dokładnie 100 s.
Taki ruch piłki — składający się z jej szybkiego wznoszenia, zwalniania, zatrzymania się
426
42. PRZESTRZENIE ZAKRZYWIONE
42.19. W jednorodnym polu grawitacyjnym torem,
wzdłuż którego czas własny przyjmuje maksimum
dla ustalonego odstępu czasu, jest parabola
i powrotu na powierzchnię Ziemi — jest
właśnie dokładnie tym ruchem, podczas
którego upłynie maksymalny odstęp
czasu na zegarku poruszającym się
wraz z piłką.
Rozważmy teraz trochę inne zagad-
nienie. Przypuśćmy, że mamy dane
dwa punkty A i B na powierzchni
Ziemi, umieszczone w pewnej odle-
głości od siebie. Chcemy rozwiązać
tu to samo zagadnienie, jak wtedy,
gdyśmy próbowali znaleźć odpowied-
nik linii prostej w czasoprzestrzeni.
Pytamy się więc, jak powinniśmy się poruszać od punktu A do punktu B, aby czas
wskazany przez poruszający się tak zegar był najdłuższy — przy założeniu, że na dany
sygnał startujemy z punktu A i przybywamy do punktu B jednocześnie z innym
sygnałem, nadanym w punkcie B, po upływie określonego odstępu czasu, np. 100 s
po pierwszym sygnale, mierzonego przez zegar w spoczynku. Czytelnik może nam na
to odpowiedzieć: „Stwierdzilibyśmy jednak wtedy, że należy poruszać się z wyłączonym
silnikiem wzdłuż linii prostej z tak dobraną stałą prędkością, aby pojawić się w punkcie B
dokładnie po upływie 100 s. Gdybyśmy bowiem nie poruszali się wzdłuż linii prostej,
musielibyśmy przyspieszać, co spowodowałoby zwolnienie rytmu naszego zegara.” Czy
jednak na pewno! Wynik taki otrzymaliśmy, nie biorąc pod uwagę zjawiska grawitacji.
Czy jednak nie byłoby lepiej wznieść sie trochę po linii krzywej, a następnie znowu się
opuścić? Czy nie moglibyśmy zyskać na tym, że na dużych wysokościach zegar nasz przy-
spiesza swój rytm? Okazuje się, że rzeczywiście jest to prawdą. Jeżeli rozwiąże się zagad-
nienie matematyczne, polegające na takim dobraniu toru ruchu zegara, aby wskazany przez
niego odstęp czasu był możliwie najdłuższy, okaże się, że torem tym jest parabola, a więc
ta sama krzywa, która jest swobodnym balistycznym torem obiektów poruszających się
w polu grawitacyjnym, czyli krzywa przedstawiona na rys. 42.19. Dlatego też prawu ruchu
w polu grawitacyjnym można także nadać następujące sformułowanie: Każde ciało tak. się
zawsze porusza, aby poruszający się z nim zegar wskazywał dla toru rzeczywistego dłuższy
czas niż wskazywałby on dla jakiegokolwiek innego możliwego toru — przy założeniu, oczy-
wiście, tych samych warunków na początku i na końcu takiego ruchu. Czas mierzony
przez poruszający się zegar jest często nazywany „czasem własnym”. Podczas swobodnego
spadku czas własny danego ciała przyjmuje wzdłuż rzeczywistego toru jego ruchu wartość
maksymalną.
Sprawdźmy, jak ta zasada działa. Za punkt wyjścia przyjmujemy równanie (42.5),
które stwierdza, że różnica rytmów pomiędzy poruszającym się i spoczywającym zegarem
jest równa
c2
(42.13)
42-8. RUCH W CZASOPRZESTRZENI ZAKRZYWIONEJ
427
Ponadto musimy uwzględnić, że podczas ruchu pojawia się poprawka o przeciwnym znaku,
która jest związana z prędkością ciała. Powoduje ona zmianę rytmu zegara określoną
wzorem
CO = COo^l— v2/c2.
Rozważana tu zasada jest prawdziwa dla każdej prędkości ciała. Dla uproszczenia bę-
dziemy tu jednak zakładali, że prędkość ciała jest dużo mniejsza niż prędkość światła c-
Wtedy powyższe równanie można zapisać w postaci
co = coo(l—v2/2c2)
i różnica rytmów naszego zegara w ruchu i w spoczynku jest równa
v2
-«0TT. (42.14)
Zc ‘
Uwzględniając obie poprawki, (42.13) i (42.14), widzimy, że
(42.15)
Jeśli więc spoczywający zegar wskaże odstęp czasu dt, to wskutek powyższej zmiany rytmu
poruszający się zegar zarejestruje czas równy
(42.16)
Całkowita różnica czasów, mierzona przez zegar w spoczynku i w ruchu, wzdłuż całego
toru, jest równa całce z powyższej poprawki względem czasu, czyli
(42.17)
przy czym całka ta dla toru rzeczywistego powinna przybierać wartość maksymalną.
Wyraz gH jest po prostu równy potencjałowi grawitacyjnemu cp. Otrzymaną całkę
możemy pomnożyć przez stały czynnik — mc2, gdzie m jest masą spoczynkową ciała.
Wtedy w wyniku takiego pomnożenia dostaniemy wyrażenie, które będzie miało takie
samo ekstremum, lecz z powodu pojawienia się znaku minus ekstremum to ulegnie zmianie
z maksimum na minimum. Równanie (42.17) można wtedy zastąpić warunkiem stwier-
dzającym, że podczas ruchu ciała
mu2
—mcp\ dt = minimum.
(42.18)
Wyrażenie podcałkowe jest tu po prostu różnicą energii kinetycznej i potencjalnej. Jak
czytelnik zapewne pamięta, w rozdz. 19 tomu II (cz. 1) poświęconym zasadzie najmniej-
szego działania, pokazaliśmy, że newtonowskie prawa ruchu ciała w dowolnym polu
potencjalnym można zapisać w postaci danej równaniem (42.18).
428
42. PRZESTRZENIE ZAKRZYWIONE
42-9. Einsteinowska teoria ciążenia
Einsteinowska postać równań ruchu — równoważna stwierdzeniu, że czas własny
w zakrzywionej przestrzeni powinien przyjmować wartość maksymalną — prowadzi
w przypadku małych prędkości do tych samych wyników co prawa Newtona. Tak więc
zegarek astronauty Gordona Coopera podczas jego ruchu wokół Ziemi spóźniał
się w porównaniu z tym, co by ten zegarek wskazywał, gdyby pojazd kosmiczny
Coopera poruszał się po jakimś innym, nierzeczywistym torze, jaki moglibyśmy sobie
wyobrazić*’.
Prawo ciążenia można więc sformułować za pomocą pojęć geometrii czasoprzestrzeni
w ten oto szczególny sposób: Czas własny poruszającej się cząstki — będący w czasoprze-
strzeni odpowiednikiem „najkrótszej drogi” — jest zawsze najdłuższy. Jest to prawo ruchu
w polu grawitacyjnym. W takim sformułowaniu prawo to nie zależy ani od układów współ-
rzędnych, ani też od innych sposobów opisu rozważanej sytuacji; i to jest największą za-
letą tego sformułowania.
Spróbujmy zreasumować nasze dotychczasowe rozważania. Poznaliśmy dwa prawa
teorii grawitacji:
1. W obecności materii zmienia się geometria czasoprzestrzeni i to tak, że krzywizna
czasoprzestrzeni wyrażona za pomocą nadwyżki promienia jest proporcjonalna do masy
zawartej we wnętrzu kuli o tym promieniu, co zostało wyrażone równaniem (42.3).
2. W przypadku, gdy siły grawitacyjne są jedynymi działającymi siłami, ciała się tak
poruszają, że czas własny pomiędzy dwoma ich ustalonymi punktami w czasoprzestrzeni
przyjmuje wartość maksymalną.
Powyższe dwa prawa są w ścisłej analogii z odpowiednimi parami praw, z którymi
spotykaliśmy się poprzednio. Pierwotnie ruch w polu grawitacyjnym opisywaliśmy za
pomocą newtonowskiego prawa powszechnego ciążenia oraz za pomocą newtonow-
skich praw ruchu. Prawa te zostały teraz zastąpione prawami 1 i 2. Ta nasza
nowa para praw wykazuje także pewne podobieństwo do tego, z czym spotkaliśmy
się w elektrodynamice. Podstawowe prawo było tam wyrażone za pomocą równań
Maxwella, które pozwalały określać wytwarzane przez ładunki pola elektromagnetyczne.
Prawo to mówiło jak zmienia się charakter „przestrzeni” na skutek obecności naładowanej
materii, a więc spełniało podobną rolę jak prawo 1 w przypadku teorii grawitacji. Ponadto
mieliśmy także prawo określające ruch cząstek w danym polu elektromagnetycznym:
d(rm)fdt = <?(E+vxB). Funkcję tę w przypadku teorii grawitacji przejmuje prawo 2.
Prawa 1 i 2 są ścisłym sformułowaniem einsteinowskiej teorii grawitacji, chociaż w li-
teraturze podaje się zwykle ich bardziej skomplikowaną matematyczną postać. Powin-
*’ Mówiąc ściśle, maksimum to ma tylko charakter lokalny. W bardziej poprawnym sformułowaniu
omawianej zasady powinniśmy uwzględnić, że czas własny przyjmuje dla ruchu po torze rzeczywistym
większą wartość niż dla dowolnego sąsiedniego toru. Tak więc czas własny dla ruchu po, na przykład, elip-
tycznej orbicie wokół Ziemi nie musi wcale być większy niż dla ruchu po torze balistycznym, jaki będzie
wykonywało ciało wystrzelone na niezbyt dużą wysokość nad powierzchnię Ziemi.
42-9. EINSTEINOWSKA TEORIA CIĄŻENIA
429
niśmy tu jeszcze zwrócić uwagę na pewien szczegół. W polu grawitacyjnym przy przecho-
dzeniu od miejsca do miejsca zmienia się nie tylko jednostka czasu, lecz także jednostka
długości. Pręty miernicze zmieniają swą długość na skutek ich położenia. Skoro czas i prze-
strzeń są tak nierozerwalnie związane, nie może absolutnie nic przytrafić się wielkościom
związanym z czasem, co nie miałoby jakiegoś wpływu na zachowanie się wielkości zwią-
zanych z przestrzenią. Weźmy taki oto najprostszy przykład: przypuśćmy, że ktoś oddala
się od Ziemi. Wtedy to, co będzie „czasem" z jego punktu widzenia, będzie odległością
przestrzenną z naszego punktu widzenia. Zmianie w czasie musi tu bowiem towarzyszyć
zmiana w przestrzeni. W teorii grawitacji jednak cała czasoprzestrzeń jest zniekształcona
na skutek obecności materii, jest to znacznie bardziej skomplikowaną rzeczą niż prosta
zmiana jednostek czasowych. Reguła, którą sformułowaliśmy za pomocą równania (42.3)
w zupełności jednak wystarcza do określenia wszystkich praw teorii grawitacji, o ile się
będzie rozumiało, że wypowiedzi tej reguły dotyczące krzywizny przestrzeni są słuszne
z punktu widzenia każdego obserwatora. Ktoś mijający na przykład bryłę materialną bę-
dzie za jej masę przyjmował liczbę różną od jej masy spoczynkowej, gdyż przy wyzna-
czaniu masy mijającej go bryły będzie musiał uwzględnić masę związaną z jej energią ki-
netyczną. Teorię należy tak sformułować, aby każdy obserwator — niezależnie od stanu
swego ruchu — stwierdzał, po skonstruowaniu w swoim układzie odniesienia powierzchni
kuli, że nadwyżka promienia tej kuli równa się iloczynowi czynnika G/3c2 i całkowitej
masy (lub, bardziej poprawnie, czynnika G/3c4 i całkowitej energii) zawartej we wnętrzu
tej kuli. Stwierdzenie, że to prawo — prawo 1 — jest spełnione w dowolnie poruszającym
się układzie odniesienia, jest jednym z najbardziej podstawowych praw teorii grawitacji,
zwanych einsteinowskimi równaniami pola. Następnym z kolei podstawowym prawem
jest prawo 2 — stwierdzające, że podczas ruchu ciał ich czas własny przyjmuje wartość
maksymalną — które jest nazywane einsteinowskim równaniem ruchu.
Napisanie tych praw w ich pełnej algebraicznej postaci, porównanie ich z prawami
Newtona lub powiązanie ich z prawami elektrodynamiki jest matematycznie trudnym
zadaniem. Z fizycznego jednak punktu widzenia prawa te stanowią najbardziej pełną,
współcześnie znaną wersję praw teorii grawitacji.
Chociaż w rozpatrywanym przez nas prostym przykładzie otrzymaliśmy na ich pod-
stawie wyniki zgodne z mechaniką Newtona, to na ogół jednak nie muszą one prowadzić
do takiej zgodności. Einstein na ich podstawie przewidział następujące trzy odstępstwa od
mechaniki newtonowskiej, które zostały potwierdzone na drodze doświadczalnej: orbita
Merkurego nie jest ustaloną w przestrzeni elipsą; światło gwiazd przechodzące w pobliżu
Słońca jest uginane dwukrotnie więcej, niż można by się tego spodziewać; rytm zega-
rów zależy od ich położenia w polu grawitacyjnym. Ilekroć dotychczas teoria Einsteina
przewidywała odstępstwa od mechaniki newtonowskiej, Przyroda zawsze przyznawała
rację Einsteinowi.
Zreasumujmy raz jeszcze wszystko to, cośmy w tym rozdziale powiedzieli. Po pierwsze,
zmiany w czasie i w przestrzeni zależą od przestrzennego położenia miejsca, w którym
są wyznaczone, oraz od czasu, w którym są mierzone. Zdanie to jest równoważne stwier-
dzeniu, że czasoprzestrzeń jest zakrzywiona. Mierząc pole A powierzchni kuli można
430 42. PRZESTRZENIE ZAKRZYWIONE
określić jej przewidywany promień, równy V AI4n, rzeczywiście jednak mierzony promień
będzie miał nadwyżkę ponad tę wartość, proporcjonalną (ze współczynnikiem proporcjo-
nalności równym G/3c2) do całkowitej masy zawartej wewnątrz tej kuli. Prawo to dokładnie
ustala stopień zakrzywienia czasoprzestrzeni. Tak wyznaczona krzywizna musi być zawsze
taka sama, niezależnie od obserwatora, który będzie ją wyznaczał i niezależnie od jego
stanu ruchu. Po drugie, cząstki poruszają się „po liniach prostych” (którym odpowiadają
tory o maksymalnym czasie własnym) w tej zakrzywionej czasoprzestrzeni. Taka jest
właśnie treść podanego przez Einsteina sformułowania praw teorii grawitacji.
Rozdział 22
zadania
22.1. Sieć w kształcie sześciennej ramki ma końcówki w każdym wierzchołku
i jednoomowy opór wzdłuż każdej krawędzi. Znajdź wypadkowy opór między wszyst-
kimi możliwymi kombinacjami końcówek.
22.2. a. Znajdź prąd I w podanym obok obwodzie.
b. Jaki jest prąd I, jeśli istnieje wzajemna indukcyjność
y/, która sprzęga obie występujące tu indukcyjności.
22.3. Na rysunku obok pokazano sieć skrzyżowaną do
układu hi-fi**. Efektywny opór każdego głośnika wynosi R.
a. Wykaż, że jeżeli R2 = L/2C, to oporność pozorna
na wejściu (oporność pozorna taka, jaką odczuwa gene-
rator) jest czysto oporowa i równa jest R.
b. Wykaż. że krzyżowa częstość dana jest wzorem
w2 = \)LC. Krzyżowa częstość a>c zdefiniowana jest jako
ta częstość, przy której każdy z głośników otrzymuje połowę
całkowitej mocy.
22.4. Wykaż, że w podanym obok obwodzie różnica
potencjałów (napięcie) między' punktami a i b ma ampli-
tudę niezależną od częstości w. Podaj wykres fazy tej róż-
nicy potencjałów jako funkcji w. Gdyby źródło miało opór
wewnętrzny R *10, jaki by to miało wpływ na amplitudę
napięcia między punktami a i b oraz na jego fazę?
duży gtosntk
do ruskich
torów
03
maty
gtosmk do .
wysokich tonów
*’ Układ elektroakustyczny o wysokiej czułości i wierności odtwarzania. Od słów high fidelity. (Przyp.
tłum.)
432
ZADANIA
Eocos a>t
VoCOSCi)t
22.5. Prosty równolegle łączony obwód pokazano na ry-
sunku obok.
a. Narysuj z grubsza wykres obrazujący amplitudę prądu
jako funkcję częstości dla wybranych wartości L, C i R.
b. Gdy R >ł-/Z,/C. porównaj częstość rezonansową i szerokość
krzywej rezonansowej dla tego obwodu z takimi samymi wiel-
kościami dla obwodu zawierającego te same elementy połączo-
ne szeregowo, w którym jednak R<źy'L/C. W szczególności
rozważ równoległy obwód z R — K^L/C i szeregowy obwód
z R = — Yl[Ć.
K
22.6. Przedstawiony obwód jest mostkiem używanym
do mierzenia indukcyjności. Generator ma zmienną siłę elek-
tromotoryczną o częstości a>. Gdy mostek jest w równowadze,
prąd w detektorze RD wynosi zero. Znajdź L i wyraź przez R i C.
22.7. Przedstawiony obwód jest mostkiem Weina, często
używanym w oscylatorach RC. Mówi się, że jest on w równo-
wadze, gdy przez detektor nie płynie prąd. Wykaż, że aby
zachodziła równowaga, muszą być spełnione równocześnie
oba następujące równania:
\r2 / \ ^2 / \C1 /
1
CO = —========-.
}/RlR2C1C2
22.8. Źródło napięcia K(t) = Po cos rot przyłożone jest
do obwodu pokazanego na rysunku obok.
a. Wykaż, że jeśli R, L i C dobrane są tak, że RC = L/R,
to prąd /jest niezależny od częstości.
b. Jaka jest różnica faz między przyłożonym napięciem a
spadkiem napięcia na parze kondensator-opomik (dla RC =
= L/R)?
22.9. Obwód zmontowany jest tak, że pokazane na rysun-
ku połączenie w punkcie P3 może być zrobione w każdym
z punktów P0,Pi,P2, ...,Pn.
a. Znajdź wyrażenie na średnią moc rozpraszaną w opor-
niku R, jeżeli połączenie zrobiono w punkcie Pm, gdzie
0 < m < n.
b. Gdy R = 1000 Q, L = 10 henrów, C = 20 p.F <u =
= 100 rad/s,
ZADANIA DO ROZDZIAŁU 22
433
i) Dla jakiej wartości m moc osiąga maksimum?
ii) Jaki jest maksymalny spadek napięcia między punktami i P3, gdy m =
= 2 i Ko = 100 N, jaki zaś na oporniku R1
Rozdział 23
23.1. Znajdź przybliżoną wartość częstości rezonansowej pokazanego poniżej rezo-
natora. Załóż, że d<^a, d <^(b—a). Jakie najważniejsze efekty nie są uwzględnione
przez takie założenia?
Gdy rezonator jest chłodzony równomiernie (tzn. tak, że
cały rezonator ma tę samą temperaturę), czy skurczenie
termiczne prowadzi do wzrostu częstości rezonansowej,
jej zmniejszenia, czy też nie powoduje żadnych jej
zmian.
Rozdział 24
24.1. Linia przesyłowa ma indukcyjność na jednostkę długości Lo i pojemność na
jednostkę długości Co. Wykaż, że jeśli napięcie i prąd zmieniają się powoli (co odpowiada
przesyłaniu sygnałów o długości fali dużej w porównaniu z odstępem między liniami),
to podstawowymi równaniami są:
dV _ dl
dx ’
dl dV
, dx dt
Wykaż, że wynika stąd, iż zarówno I, jak i V spełniają równanie falowe
d2I _ 1 d2I d2V __ 1 d2V
dx2 v2 dt2 ’ dx2 v2 dt2 *
. . ,1
gdzie v2 =-------.
Lo Co
Chcielibyśmy zwrócić uwagę, że założenie dotyczące wolno zmiennych sygnałów nie jest
konieczne, ale dowód tego wykracza poza zakres wiadomości podanych w tym rozdziale.
24.2. Charakterystyczna oporność pozorna linii przesyłowej Zo = ^LojCo, gdzie Lo
jest indukcyjnością na jednostkę długości, a Cq jest pojemnością na jednostkę długości.
Wykaż, że dla linii przesyłowej składającej się z dwóch cienkich pasków o szerokości b,
oddalonych o a (a b)
1 a
Z° ~ e0C ~b'
28 — Wykłady z fizyki
434
ZADANIA
24.3. Przez przystawienie przewodzących płyt do końców kawałka cylindrycznego
współosiowego przewodu o długości l utworzono rezonator.
a. Znajdź częstość najniższych drgań, przy których pole elektryczne pozostaje zawsze
radialne.
b. Podaj wyrażenie na pole E.
c. Porównaj częstość rezonansową z częstością o>0 = l/^LC, gdzie L i C są indukcyj-
nością i pojemnością współosiowego przewodu o długości l.
24.4. Prostopadłościenny falowód zbudowany z doskonałego przewodnika ma krawę-
dzie o długości a i b, tak jak pokazano na rysunku. Końce jego fragmentu o długości l
przykryto płytami z przewodzącego materiału i falowód stał się w efekcie rezonatorem.
Jeśli pole elektryczne dane jest przez część rzeczywistą wy-
rażenia
E(x, y, z, t) = E0(x, z) eim'ey,
to jaka będzie amplituda E0(x, z) dla drgań rezonatora o naj-
niższej częstości rezonansowej? Czemu przy tym będzie
się równała najniższa rezonansowa częstość rezonatora?
24.5. Współosiowy kabel złożony jest z dwóch koncentrycznych przewodzących wal-
ców. Jeden koniec (x = 0) podłączony jest do generatora napięcia, który wytwarza na-
pięcie
V(t) — Kocosw/.
Drugi koniec kabla (x = l) przykryty jest przewodzącą płytą. Indukcyjność na jednostkę
długości wynosi Lo, a pojemność Co.
a. Naszkicuj napięcie między przewodnikami jako funkcję odległości x, gdy długość
kabla wynosi 5nc/2a>, gdzie c jest prędkością światła. Wyznacz wartość x, przy której
napięcie jest maksymalne.
b. Wypisz wyrażenie na fale: postępującą do przodu i odbitą, które wytwarzają napię-
cie między przewodnikami.
c. Jaki jest prąd w punktach o współrzędnej x = 0, x = 1/2 = |(57tc/2a>) i x = l —
= 5nc/2ft>?
d. Jeśli źródło napięcia jest idealnym generatorem, którego wirnik obraca się z pręd-
kością kątową w, jaki musi być średni moment siły przyłożony do generatora?
24.6. Wykaż, że jeśli linia przesyłowa jest zakończona w punkcie o współrzędnej x = l
opornością pozorną ZT, to oporność pozorna „przesyłającego końca” (x = 0) dana jest
wzorem:
tgwFLC l—iZTIZ0
Zs = iZ0 ,
1 + iZT/Z0 tg w F LC l
gdzie Zo = L/C jest charakterystyczną opornością pozorną
linii. Czemu będzie się równało Zs, jeśli
a. ZT = 0, b. ZT = oo, c. ZT = Z01 |.
ZADANIA DO ROZDZIAŁU 24
435
24.7. Linia przesyłowa o charakterystycznej oporności pozornej Zx przyłączona jest
do linii przesyłowej o charakterystycznej oporności pozornej Z2. Wykaż, że jeśli układ
zasilany jest przez generator podłączony do pierwszej linii (ZJ, to „współczynnik odbicia”
określony jako iloraz Voib[ Lprzj,, jest równy
^odb _ Zj
^przyl Z2 + Z1
podczas gdy „współczynnik przejścia” dany jest wyrażeniem
^przęśl _ 2Z2
Pprzyl Z1+Z2
24.8. W pewnej stacji radarowej klatka elektroniczna oddzielona jest od podstawy
odbiorczej o długości 3048,0 cm falowodem, którego długość jest równa 1219,20 cm,
a wewnętrzne wymiary wynoszą 14,60 cmx29,21 cm. Porównaj prędkość sygnału z pręd-
kością w przestrzeni swobodnej, gdy częstość fali nośnej wynosi 960 MHz.
24.9. Pole elektryczne wewnątrz falowodu opisanego w rozdz. 24 ma tę własność, że
składowa pola elektrycznego w kierunku propagacji równa jest zeru, czyli pole elektryczne
jest transwersalne. (Typy fali, takie jak te, nazywane są przeto TE lub falami elektrycznie
transwersalnymi). Istnieją również fale zwane TM, w których w kierunku propagacji nie
ma pola magnetycznego. Dla prostokątnego falowodu przedstawionego na rys. 24.3
i 24.4 (str. 64 i 65) potencjał wektorowy fali typu TM dany jest wzorem:
mitx ntty
A = e.sin------sin-----exp[i(wt—k.z)},
a b
gdzie
a. Przekonaj się, że pole magnetyczne, obliczone z tych wzorów, jest rzeczywiście
transwersalne i wykaż, że pola E i B spełniają równanie falowe i właściwe warunki brze-
gowe.
Wskazówka: Żądamy, żeby
SA
E = -V9>-—, B = VXA,
gdzie
b. Wykaż, że drgania scharakteryzowane liczbami n i m, nie będą się propagowały,
jeśli
, /lmn\2 Znit\2
" < CV (v) +rr) •
436
ZADANIA
przed
(zderzeniem)
e
7i
PO
Rozdział 25
W zadaniach tego rozdziału jednostki są tak dobrane, że c = I.
25.1. Zapisz poniższe wyrażenia za pomocą cztero wektorów:
(<p2-A2),
(Aj-Q<p).
Ą 25,2. W zjawisku Comptona spoczywający elektron ude-
rzany jest przez foton, w wyniku czego pęd każdej z tych
cząstek zmienia się. Znajdź energię emitowanego fotonu
i wyraź ją przez energię początkową i kąt odchylenia od
jego toru początkowego.
25.3. Pozytron można utworzyć bombardując spoczywający elektron fotonem.
y+e~ -> e~+e++e~.
Jaka jest minimalna energia fotonu? Używaj wszędzie, gdzie można, czterowektorów
i niezmienników, jakie one tworzą.
25.4. Para elektron-pozytron może być wytworzona przy pomocy fotonu (y) w wyniku
reakcji:
y+e-->er+(e++er).
Niemożliwa do zrealizowania jest natomiast reakcja
y->e++e~
z jednym izolowanym fotonem, nawet jeśli energia fotonu jest większa niż dwie masy
spoczynkowe elektronu i mimo że ładunek jest zachowany. Wykaż, że jest to prawda,
posługując się czterowektorami.
25.5. Cząstka o masie m w spoczynku uderzona została przez inną cząstkę o masie M
i o pędzie P. Po całkowicie niesprężystym zderzeniu cząstki te się połączyły tworząc po-
jedynczą nową cząstkę. Jaka jest jej masa i prędkość ?
Porównaj swoje wyniki z wartościami, które otrzymałoby się z obliczeń nierelatywi-
stycznych.
Rozdział 26
W zadaniach tego rozdziału jednostki dobrane są tak, Że c = 1.
26.1. Rozpisz na składowe i oblicz
a
V F .
ZADANIA DO ROZDZIAŁU 26
437
26.2. Znajdź czterowektor, którego przestrzenną częścią jest wektor
(>E+jxB.
Jakie jest fizyczne znaczenie zarówno czasowej, jak i przestrzennej składowej tegocztcro
wektora?
26.3. Wykaż, że wyrażenia E2—B2 i (E-B) są niezmiennikami względem przekształceń
Lorentza. Zauważ, że jeśli wektory E i B tworzą kąt ostry w jednym układzie, to dzieje się
tak we wszystkich układach. W jakim ważnym zjawisku fizycznym oba te niezmienniki
równają się zeru?
26.4. Niech E i B będą polami elektrycznym i magnetycznym w pewnym punkcie
przestrzeni w danym układzie odniesienia. Określ prędkość innego układu, w któryir
pola elektryczne i magnetyczne będą równoległe. Istnieje wiele układów, które mają t^
własność; jeśli znaleźlibyśmy jeden z nich, wtedy tę samą własność miałby każdy ukłac
poruszający się względem tego pierwszego z prędkością równoległą do wspólnego kie
runku E' i B'. Mamy swobodę wyboru, wystarczy więc i wygodnie jest znaleźć układ
którego prędkość jest prostopadła do obu pól.
Odpowiedź:
v ExB
1 +v2 = E24-B2 ’
26.5. Omówione w rozdz. 26 pola pochodzące od naładowanych cząstek poruszają
cych się z jednostajną prędkością otrzymano przez przekształcenie potencjału nierucho
mego ładunku do poruszającego się układu odniesienia. Pola E i B zostały następnie otrzy
manę z potencjału A? w standardowy sposób.
Obecnie znajdź te pola biorąc za punkt wyjścia wyrażenia na pola nieruchomegi
ładunku i stosując prawa transformacyjne dla pól.
26.6. Wykaż, że pola elektryczne i magnetyczne pochodzące od ładunku poruszającegi
się z jednostajną prędkością v mogą być przedstawione w postaci
qt 1—u2
£ __ _2____________________
47teor3 (1 — i?sin20)3/2 ’
q vxr l—v2
D __ ?________________________
47te0 r3 (1—u2sin20)3/2 ’
gdzie r jest promieniem wodzącym od chwilowego położenia cząstki do obserwator;
a 0 jest kątem między wektorami r i v. .
26.7. Bardzo długi prosty drut przewodzi prąd I wytworzony przez elektrony porusz;
jące się z prędkością v. Istnienie w drucie stacjonarnych dodatnich jonów powoduje. ;
globalna gęstość ładunku równa jest zeru.
a. Znajdź pola na zewnątrz drutu w układzie nieruchomym Względem drutu.
b. Przekształć te pola do układu poruszającego się razem z elektronami. [W rozdziale :
438
ZADANIA
(t. II, cz. 1) pole elektryczne obserwowane z takiego poruszającego się układu zostało obli-
czone inną metodą; por. równanie (13.28).]
26.8. Dwa elektrony o jednakowych prędkościach v poruszają się obok siebie, odda-
lone od siebie o a. W środku między nimi znajduje się nieskończona warstwa stałego do-
datniego ładunku o powierzchniowej gęstości ładunku <r.
a. Jak duża musi być gęstość a, aby elektrony zacho-
~ wały odległość a?
----------b. Porównaj potrzebną gęstość ładunku w przypad-
ku, gdy elektrony mają energię 500 MeV z gęstością po-
ę »--------_______k. trzebną w przypadku, gdy poruszają się one z bardzo małą
prędkością.
26.9. Wykaż, że jeżeli jest czterowektorem siły działającej na cząstkę, a jest
czterowektorem jej prędkości, to
= 0.
26.10. Cząstka o ładunku q porusza się w płaszczyźnie xy ze stałą szybkością v wzdłuż
toru przedstawionego na rysunku linią przerywaną. (Cząstka rozprasza się w początku
układu.) Szybkość jej przez cały czas pozostaje stała. W chwi-
x y 1 p li t = Zi cząstka znajduje się w punkcie o współrzędnych
\ • x = a, y = 0.
45.^ a. Punkt P ma współrzędne x = y = a. Znajdź pole
elektryczne w punkcie P w chwili Ą, jeśli v/'c = 0,5 (c jest
prędkością światła).
b. Jak zmieni się wynik, jeżeli w części a. zadania tor cząstki przed rozproszeniem będzie
biegł w dół osi y?
Rozdział 27
27.1. Stosując metody użyte do wyprowadzenia wzoru (27.11) znajdź równoważne
wyrażenia dla
Vx(AxB),
V(A-B).
27.2. Ile megaton energii zawarte jest na zewnątrz Ziemi w jej polu magnetycznym?
Załóż, że pole ziemskie jest polem dipola o natężeniu $ Gs przy równiku. Jedna megatona
równoważna jest energii wyzwolonej przy wybuchu jednego miliona ton trotylu czyli
4,2 1015J.
W świetle swojego wyniku zastanów się, na ile, twoim zdaniem, eksplozja jednej
megafonowej bomby wodorowej wysoko w atmosferze zaburzyłaby ziemskie pole
magnetyczne.
27.3. Dany jest długi prosty drut o oporze R na jednostkę długości. Oblicz strumień S
przy powierzchni tego drutu, gdy płynie w nim prąd I. Porównaj ten wynik z wyzwalają-
cym się ciepłem, obliczonym przy użyciu prawa Ohma.
ZADANIA DO ROZDZIAŁU 27
<łjy
27.4. Długi współosiowy kabel sporządzono z dwóch doskonale przewodzących współ-
osiowych walców. Jeden koniec kabla podłączono do baterii, której napięcie na wyjściu
jest V, drugi zaś koniec połączono z oporem R tak, że płynie prąd I = VjR. Oblicz posłu-
gując się wektorem Poyntinga szybkość przepływu energii.
27.5. Średnia moc promieniowana przez stację nadawczą wynosi 10 kW.
a. Jaka jest wielkość wektora Poyntinga w punktach przy powierzchni Ziemi odległych
od siebie o 10 km? W tej odległości falę można uważać za płaską. Rozsądnie jest założyć,
że moc jest promieniowana przez ćwierćfalową (|A) antenę ponad doskonale przewodzącą
powierzchnią.
b. Znajdź maksymalne natężenia pola elektrycznego i magnetycznego.
27.6. Pola najniższych drgań typu TE prostokątnego falowodu przedstawionego na
rys. 24.6 (str. 66) dane są przez wyrażenia:
E = erEosin — cosfcot—k2z), j
a
kz k ttx
B = — exE0 — sin— cos(wt—kzz)—e.E0— cos — sin (oj/ —kzz).
a> a <»a a
a. Wykaż, że podane powyżej rozwiązania spełniają warunki brzegowe dla tego za-
gadnienia.
b. Oblicz wektor Poyntinga S i gęstość energii U.
c. Oblicz średnią prędkość przepływu energii przez dowolną płaszczyznę prostopadłą
do osi z.
d. Oblicz średnią gęstość energii w falowodzie.
e. Użyj wyników otrzymanych w części c i d zadania do obliczenia średniej prędkości,
z jaką propaguje się energia. Pokaż, że jest ona taka sama, jak prędkość grupowa okre-
ślona wzorem (24.27) ze str. 69.
27.7. a. Znajdź szybkość przepływu energii przez jednostkę powierzchni z oscylują-
cego dipola o momencie dipolowym pcosoit.
Wskazówka: Weź pod uwagę wyrazy promieniste (tj. te, które maleją jak 1/r).
b. Całkując po powierzchni dużej kuli, której środkiem jest dipol, wykaż że średnia
moc promieniowana wynosi
1 p2 <u4 1
3 47teoc2 c
27.8. Płaska fala świetlna pada na swobodny elektron. Elektron oscyluje pod wpływem
pola E. Oblicz stosunek energii promieniowanej przez elektron na jednostkę czasu do
energii świetlnej padającej na jednostkę powierzchni w jednostce czasu. Załóż, że fala
świetlna ma niską częstość i pomiń wpływ pola B fali na elektron.
27.9. Na cząstkę pyłu w Układzie Słonecznym działają dwie siły: siła grawitacyjni
Słońca i planet i promienista siła światła skierowana od Słońca. Ze względu na to, że siła
grawitacyjna jest proporcjonalna do objętości cząstki, a siła promienista jest proporcjo-
44U
ZADANIA
nalna do powierzchni jej przekroju poprzecznego, znajdą się cząstki o takich wymiarach,
dla których te dwie siły będą się równoważyć. Przyjmując, że cząstka pyłu jest kulista i że
absorbuje ona całe padające na nią promieniowanie, znajdź taki promień cząstki przy
którym obie siły się równoważą.
Wytłumaczenie tego, że ogon komety zwrócony jest od Słońca, opiera się na omówio-
nym powyżej zjawisku, przy założeniu, że ogon składa się z małych cząstek, może nawet
i molekuł gazu. Czy jest to sensowna teoria?
Energia promieniowana przez Słońce wynosi 4-1026 W, a jego masa jest równa
ł-1030kg.
27.10. Totus o powietrznym rdzeniu, średnim promieniu R i powierzchni przekroju w2,
iwinięty jest N zwojami drutu (r << R). Prąd o zależności czasowej danej wzorem I(t) =
= Kt włączony jest w chwili t = 0.
a. Znajdź bezpośrednio z wyrażenia na pole magnetyczne energię nagromadzoną
v polu magnetycznym w chwili t.
b. Znajdź kierunek i długość wektora Poyntinga w wewnętrznym punkcie torusa
/ chwili t.
c. Posługując się wektorem Poyntinga znajdź szybkość zmiany energii pola wewnątrz
orusa w czasie t. Sprawdź swój wynik porównując z wynikiem otrzymanym w części a za-
ania.
ozdział 28
28.1. Oblicz promień elektronu zakładając, że jego masa spoczynkowa utożsamiona
st z energią elektrostatyczną jego ładunku i że ładunek rozmieszczony jest równomiernie
r objętości kuli. Porównaj wynik z wartością daną wzorem (28.2) ze str. 133.
28.2. Dobrze wiadomo, że elektron poza ładunkiem i masą ma moment pędu (spin)
moment magnetyczny, przy czym stosunek tych wielkości jest równy
i moment pędu m
'' ' * ' moment magnetyczny q
yrażenie to jest poprawne z dokładnością do około 0,1 °/0. Przyjmijmy, że masa dana jest
torem (28.4).
a. Niech będzie dana równomiernie naładowana powłoka o ładunku q i o promieniu a,
której środku umieszczony jest dipol magnetyczny o momencie /i. Wykaż, że moment
du pola elektromagnetycznego jest równy
L = — qf* 1
3 47teoc2 a
b. Znajdź stosunek momentu pędu do momentu magnetycznego i porównaj z pny-
;zoną powyżej wartością (rn)q).
ZADANIA DO ROZDZIAŁU 28
441
c. Jeśli moment magnetyczny elektronu dany jest jako oblicz maksymalną pręd-
kość przy powierzchni wirującego elektronu, która powoduje powstanie takiego momentu
magnetycznego. Jaki komentarz uznałbyś za właściwy. Wielkość 4Keoc7i/g2 = 1/a ma
wartość 137.
Rozdział 29 >
29.1. Naładowana cząstka (o ładunku q i o masie spoczynkowej m0) znajdowała się
początkowo w spoczynku w początku układu. Działa na nią stałe pole elektryczne w kie-
runku osi x.
a. Oblicz prędkość i położenie jako funkcję czasu (relatywistycznie).
b. Jak zmieni się Twój wynik, jeśli cząstka miała początkową prędkość v0 w kierunku
osi y?
29.2. W protonowym cyklotronie protony biegną po kołowych torach w jednorodnym
polu magnetycznym. Znajdź „częstość cyklotronową”, czyli prędkość kątową, jako funk-
cję q, B, m przy niskich energiach. Jak zmienia się częstość przy wzroście energii. Przy ja-
kiej energii częstość zmieni się o 1%.
29.3. W chwili t = 0 cząstka o masie m i o ładunku q znajdowała się w początku układu
współrzędnych w spoczynku. Na cząstkę działa jednorodne pole E w kierunku osi y i jedno-
rodne pole B w kierunku osi z.
a. Znajdź ruch cząstki, x(l),y(l), z(l), zakładając, że jest on nierelatywistyczny. Jakie
ograniczenia założenie to nakłada na pola E i B?
b. Czy możesz w sposób jakościowy wskazać, jaki byłby ruch relatywistyczny? Co się
dzieje, gdy E/B > c?
c. Jeśli jedną płytę umieścimy w płaszczyźnie xz(y = 0), a drugą równoległą w płasz-
czyźnie o równaniu y = d o potencjale Ko = Ed względem pierwszej płyty i przyłożymy
pole magnetyczne równoległe do płyt, otrzymamy to, co nosi nazwę magnetronu. Gdy
elektrony emitowane są z ujemnej katody głównie w spoczynku, jak silne musi być pole
magnetyczne, żeby elektrony nie mogły osiągnąć dodatniej anody?
29.4. Zasadę ogniskowania przez zmienny gradient można zilustrować na przykładzie
z optyki, przedstawionym na rysunku obok. Mimo że obie soczewki mają tu takie same
ogniskowe, ich kombinacja może w pewnych warunkach
działać skupiająco.
a. Wyznacz dla równoległych promieni padającego
światła odległość l jako funkcję d.
b. W jakich warunkach otrzymany obraz jest rzeczy- f -f
wisty, a w jakich pozorny?
Rozdział 32
32.1. Wykaż, że w substancjach niepolarnych kwadrat współczynnika załamania przy
niskich częstościach równy jest stałej dielektrycznej. 1
442
ZADANIA
32.2. Dla częstości około 6MHz jonosfera staje się przezroczyste. Oszacuj gęstość
elektronów w jonosferze stosując model elektronów swobodnych.
32.3. Pole elektryczne przyłożone do metalu utrzymywane jest jako stałe przez dłuższy
czas, po czym nagle zostaje wyłączone. Stosując model elektronowego gazu w metalu
wykaż, że czas relaksacji (tj. czas potrzebny na to, by prędkość unoszenia zmalała do 1/e
swojej początkowej wartości) równy jest 2 t, dwukrotnemu odstępowi czasu między zde-
rzeniami.
32.4. W metalu istnieją rozwiązania równań Maxwella w postaci fali płaskiej:
Ex = Eoe'(m,~kz),
gdzie k jest liczbą zespoloną. Dla niskich częstości
k = (l-i)l/
... u ,f . , 2e°c
a. Wypisz wyrażenie na pole magnetyczne związane z taką falą.
b. Ile wynosi kąt między wektorami E i B?
c. Ile wynosi stosunek szczytowej wartości pola B do szczytowej wartości pola E przy
dowolnym z?
d. Jaka jest różnica faz między polami E i B? [Gdy maksimum pola E występuje
w czasie t2, a maksimum pola B występuje w czasie t2, różnica faz zdefiniowana jest jako
G)-]
32.5. Równanie (32.50) sugeruje, że w metalu występuje całkiem wyraźne obcięcie
nadfioletu (obcięcie to jest określone przez wartość co, przy której współczynnik n zmienia
się z rzeczywistego w urojony). Doświadczenie tymczasem wykazuje, że obcięcie to nie
jest określone wyraźnie. Stosując lepsze przybliżenie dla n2 wykaż, że doświadczalny wynik
jest w istocie zgodny z teorią.
Rozdział 33
33.1. a. Wyznacz współczynnik przejścia dla płaskiej fali elektromagnetycznej prze-
chodzącej przez trzy ośrodki dielektryczne tak, jak pokazano na rysunku poniżej.
b. Wykaż, że jeżeli n2 = i l = ź2/4, stosunek
przejścia równy jest jedności. (Jest to powód, dla którego
w dobrych aparatach fotograficznych i lornetkach soczew-
ki pokrywa się warstwami przeciwodblaskowymi.)
c. Jaka jest grubość l warstwy przeciwodblaskowej
w lornetkach przeznaczonych do użytku w zwykłym bia-
łym świetle?
d. Gdy możliwe jest pokrycie tylko jednej strony soczewki, czy ważne jest, która strona
zostanie pokryta? Dlaczego?
ZADANIA DO ROZDZIAŁU 33
443
33»2. Promień światła o długości fali 4500 A (w próżni) pada na pryzmat tak, jak
pokazano na rysunku poniżej, i ulega całkowitemu odbiciu pod kątem 90°. Współczynnik
załamania pryzmatu wynosi 1,6. Oblicz odległość od dłu- k
giego boku pryzmatu, na której natężenie pola elektry- 45K
cznego spada do 1/e wartości przy samej powierzchni. r , X.
Załóż, że światło jest spolaryzowane, a pole E jest prosto- n=l,6 X.
padłe do płaszczyzny padania. Czy wynik zmieni się, jeśli
wektor E leży w płaszczyźnie padania? '
Rozdział 34 ,
34.1. Naładowana cząstka porusza się w płaszczyźnie prostopadłej do jednorodnego
pola magnetycznego B. Pokaż, że jeżeli pole B zmienia się powoli w czasie, to moment
magnetyczny wytworzony przez ruch orbitalny pozostaje stały. Co rozumiemy tu przez
słowo powoli? «
Rozdział 35
35.1. W cyklotronie niskich energii protony obiegają pełną kołową orbitę w czasie T
równym około 0,13 p.s. Doświadczenia nad protonowym jądrowym rezonansem magnetycz-
nym przy użyciu protonów w tym samym polu magnetycznym wskazują na istnienie re-
zonansu przy 21 MHz. Na podstawie tych danych znajdź czynnik g protonu.
35.2. Wyprowadź wzór (35.9) w sposób sugerowany w rozdz. 35. Czy możesz pogodzić
to wyprowadzenie z podanym w rozdz. 34 dowodem, że paramagnetyzm nie mógłby istnieć,
jeśli oprzeć się na teorii czysto klasycznej?
35.3. Sól paramagnetyczna zawiera 1022 jonów w centymetrze sześciennym. Moment
magnetyczny każdego jonu jest równy 1 magnetonowi Bohra. Sól ta została umieszczona
w polu jednorodnej indukcji magnetycznej B o natężeniu 10 000 Gs (1 Wb/m2).
Oblicz procent nadwyżki równoległych spinów zarówno w temperaturze pokojowej,
jak i w temperaturze ciekłego helu.
35.4. Wyprowadź wzór na kwantowomechaniczny paramagnetyzm cząstek o spinie 1,
naśladując wyprowadzenie z rozdz. 35 dla spinu
Rozdział 36
36.1. Równomiernie namagnesowana kula ma całkowity moment magnetyczny równj
-i 7t(a)3Af, gdzie u jest jej promieniem, a M— namagnesowaniem. Oblicz równoważny prąd
powierzchniowy, który powodowałby na zewnątrz kuh takie same skutki, jak namagneso-
wana kula.
Pokaż, że ten rozkład prądu ma taki sam globalny moment magnetyczny.
444
ZADANIA
36.2. Magnetyczna rama żelazna przedstawiona na rysunku lewym jest owinięta 2150
zwojami drutu, przez który płynie prąd o natężeniu 5 A. Rama ma jednostajną szerokość
28 cm w kierunku prostopa-
dłym do płaszczyzny rysunku,
a żelazo, z którego jest spo-
• rządzona, charakteryzuje się
- krzywą zależności B od H
pokazaną na wykresie (rysu-
nek prawy). Przeprowadź
oszacowanie, jak wielkie po-
le magnetyczne otrzymamy
w szparze powietrznej. Jakie są główne pominięte przez Ciebie efekty?
~2 (Wb/m2)
p
powierzchnia przekroju mer -
nesu trwałego wynosi lOOcm2
zelazo
miękkie
Wskazówka: Ze względu na to, że zależność B-H jest empiryczna i nieliniowa, nie bądź
zdziwiony, że problemu nie będzie można rozwiązać analitycznie ani ściśle.
36.3. Strumień magnetyczny wytworzony jest w szczelinie powietrznej przy użyciu
sztabki magnesu trwałego i kawałków pręta z miękkiego żelaza. Dane charakteryzujące
magnes i rozmiary urządzenia
zostały podane na rysunku
lewym. Materiał, z którego
jest sporządzony magnes, na-
magnesowano do punktu P
(rysunek prawy) przepuszcza-
jąc prąd o dużym natężeniu
przez uzwojenia cewki. Zakła-
dając, że miękkie żelazo ma
nieskończoną przenikalność
magnetyczną i pomijając rozproszenie strumienia na krawędziach, znajdź gęstość stru-
mienia w szczelinie po wyłączeniu prądu.
36.4. Bardzo długi cylindryczny pręt żelazny namagnesowany jest trwale z jednorodnym
namagnesowaniem M, które skierowane jest wzdłuż osi pręta. Pomijając wszelkie efekty
związane z końcami, znajdź pola B i H w żelazie.
Jeśli wydrąży się wzdłuż osi długi otwór w kształcie igły, jakie będzie pole B w środku
tego otworu?
+0,1
H
,,u (Wb/m2)
Rozdział 38
38.1. W badaniach przestrzeni kosmicznej w wielu przypadkach ważne jest, żeby
używać materiałów o maksymalnym stosunku wytrzymałości do ciężaru.
a. Porównaj promienie masowej aluminiowej podpory o kołowym przekroju i stalowej
podpory o tej samej sztywności i tej samej długości L. (Sztywność zdefiniowana jest jako
stosunek przyłożonej poprzecznej siły do wywołanego odkształcenia.)
b. Jak duże w stosunku do siebie są masy tych podpór?
ZADANIA DO ROZDZIAŁU 38
445
38.2. Aluminiowa belka o długości L i o kwadrato-
wym przekroju ma jeden koniec sztywno umocowany, jak
pokazano na rysunku obok. Do swobodnego końca belki
przymocowana jest masa m.
Znajdź naturalną częstość drgań tego układu. Załóż, że belka ma kwadratowy prze-
krój poprzeczny o boku a, że masa belki jest dużo mniejsza od m oraz że masa m może
być uważana za masę punktową.
38.3. W rozdziale 47 tomu I (cz. 2) prędkość głosu w cieczy wyrażona została przez
szybkość zmiany ciśnienia ze zmianą gęstości. Wykaż, że dla podłużnych fal w ciele sta-
łym (płaskie fale zgęszczeń) prędkość fazowa dana jest wyrażeniem
y2 _ (i-g)y
podl (1-2n)(l+n)e ’
(Prędkość ta odnosi się do podłużnych fal w „nieskończonym” ośrodku. W tym przypadku
ruch każdej cząstki jest zawsze równoległy do kierunku fali; gdy ośrodek jest ściśnięty
przez falę, nie występują żadne ruchy boczne, takie jakie zdarzają się na przykład w pręcie,
który gdy jest ściśnięty, staje się grubszy.) Jak wielkie, według Ciebie, muszą być wymiary
bloku, żeby ten wzór miał zastosowanie.
38.4. Stalowa linijka o długości 30,48 cm o szerokości
1,27 cm i o grubości 0,08 cm została zaklinowana między
dwoma blokami ustawionymi na stole w odległości 29,21 cm
od siebie tak, jak pokazano na rysunku obok.
a. W jakiego rodzaju krzywą wygnie się ta linijka?
b. Znajdź siłę działającą na bloki.
38.5. Wyznacz obciążenie krytyczne (przy wyboczeniu)
dla belki o długości L o umocowanym jednym końcu
i swobodnym drugim tak, jak pokazano na rysunku obok.
Belka ma prostokątny przekrój poprzeczny o grubości t
i o szerokości w.
r-----29.2cm—*f
Rozdział 40
40.1. a. Udowodnij, dla własnego zadowolenia, twierdzenie sformułowane w rozdz. 40,
że jeśli w cieczy nie może istnieć napięcie ścinające, to ciśnienie jest we wszystkich kierun-
kach takie samo.
b. Jako ćwiczenie matematyczne wyprowadź całkiem pożyteczną wektorową toż-
samość stosowaną w rozdz. 40:
(vV)v = |V(w)+(S2 x v),
446
ZADANIA
gdzie *«
S2 = (V x v). •
40.2. Ciecz w naczyniu o kształcie walca o kołowym przekroju poprzecznym wiruje
wokół osi ze stałą prędkością kątową o. Znajdź kształt powierzchni swobodnej cieczy,
gdy cząstka w odległości r od osi wiruje z prędkością v — a>r.
Wykaż, jak wskazano w rozdz. 40, że krążenie na jednostkę powierzchni, czyli rotv,
jest równe podwojonej prędkości kątowej, z jaką ciecz wiruje.
40.3. Kula o promieniu a i o masie m porusza się w „suchej” wodzie ze stałą pręd-
kością v. Wykaż, że całkowita łączna energia kinetyczna kuli i cieczy jest równa
gdzie M jest masą cieczy wypartej przez kulę. Jaki jest całkowity łączny pęd kuli i cieczy?
na rysunku poniżej.
Rozdział 41
41.1. Kula o promieniu a jest ciągnięta ze stałą prędkością v w lepkiej cieczy na tyle
powoli, że przepływ jest laminarny; przyłożona siła jest miarą siły lepkości, z jaką ciecz
działa na kulę. Mimo że jesteś w stanie obliczyć ściśle tę siłę, postaraj się znaleźć postać
tej siły z analizy wymiarowej po spostrzeżeniu, od jakich parametrów powinna ona zależeć.
Zrób to. Czy możesz znaleźć jakościowe argumenty fizyczne, dlaczego parametry te wcho-
dzą do wzoru w ten właśnie sposób?
41.2. Gdy lepka ciecz płynie w małej rurce, przepływ można uważać za laminar-
ny, tzn. warstwy cieczy w cylindrycznej rurze przepływają jedna koło drugiej. Dla rury
o promieniu a profil prędkości w poprzek rury wygląda z grubsza tak, jak pokazano
Wykaż, że jeśli r jest odległością w kierunku radialnym
od środka rury, jeśli r] jest lepkością cieczy i jeśli istnieje
spadek ciśnienia (Pt— PiUL na jednostkę długości rury, to
prędkość dana jest wzorem:
t>(r) = — -— -------(a2-r2).
4ij L
Analogicznie jak w prawie Ohma, prędkość wypływu cieczy Q z takiej rury wiąże się z róż-
nicą ciśnień AP = Pt—P2 równaniem
AP = QR,
gdzie R jest „oporem” rury. Znajdź opór rury o promieniu a i o długości L. Czy Twoim
zdaniem definicja takiego oporu jest tylko definicją formalną, czy widzisz powody, dla
których podobne analogie są użyteczne? Jaki jest odpowiednik kondensatora?
V
ZADANIA DO ROZDZIAŁU 41
447
41.3. Duża, płytka taca napełniona jest częściowo wodą (nieściśliwą cieczą o lepkości Tj).
Po wodzie pływa cienka płaska drewniana deska, a jej dolna powierzchnia znajduje się
na wysokości d nad dnem tacy. Oba pozostałe wymiary deski są dużo większe niż d. Deska
poruszana jest poziomo z małą prędkością v.
Jaka jest szybkość rozpraszania energii na jednostkę objętości wody w pobliżu środka
deski?
skorowidz
Adiabatyczne rozmagnesowanie 277
Alnico V 322
Ampćre’a prądy 284
antyferromagnetyczne materiały 324
atomowa polaryzowalność 208
Barkhausena efekt 321
belka-dźwigar 342
Bernoulliego twierdzenie 375
Bessela funkcja 48
bezwirowy przepływ 374
bierne elementy obwodu 15
Bohra magneton 262
Bopp, F. 143
Bom, M. 142
Bragg, L. 179
Bragga i Nye’a model kryształu 179
Całkowite odbicie wewnętrzne 242
cechowania warunek 91
chemiczne ogniwo 18
ciepło właściwe 312
Clausiusa-Mossottiego równanie 215
Curie temperatura 303
czasoprzestrzeń 112
częstość
— graniczna 31
— Larmora 254
— plazmowa 224
czterowektory 79
czynnik g jądrowy 251
-----Landego 250
czynne elementy obwodu 15
Dalambercjan 90
diamagnetyzm 246
Dirac, P.A.M. 142
domena 315
doświadczenie Sterna—Gerlacha 266
drobinowy kryształ 167
dyslokacja 177, 178
— poślizgowa 178
— śrubowa 178
dywergencja (czterowektora) 87
Einstein, A. 129, 405, 413, 415, 420
elektrodynamika w zapisie relatywistycz-
nym 79
elektromagnetyczna masa 135
elektromagnes 296
elektronu klasyczny promień 136
elementy obwodu 40
-----bierne 15
----- czynne 15
energia 26
— pola 115
-----dla ładunku punktowego 132
— ściany 315
energii gęstość 117
— strumień 117
SKOROWIDZ
44'
energii zasada zachowania 115
ersted (jednostka) 290
Fale
— odbite 236
— ścinania 339
— załamane 236
falowody 59
ferromagnetyzm 246, 282, 306
ferromagnetyczne izolatory (ferryty) 325 .
Feynman, R. 143
filtry 31
Gamet 326
gaus (jednostka) 290
generator elektryczny 15
Gerlach, W. 266
gęstość wirów 374
głębokość naskórkowa 222
graniczna częstość 31
grawitacja 415
Heksagonalna komórka 174
Helmholtz, H. 383
histerezy krzywa 314
— pętla 293
Hooke’a prawo 328
hydrostatyka 368
Iloczyn skalamy 82
indukcyjność 11
— wzajemna 36
Infeld, L. 142
izolatory ferromagnetyczne (ferryty) 325
Jednoskośna komórka 174
Karmana ścieżka wirów 397
kąt precesji 251
Kirchhoffa prawa 19
klasyczny promień elektronu 136
komórka heksagonalna 174
— jednoskośna 174
— regularna 174
— rombowa 174
— tetragonalna 174
— trygonalna 174
kondensator 12, 42
Kroneckera delta 193
kryształ drobinowy 167
kryształu sieć 167
kryształów geometria 164
kryształy 164
krzywizna dodatnia 412
— średnia 414
— ujemna 412
— wewnętrzna 413
— w przestrzeni trójwymiarowy 413
kwadrupolowe soczewki 161
Lamćgo stałe sprężyste 354
Landego czynnik g 250
Larmora częstość 255
— twierdzenie 254
Lenza reguła 247
lepkość 387
lepkości współczynnik 388
liczba Reynoldsa 393
linia koncentryczna 60
— przesyłowa 59
linie prądu 376
— wiru 383
Lorentz, H. A. 79, 95
Lorentza transformacja 79
----pól 95
— warunek 91
Ładunku ruch 151
Macha liczba 396
magnesujące pole 292
magneton Bohra 262
magnetostrykcja 315
magnetyczna podatność 274
— soczewka 155
magnetyczne momenty 249
— substancje 306
magnetyczny rezonans 264
----jądrowy 278
magnetyzm materii 246
masa elektromagnetyczna 135
Maxwella równania 209, 428
metoda wiązek molekularnych RabiegO 268
mikroskop elektronowy 156
Minkowskiego przestrzeń 203
moduł ścinania 333
— ściśliwości 332
— Younga 330
Móss bauera zjawisko 423
„Nadwyżka promienia” 412
naprężenie 330
Neuman, J. von 372
Newtona prawa 405, 428
Nye, J. F. 179
450
w
SKOROWIDZ
Objętościowe naprężenie 332
— odkształcenie 332
obwodu elementy 40
— bierne 15
— czynne 15
obwody prądu zmiennego 9
— rezonansowe 56
— zastępcze 25
odbicie
— całkowite wewnętrzne 242
— od metali 241
— światła 226
odkształcenia jednorodne 331
odkształcenie 330
ogniwo chemiczne 18
opornik 14
oporność pozorna 9
oporu czołowego współczynnik 396
ośrodki sprężyste 347
Paramagnetyzm 246, 264
pęd pola 127
----poruszającego się ładunku 134
pędu spektrometr 152
— widmo 153
permaloj 323
plazmowa częstość 224
płaszczyzna hipliwości 165
pochłaniania współczynnik 217
podatność magnetyczna 274
Poincarego napięcia 137
Poissona stała 330
pola prowadzące w akceleratora# 137
— wskaźnik 158
polaryzacja metali 206
polaryzowalność atomowa 208
pole magnesujące 292
— tensorowe 202
potencjał Yukawy 150 1
Poynting, J. 118
Poyntinga wektor 122
prawa Kirchhoffa 19
— Newtona 405, 428
prawo Hooke’a 328
— powszechnego ciążenia 405
prądy Ampere’a 284
— namagnesowania 282
precesja atomowych momentów magnetycznych
251
precesji kąt 251
prostownik 34
przenikalność magnetyczna 295
przepływ bezwirowy 374
— lepki 391
— ustalony 375
— „wstęgowy” 401
przestrzeń zakrzywiona 405
przewodność 220
Rabi, I. I. 268
Rabiego metoda wiązek molekularnych 268
Rayleigha fale 339
reaktancja 27
regularna komórka 174
Reynoldsa liczba 393
rezonansowa wnęka 48
rezonansowe obwody 56
rezonator wnękowy 40
rezystancja 27
rombowa komórka 174
rozmagnesowanie adiabatyczne 277
równania einsteinowskie pola 429
— Maxwella 209, 428
równanie Clausiusa-Mossottiego 215
— einsteinowskie ruchu 429
ruch ładunku 151
— orbitalny 249
Sieć płaska 171
— trójskośna 174
siła wymienna 308
skalamy iloczyn 82
skręcanie pręta 331
skwantowane stany magnetyczne 264
Snelliusa prawo 226
soczewka elektrostatyczna 154
— magnetyczna 155
soczewki kwadrupolowe 161
spinel 325
sprężyste ośrodki 347
sprężystości stałe 354, 362 1
— tensor 351
Stern, O. 266
Stema-Gerlacha doświadczenie 266
„sucha” woda 268
„supermaloj” 295
Ścinanie 334
ścinania fale 339
— moduł 333
śrubowa dyslokacja 178
Temperatura Curie 303
tensor naprężeń 197
SKOROWIDZ
451
I" !
tensor odkształceń 202, 347
— sprężystości 351
tensorowe pole 202
tensory 106, 186
teoria einsteinowska ciążenia 428
termodynamika 312
tetragonalna komórka 174
transformacja Lorentza 79
-----pól 95
transformator 296
trygonalna komórka 174
turbulentna warstwa graniczna 399
twierdzenie Bernoulliego 375
— Larmora 254
typy drgań w rezonatorach wnękowych 53
Warunek Lorentza 91
Wheeler, J. A. 142
wnęka rezonansowa 48
wnękowe rezonatory 40
woda „mokra” 387
— „sucha” 368
współczynnik lepkości 388
— oporu czołowego 396
— pochłaniania 217
— załamania 206
Załamanie światła 206
załamania współczynnik 206
zasada równoważności 417
— zachowania energii 115
zastępcze obwody 25
zorientowany moment magnetyczny 268
Wydawnictwo Naukowe PWN SA
Wydanie trzecie
Arkusz) drukarskich 28.25 + I ark wkł
Druk ukończono w maju 2001 r
Druk i oprawa Pabianickie Zakłady Graficzne SA
Zam 91/2001
DO NABYCIA WKSIĘGARNIACH
F.C. Adams, G.R Laughhn
Ewolucja Wszechświata
S. Chandrasekhar, M. Kac, R. Smoluchowski
Marian Smoluchowski. His Life and Scientific Work
A. Drzewiński, A.Wojtkiewicz
Opowieści z historii fizyki
RJ Durka
Komputer, Internet, cyfrowa rewolucja
R. Penrose
Nowy umyst cesarza.
O komputerach, umyśle i prawach fizyki
I Stewart
Czy Bóg gra w kości?
Nowa matematyka chaosu
C. Suplee
Fizyka XX wieku
Książki PWN są do nabycia w księgarniach własnych PWN:
Warszawa, ul Miodowa 10, tel (22) 635 80 88,
Gdańsk, ul Korzenna 33/35, tel (58) 305 24 50,
Katowice, al Korfantego 51, tel (32) 58 32 26,
Kraków, ul Sw Tomasza 30, tel (12) 421 75 64,
Łodz ul Więckowskiego 13, tel (42) 630 67 69,
Poznań, ul Wodna 8/9, tel (61) 85174 94,
Wrocław, ul Kuzmcza 56, tel (71) 343 54 52
Zamówienia telefoniczne i pisemne przyjmuje
Dział Dystrybucji Wysyłkowej i Prenumerat,
ul Miodowa 10, 00-251 Warszawa,
infolinia 0-801 351 929, fax 69 54 179
Zapraszamy do księgarni PWN w Internecie www.pwn.com.pl