/
Author: Feynman R.P. Leighton R.B. Sands M.
Tags: optyka fizyka nauki przyrodnicze termodynamika
ISBN: 83-01-01-13484-4
Year: 2001
Text
R.P. FEYHMAN, R.B.IEIGHION, M.SANDS
I I
wykłady z fizyki
Optyka
Termodynamika
Fale
WjlawnittND Naukowe PWN
liichard Feynman Iwo Biatymcki-Bimla
\
c\a Teorie .s.atyw^.yjzne ' graw'.acja. Warszawa 1962
RJ. FEYNMAN, R.B.IEIGHTON, M.SANDS
Feynmana
^ wykłady z fizyki
TDM 1.2
Optyka
Termodynamika
Fale
./arszav.a 2001
.z PWN
J „ 4-. .-. h I „ I
Dane oryginału
Richard P. Feynman, Robert B. Leighton, Matthew Sands
The Feynman Lectures on Physics, vol.1
Copyright © 1963, California Institute of Technology
All rights reserved
Commemorative issue published by arrangement with the original publisher,
Addison Wesley Longman, a Pearson Education Company
Przekład z języka angielskiego
Andrzej Jurewicz (rozdziały 26-36)
Marek Grynberg (rozdziały 37-52)
Mirosław Kozłowski (rozdziały 39-51)
Teresa Butler (zadania)
Redakcja naukowa
Stanisław Bażański
Projekt okładki i stron tytułowych
Joanna Sobieraj
Copyright O for the Polish edition
By Państwowe Wydawnictwo Naukowe
Warszawa 1968
Copyright O for the Polish edition
by Wydawnictwo Naukowe PWN SA
Warszawa 2001
Wydawnictwo Naukowe PWN SA
ul. Miodowa 10,00-251 Warszawa
teł.: 69 54 321, e-mail: pwn(g pwn.com.pl
www.pwn.com.pl
ISBN 83-01-01-13484-4 t.1-3
ISBN 83-01-13486-0 t.1.2
Wydawnictwo Naukowe PWN SA
Wydanie czwarte
Arkuszy drukarskich 27.0
Druk ukończono w marcu 2001 r.
Druk i oprawa: Pabianickie Zakłady Graficzne SA
Zam. 68/2001
spis rzeczy
Rozdział 26. Optyka. Zasada najkratszega czasu . . 11
26-1. Światło ... . 11
26-2. Odbicie i załamanie . . 13
26-3. Zasada Fermata najkrótszego czasu . 14
26-4. Zastosowanie zasady Fermata . . 17
26-5. Dokładniejsze sformułowanie zasady Fermata . 22
26-6. Jak to się wszystko odbywa naprawdę? . . 23
Rozdział 27. Optyka geometryczna . 25
27-1. Wstęp . . 25
27-2. Odległość ogniskowa powierzchni kulistej 26
27-3. Odległość ogniskowa soczewki 30
27-4. Powiększanie . 32
27-5. Soczewki złożone . 33
27-6. Aberracje j . 35
27-7. Zdolność rozdzielcza ... 36
Rozdział 28. Promieniowanie tlektromagnetyczne . . . 38
28-1. Elektromagnetyzm 38
28-2. Promieniowanie 42
28-3. Dipol promieniujący 43
28-4. Interferencja 45
Rozdział 29. Interferencja ... . 47
29-1. Fale elektromagnetyczne . 47
29-2. Energia promieniowania 49
29-3. Fale sinusoidalne . . . 50
29-4. Dwa dipole promieniujące .... 51
29-5. Matematyczne ujęcie interferencji 55
SPIS
Rozdział 30. Dyfrakcja ... 59
30-1. Wypadkowa amplituda promieniowania n jednakowych oscylatorów 59
30-2. Siatka dyfrakcyjna 63
30-3. Zdolność rozdzielcza siatki 67
30-4. Antena paraboliczna . . 68
30-5. Warstewki barwne; kryształy ... 69
30-6. Ugięcie na nieprzezroczystych ekranach . . 70
30-7 Pole pochodzące od płaszczyzny drgających ładunków 73
Rozdział 31. Skąd się bierze współczynnik załamania . 77
31-1. Współczynnik załamania 77
31-2. Pole pochodzące od ośrodka materialnego . 82
31-3. Dyspersja ... . 84
31-4. Pochłanianie (absorpcja) ... 88
31-5. Energia niesiona przez falę elektryczną 89
31-6. Ugięcie światła na ekranie 90
Rozdział 32. Tłumienie pramieniawania. Rozpraszanie światła .... 93
32-1. Opór promieniowania 93
32-2. Szybkość wypromieniowywania energii 95
32-3. Tłumienie promieniowania 97
32-4. Niezależne źródła 98
32-5. Rozpraszanie światła 100
Rozdział 33. Polaryzacja ... . . . 106
33-1. Elektryczny wektor światła 106
33-2. Polaryzacja światła rozproszonego . 108
33-3. Dwójłomnośc 109
33-4. Polaryzatory . . 111
33-5. Aktywność optyczna 113
33-6. Natężenie światła odbitego 114
33-7. Anomalne załamanie 117
Rozdział 34. Relatywistyczne efekty w promieniowaniu . . 120
34-1. Ruchome źródła . . 120
34-2. Znajdowanie ruchu „pozornego" . 122
34-3. Promieniowanie synchrotronowe 124
34-4. Kosmiczne promieniowanie synchrotronowe 128
34-5. Promieniowanie hamowania . 129
34-6. Zjawisko Dopplera 130
34-7. Czterowektor k, co 133
34-8. Aberracja 135
34-9. Pęd światła . 136
Rozdział 35. Widzenie barwne . 138
35-1. Oko ludzkie ... 138
35-2. Barwa zależy od natężenia światła 140
35-3. Mierzenie wrażenia barwnego 142
35-4. Wykres barwności . ... 146
35-5. Mechanizm widzenia barwnego 148
35-6. Fizjochemia widzenia barwnego 150
Rozdział 36. Mechanizm widzenia
153
36-1. Wrażenie barwy 153
36-2. Fizjologia oka ... . . 156
36-3. Komórki pręcikowe 160
36-4. Oko złożone (owadzie) 162
36-5. Jeszcze inny rodzaj oczu . . 165
36-6. Neurologia widzenia ... '66
Rozdział 37. Efekty kwantowe .172
37-1. Mechanika atomowa . . 172
37-2. Doświadczenie z pociskami . . . . 173
37-3. Doświadczenie z falami ..... 175
37-4. Doświadczenie z elektronami . 177
37-5. Interferencja fal elektronowych .... 179
37-6. Obserwacja elektronów . 181
37-7. Podstawowe zasady mechaniki kwantowej . . 185
37-8. Zasada nieoznaczoności . . 187
Rozdział 38. Porównanie dwóch punktów widzenia: falowego i korpuskularnego 189
38-1. Falowe amplitudy prawdopodobieństwa 189
38-2. Pomiar położenia i pędu . . '90
38-3. Dyfrakcja na kryształach 194
38-4. Rozmiary atomu . '96
38-5. Poziomy energetyczne . . • '98
38-6. Konsekwencje filozoficzne 200
Rozdział 39. Kinetyczna teoria gazów . 203
39-1. Własności materii . . 203
39-2. Ciśnienie gazu ..... . 205
39-3. Ściśliwość promieniowania . . 209
39-4. Temperatura i energia kinetyczna 210
39-5. Prawo gazu doskonałego 215
Rozdział 40. Zasady mechaniki statystycznej . 218
40-1. Wzór barometryczny ... 218
40-2. Prawo Boltzmanna 220
40-3. Parowanie cieczy 221
40-4. Rozkład prędkości cząsteczkowych . . 223
40-5. Ciepła właściwe gazów .... 227
40-6. Załamanie się fizyki klasycznej 230
Rozdział 41. Ruchy Browna 233
41-1. Ekwipartycja energii 233
42-2. Termodynamiczna równowaga promieniowania 237
41-3. Ekwipartycja i oscylator kwantowy 341
41-4. Błądzenie przypadkowe 244
Rozdział 42. Zastosowania teorii kinetycznej 248
42-1. Parowanie . 248
42-2. Termoemisja . 252
42-3. Jonizacja termiczna 253
8
SPIS RZECZY
42-4. Kinetyka reakcji chemicznych . .... ... 256
42-5. Prawa promieniowania Einsteina .... 258
Rozdział 43. Dyfuzja . . . . . 262
43-1. Zderzenia między cząsteczkami . . 262
43-2. Średnia droga swobodna . . .... 265
43-3. Szybkość unoszenia 267
43-4. Przewodnictwo jonowe 270
43-5. Dyfuzja cząsteczkowa 271
43-6. Przewodnictwo cieplne . . . 274
Rozdział 44. Zasady termodynamiki . 276
44-1. Silniki cieplne, pierwsza zasada ... . . 276
44-2. Druga zasada . 279
44-3. Silniki odwracalne ... 281
44-4. Sprawność silnika idealnego 285
44-5. Termodynamiczna skala temperatur .... . . 288
44-6. Entropia ... 290
Rozdział 45. Zastosowania termodynamiki . . 295
45-1. Energia wewnętrzna . . 295
45-2. Zastosowania .... 299
45-3. Równanie Clausiusa-Clapeyrona ... . 302
Rozdział 46. Mechanizm zapadkowy . . . . 307
46-1. Jak pracuje zębatka . 307
46-2. Zębatka w roli silnika . . 309
46-3. Odwracalność w mechanice . . 312
46-4. Nieodwracalność . . ... 313
46-5. Porządek i entropia . 315
Rozdział 47. Dźwięk. Równanie falowe . . . 319
47-1. Fale .... . . . 319
47-2. Rozchodzenie się dźwięku . . 322
47-3. Równanie falowe 323
47-4. Rozwiązania równania falowego . 326
47-5. Szybkość dźwięku . 328
Rozdział 48. Dudnienia . . 330
48-1. Dodawanie dwóch fal ... 330
48-2. Dudnienia i modulacja . 333
48-3. Pasma boczne 334
48-4. Zlokalizowane paczki falowe . 336
48-5. Amplitudy prawdopodobieństw dla cząstek 339
48-6. Fale trójwymiarowe . . 341
48-7. Drgania własne 342
Rozdział 49. Fale stające ... . . . 345
49-1. Odbicie fal ... 345
49-2. Fale stojące i częstości własne 347
49-3. Dwuwymiarowe fale stojące 349
SPIS RZECZY
49-4. Wahadła sprzężone . . 353
49-5. Układy liniowe 354
Rozdział 50. Składowe harmoniczne 356
50-1. Tony muzyczne 356
50-2. Szeregi Fouriera 358
50-3. Barwa i harmonia 360
50-4. Współczynniki Fouriera 362
50-5. Twierdzenie o energii 366
50-6. Zjawiska nieliniowe 367
Rozdział 51. Fale 370
51-1. Fale czołowe 370
51-2. Fale uderzeniowe 372
51-3. Fale w ciałach stałych 375
51-4. Fale powierzchniowe 379
Rozdział 52. Symetria praw fizyki 384
52-1. Operacje symetrii 384
52-2. Symetria czasu i przestrzeni . 385
52-3. Symetria a zasady zachowania . 388
52-4. Odbicia zwierciadlane . 389
52-5. Wektory i pseudowektory . 392
52-6. Która ręka jest prawa? . 394
52-7. Parzystość nie jest zachowana! . 395
52-8. Antymateria ... 398
52.9. Naruszone symetrie 399
Zadania . . 401
Odpowiedzi do zadań 425
Skorowidz
429
26
optyka: zasada najkrótszego czasu
26-1. Światło
Oto pierwszy z cyklu rozdziałów poświęconych promieniowaniu elektromagnetycznemu.
Światło widzialne stanowi tylko małą część rozległego widma fal podobnych do światła,
przy czym rozmaite części tego widma charakteryzują się różnymi wartościami pewnej
zmiennej wielkości, którą można nazwać „długością fali". W miarę tego jak zmienia się
ona w zakresie fal widzialnych, światło w sposób widoczny zmienia barwę od czerwieni
do fioletu. Chcąc zaś systematycznie badać całe widmo, poczynając od fal o dużych
długościach w stronę fal o długościach coraz to mniejszych, powinniśmy zacząć od fal
nazywanych zwykle falami radiowymi. W technice fale radiowe otrzymuje się w szerokim
zakresie długości fali. Mogą być one nawet dłuższe od fal używanych do stałych transmisji
radiowych; w regularnych programach korzystamy z fal o długości około 500 m. Po nich
następują tak zwane „fale krótkie" (tzn. fale radarowe), fale milimetrowe i tak dalej.
Między kolejnymi zakresami długości fali nie ma właściwie żadnych granic, ponieważ
przyroda nie zna ostrych odgraniczeń. Wszelka liczbowa charakterystyka związana z daną
nazwą fal jest tylko orientacyjna, podobnie jak i same nazwy nadawane poszczególnym
zakresom.
Dalej, po długiej drodze przez fale milimetrowe dochodzimy wreszcie do obszaru fal
zwanego podczerwienią, a jeszcze dalej — do widma widzialnego. Przeszedłszy na drugi
jego kraniec dochodzimy do obszaru zwanego nadfioletem. Tam, gdzie się kończy nadfiolet,
zaczyna się obszar promieniowania rentgenowskiego, ale nie możemy dokładnie określić
miejsca, w którym to następuje: dzieje się to przy około 10~8 m czyli 10 ~2 u. Jest to obszar
„miękkich" promieni rentgenowskich, po nich następuje obszar promieni rentgenowskich
zwykłych i wreszcie promieni bardzo twardych; dalej mamy obszar promieni y, które się
rozciągają w obszar coraz to mniejszych wartości długości fal.
12
26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
W tym ogromnym zakresie długości fal istnieją co najmniej trzy zakresy szczególnie
ciekawe ze względu na dokonywane w nich przybliżenia. W jednym z nich spełniony jest
warunek, który mówi, że długości fal są bardzo małe w porównaniu z rozmiarami urządzeń
służących do ich badania, a ponadto energie fotonów (w języku teorii kwantów) są małe
w porównaniu z czułością energetyczną przyrządu. Gdy warunki te są spełnione, możemy
dokonać pierwszego przybliżenia zwanego optyką geometryczną. Jeżeli zaś długości fal
są porównywalne z rozmiarami przyrządów, co trudno osiągnąć w przypadku światła,
ale łatwiej w przypadku fal radiowych, i jeżeli energię fotonu nadal można pominąć, bardzo
użyteczne przybliżenie polega na uwzględnieniu charakteru falowego i pominięciu
mechaniki kwantowej. Metoda ta oparta jest na klasycznej teorii promieniowania
elektromagnetycznego, którą omówimy w jednym z dalszych rozdziałów. Gdy przejdziemy dalej, do
fal o bardzo małej długości, których charakter falowy możemy pominąć, ale których fotony
mają bardzo dużą energię w porównaniu z czułością naszego przyrządu, sprawy znowu staną
się proste. Będziemy mieli prosty obraz fotonowy, którym zajmiemy się tylko pobieżnie.
Pełnego jednak obrazu, łączącego wszystkie te zjawiska w jednym modelu, długo jeszcze
nie będziemy mieli.
W rozdziale tym ograniczymy się do omówienia obszaru fal, w którym możemy
stosować prawa optyki geometrycznej. Zapominamy więc teraz o długości fali i o fotonowym
charakterze światła, do spraw tych wrócimy jednak we właściwym czasie. Nie
zastanawiamy się więc teraz wcale nad tym, czym jest światło, ale po prostu badamy jak ono się
zachowuje w skali dużej w porównaniu z jego długością fali. Wszystko to mówimy, aby
podkreślić, że będziemy rozważać tylko bardzo grube przybliżenie. Metoda podana w tym
rozdziale jest jedną z tych, których potem będziemy musieli się „oduczać". Oduczenie to
nastąpi jednak bardzo szybko, ponieważ prawie zaraz przejdziemy do bardziej dokładnej
metody.
Optyka geometryczna, mimo że jest tylko przybliżeniem, ma bardzo duże znaczenie
praktyczne, a przy tym jest ogromnie ciekawa ze względów historycznych. Temat ten
ujmiemy więc może bardziej od strony historycznej niż inne, aby dać pojęcie o rozwoju teorii
lub idei fizycznej.
Zacznijmy od stwierdzenia, że światło jest oczywiście dobrze wszystkim znane i to od
niepamiętnych czasów. Pojawia się jednak od razu pytanie: w wyniku jakiego procesu
w ogóle widzimy światło? Teorii wyjaśniających było wiele, ale ostatecznie ustaliła się jedna,
według której w procesie widzenia uczestniczy coś, co wychodzi z przedmiotów i wchodzi
do oka. Z poglądem tym jesteśmy oswojeni od tak dawna, że wprost nie możemy sobie
wyobrazić, jak niektórzy bardzo inteligentni ludzie mogli proponować teorie przeciwstawne,
według których na przykład coś wychodzi z oka i „wymacuje" przedmiot. Pewne inne ważne
spostrzeżenia pozwalają nam stwierdzić, że światło przechodząc z jednego miejsca do
drugiego rozchodzi się po liniach prostych, gdy mu nic nie stoi na drodze, i że promienie
świetlne, jak się zdaje, nie przeszkadzają sobie wzajemnie. Znaczy to, że światło porusza się
wprawdzie w przestrzeni tam i sam we wszystkich kierunkach, ale światło, przechodzące
w poprzek naszej linii wzroku, nie wpływa na światło, przychodzące do nas od jakiegoś
przedmiotu. Był to kiedyś jeden z najpotężniejszych argumentów przeciwko teorii korpu-
skularnej; posługiwał się nim Huygens. Gdyby światło było pękiem lecących strzał,
26-1. ŚWIATŁO
13
jakże mogłyby z taką łatwością przechodzić przezeń inne strzały? Takie filozoficzne
argumenty nie mają jednak wielkiego znaczenia. Zawsze może się znaleźć ktoś, kto
powie, że światło jest zrobione ze specjalnych strzał, które wzajemnie przenikają
przez siebie!
26-2. Odbicie i załamanie
Powyższe rozważania dają wystarczające wyobrażenie o podstawowej idei optyki
geometrycznej — czas teraz na pogłębienie jej związków ilościowych. Dotąd rozważaliśmy
światło rozchodzące się po liniaeh prostych między dwoma punktami; zbadajmy teraz jak
zachowuje się światło, gdy natrafia na różne ośrodki materialne. Najprostszym takim
przedmiotem jest zwierciadło. Obowiązuje dla niego prawo mówiące, że gdy światło pada
na zwierciadło, nie biegnie dalej po linii prostej, ale odbija się po nowej linii prostej, która
się zmienia, gdy zmieniamy nachylenie zwierciadła. W starożytności stawiano sobie pytanie:
jaki związek zachodzi między dwoma wchodzącymi tu w grę kątami? Związek ten jest
bardzo prosty i dawno go już odkryto. Światło padając na zwierciadło biegnie tak, że kąty
między każdą z wiązek a zwierciadłem są sobie równe. Z pewnych powodów przyjęto
mierzyć kąty względem normalnej do powierzchni zwierciadła.
Wobec tego tak zwane prawo odbicia brzmi:
0p.d=0o
(26.1)
(rys. 26.1). Tutaj sprawa jest dość prosta, ale problem staje
się trudniejszy, gdy światło przechodzi z jednego ośrodka
do drugiego, na przykład z powietrza do wody;
widzimy, że i wtedy nie biegnie ono po tej samej linii prostej. Pro--
mień w wodzie jest nachylony względem kierunku swojego
rozchodzenia się w powietrzu (rys. 26.2). Jeśli dobieramy
kąt 6 tak, aby promień padał prawie pionowo w
stosunku do powierzchni wody, kąt „załamania" jest bardzo
niewielki. Jeżeli jednak zmienimy nachylenie wiązki
światła o spory kąt, kąt odchylenia staje się bardzo
duży. Powstaje pytanie: jaki jest związek między jednym
kątem a drugim? Również nad tą sprawą przez długi czas
zastanawiali się starożytni, w tym jednak wypadku nigdy
nie udało im się znaleźć odpowiedzi! Jest to jednak jedno
z niewielu zagadnień całej greckiej fizyki, dla którego
można znaleźć zestawienie pewnych wyników doświadczalnych.
Klaudiusz Ptolemeusz sporządził wykaz kątów w wodzie,
odpowiadających kilku różnym kątom w powietrzu.
Tabela 26.1 podaje wartości kątów w powietrzu (mierzone
w stopniach) i odpowiednie kąty zmierzone w wodzie.
(Mówi się zwykle, że uczeni greccy nigdy nie przeprowadzali
26.1. Kąt padania jest
równy kątowi odbicia
26.2. Promień świetlny
załamuje się, gdy przechodzi
z jednego ośrodka do
drugiego
Ppad-
"zat\
14 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
Tabela 26.1 Tabela 26.2
Kąt w wodzie
10
20
30°
40°
50°
60
70°
80c
Kąt w powietrzu
8°
15ł°
22ł
28°
35°
40JC
45°
50°
Kąt w wodzie
10°
20°
30"
40°
50°
60°
70'
80°
Kąt w powietrzu
7i°
15°
22°
29°
35°
40°
48°
49ł°
doświadczeń. Ale nie znając właściwego prawa nie mogliby bez doświadczeń otrzymać tej
tabeli wartości. Należy jednak zauważyć, że wartości te nie stanowią starannych,
niezależnych pomiarów dla każdego kąta z osobna. Są one liczbami interpolowanymi z kilku
tylko pomiarów. Sądzimy tak dlatego, że leżą doskonale na paraboli.)
Na tym właśnie polega jeden z ważnych kroków w rozwoju prawa fizycznego: najpierw
obserwujemy jakieś zjawisko, potem dokonujemy pomiarów i wyniki zestawiamy w tabeli;
wreszcie próbujemy znaleźć regułę, za pomocą której można kilka rzeczy wzajemnie
powiązać. Wspomnianą tabelę liczbową ułożonowroku 140,ale dopiero w roku 1621 znaleziono
wreszcie regułę wiążącą ze sobą owe dwa kąty! Reguła znaleziona przez holenderskiego
matematyka Willebrorda Snella brzmi następująco: jeżeli 0pad jest katem w powietrzu,
a 0zał — kątem w wodzie, to sinus kąta 0pad jest równy pewnej stałej pomnożonej przez
sinus kąta 0zal:
sin0pad = nsin0Ml. (26.2)
Dla wody liczba n wynosi w przybliżeniu 1,33. Równanie (26.2) nazywamy prawem
Snella. Pozwala nam ono przewidzieć, jak się światło zakrzywi przechodząc z powietrza
do wody. W tabeli 26.2 zestawiono kąty w powietrzu i w wodzie według prawa Snella.
Zauważmy wyjątkową zgodność tej tabeli z wykazem Ptolemeusza.
26-3. Zasada Fermata najkrótszego czasu
W miarę dalszego rozwoju nauki szukamy czegoś więcej niż wzoru. Najpierw
obserwujemy, potem otrzymujemy liczby będące wynikami pomiarów, wreszcie dochodzimy
do prawa, łączącego w sobie wszystkie te liczby. Ale prawdziwa chluba nauki polega na
tym, że możemy znaleźć taki sposób podejścia, w którego wyniku prawo staje się oczywiste.
Sposób podejścia, dzięki któremu prawo zachowania się światła stało się oczywiste,
został odkryty przez Fermata około roku 1650 i nazywa się go zasadą najkrótszego czasu
albo zasadą Fermata. Pomysł Fermata wiąże się z obserwacją, że światło spośród wszystkich
możliwych torów łączących dwa punkty wybiera ten, którego przebycie wymaga
najkrótszego czasu.
26-3. ZASADA FERMATA NAJKRÓTSZEGO CZASU
1!
%c — — ~ "~Ź?
lfv -*■ S
n X. -->- >^
i \ \ .. -'-' S
\ X. ^^ ./^
iN >ć' X
M l^K^S
5 r^ ćsn
^ N
-« x
^ V
>. \
"">>
r
s\
.8
M
F
•yB
Pokażemy najpierw, że jest to prawda w
przypadku odbicia od zwierciadła, że ta prosta zasada
obejmuje zarówno prawo prostoliniowego
rozchodzenia się światła, jak i prawo odbicia od zwierciadła.
Rozszerzymy w ten sposób nasz zakres rozumienia
zjawisk! Spróbujmy znaleźć rozwiązanie
następującego zagadnienia. Na rysunku 26.3 pokazano dwa
punkty, A i B, oraz płaskie zwierciadło MM'. Po
jakiej drodze można się dostać z punktu A do B
w najkrótszym czasie? Odpowiedź brzmi: idąc prosto 26.3. Objaśnienie zasady najkrótszego
od punktu A do 8! Odpowiedź nie jest jednak już taka czasu
łatwa, jeśli dołączymy dodatkowy warunek, że światło
ma w najkrótszym czasie paść na zwierciadło i wrócić. Jeden z wyborów drogi mógłby
polegać na jak najszybszym pobiegnięciu do zwierciadła, a stamtąd do punktu B po drodze A DB.
Do przebycia pozostanie wtedy długa droga DB. Jeśli przesuniemy się nieco w prawo,
do punktu E, zwiększymy wprawdzie trochę pierwszą odległość, ale znacznie zmniejszymy
drugą, skrócimy więc całkowitą długość toru i dzięki temu czas przelotu stanie się krótszy.
W jaki sposób możemy znaleźć punkt C, dla którego czas ten będzie najkrótszy? Możemy
posłużyć się bardzo pomysłowym chwytem geometrycznym.
Po przeciwnej stronie płaszczyzny MM' umieszczamy fikcyjny punkt B', który leży pod
płaszczyzną MM' w takiej samej odległości od niej jak punkt B. Rysujemy z kolei linię
EB'. Ponieważ kąt BFM jest kątem prostym i BF=FB', więc EB jest równe EB'. Wobec
tego suma dwu odległości AE+EB', która z kolei jest proporcjonalna do czasu przelotu
światła poruszającego się ze stałą prędkością, jest równa sumie AE+EB. Zagadnienie
sprowadza się więc do następującego pytania: kiedy suma tych dwu długości jest najmniejsza?
Odpowiedź jest prosta: wtedy, gdy linia przechodząca przez punkt C jest linią prostą
łączącą punkty A i B'\ Musimy, innymi słowy, znaleźć punkt, przez który przechodzi
prosta do punktu fikcyjnego i on właśnie będzie punktem szukanym. Jeśli ACB' będzie
linią prostą, kąt BCFbędzie równy kątowi B'CF, a stąd kątowi ACM. Wobec tego równość
kąta padania i kąta odbicia jest równoważna stwierdzeniu, że światło biegnie do
zwierciadła tak, aby przybyć do punktu B' w możliwie najkrótszym czasie. Twierdzenie
pierwotnie wypowiedziane przez Herona z Aleksandrii mówiło, że światło od jednego punktu
do drugiego porusza się po takim torze, że biegnie do zwierciadła, a następnie do tego
drugiego punktu po możliwie najkrótszej drodze. Nie mówi ono więc dokładnie tego, co
współczesna teoria. Ale to właśnie twierdzenie podsunęło Fermatowi myśl, że może i
proces załamania światła odbywa się według podobnych zasad. Ponieważ zaś przy załamaniu
światło oczywiście nie wybiera drogi zgodnie z najkrótszą odległością, Fermat wpadł na
pomysł, że światło biegnie po drodze wymagającej najkrótszego czasu.
Zanim przejdziemy do rozpatrywania zjawiska załamania światła, zróbmy jeszcze jedną
uwagę tyczącą się zwierciadła. Niech w punkcie B znajduje się źródło wysyłające światło
w kierunku zwierciadła. Światło biegnąco od punktu B do .4/zachowuje się zupełnie tak,
jak gdyby nie było żadnego zwierciadła, a źródło znajdowało się w punkcie B'. Oko wykrywa
naturalnie tylko to światło, które fizycznie do niego wchodzi; jeżeli więc przedmiot znaj-
16
26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
duje się w punkcie B, a zwierciadło powoduje, że światło dochodzi do oka dokładnie tak,
jak gdyby znajdował się on w punkcie B', układ oko-mózg (przy założeniu, że nie wie
zbyt wiele) interpretuje całe zjawisko jako obecność przedmiotu w punkcie B'. Tak więc
złudzenie, że przedmiot znajduje się za zwierciadłem, polega po prostu na tym, że światło
przychodzące do oka fizycznie wchodzi do niego tak, jak gdyby przedmiot rzeczywiście
znajdował się z drugiej strony zwierciadła (nie biorąc pod uwagę zanieczyszczeń szkła
i tego, że mamy świadomość obecności przedmiotu oraz tym podobnych poprawek
wprowadzanych przez mózg).
Pokażmy teraz, że z zasady najkrótszego czasu wynika prawo załamania Snella.
Musimy jednak założyć coś o prędkości światła w wodzie. Otóż założymy, że prędkość
światła w wodzie jest o pewien czynnik n mniejsza od prędkości światła w powietrzu.
Nasz problem, przedstawiony na rys. 26.4, polega znowu na przejściu od punktu A do B
w najkrótszym czasie. Dla zobrazowania, że poiuszanie się zwyczajnie wzdłuż prostej
nie jest najlepszym wyjściem, wyobraźmy sobie następującą sytuację: z łodzi wypadła
piękna dziewczyna i znajdując się w wodzie w punkcie B woła o pomoc. Niech oś X stanowi
linię brzegu. Znajdujemy się na lądzie w punkcie A, widzimy wypadek i na pomoc możemy
zarówno biec, jak i płynąć. Ale biec
możemy szybciej niż płynąć. Co robimy? Czy
biegniemy po linii prostej? (Niewątpliwie tak!)
Jednakże po zastanowieniu się stwierdzimy,
że lepiej będzie przebyć nieco dłuższą drogę
po lądzie, aby skrócić sobie drogę w wodzie,
ponieważ w wodzie poruszać się będziemy
o wiele wolniej. (Rozumując w ten sposób
doszlibyśmy do wniosku, że lepiej byłoby
najpierw dokładnie obliczyć drogę, jaką
mamy do przebycia!) Spróbujmy w każdym razie
pokazać, że rozwiązaniem zagadnienia jest
tor ACB i że czas jego przebycia jest
najkrótszy ze wszystkich możliwych. Jeżeli ma to
być najszybsza droga, to każda inna droga
będzie od niej wolniejsza. Wykreślając zużyty
czas w zależności od położenia punktu
^(przecięcia się drogi z osią X), otrzymamy krzywą
podobną do pokazanej na rys. 26.5, na
którym punkt C odpowiada najkrótszemu
możliwemu czasowi. Znaczy to, że gdy
przesuwamy punkt X w pobliżu punktu C, w pierwszym
przybliżeniu nie powodujemy istotnych zmian
w czasie, ponieważ w najniższym punkcie
krzywej jej nachylenie wynosi zero. Nasza
metoda poszukiwania matematycznej postaci
prawa załamania będzie zatem polegała na
26.4. Objaśnienie zasady Fermata dla
załamania
26.5. Czas minimalny odpowiada punktowi
C, ale pobliskie punkty odpowiadają prawie
takiemu samemu czasowi
fj,
ZASADA FERMATA NAJKRÓTSZEGO CZASU
17
rozważaniu tak niewielkich przesunięć punktu, dla których nie następuje istotna zmiana
czasie. (Będzie istniała tu naturalnie nieskończenie mała zmiana drugiego rzędu;
następuje bowiem wzrost czasu dla dowolnych przesunięć od punktu C.) Rozważmy więc
pobliski punkt X i obliczmy, jak długo będzie trwała droga od punktu A do B po dwu torach,
co pozwoli na porównanie nowego toru z dawnym. Bardzo łatwo to zrobić. Chcemy
oczywiście, aby różnica wynosiła prawie zero, gdy odległość XA będzie mała. Spójrzmy najpierw
na drogę po lądzie. Prowadząc prostopadłą XE zauważamy, że droga po lądzie ulega
skróceniu w przybliżeniu o wielkość EC. Stanowi to nasz zysk, że nie potrzebujemy
pokonywać tej dodatkowej odległości. Przeprowadzając z drugiej strony odpowiednią
prostopadłą CF znajdujemy, że w wodzie mamy do przebycia dodatkową odległość XF, wskutek
czego tracimy czas. Zastanówmy się nad czasem przejścia. Zyskujemy czas, jaki by zabrało
przebycie odległości EC, ale tracimy czas na przebycie odległości XF. Czasy te powinny
być sobie równe, ponieważ w pierwszym przybliżeniu czas przejścia nie może ulec zmianie.
Zakładając, że w wodzie szybkość wynosi I/h szybkości w powietrzu, musimy mieć
EC = nXF. (26v3)
Widzimy więc, że biorąc właściwy punkt otrzymujemy XC sin fc EXC=n- XC sin fc XCF
czyli, skracając obie strony tej równości przez wspólną przeciwprostokątną XC i
zauważając, że
* EXC = * ECN = 0p,d oraz *XCF=% BCN' = 6>ial,
mamy
sin0pad = nsin0Ml. (26.4)
Tak więc widać, że aby przejść w najkrótszym czasie od jednego punktu do drugiego,
gdy stosunek prędkości wynosi n, światło powinno wchodzić pod takim kątem, aby
stosunek sinusów kątów #pad i #al był równy stosunkowi prędkości w dwu ośrodkach.
26-4. Zastosowanie zasady Fermata
Rozważmy teraz pewne ciekawe konsekwencje wynikające z zasady najkrótszego
czasu. Pierwsza z nich — to zasada wzajemności. Mówi ona, że jeżeli najkrótszy czas
Przejścia od punktu A do B jest osiągany na pewnym torze, to również na nim osiągany
jest najkrótszy czas przejścia w kierunku przeciwnym (przy założeniu że światło porusza
Sl? w każdym kierunku z tą samą szybkością). Jeśli zatem światło rozchodzi się w jednym
Kierunku, to może się także rozchodzić w kierunku przeciwnym.
Drugą ciekawą konsekwencją są zjawiska zachodzące w szklanym bloku o płaskich
ownoległych ścianach, ustawionym pod kątem do padającej wiązki światła. Światło
Iegnąc przez blok od punktu A do punktu B (rys. 26.6) nie przechodzi po linii prostej,
e ^raca sobie czas drogi zmniejszając kąt nachylenia przy przejściu przez blok, mimo
wskutek tego nieco traci na drodze w powietrzu. W wyniku wiązka zostaje po prostu
esunięta równolegle względem początkowego kierunku, ponieważ kąty wyjścia i wejścia
** fckie same.
18
26 OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
B'
6
26.6. Wiązka światła zostaje przesunięta
przy przejściu przez przezroczysty blok.
do Słońca pozornego
tor światła
Trzecią ciekawą konsekwencją jest fakt,
że gdy oglądamy zachodzące słońce, w
rzeczywistości znajduje się ono już pod
horyzontem! To tylko nam się wydaje, że jeszcze
znajduje się ono nad horyzontem, ale
naprawdę jest inaczej (rys. 26.7). Atmosfera
ziemska jest rzadka w górnych warstwach, a gęsta
w dolnych. Światło rozchodzi się w powietrzu
wolniej niż w próżni i w ten sposób światło
słoneczne szybciej może osiągnąć punkt 5 za
horyzontem, jeżeli zamiast biec po prostej,
będzie unikać obszarów gęstych, w których
porusza się powoli, przechodząc przez nie pod
większym nachyleniem. Gdy wydaje się, że
słońce dopiero zachodzi za horyzont,
naprawdę znajduje się ono już dobrze za nim. Innym
przykładem tego zjawiska są miraże, które
się często widzi jadąc po rozgrzanej szosie.
Widzi się „wodę" na szosie, ale dojechawszy
na miejsce okazuje się, że jest ono suche
jak pustynia! Zjawisko tłumaczy się
następująco: to, co naprawdę widzimy, jest światłem
słonecznym „odbitym" od drogi. Światło
słoneczne zmierzające w stronę szosy może
dojść do oka tak, jak pokazano na rys. 26.8.
Dlaczego? Dlatego, że powietrze bezpośrednio
nad szosą jest bardzo gorące, wyżej zaś chłodniejsze. Gorące powietrze jest optycznie
rzadsze (tzn. ma mniejsze n) niż zimne i dlatego prędkość światła spada tam w mniejszym
stopniu. Światło biegnie więc szybciej w obszarze gorącym niż chłodnym. Wobec tego
zamiast decydować się na bieg bezpośrednio po prostej drodze światło porusza się po
torze najkrótszego czasu, oszczędzając czas w obszarze, gdzie przez chwilę biegnie szybciej.
Dlatego może poruszać się po krzywej.
Rozważając inny ważny przykład zasady najkrótszego czasu spróbujmy stworzyć
sytuację, w której wszystko światło przychodzące z jednego punktu P odnajdzie się zebrane
znowu w innym punkcie P' (rys. 26.9). Znaczy to naturalnie, że światło może się poruszać
26.8. Miraż
Ziemia
26.7. Blisko horyzontu pozorne Słońce
znajduje się o około ł° wyżej od prawdziwego.
światło słoneczne
gorąca szosa lub piasek
26-4. ZASTOSOWANIE ZASADY FERMATA
19
[Z^^le:
po linii prostej od punktu P do P'. Rzeczywiście tak jest, ale czy możemy tak zrobić, żeby
odnaleźć w punkcie P' nie tylko światło biegnące na wprost, ale także rozchodzące się
od punktu P w stronę CP. Chcemy z powrotem zebrać wszystko światło w punkcie zwanym
ogniskiem. Jak to zrobić? Przecież jeżeli światło zawsze wybiera tor najkrótszego czasu, to
naturalnie nie będzie chciało biec po jakichś innych torach. Będzie ono mogło rzeczywiście
wybierać różne tory jedynie wtedy, gdy odpowiadające im czasy przejścia staną się dokładnie
równe\ W przeciwnym bowiem razie światło wybierze tylko tor najkrótszego czasu. Wobec
tego zagadnienie zbudowania układu ogniskującego polega po prostu na ustawieniu takiego
urządzenia, w którym całej rozmaitości torów odpowiada ten sam czas rozchodzenia się
światła!
Sprawa jest prosta. Weźmy kawałek szkła, w którym światło rozchodzi się wolniej niż
w powietrzu (rys. 26.10), i rozważmy promień, który w powietrzu biegnie po torze PQP'.
Tor ten jest dłuższy niż bezpośrednia droga
PP' i bez wątpienia zabiera więcej czasu.
Ale wstawiając kawałek szkła o odpowiedniej
grubości (a jakiej, obliczymy później) możemy
skompensować nadmiar czasu, jaki światłu
zabiera droga załamana pod pewnym kątem!
W tych warunkach może się okazać, że czas
odpowiadający przejściu na wprost będzie
dokładnie równy czasowi upływającemu na
torze PQP'. Rozważmy w podobny sposób
promień PRR'P'. Jest on tylko częściowo
nachylony, a więc nie tak długi jak PQP' i wobec
tego pewne wyrównanie jest konieczne,
chociaż nie tak duże jak dla promienia
biegnącego prosto. Ostatecznie więc nasza płytka
będzie wyglądała tak, jak na rys. 26.10. Przy
takim kształcie wszystko światło wychodzące
z punktu P będzie docierało do punktu P'.
Wszystko to jest nam oczywiście dobrze
znane; urządzenie takie nazywamy soczewką
skupiającą. W następnym rozdziale obliczymy,
jaki właściwie kształt musi mieć soczewka,
aby dawać doskonałe ogniskowanie.
Weźmy inny przykład. Spróbujmy ustawić
kilka zwierciadeł tak, aby światło z punktu P
zawsze dochodziło do P' (rys. 26.11). Biegnie
ono po różnych torach do zwierciadeł i wraca,
odpowiednie zaś czasy muszą być sobie rów-
ne- W tym przypadku światło rozchodzi się
stale w powietrzu tak, że czas i odległość są
do siebie proporcjonalne. Wobec tego stwier-
26.9. Bliżej niesprecyzowany układ optyczny
26.10. Ogniskujący układ optyczny
26.11. Zwierciadło elipsoidalne
20
26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
dzenie, że wszystkie czasy są jednakowe, jest
równoważne stwierdzeniu, że całkowita
odległość jest zawsze taka sama. Tak więc suma
dwóch odległości r, i r2 musi być stała. Suma
odległości od dwu punktów jest stała dla
każdego punktu na krzywej zwanej elipsą; w takim
wypadku możemy być więc pewni, że światło
z jednego ogniska będzie dochodzić do drugiego.
Na tej samej zasadzie opiera się skupianie
światła jakiejś gwiazdy. Wielki, prawie
pięciometrowy teleskop na Mount Palomar jest
zbudowany w następujący sposób: Wyobraźmy
sobie gwiazdę odległą o miliony kilometrów.
Chcemy wszystko przychodzące od niej światło zebrać w ognisku. Nie możemy
oczywiście narysować promieni biegnących hen od gwiazdy na całej ich długości, ale
mimo to spróbujmy sprawdzić czy czasy są równe. Wiemy oczywiście, że gdy
różne promienie przechodzą przez płaszczyznę KK' do nich prostopadłą, to
odpowiednie czasy na tej płaszczyźnie są wszystkie sobie równe (rys. 26.12). Promienie
następnie dochodzą do zwierciadła i biegną dalej w kierunku punktu P w
jednakowym czasie. Musimy więc znaleźć krzywą, która ma własność, że suma odległości XX' +
+ X'P' jest stała, niezależna od wyboru punktu X. Prosty sposób jej znalezienia polega
na przedłużeniu linii XX' at do płaszczyzny LL'. Jeżeli spełniane będą warunki, że A'A" =
= A'P', B'B"=B'P', C'C"=C'P' i tak dalej, to otrzymamy żądaną krzywą, ponieważ
wówczas A A' + A''P' = AA' + A' A" będzie naturalnie stałe. Wobec tego nasza krzywa jest
miejscem geometrycznym punktów równo oddalonych od pewnej prostej i od punktu.
Taką krzywą nazywa się parabolą; zwierciadło teleskopu jest więc zbudowane w kształcie
paraboli.
Powyższe przykłady obrazują zasadę, na której można się opierać przy projektowaniu
podobnych przyrządów optycznych. Dokładne krzywe można wyliczyć posługując się
zasadą, że dla uzyskania doskonałego ogniskowania czasy przebiegu muszą być dokładnie
równe dla wszystkich promieni świetlnych i muszą być krótsze niż czasy odpowiadające
jakiemukolwiek innemu sąsiedniemu torowi.
W następnym rozdziale będziemy dalej rozważać ogniskujące urządzenia optyczne,
a teraz zajmiemy się dalszym rozwojem teorii. Śledząc rozwój nowej zasady teoretycznej,
takiej jak zasada najkrótszego czasu, skłonni jesteśmy może sądzić, że jest to coś bardzo
ładnego, nawet zachwycającego, ale zadajemy sobie pytanie: czy w ogóle pomaga ona
w rozumieniu fizyki? Można by wprawdzie odpowiedzieć, że tak, że ułatwia ona
zrozumienie wielu nowych faktów, ale prawdą jest też, że i bez niej można zrozumieć działanie
zwierciadła. Wystarczy znaleźć krzywą, dla której każda płaszczyzna styczna tworzy równe
kąty z dwoma promieniami. Podobnie można zrozumieć działanie soczewki, bowiem
każdy promień, który do niej dochodzi, jest załamywany pod kątem danym przez prawo
Snella. Bez wątpienia twierdzenie o najkrótszym czasie mówi to samo co twierdzenie, że
przy odbiciu kąty są sobie równe, a przy załamaniu sinusy kątów są do siebie propor-
A
A*
'
fi
lx"~—-~
X
x
e'
c
7r
D
p'
~fi
X
X'
1
1
i i
i i.
i
i
i
-l—L'
" A" B" C"D" X"
26.12. Zwierciadło paraboloidalne
26-4. ZASTOSOWANIE ZASADY FERMATA
21
cjonalne. Czy zatem sprawa polega tylko na estetyce, czy też ma głębszy sens? Obie
strony mogą tu wysunąć swoje argumenty.
Sprawa zawiera się w tym, że znaczenie ważnej zasady polega na możności
przewidzenia nowych fak lów.
Łatwo pokazać, że zasada Fermata przewiduje szereg nowych faktów. Weźmy
najpierw trzy ośrodki: szkło, wodę i powietrze; przeprowadźmy doświadczenie nad załamaniem
światła w tych trzech ośrodkach i zmierzmy współczynnik n jednego ośrodka względem
drugiego. Współczynnik załamania powietrza (I) względem wody (2) oznaczmy n12,
a współczynnik załamania powietrza (I) względem szkła (3) oznaczmy n,3.
Przeprowadzając pomiary dla wody względem szkła znaleźlibyśmy inny współczynnik załamania,
który oznaczmy n23. A priori nie ma powodu, aby istniał jakikolwiek związek między
n,,, nl3 i n2i, natomiast zgodnie z zasadą najkrótszego czasu związek taki jest dobrze
określony. Współczynnik ni2 jest stosunkiem prędkości światła w powietrzu do prędkości
światła w wodzie; nI3 jest stosunkiem prędkości światła w wodzie do prędkości światła
w szkle. Możemy więc pozbyć się prędkości w powietrzu otrzymując
n23 = i;2/i>3=—— =—. (26.5)
l',/l.'2 HI2
Przewidujemy zatem, że współczynnik załamania dla nowej pary substancji można
wyliczyć ze współczynników załamania każdej z tych substancji względem powietrza
lub względem próżni. Wzór nasz stanie się bardzo prosty, jeżeli z pomiarów prędkości
światła we wszystkich substancjach otrzymamy charakteryzujące je liczby, mianowicie
ich współczynniki załamania względem próżni oznaczone nt (n, jest prędkością światła
w powietrzu względem prędkości światła w próżni, itd.). Współczynnik załamania dla
jakichkolwiek dwu substancji będzie bowiem wynosił
nu-*=X (26.6)
vj n,
Korzystając tylko z prawa Snella nie mamy podstaw do takich przewidywań*', chociaż
przewidywanie to rzeczywiście się spełnia. Związek (26.5) poznano bardzo wcześnie i
stanowił poważny argument na korzyść zasady najkrótszego czasu.
Innym argumentem na korzyść tej zasady, innym przewidywaniem, jest, że prędkość
światła zmierzona w wodzie okaże się mniejsza od prędkości w powietrzu. Przewidywanie
to ma zupełnie inny charakter niż wszystkie dotychczasowe. Jest ono znakomite,
ponieważ dotychczas mierzyliśmy kąty, teraz zaś mamy przewidywanie teoretyczne,
zupełnie różne od spostrzeżeń, na których podstawie Fermat wyprowadził zasadę
najkrótszego czasu. Okazuje się, że prędkość światła w wodzie jest rzeczywiście mniejsza od
prędkości światła w powietrzu, dokładnie w takim samym stosunku, że daje poprawny
współczynnik załamania!
*' Aczkolwiek można ten wzór wyprowadzić, zakładając dodatkowo, że umieszczenie warstwy
jednej substancji na powierzchni drugiej nie zmieni ostatecznego kąta załamania w tym drugim ośrodku.
22
26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
26-5. Dokładniejsze sformułowanie zasady Fermata
Zasada najkrótszego czasu nie została przez nas wypowiedziana poprawnie i właściwie
powinniśmy sformułować ją nieco bardziej dokładnie. Nie jest w ogóle rzeczą poprawną
nazywanie jej zasadą najkrótszego czasu i tylko dla wygody posługiwaliśmy się dotąd
tym niewłaściwym sformułowaniem. Teraz musimy jednak zobaczyć, jakie jest jej
poprawne brzmienie. Wyobraźmy sobie zwierciadło takie jak na rys. 26.3. Skąd światło wie,
że ma w ogóle biec do zwierciadła? Torem najkrótszego czasu jest oczywiście AB, a więc
można by sądzić, że niekiedy czas jest maksymalny. W naszym przypadku czas jednak
nie jest maksymalny, ponieważ niewątpliwie dłuższego czasu wymagałby tor zakrzywiony!
Poprawne sformułowanie zasady brzmi następująco: promień biegnący po danym torze
ma własność, że jeśli dokonamy w nim jakiejkolwiek niewielkiej zmiany (dajmy na to
przesunięcia o 1 %), na przykład zmieniając miejsce jego padania na zwierciadło albo
kształt krzywej, albo jeszcze coś innego, wówczas w czasie nastąpią zmiany nie rzędu
pierwszego, a tylko drugiego. Innymi słowy, zasada ta mówi, że światło wybiera taki
tor, w którego sąsiedztwie znajduje się wiele innych torów wymagających prawie dokładnie
takiego samego czasu.
Z zasadą najkrótszego czasu związana jest jeszcze inna trudność i to taka, że nigdy
jej nie strawią ludzie, którzy nie lubią teorii tego rodzaju. Przy pomocy teorii Snella możemy
„zrozumieć" zachowanie się światła. Biegnie ono przed siebie, widzi jakąś powierzchnię
i załamuje się, ponieważ na tej powierzchni coś się z nim dzieje. Światło biegnie od jednego
punktu do drugiego i do następnego i tak dalej, więc idea przyczynowości jest tu łatwo
zrozumiała. Zasada najkrótszego czasu jest natomiast zupełnie odmienną filozoficznie
zasadą działania przyrody. Zamiast mówić, że coś jest sprawą przyczynową, że zrobienie
jednej rzeczy powoduje w następstwie coś innego i tak dalej, powyższa zasada głosi, że my
ustalamy pewną sytuację, a światło decyduje, który czas jest najkrótszy lub ekstremalny
i wybiera odpowiedni tor. Me jak światło to robi? Jak wynajduje ten tor? Czyżby
obwąchiwała ono sąsiadujące tory porównując je? Odpowiedź jest twierdząca; światło w
pewnym sensie tak właśnie postępuje. Własność ta jest oczywiście nieznana w optyce
geometrycznej i zawarta jest w pojęciu długości fali; długość fali mówi nam w przybliżeniu
o tym jak daleko do przodu światło musi „ob-
wąchać" tor, aby móc go sprawdzić. W
przypadku światła trudno zjawisko to pokazać w dużej
skali, ponieważ długości jego fali są strasznie
małe. Ale dla fal radiowych, np. fal o
długości 3 cm, odległości, na których dokonuje się
porównywań, są większe. Weźmy źródło fal
radiowych, detektor i szczelinę, jak to
przedstawiono na rys. 26.13. Promienie będą wówczas
biegły oczywiście od S do D, ponieważ jest to
linia prosta, i nic się nie zmieni, jeśli szczelinę
uczynimy węższą. Jeśli jednak przesuniemy
detektor w bok do D', fale nie przebiegną przez
26.13. Przechodzenie fal radiowych przez
wąską szczelinę
26-i DOKŁADNIEJSZE SFORMUŁOWANIE ZASADY FERMATA
23
szeroką szczelinę od S do D', ponieważ porównując szereg pobliskich torów powiedzą
sobie: „Nic z tego, wszystkie tory odpowiadają innym czasom". Jeśli jednak uda się nam
zabezpieczyć promieniowanie przed porównywaniem torów przez przymknięcie szczeliny
aż do utworzenia się bardzo wąskiej szparki, wówczas możliwy będzie tylko jeden tor
i promieniowanie jego właśnie wybierze! W rezultacie więcej promieniowania dotrze do
D przy wąskiej szczelinie niż przy szerokiej!
Ze światłem można zrobić to samo, ale trudno to pokazać w dużej skali. Zjawisko
można jednak zauważyć w następujących prostych warunkach. Poszukajmy jakiegoś
małego jasnego źródła światła, na przykład przezroczystej żarówki w dalekiej latarni
ulicznej albo odbicia słońca w zakrzywionym zderzaku samochodowym. Ustawmy teraz
przed jednym okiem dwa palce tak, aby patrzeć przez szparę między nimi i bardzo łagodnie
starajmy się stłumić światło aż do zera. Zobaczymy, że obraz źródła światła, który przedtem
był małą kropką, stanie się wydłużony i nawet rozciągnie się w długą linię. Przyczyna
zjawiska leży w tym, że palce znajdują się bardzo blisko siebie i światło, które powinno
przyjść po linii prostej, rozkłada się wewnątrz pewnego kąta tak, że wchodząc do oka
przybywa z różnych kierunków. Przypatrując się bardzo uważnie, spostrzeżemy również
boczne maksima i liczne prążki wzdłuż brzegów. Co więcej, całe zjawisko będzie barwne.
Wszystko to wyjaśnimy sobie w odpowiednim czasie, bo teraz służy to tylko do łatwego
wykazania, że światło nie zawsze rozchodzi się po liniach prostych.
26-6. Jak to się wszystko odbywa naprawdę?
Na zakończenie podamy bardzo prymitywny obraz tego, co się właściwie dzieje;
przedstawimy, w jaki sposób cała sprawa naprawdę się odbywa, ze ścisłego, uważanego za
poprawny, punktu widzenia mechaniki kwantowej. Opis nasz będzie oczywiście tylko
jakościowy. Śledząc światło między punktami A i B na rys. 26.3 stwierdzamy, że wcale nie przejawia
ono swej postaci falowej. Wydaje się natomiast że promienie składają się z fotonów
i właściwie one powodują cykanie licznika fotonowego, jeśli się nim posługujemy. Jasność
światła jest proporcjonalna do średniej liczby fotonów przechodzących w ciągu sekundy,
a to, co liczymy, jest prawdopodobieństwem, że foton przedostanie się z punktu A do B.
na przykład padając na zwierciadło. Prawdopodobieństwem tym rządzi następujące
bardzo dziwne prawo. Weźmy jakiś tor i znajdźmy dla niego czas przelotu; utwórzmy
następnie liczbę zespoloną albo narysujmy mały zespolony wektor pe", którego kąt 0
jest proporcjonalny do czasu. Liczba jego obrotów na sekundę określa częstość światła.
Weźmy teraz inny tor, któremu odpowiada jakiś inny czas; jego wektor będzie więc
obrócony o inny kąt — nadal proporcjonalny do czasu. Weźmy teraz wszystkie możliwe tory
' pododawajmy malutkie wektory odpowiadające każdemu z nich; okazuje się, że
prawdopodobieństwo przybycia fotonu jest proporcjonalne do kwadratu długości wektora
wypadkowego!
Pokażmy teraz, jak z tego wynika zasada najkrótszego czasu dla zwierciadła. Rozważmy
Wszystkie promienie, wszelkie możliwe tory ADB, AEB. ACB itd. na rys. 26.3. Tor ADB
daje pewien mały przyczynek, ale dla sąsiedniego toru AEB czas jest zupełnie inny, a więc
24
26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU
jego kąt 0 jest zupełnie inny. Niech punkt C
odpowiada czasowi minimalnemu, to znaczy
takiemu, dla którego czasy się nie zmieniają
przy zmianie toru. Tak więc w miarę zbliżania
się do punktu C(rys. 26.14) czasy najpierw
ulegają zmianie, a potem zaczynają zmieniać
26.14. Sumowanie amplitud prawdopo- się coraz to mniej. Wobec tego wektory, któ-
dobieństwa dla wielu sąsiadujących torów K mamy dodawaCj ustawiają się w
pobliżu C prawie dokładnie pod stałym kątem.
Czas zaczyna potem stopniowo wzrastać, fazy zmieniają się i tak dalej. Wynika z tego
ostatecznie dość zaplątany węzeł. Całkowite prawdopodobieństwo dane jest przez
kwadrat odległości między obu końcami. Tak nagromadzone prawdopodobieństwo
pochodzi prawie w całości z obszaru, w którym wszystkie wektory mają ten sam
kierunek (albo tę samą fazę). Wszystkie przyczynki od torów, których czasy bardzo
się różnią między sobą, znoszą się wzajemnie, ponieważ są skierowane w różne
strony. Dlatego też, gdy zasłonimy zewnętrzne części zwierciadła, będzie ono odbijać
prawie tak samo jak niezasłonięte, ponieważ sprawa polega na usunięciu części diagramu
wewnątrz końców spirali, co powoduje tylko bardzo małą zmianę ilości światła. W taki
to sposób zasadę najkrótszego czasu wiąże się z obrazem fotonowym, w którym
prawdopodobieństwo przyjścia zależy od nagromadzenia opisanych tu wektorów.
■G^O
27
optyka geometryczna
27-1. Wstęp
W rozdziale tym omówimy szereg praktycznych i elementarnych urządzeń, w których
znalazły zastosowanie idee podane w poprzednim rozdziale. Posłużymy się przybliżeniem
zwanym optyką geometryczną. Jest to przybliżenie bardzo użyteczne przy praktycznym
projektowaniu wielu układów i przyrządów optycznych. Optykę geometryczną można
przedstawić w sposób albo bardzo prosty, albo bardzo złożony. Jak to należy rozumieć?
Z jednej strony możemy badać ją tylko powierzchownie, tak aby móc ogólnie projektować
przyrządy posługując się bardzo prostymi regułami, które prawie nie wymagają wyjaśnień,
ponieważ praktycznie są na poziomie szkoły średniej. Z drugiej strony, jeżeli chcemy się
czegoś dowiedzieć o wadach soczewek i o tym podobnych szczegółach, sprawa staje się
bardzo skomplikowana, ponadto tak specjalna, że nie możemy jej tutaj rozważać! Jeżeli
ktoś rzeczywiście stoi przed specjalnym zagadnieniem z dziedziny projektowania soczewek,
wymagającym analizy aberracji, niech poczyta sobie na ten temat, albo korzystając z prawa
załamania niech po prostu nakreśli promienie przechodzące przez różne powierzchnie
(a jak to zrobić - podają podręczniki) i niech znajdzie miejsce wychodzenia promieni, aby
się przekonać czy dają one zadowalający obraz. Dawniej drogę tę uważano za zbyt żmudną,
ale dziś, gdy korzysta się z maszyn liczących, jest to najwłaściwsza droga postępowania.
Wystarczy sformułować zagadnienie od strony matematycznej i wykonać bardzo łatwe
obliczenia dla jednego promienia po drugim. Ostatecznie więc sprawa staje się naprawdę
zupełnie prosta i nie wymaga nowych zasad. Okazuje się ponadto, że reguły optyki zarówno
elementarnej jak i zaawansowanej na ogół nie dają się przenieść do innych dziedzin; nie
ma więc szczególnego powodu, aby się w nie bardzo zagłębiać, choć istnieje jeden ważny
wyjątek.
Najbardziej rozwiniętą, abstrakcyjną teorię optyki geometrycznej opracował
Hamilton i jak się okazało znalazła ona bardzo ważne zastosowanie w mechanice. Prawdę mó-
26
27. OPTYKA GEOMETRYCZNA
, wiąc, ma ona nawet większe znaczenie w mechanice
N*s^^ niż w optyce i dlatego teorię Hamiltona zostawimy
/ ^^-x. jako temat dla wyższej mechaniki analitycznej, któ-
/ ^^n. r3 s'ę stu^'uJe "a starszym roku lub na studiach
f ^^^^ podyplomowych. Uznajmy więc, że optyka geome-
^^^ tryczna przedstawia wartość tylko ze względu na
d siebie samą i przejdźmy teraz do rozważenia
elementarnych własności prostych układów optycz-
27.1 nych. Będziemy je badać opierając się na
zasadach naszkicowanych w poprzednim rozdziale.
Dla naszych celów musimy mieć jeszcze następujący wzór geometryczny: weźmy trójkąt
prostokątny o małej wysokości h i o długiej podstawie d. Jego przeciwprostokątna s (która
będzie nam potrzebna do znalezienia różnicy w czasie między dwiema różnymi drogami)
jest dłuższa niż podstawa (rys. 27.1). O ile mianowicie? Różnicę A=s — d można znaleźć
na wiele sposobów. Jeden z nich jest następujący. Widzimy, że s2 — d2 — h2, czyli (s—d)(s+d) =
= h2. Ale s — d=A, a s + d~2s. A więc
h2
ń~- (27.1)
2s
I to jest cała geometria potrzebna nam do badania w jaki sposób zakrzywione
powierzchnie tworzą obrazy!
27-2. Odległość ogniskowa powierzchni kulistej
Pierwszym i najprostszym układem, który omówimy, jest pojedyncza powierzchnia
załamująca, oddzielająca dwa ośrodki o różnych współczynnikach załamania (rys. 27.2).
Przypadek dowolnych współczynników załamania pozostawiamy do rozważenia
czytelnikowi, ponieważ najważniejszą rzeczą jest zawsze ogólna idea, a nie określona sytuacja,
zagadnienie zaś jest tak proste, że można je rozwiązać w każdym przypadku. Przypuśćmy
27.2 Ogniskowanie przez pojedynczą powierzchnię załamującą
27-? ODLEGŁOŚĆ OGNISKOWA POWIERZCHNI KULISTEJ
27
więc, że w rozpatrywanym przypadku (rys. 27.2) prędkość na lewo wynosi 1, a na prawo
|/n. gdzie n jest współczynnikiem załamania. Światło w szkle porusza się n razy wolniej.
Weźmy teraz punkt O w odległości 5 od przedniej powierzchni szkła i punkt O' w
odległości s' wewnątrz szkła. Chcemy dobrać zakrzywioną powierzchnię w taki sposób,
aby każdy promień z O padający na powierzchnię w dowolnym punkcie P załamywał
się tak, aby biec w kierunku punktu O'. Aby rzeczywiście tak się działo, powierzchnia
musi mieć taki kształt, żeby czas zużywany przez światło na przejście od punktu O do P
był stały i niezależny od punktu P. Czas ten jest równy odległości OP, podzielonej przez
prędkość światła (która tutaj wynosi 1) plus n-0'P, co określa czas przejścia od punktu
P do O'. Warunek ten daje nam równanie wyznaczające powierzchnię. Jako wynik
otrzymujemy, że przekrój tej powierzchni jest skomplikowaną krzywą czwartego stopnia
i czytelnik może spróbować ją obliczyć metodami geometrii analitycznej. Prościej
jest wziąć szczególny przypadek odpowiadający j->oo, ponieważ wówczas szukana
krzywa jest krzywą drugiego stopnia i łatwiej ją rozpoznać. Ciekawe jest porównanie
tej krzywej z parabolą, którą znaleźliśmy dla zwierciadła ogniskującego, gdy światło
przybywało z nieskończoności.
Niełatwo więc utworzyć odpowiednią powierzchnię. Ogniskowanie światła z jednego
punktu w drugim wymaga powierzchni dość skomplikowanej. W praktyce zwykle nie
próbujemy nawet wykonania takich skomplikowanych powierzchni i decydujemy się na
kompromis. Zamiast się starać, aby wszystkie promienie dochodziły do ogniska,
urządzamy się tak, że dochodzą do niego tylko promienie bliskie osi OO'. Dalsze promienie
mogą niestety zbaczać, ponieważ zamiast skomplikowanej idealnej powierzchni bierzemy
powierzchnię kulistą o właściwej krzywiźnie na osi. Praktyczne wykonanie kuli jest tak
dalece łatwiejsze niż innej powierzchni, że warto zobaczyć, co się dzieje z promieniami
padającymi na powierzchnie kuliste przy założeniu, że doskonałe ogniskowanie ma
obowiązywać tylko promienie bliskie osi. Promienie bliskie osi zwiemy niekiedy promieniami
przyosiowymi {paraksjalnymi), a więc przedmiotem analizy będą warunki ogniskowania
promieni przyosiowych. Omówimy potem, jakie błędy biorą się stąd, że nie wszystkie
promienie są zawsze bliskie osi.
Załóżmy więc, że punkt P leży blisko osi i opuśćmy prostopadłą PQ tak, aby wysokość
PQ wynosiła h. Wyobraźmy sobie na chwilę, że powierzchnia stanowi płaszczyznę
przechodzącą przez punkt P. W tym wypadku czas potrzebny do przejścia od punktu O do
P przewyższałby czas przejścia od punktu O do Q, a czas przejścia od punktu P do O'
przewyższałby czas przejścia od punktu Q do O'. Szkło dlatego właśnie musi być
zakrzywione, żeby całkowity nadmiar czasu został skompensowany przez opóźnienie na
drodze od punktu V do Q\ Nadwyżka czasu wzdłuż drogi OP wynosi teraz h2\2s, a
nadwyżka czasu na drugiej drodze wynosi nh2l2s'. Nadwyżka, która musi zostać wyrównana
przez opóźnienie na drodze VQ, jest inna niż w próżni, ponieważ obecnie droga
promienia przechodzi przez ośrodek. Innymi słowy, czas przejścia od punktu V do Q nie
jest po prostu taki jak w powietrzu, ale n razy dłuższy. Nadwyżka opóźnienia na tej
drodze wynosi więc (n-1) VQ. A teraz, ile wynosi VCP. Jeśli punkt C jest środkiem kuli
° promieniu R, to z naszego wzoru wynika, że odległość VQ równa jest h2/2R. W ten
sposób dochodzimy do następującego prawa, które wiąże odległości s i s' i daje nam R,
28
27. OPTYKA GEOMETRYCZNA
promień krzywizny żądanej powierzchni:
(/i2/2s)+(n/i2/2s')=(n -1) h'l2R , (27.2)
czyli
(l/s) + (n/s')=(n-l)/K. (27.3)
Mając dane punkty O i O' i chcąc zogniskować światło z punktu O w punkcie O'
możemy przy pomocy tego wzoru obliczyć żądany promień krzywizny R.
Ciekawe, że ta sama soczewka, o tej samej krzywiinie l/R, będzie ogniskowała i dla
innych odległości; zachodzić to będzie dla dowolnej pary takich odległości, że suma ich
odwrotności, z których jedna pomnożona jest przez n, ma wartość stałą. Dana soczewka
będzie więc ogniskować (jeśli ograniczymy się do promieni przyosiowych) nie tylko dla
pary punktów O i O', ale dla nieskończenie wielu innych par punktów, jeżeli dla nich
(1 /*)+(«/s') będzie pewną stałą charakterystyczną dla soczewki.
Interesujący przypadek zachodzi w szczególności wtedy, gdy s-*oo. Ze wzoru
widzimy, że gdy s rośnie, s' maleje. Innymi słowy, jeśli punkt O oddala się, punkt O'
przybliża się, i odwrotnie. W miarę jak punkt O oddala się do nieskończoności, punkt O'
przybliża się, aż osiągnie pewną odległość wewnątrz szkła, zwaną odległością ogniskową
/'. Promienie padające równolegle spotykają się z osią w odległości /'. Możemy także
wyobrazić sobie sytuację odwrotną. (Pamiętajmy o zasadzie wzajemności: jeśli światło
biegnie od punktu O do O', to oczywiście będzie także biec od punktu O' do O.) Weźmy
zatem źródło światła wewnątrz szkła i zapytajmy, gdzie obecnie znajduje się ognisko.
W szczególności, gdyby źródło światła w szkle znajdowało się w nieskończoności (to samo
zagadnienie co poprzednio), to gdzie na zewnątrz następowałoby ogniskowanie? Szukaną
odległość oznaczamy jako/. Możemy pomyśleć o odwrotnej sytuacji. Jeżeli źródło światła
znajduje się w odległości/, światło przechodzące przez powierzchnię wychodzi na zewnątrz
jako wiązka równoległa. Łatwo znaleźć czemu są równe / i /':
nlf'=(n-l)IR, czyli f'=Rnl(n-\), (27.4)
llf = (n-l)/R, czyli f=R/(n-l). (27.5)
Zauważmy ciekawą rzecz: jeśli podzielimy każdą odległość ogniskową przez
odpowiedni współczynnik załamania, to otrzymamy to samo! Twierdzenie to jest rzeczywiście
ogólne. Warto je zapamiętać, bo jest ono prawdziwe dla każdego dowolnie
skomplikowanego układu soczewek. Twierdzenia tego nie dowiedliśmy w ogólnym przypadku —
stwierdziliśmy po prostu, że jest prawdziwe dla pojedynczej powierzchni. Jest jednak prawdą,
że również w ogólnym przypadku dwie ogniskowe układu są ze sobą związane w
powyższy sposób. Równanie (27.3) bywa czasem pisane w postaci:
(l/s)+ («/»')= 1/T (27.6)
Postać ta jest bardziej użyteczna niż postać (27.3), ponieważ łatwiej zmierzyć / niż
krzywiznę i współczynnik załamania soczewki: jeśli soczewkę po prostu bierzemy z półki,
a nie interesuje nas ani sposób jej projektowania, ani jak została zrobiona, to ważną dla
na« wirllcoćcia iest f. a nie n czy 1, czy też R\
27-2. ODLEGŁOŚĆ OGNISKOWA POWIERZCHNI KULISTEJ
29
Ciekawą będzie sytuacja, gdy s stanie się
mniejsze od/. Cc się wtedy dzieje? Jeśli s<f,
to (l/s) >(!//) ' wobec tego s' jest ujemne; z
naszego równania wynika tylko tyle, że
światło będzie ogniskowane w ujemnej odległości
s', choć nie wiadomo, co to oznacza!
Oznacza to zaś coś bardzo ciekawego i bardzo
dobrze określonego. Innymi słowy, wzór nasz
jest użyteczny i wtedy, gdy pojawiają się liczby
ujemne. Znaczenie tego obrazuje rys. 27.3.
Jeśli poprowadzimy promienie rozchodzące
się z punktu O, to ulegną one załamaniu na
powierzchni, ale nie będą przechodziły przez
ognisko, ponieważ punkt O leży tak blisko,
że są one jeszcze „pozarównoległe".
Rozchodzą się one jednak tak, jak gdyby przyszły
z punktu O' leżącego na zewnątrz szkła. Ten
rodzaj obrazu nazywamy niekiedy obrazem
pozornym. Jeśli światło rzeczywiście
dochodzi do pewnego punktu, to obraz nazywamy
obrazem rzeczywistym. Jeśli zaś światło
pozornie wychodzi z jakiegoś fikcyjnego
punktu różnego od punktu właściwego, mówimy
wówczas o obrazie pozornym. Jeśli więc otrzymujemy ujemne s', oznacza to, że punkt O'
znajduje się po przeciwnej stronie powierzchni, poza tym zaś wszystko jest w
porządku.
Rozważmy teraz inny ciekawy przypadek, gdy A? jest nieskończone; wtedy (\ls) + (n/s') =
=0. Innymi słowy, s'= —ns, co oznacza, że patrząc z ośrodka gęstego do rzadkiego
widzimy punkt w ośrodku rzadkim pozornie n razy głębiej. Możemy także posłużyć się
tym równaniem w odwrotnej sytuacji. Tak więc, gdy patrzymy na płaską powierzchnię
w stronę przedmiotu znajdującego się w pewnej odległości wewnątrz gęstego ośrodka,
będzie się nam wydawać, że światło przychodzi z odległości mniejszej (rys. 27.4). Jeśli
patrzymy z góry na dno basenu pływackiego, to wydaje się on nam płytszy niż w
rzeczywistości i to o czynnik |, który jest odwrotnością współczynnika załamania wody.
W dalszym ciągu moglibyśmy jeszcze omówić działanie zwierciadła kulistego. Kto
Jednak zrozumiał idee tu zawarte, może dalej już liczyć sobie sam. Pozostawiamy więc
czytelnikowi wyprowadzenie wzoru dla zwierciadła kulistego, nadmieniając tylko, że
°brze jest przyjąć pewne umowy tyczące się rozważanych odległości:
•• Odległość, przedmiotu s jest dodatnia, jeśli punkt O leży na lewo od powierzchni.
2- Odległość obrazu s' jest dodatnia, jeśli punkt O' leży na prawo od powierzchni.
-■ Promień krzywizny powierzchni jest dodatni, jeśli jej środek leży na prawo od
Powierzchni.
Na rysunku 27.2, na przykład, wielkości s, s' oraz R są wielkościami dodatnimi, na
27.3. Obraz urojony
powietrze
szkło
27.4. Płaska powierzchnia odtwarza w
punkcie O światło z punktu O'
30
27. OPTYKA GEOMETRYCZNA
rys. 27.3 wielkości s i R są dodatnie, natomiast s' jest ujemne. Jeżeli weźmiemy
powierzchnię wklęsłą i po prostu przyjmiemy, że R jest wielkością ujemną, nasz wzór (27.3) nadal
będzie dawał poprawny wynik.
Gdybyśmy korzystali z powyższych konwencji przy wyprowadzeniu odpowiedniego
wzoru dla zwierciadła, to okazałoby się, że poprawny wzór otrzymamy przyjmując
wszędzie we wzorze (27.3) n = — 1! (Tak jak gdyby ośrodek za zwierciadłem miał
współczynnik załamania równy —1!)
Wywód wzoru (27.3) przy pomocy zasady najkrótszego czasu jest prosty i elegancki,
ale można oczywiście wyprowadzić go przy pomocy prawa Snella, pamiętając o tym, że
sinusy kątów można zastąpić przez same kąty, ponieważ są one bardzo małe.
27-3. Odległość ogniskowa soczewki
Rozważmy teraz inną sytuację mającą znaczenie praktyczne. Większość używanych
soczewek ma dwie powierzchnie zakrzywione, a nie tylko jedną. Jak dalece zmienia to
sprawę? Załóżmy, że mamy dwie powierzchnie o różnej krzywiźnie, a przestrzeń między
nimi wypełniona jest szkłem (rys. 27.5). Chcemy zbadać kwestię ogniskowania między
punktem O, a zmiennym punktem O'. Jak to zrobić? Odpowiedź jest następująca:
Korzystamy najpierw ze wzoru (27.3) dla pierwszej powierzchni, zapominając na razie o
drugiej. Wzór ten powie nam, że światło rozchodzące się z punktu O pozornie zbiega się
lub rozbiega (zależnie od znaku s') z pewnego innego punktu, np. O'. Rozważmy
następnie nowe zagadnienie. Mamy drugą powierzchnię, oddzielającą szkło od powietrza,
wewnątrz której promienie schodzą się w kierunku pewnego punktu O'. W którym miejscu
zejdą się one naprawdę? Korzystamy ponownie z tego samego wzoru i stwierdzamy, że
zbiegają się one w punkcie O". Jeśli zajdzie więc potrzeba, możemy tak przejść kolejno
75 powierzchni, korzystając raz po raz z tego samego wzoru!
Istnieją pewne bardzo specjalne wzory, które mogłyby nam zaoszczędzić sporo trudu
w tych kilku wypadkach w naszym życiu, w których zajdzie potrzeba śledzenia biegu
światła przez 5 powierzchni. Jeżeli taki problem w ogóle się pojawi, to prościej jednak
prześledzić bieg światła przez 5 powierzchni, niż zapamiętywać mnóstwo wzorów, gdyż
może nigdy nie będziemy musieli śledzić biegu światła przez jakieś powierzchnie!
W każdym razie zasada jest taka, że przy
przechodzeniu światła przez jakąś powierz-
27.5. Tworzenie obrazu w soczewce dwu- chnię znajdujemy nowe położenie punktu
powierzchniowej ogniskowania; bierzemy ten punkt za punkt
wyjściowy dla następnej powierzchni, i tak
dalej. Aby to wszystko naprawdę móc
policzyć, potrzebne jest uogólnienie wzoru (27.3)
na przypadek, gdy mamy dwa różne
współczynniki załamania, n, i n2, a nie tylko n.
Chodzi o to, że na drugiej powierzchni
przechodzimy od współczynnika n do 1, a nie od
27-3. ODLEGŁOŚĆ OGNISKOWA SOCZEWKI
31
1 do n, a poza tym w wielu układach
występuje więcej niż jeden rodzaj szkła, tak że
współczynniki załamania są równe »,, n2 ...
Nie trudno wtedy udowodnić, że takie
uogólnienie wzoru (27.3) ma postać
(it,/s)+(n2/s') = («2-»i)/1- (27.7)
Wyjątkowo prosty jest szczególny przypadek,
w którym obie powierzchnie leżą tak blisko
siebie, że możemy pominąć małe błędy
pochodzące od grubości soczewki. Narysujmy
soczewkę tak, jak pokazano na rys. 27.6 i zadajmy sobie pytanie: w jaki sposób musi być
ona zbudowana, aby w punkcie O' ogniskować światło z punktu O? Załóżmy, że światło
pada dokładnie na brzeg soczewki, w punkcie P. Nadmiar czasu przy przejściu od punktu
O do O' wynosi wówczas (<nlh2j2s) + (nlh2j2s'), jeśli pominiemy na chwilę grubość T
szkła o względnym współczynniku załamania n2. Aby czas przejścia na wprost stał się
równy czasowi przejścia drogą OPO', musimy wstawić kawałek szkła o takiej grubości
T w środku, aby opóźnienie wywołane przejściem przez szkło wystarczało do
zrównoważenia obliczonego nadmiaru czasu. Wobec tego grubość soczewki w środku musi być
dana przez związek:
(«1/i2/2s) + («,fi2/2s') = («2-n1)r. (27.8)
Możemy także wyrazić T przy pomocy promieni Rt i R2 obu powierzchni. Mając w
pamięci naszą konwencję 3, znajdujemy dla R,<R2 (soczewka wypukła)
T = (h2l2R,)-(h2l2R2), (27.9)
stąd otrzymujemy ostatecznie:
(nlls) + (nlls') = (n2-nl)(\IRl-\IR1). (27.10)
Zauważmy teraz znowu, że jeżeli jeden z punktów znajdzie się w nieskończoności, to drugi
będzie się znajdował w odległości zwanej odległością ogniskową /. Jest ona określona
wzorem:
!//=(«-!)(1/K,-1/R2), (27.11)
gdzie n = n2ln,.
Weźmiemy teraz przypadek odwrotny, w którym i ucieka do nieskończoności. Widzimy,
że s' znajdzie się teraz w odległości ogniskowej/', przy czym obie odległości ogniskowe
są tym razem równe. (Jest to jeszcze jeden szczególny przypadek ogólnej reguły, że
stosunek dwu odległości ogniskowych jest równy stosunkowi współczynników załamania
dwu ośrodków, w których promienie ulegają ogniskowaniu. W tym szczególnym układzie
optycznym początkowy i końcowy współczynnik jest taki sam i obie ogniskowe są równe.)
Zapomnijmy na chwilę o naszym wzorze na odległość ogniskową. Gdybyśmy kupili
zaprojektowaną przez kogoś soczewkę o pewnych promieniach krzywizny i o pewnym
27.6. Cienka soczewka o dwu dodatnich
promieniach
32
27. OPTYKA GEOMETRYCZNA
współczynniku załamania, moglibyśmy zmierzyć odległość ogniskową poszukując na
przykład miejsca, w którym ogniskuje się punkt z nieskończoności.
Mając już odległość ogniskową byłoby lepiej zapisać nasze równanie korzystając
z niej bezpośrednio. Wówczas wzór nasz przybiera postać:
(l/s)+(l/s') = (l//)-
(27.12)
Zobaczymy teraz, jak się tym wzorem posługiwać i co z niego w różnych warunkach
wynika. Przede wszystkim wynika z niego, że jeżeli s jest nieskończone, to s' jest równe
/, i odwrotnie. Oznacza to, że wiązka równoległa ogniskuje się w odległości /, co stanowi
właściwie definicję f. Drugą ciekawą rzeczą, o której się dowiadujemy z wzoru, jest to,
że oba punkty przesuwają się w tym samym kierunku. Jeżeli jeden z nich przesuwa się
w prawo, to z drugim dzieje się to samo. Inną rzeczą, o której mówi nasz wzór, jest to,
że s i s' są równe wtedy, gdy oba wynoszą 2/. Innymi słowy, jeśli szukamy sytuacji
wykazującej symetrię względem soczewki, okazuje się, że ogniskowanie z obu stron
następuje w odległości 2/
27-4. Powiększanie
Na razie rozważaliśmy tylko działanie ogniskujące dla punktów na osi. Teraz zaś
rozważymy tworzenie się obrazów przedmiotów, które nie leżą dokładnie na osi, ale
w jej pobliżu. Chodzi nam teraz o zrozumienie zjawiska powiększania. Ustawmy soczewkę
tak, aby światło z niewielkiego włókna zogniskować „punktowo" na ekranie. Zauważymy
wówczas na nim „obraz" włókna, tyle że rozmiarów większych lub mniejszych od
prawdziwego przedmiotu. Światło musi więc przybywać do ogniska z każdego punktu włókna.
Aby to lepiej zrozumieć, zbadajmy cienki układ soczewek, pokazany schematycznie na
rys. 27.7. Wiemy już, że:
1. Dowolny promień wchodzący równolegle do osi soczewki z jednej jej strony,
podąża do pewnego szczególnego punktu zwanego ogniskiem, położonego po .drugiej stronie
soczewki w odległości /.
2. Dowolny promień przybywający do soczewki z ogniska po jednej jej stronie
wychodzi z drugiej strony równolegle do osi.
27.7. Geometria tworzenia obrazu przez cienką soczewkę
p
y
V x (A
f
y
X
T
Q
NA
X'
W
f "\
y
s
27-4 POWIĘKSZANIE
33
To jest wszystko, co nam będzie potrzebne do geometrycznego wyprowadzenia wzoru
(27.12). Załóżmy, że przedmiot leży w pewnej odległości x od ogniska; niech jego
wysokość wynosi y. Wiemy, że jeden z promieni, oznaczmy go PQ, załamie się tak,
że przejdzie przez ognisko R po drugiej stronie soczewki. Jeżeli soczewka będzie w ogóle
ogniskować punkt P, to łatwo znaleźć, gdzie to nastąpi, badając po prostu bieg jakiegoś
innego promienia. Nowe ognisko znajdzie się bowiem w punkcie przecięcia obu
promieni. Musimy tylko dobrze pomyśleć, jak znaleźć dokładny kierunek jeszcze jednego
promienia. Przypomnijmy sobie, że promień równoległy do osi przechodzi przez ognisko
i vice versa: promień przechodzący przez ognisko będzie wychodził równolegle do osi!
Prowadzimy więc promień PT przez punkt U. (Rzeczywiste promienie, ulegające
ogniskowaniu, powinny być co prawda znacznie bliżej osi niż te dwa, które poprowadziliśmy,
ale ponieważ trudniej je przedstawić, więc uznajmy, że te, które narysowaliśmy, są jeszcze
dobre.) Ponieważ będzie on wychodził równolegle do osi, prowadzimy prostą TS
równolegle do XW. Punkt przecięcia 5 wyznacza poszukiwany punkt. Określać on będzie
poprawne położenie i poprawną wysokość obrazu. Oznaczmy jego wysokość przez y', a
odległość od ogniska x'. Teraz już możemy wyprowadzić wzór soczewkowy. Korzystając
z podobnych trójkątów PVU i TXU znajdujemy:
-= - (27.13)
/ x
Podobnie, z trójkątów SWR i QXR otrzymujemy:
-, = 4 <2714>
x f
Rozwiązując każdy z tych wzorów względem y'/y znajdujemy, że
"-AJ-. (27-15)
y f x
Równanie (27.15) jest słynnym wzorem soczewkowym; zawiera on wszystko, co trzeba
wiedzieć o soczewkach: daje nam powiększenie y'jy wyrażone przez odległości obrazu
i przedmiotu od ognisk i odległości ogniskowe. Wiąże on także dwie odległości x i x'
z ogniskową /:
xx'=/2. (27.16)
Wzór ten jest w praktyce znacznie wygodniejszy niż równanie (27.12). Czytelnik łatwo
może pokazać, że jeśli s~x+f i s'=x'+f, równanie (27.12) będzie równoważne
równaniu (27.16).
27-5. Soczewki złożone
Opiszemy teraz krótko, bez wyprowadzenia, ogólny wynik dla większej liczby
soczewek. Jak w ogóle możemy analizować układ wielu soczewek? Sprawa jest prosta.
34
27. OPTYKA GEOMETRYCZNA
1 2
27.8. Ilustracja płaszczyzn głównych układu optycznego
Rozpoczynamy od jakiegoś przedmiotu i obliczamy, gdzie znajduje się jego obraz dla
pierwszej soczewki. Posługujemy się wzorem (27.16) lub (27.12), lub innym im
równoważnym, lub też robimy wykresy. Znaleziony w ten sposób obraz przedmiotu traktujemy
następnie jako przedmiot dla następnej soczewki o dowolnej ogniskowej i posługujemy
się nią do ponownego znalezienia obrazu. Przechodzimy tak po prostu przez cały ciąg
soczewek. Oto i wszystko, co można powiedzieć. Nie ma tu w zasadzie niczego nowego,
nie musimy się więc w te sprawy zagłębiać. Ciekawy jest jednak ostateczny wynik
działania dowolnego układu soczewek na światło, które wchodzi do układu z jakiegoś
ośrodka zewnętrznego i wychodzi z układu z powrotem do tego samego ośrodka. Ośrodkiem
tym może być np. powietrze. Dowolny przyrząd optyczny — teleskop lub mikroskop
zawierający dowolną liczbę soczewek i zwierciadeł — ma następującą własność.
Istnieją w nim dwie płaszczyzny, zwane płaszczyznami głównymi układu (płaszczyzny te
leżą blisko pierwszej powierzchni pierwszej soczewki i ostatniej powierzchni ostatniej
soczewki). Mają one następujące własności: 1. Światło wchodzące do układu równolegle
do osi z jednej jego strony wychodząc skupia się w pewnym ognisku odległym od drugiej
płaszczyzny o odległość ogniskową, tak jak gdyby układ stanowił cienką soczewkę
ustawioną w tej właśnie płaszczyźnie. 2. Wiązka równoległa do osi, wchodząca z drugiej
strony układu, skupia się w ognisku oddalonym o tę samą odległość / od pierwszej
płaszczyzny głównej, znowu tak jak gdyby była w niej ustawiona cienka soczewka (patrz
rys. 27.8).
Jeśli tak jak poprzednio mierzymy odległości x i x oraz y i y', wzór (27.16) napisany
dla cienkiej soczewki będzie oczywiście zupełnie ogólny, byle tylko mierzyć ogniskowe od
płaszczyzn głównych, a nie od środka soczewki. Okazuje się, że dla cienkiej soczewki,
płaszczyzny główne się ze sobą pokrywają. Sprawa wygląda tak, jak gdyby można było
rozciąć cienką soczewkę w środku i rozsunąć, nie zauważając, że została ona rozdzielona.
Każdy wchodzący promień wyskakuje z przeciwnej strony drugiej płaszczyzny głównej,
dokładnie w tym samym punkcie, w którym przeszedł on przez płaszczyznę pierwszą!
Płaszczyzny główne i ogniskowe można znaleźć metodą albo doświadczalną, albo
rachunkową i daje to nam cały zbiór własności układu optycznego. Ciekawe, że gdy się
już uporamy z takim wielkim i skomplikowanym układem optycznym, wynik wcale nie
będzie skomplikowany.
27-6 ABERRACJE
35
27-6. Aberracje
Zanim zdążymy wpaść w zachwyt nad tym, jakie to cudowne są te soczewki, musimy
pospieszyć się i dodać, że istnieje tu jednak poważne ograniczenie. Pochodzi ono stąd,
że sami ściśle mówiąc ograniczyliśmy się do promieni przyosiowych. Rzeczywiste
soczewki o skończonych rozmiarach będą na ogół wykazywać aberracje. I tak na przykład
promień, który leży na osi, oczywiście przechodzi dokładnie przez ognisko, a promień,
który jest bardzo bliski osi, nadal będzie z bardzo dobrym przybliżeniem przechodził
przez ognisko. Ale w miarę oddalania się od osi promienie zaczynają się odchylać
od ogniska i może nawet wcale do niego nie dojdą, a promień przechodzący w pobliżu
górnej krawędzi soczewki załamie się do dołu i minie ognisko w sporej odległości. W ten
sposób, zamiast otrzymać obraz punktowy, otrzymamy plamę. Zjawisko to zwiemy
aberracją sferyczną, ponieważ jest własnością powierzchni kulistych, które zastępują
powierzchnie właściwego kształtu. Aberrację można poprawić dla każdej określonej
odległości przedmiotu, zmieniając kształt powierzchni soczewki albo biorąc szereg
soczewek ułożonych tak, że aberracje poszczególnych elementów układu będą się wzajemnie
znosić.
Soczewki wykazują jeszcze inną wadę: światło o różnych barwach ma różne prędkości,
a co za tym idzie — różne współczynniki załamania w szkle i wobec tego odległość
ogniskowa danej soczewki jest różna dla różnych barw. Obraz białego punktu jest więc barwny,
ponieważ gdy osiągniemy ogniskowanie się światła czerwonego, niebieskie wypadnie
poza ogniskiem, i odwrotnie. Zjawisko to nazywamy aberracją chromatyczną.
Istnieją jeszcze inne wady soczewek. Dla przedmiotu znajdującego się poza osią
ogniskowanie nie jest doskonałe, szczególnie jeżeli ognisko leży dostatecznie daleko od osi.
Najłatwiej sprawdzić to najpierw ogniskując światło w soczewce, a następnie przechylając ją
tak, aby promienie padały pod dużym kątem względem osi Tworzący się wówczas obraz
będzie na ogół zupełnie nieostry i można wcale nie znaleźć takiego miejsca, w którym
będzie dobre ogniskowanie. Soczewki mają więc różne wady, które optyk-projektant
stara się usunąć, używając wielu soczewek do wzajemnego wyrównywania tych wad.
Jaką dokładność jesteśmy w stanie osiągnąć? Czy jest możliwe zbudowanie
bezwzględnie doskonałego układu optycznego? Wyobraźmy sobie, że zbudowaliśmy układ optyczny,
który z założenia skupia światło dokładnie w punkcie. Jak znaleźć warunek na doskonałość
układu, posługując się zasadą najkrótszego czasu? Układ będzie zaopatrzony w jakiś
rodzaj wejściowego otworu dla światła. Weźmy najdalszy od osi promień, mogący trafić
do ogniska (oczywiście, jeśli układ jest doskonały); wówczas czasy dla wszystkich innych
promieni są dokładnie takie same. Ale nie ma rzeczy doskonałych, tak że powstaje
pytanie, jakim błędem może być obarczony czas dla tego promienia, aby nie potrzeba było
oprowadzać dalszych poprawek? To zależy od tego, jak doskonały chcemy mieć obraz.
Ale załóżmy, że» chcemy mieć obraz tak doskonały, jak tylko można. Przypuszczamy
oczywiście, że trzeba, aby czas przebiegu każdego promienia był prawie taki sam, tak
dalece jak tylko to jest możliwe. Okazuje się jednak, że nie jest to możliwe; poczynając
°d pewnego punktu staramy się zrobić coś, co przekracza możliwości optyki geometrycznej,
Ponieważ sama teoria optyki geometrycznej już tam nie działa!
36
27. OPTYKA GEOMETRYCZNA
Pamiętajmy, że zasada najkrótszego czasu nie jest dokładnym sformułowaniem,
inaczej niż zasada zachowania energii, czy też zasada zachowania pędu. Zasada najkrótszego
czasu jest tylko przybliżeniem i warto wiedzieć, jak wielki błąd można popełnić, nie
powodując jeszcze widocznych różnic. Odpowiedzią na to jest stwierdzenie, że jeśli różnica
w czasie między promieniem maksymalnym, czyli „najgorszym", tzn. najbardziej
zewnętrznym, a promieniem środkowym jest mniejsza niż w przybliżeniu okres
odpowiadający jednemu drganiu światła, wówczas dalsze poprawianie nie ma sensu. Światło jest
obiektem drgającym z określoną częstością, związaną z długością fali, i jeżeli zadbamy
o to, aby różnice czasów dla różnych promieni były mniejsze niż czas rzędu okresu,
wówczas nie ma celu dalej zwiększać dokładności.
27-7. Zdolność rozdzielcza
Inną, bardzo ciekawą kwestią z punktu widzenia zastosowań technicznych, dotyczącą
wszystkich przyrządów optycznych, jest sprawa ich zdolności rozdzielczej. Mikroskop
musimy zbudować tak, aby rzeczywiście widzieć oglądane pod nim przedmioty.
Oznacza to na przykład, że jeżeli bakteria ma dwa punkciki, to w powiększeniu chcemy
naprawdę zobaczyć na niej dwie kropki. Można by sądzić, że sprawa polega tylko na
uzyskaniu dostatecznego powiększenia. Możemy przecież zawsze dodawać nowe
soczewki i uzyskiwać coraz to większe powiększenia, a przy pewnej pomysłowości
konstruktorów znieść wszystkie aberracje, sferyczne i chromatyczne. Mogłoby się więc wydawać,
iż nie ma powodu, który uniemożliwiłby nam otrzymywanie coraz to większych
powiększeń obrazu. Tymczasem ograniczenia mikroskopu polegają nie na trudnościach
zbudowania soczewki, która powiększa więcej niż 2000 razy. Możemy zbudować układ
soczewek powiększający 10 000-krotnie, ale mimo to nie będziemy mogli zobaczyć dwóch
punktów, leżących zbyt blisko siebie. Powodem są ograniczenia optyki geometrycznej, czyli
fakt, że zasada najkrótszego czasu nie jest ścisła. Regułę określającą jak daleko od siebie
muszą znajdować się dwa punkty, aby ich obrazy pojawiły się oddzielnie, można
wyprowadzić w piękny sposób uwzględniający, jaki czas jest potrzebny dla przebiegu różnych
promieni. Pomińmy teraz aberracje i wyobraźmy sobie, że dla pewnego punktu P (rys.
27.9) wszystkie promienie zużyją ten sam czas na przejście od przedmiotu do obrazu T.
(Nie jest to oczywiście prawdą, ponieważ układ nie jest doskonały, ale to już inna sprawa.)
27.9. Zdolność rozdzielcza układu optycznego
R
r-7. ZDOLNOŚĆ ROZDZIELCZA
37
Weźmy teraz inny pobliski punkt, P', i zapytajmy, czy jego obraz będzie oddzielony od
obrazu T,cty, innymi słowy, możemy je od siebie odróżnić? Zgodnie z zasadami optyki
geometrycznej powinny się pojawić dwa obrazy punktowe, ale to, co naprawdę zobaczymy,
może być tak rozmyte, że nie będziemy w stanie stwierdzić obecności dwóch punktów.
Drugi punkt będzie zogniskowany w punkcie wyraźnie różnym od pierwszego, jeżeli dwóm
skrajnym promieniom P'ST'i P'RTpo obu stronach dużego otworu soczewki będą
odpowiadały nierówne czasy przejścia od obu możliwych punktów przedmiotów do danego punktu-
-obrazu. Dlaczego? Gdyby bowiem czasy przebiegu były równe, oczywiście oba punkty
zostałyby zogniskowane w jednym miejscu. Czasy więc nie mogą być równe. Jak bardzo
muszą się one jednak różnić od siebie, abyśmy mogli stwierdzić, że dwa punkty nie
ogniskują się razem i możemy rozróżnić ich punkty-obrazy? Ogólne prawidło dotyczące
zdolności rozdzielczej każdego przyrządu optycznego jest następujące: Dwa różne źródła
punktowe mogą być rozdzielone tylko wówczas, jeżeli pierwsze źródło jest zogniskowane
w takim punkcie, że czasy przebiegu promieni skrajnych od drugiego źródła do tego
punktu-obrazu różnią się o więcej niż jeden okres od czasów przebiegu tych promieni
do drugiego punktu-obrazu. Różnica czasów przebiegu do fałszywego ogniska dla
promienia górnego i dolnego (na rys. 27.9) musi więc przewyższać pewną wielkość, mianowicie
w przybliżeniu okres drgań światła
l2-*,>l/v, (27.17)
gdzie v jest częstością światła (czyli liczbą drgań na sekundę albo prędkością podzieloną
przez długość fali). Niech odległość dwu punktów wynosi D; kąt widzenia soczewki
oznaczymy jako 0. Można wówczas pokazać, że wzór (27.17) jest dokładnie równoważny
twierdzeniu, że D musi być większe od Xjn sin 0, gdzie n jest współczynnikiem załamania
w punkcie P, a ). jest długością fali. Najmniejsze przedmioty, jakie możemy zauważyć,
mają więc w przybliżeniu rozmiary długości fali świetlnej. Odpowiedni wzór istnieje
i dla teleskopów. Mówi on nam o najmniejszej różnicy w kącie widzenia dwu gwiazd,
którą można jeszcze stwierdzić*'.
*' Kąt wynosi w przybliżeniu XjD, gdzie D jest średnicą soczewki. Czy widać, skąd się to bierze?
28
promieniowanie elektromagnetyczne
28-1. Elektromagnetyzm
Najbardziej dramatyczne chwile w rozwoju fizyki to te, w których następują wielkie
syntezy. Nagle okazuje się, że zjawiska, które poprzednio sprawiały wrażenie nie
związanych ze sobą, są różnymi aspektami tego samego procesu. Historia fizyki jest historią
takich właśnie syntez, a podstawą sukcesu fizyki jako nauki jest głównie to, że jesteśmy
zdolni do przeprowadzania takich syntez.
Najbardziej chyba dramatyczna chwila w rozwoju fizyki w XIX w. przydarzyła się
gdzieś w siódmym dziesiątku lat owego wieku J. C. Maxwellowi, kiedy zestawiał prawa
elektryczności i magnetyzmu z prawami zachowania się światła. Wynikiem tego było
częściowe poznanie własności światła, owego pradawnego i subtelnego żywiołu, tak ważnego
i tajemniczego, że przypisaniu Księgi Rodzaju konieczne było ułożenie dla niego specjalnego
aktu stwórczego. Maxwell dokonawszy swego odkrycia mógł powiedzieć: .,Niech będzie
elektryczność i magnetyzm, i niech się stanie światło!"
Ten kulminacyjny moment był od dawna przygotowany przez stopniowe odkrywanie
i rozwijanie praw elektryczności i magnetyzmu. Historię tę zachowamy do szczegółowego
omówienia w drugim tomie. Pokrótce mówiąc jest ona następująca. Odkrywane stopniowo
własności elektryczności i magnetyzmu, elektrycznych sił przyciągania i odpychania,
a także sił magnetycznych, doprowadziły do wniosku, że siły te są wprawdzie
skomplikowane, ale wszystkie zanikają jak odwrotność kwadratu odległości. W dostatecznie dużych
odległościach wpływ jednego układu ładunków na drugi jest bardzo mały. Maxwell
zauważył, że odkryte przed nim równania i prawa były wzajemnie niezgodne, jeśli chciało się
je zebrać razem. Aby uzyskać wewnętrzną zgodność całego układu, musiał on dopisać
do swoich równań dodatkowy wyraz. Wyraz ten pozwolił wysnuć zaskakujący wniosek.
ELEKTROMAGNETYZM
39
że pola elektryczne i magnetyczne będą częściowo zanikać znacznie wolniej niż odwrotność
kwadratu odległości, a mianowicie jak odwrotność jej pierwszej potęgi! Tak więc Maxwell
zrozumiał, ze prądy elektryczne w jednym miejscu mogą wpływać na inne odległe ładunki
i przepowiedział wynikające stąd skutki, z którymi dzisiaj stykamy się na co dzień:
transmisje radiowe, radar i tak dalej.
To przecież cudownie, że kogoś mówiącego w Europie można usłyszeć w Los Angeles,
w odległości tysięcy kilometrów, wyłącznie dzięki oddziaływaniom elektrycznym Jak do
tego może dochodzić? Dzieje się tak, ponieważ pola zmieniają się nie jak odwrotność
kwadratu odległości, ale tylko jak odwrotność jej pierwszej potęgi. Stwierdzono wreszcie,
że nawet samo światło stanowi rozciągające się na wielkich odległościach oddziaływanie
elektryczne i magnetyczne wytwarzane przez niewiarygodnie szybkie drgania elektronów
w atomach. Wszystkie te zjawiska łączymy w pojęciu promieniowania lub bardziej dokładnie
— promieniowania elektromagnetycznego, ponieważ istnieją jeszcze, jeden czy dwa, inne
rodzaje promieniowania. Prawie jednak zawsze słowo promieniowanie oznacza
promieniowanie elektromagnetyczne.
Tak oto cały wszechświat jest wewnętrznie powiązany. Ruchy atomów odległej gwiazdy
wywierają z tej wielkiej odległości wpływ wystarczający na to, aby wprawić w ruch elektrony
w naszym oku. W ten sposób dowiadujemy się czegoś o gwiazdach. Gdyby to prawo
nie istniało, bylibyśmy dosłownie odcięci od świata zewnętrznego! Tymczasem drgania
elektryczne w galaktyce odległej o 5 miliardów lat świetlnych — w najdalszym znalezionym
dotąd obiekcie — mogą jeszcze w znaczny i wykrywalny sposób wpływać na prądy w
wielkim „półmisku" radioteleskopu. Właśnie dzięki temu dostrzegamy gwiazdy i galaktyki.
Takie oto ważne zjawisko będzie przedmiotem rozważań obecnego rozdziału. Na
wstępie naszego kursu fizyki naszkicowaliśmy ogólny obr-az świata, a ponieważ teraz
jesteśmy już lepiej przygotowani do zrozumienia niektórych jego aspektów, znowu się nimi
zajmiemy, ale już bardziej szczegółowo. Zacznijmy od opisu stanu, w jakim się znajdowała
fizyka w końcu XIX w. Cała ówczesna wiedza o prawach podstawowych dawała się zebrać
następująco.
Przede wszystkim istniały prawa dla sił; jedną z sił opisywało prawo ciążenia, które
już pisaliśmy wiele razy: siłę działającą na ciało o masie m, pochodzącą od innego ciała
o masie M, opisuje wzór:
F = GmMe,!r2, (28.1)
gdzie er jest wektorem jednostkowym, skierowanym od m do M, a /-jest odległością między
nimi.
Dalej, prawa elektryczności i magnetyzmu, takie jak je znano w końcu XIX w., były
następujące: siły elektryczne działające na ładunek q mogą być opisane za pomocą dwu pól
oznaczonych E i B oraz za pomocą prędkości v ładunku q równaniem
»
F=g(E+vxB). (28.2)
Aby uzupełnić to prawo, musimy jeszcze dopisać wzory na pola E i B w określonych
warunkach. Jeśli ładunków jest więcej, zarówno pole E, jak i B jest sumą przyczynków
pochodzących od poszczególnych ładunków. Jeśli więc uda się nam znaleźć pola E i B wytwarzane
40
28. PROMIENIOWANIE ELEKTROMAGNETYCZNE
przez pojedynczy ładunek, wystarczy potem dodać wszystkie przyczynki od wszystkich
ładunków we wszechświecie, aby otrzymać całkowite pola E i B! Na tym polega zasada
superpozycji.
Jak wygląda wzór na pole elektryczne i magnetyczne wytwarzane przez pojedynczy
ładunek? Okazuje się, że sprawa jest bardzo skomplikowana i żeby ją zrozumieć, potrzeba
długich studiów i pewnej wprawy. Ale nie to jest istotne. Napiszemy teraz wspomniane
prawo po to tylko, aby czytelnik dostrzegł w nim piękno przyrody, polegające na tym, że
można zebrać całą podstawową wiedzę na jednej kartce papieru, używając zapisu, z którym
już jesteśmy obyci. Prawo dla pola pojedynczego ładunku jest, o ile wiemy, pełne i ścisłe
(nie biorąc pod uwagę mechaniki kwantowej), ale ma postać raczej skomplikowaną.
Nie będziemy teraz badać wszystkich jego aspektów. Piszemy je po to tylko, aby mieć
o nim pojęcie, aby pokazać, że w ogóle można je napisać i że już teraz możemy zobaczyć,
jak ono wygląda. W istocie najwygodniej zapisywać ścisłe prawa elektryczności i
magnetyzmu nie tak, jak to teraz zrobimy, ale przy pomocy tak zwanych równań pola, które
poznamy lepiej w tomie drugim. Ich matematyczny zapis jest jednak odmienny i nowy i
dlatego wypiszemy nasze prawo w postaci niewygodnej dla rachunków, ale za to w znanym
już zapisie.
Pole elektryczne E dane jest wzorem
q Te,., r d(t,.\ 1 d2 1
Co mówią nam poszczególne wyrazy wzoru? Weźmy pierwszy wyraz: E= —qer-/4ne0r'2.
Oczywiście, jest to znane nam już prawo Coulomba: q oznacza ładunek wytwarzający
pole, er. — wektor jednostkowy w kierunku od punktu P, w którym mierzymy pole E,
r zaś odległość od punktu P do ładunku q. Prawo Coulomba jest jednak błędne. Odkrycia
XIX w. pokazały, że oddziaływania nie mogą przenosić się szybciej niż z pewną
podstawową szybkością c, którą obecnie nazywamy prędkością światła. Prawo Coulomba opisywane
przez pierwszy tylko wyraz jest niepoprawne, nie tylko dlatego, że nie można wiedzieć,
gdzie ładunek się teraz znajduje i w jakiej jest teraz odległości, ale także dlatego, że wpływać
na pole w danym miejscu i czasie może jedynie zachowanie się ładunków w przeszłości.
Jak odległa ma być ta przeszłość? Opóźnieniem w czasie, czyli tak zwaną retardacją,
nazywamy czas potrzebny na to, aby z prędkością c dostać się od ładunku od punktu pola P.
Opóźnienie wynosi więc r'/c.
Aby uwzględnić to opóźnienie w czasie, stawiamy przy r znak' („prim"), oznaczający
odległość w chwili, gdy sygnał przybywający teraz do P opuszczał ładunek q. Wyobraźmy sobie
na chwilę, że ładunek niesie światło, które może przybyć do punktu P tylko z prędkością c.
Gdy zatem spoglądamy na ładunek q, oczywiście widzimy nie punkt, w którym znajduje
się on teraz, ale w którym się znajdował w pewnej wcześniejszej chwili. W naszym wzorze
pojawia się więc pozorny kierunek 6t- — kierunek wzięty z przeszłości, zwany
kierunkiem retardowanym. Pojawia się też opóźniona odległość r'. Byłoby to łatwe
do zrozumienia, gdyby nie to, że jest nieprawdziwe. Cała sprawa jest znacznie
bardziej złożona.
We wzorze widzimy jeszcze kilka wyrazów. Następny wyraz pokazuje, z grubsza mówiąc.
bLEKTROMACNETYZM
41
jak przyroda próbuje wziąć pod uwagę fakt opóźnienia zjawiska. Mówi on, że powinniśmy
obliczyć opóźnione pole kulombowskie i dodać do niego poprawkę równą iloczynowi
szybkości zmiany pola przez opóźnienie. Przyroda jak gdyby próbuje ocenić, jakie ma być
pole w obecnej chwili, biorąc szybkość jego zmiany i mnożąc ją przez opóźnienie. We
wzorze widzimy jeszcze trzeci wyraz — drugą pochodną czasową jednostkowego
wektora skierowanego do ładunku. W ten sposób wyczerpaliśmy cały wzór i to jest
wszystko, co się tyczy pola elektrycznego pochodzącego od dowolnie poruszającego
się ładunku.
Pole magnetyczne dane jest wzorem
B=-e,.xE/c (28.4)
Znowu napisaliśmy to tylko dla pokazania piękna przyrody lub, inaczej mówiąc, potęgi
matematyki. Nie staramy się zrozumieć, dlaczego można napisać tak wiele na tak małej
przestrzeni, ale przecież wzory (28.3) i (28.4) opisują mechanizm, dzięki któremu pracują
prądnice elektryczne, działa światło, zachodzą wszystkie zjawiska elektryczne i
magnetyczne. Dla uzupełnienia całej sprawy powinniśmy oczywiście powiedzieć coś jeszcze o
zachowaniu się wchodzących w grę ośrodków materialnych, o własnościach materii, które
nie są poprawnie opisane przez wzór (28.3).
Aby zakończyć nasz opis dziewiętnastowiecznego świata fizyki, musimy jeszcze
wspomnieć o innej syntezie, której dokonano w tym stuleciu. Była to synteza zjawisk ciepła i
mechaniki, a Maxwell i w niej miał swój wielki udział. Będziemy się wkrótce zajmować i tym
tematem.
W wieku XX okazało się, że potrzebne są uzupełnienia. Odkryto, że prawa dynamiki
Newtona są zupełnie fałszywe, a dla ich poprawienia należało wprowadzić mechanikę
kwantową. Prawa Newtona są słuszne w przybliżeniu, wtedy gdy rozmiary obiektów
materialnych są dostatecznie duże. Owe prawa mechaniki kwantowej zostały zupełnie
niedawno połączone z prawami elektryczności w jeden układ praw zwany elektrodynamiką
kwantową. Odkryto ponadto liczne nowe zjawiska, z których pierwszym była
promieniotwórczość. Odkryta przez Becquerela w roku 1898, jakby wkradła się jeszcze do wieku XIX.
Odkrycie zjawiska promieniotwórczości doprowadziło do stworzenia naszej wiedzy o jądrach
atomowych i o nowym rodzaju sił, które nie są ani grawitacyjne, ani elektryczne. Chodzi
tu o nowe cząstki przejawiające się w różnych oddziaływaniach. Zagadnienie to nie
zostało jeszcze dotąd rozwikłane.
Dla dbających o ścisłość, tych, którzy wiedzą więcej (np. dla profesorów, którym
przyjdzie czytać tę książkę), trzeba dodać, że nie jest zupełnie, dokładne mówienie o wzorze
(28.3) jako o pełnym wyrażeniu wiedzy o elektrodynamice. Do końca XIX w. nie został
mianowicie w pełni rozwiązany pewien problem. Usiłując obliczyć pole od wszystkich
'adunków, włączając w to i ten ładunek, na który ma działać pole, natrafiamy na kłopot
dzieląc na przykład jakieś wyrażenie przez odległość ładunku od siebie samego, wynosi ona
bowiem zero. Kwestia, jak poradzić sobie z częścią pola, wytwarzaną przez ten ładunek,
na który pole ma działać, nie jest jeszcze rozwiązana i do dzisiaj. Pozostawiamy ją więc,
tek jak jest. Nie mając jeszcze całkowitego rozwiązania zagadki, będziemy jej unikać
tek długo, jak tylko się da.
42
28. PROMIENIOWANIE ELEKTROMAGNETYCZNE
28-2. Promieniowanie
Tak oto w skrócie wygląda obraz świata. Posłużymy się nim teraz podczas omawiania
zjawisk zwanych promieniowaniem. W tym celu musimy wybrać z równania (28.3) tylko
te wyrazy, które zmieniają się jak odwrotność odległości, a nie jak odwrotność jej kwadratu.
Gdy je w końcu znajdziemy, okażą się one tak proste w swej postaci, że uzasadnione będzie
badanie optyki i elektrodynamiki w sposób elementarny, traktując rozważaną część wzoru
jako „prawo" pola elektrycznego, wytwarzanego przez poruszający się, odległy ładunek.
Na razie potraktujemy to prawo jako dane, a w następnym tomie poznamy je bardziej
szczegółowo.
Pierwszy z wyrazów występujących we wzorze (28.3) zachowuje się oczywiście jak
odwrotność kwadratu odległości, a drugi stanowi tylko poprawkę do opóźnienia. Łatwo
więc pokazać, że oba te wyrazy zmieniają się jak odwrotność kwadratu odległości. Wszystkie
interesujące nas efekty pochodzą od wyrazu trzeciego, który wcale nie jest taki
skomplikowany. Oto co nam ten wyraz daje: spójrzmy na ładunek i zastanówmy się nad kierunkiem
wektora jednostkowego (którego koniec możemy zrzutować na powierzchnię kuli
jednostkowej). Gdy ładunek kręci się dookoła, wektor jednostkowy kołysze się, my zaś interesujemy
się jego przyspieszeniem. I to wszystko. Wobec tego wzór
jest sformułowaniem praw promieniowania. Zawiera on bowiem jedyny ważny wyraz dla
odległości wystarczająco dużych na to, aby pola zmieniały się jak odwrotność odległości
(wyrazy zachowujące się jak odwrotność kwadratu odległości wygasają na tyle, że nie
trzeba się nimi interesować).
Zajmijmy się teraz bardziej wnikliwie wzorem (28.5) i zobaczmy, co on oznacza.
Załóżmy, że obserwujemy z pewnej odległości dowolnie poruszający się ładunek. Wyobraźmy
sobie na chwilę, że został on w pewien sposób „zaświecony" (chociaż właśnie staramy się
wytłumaczyć zjawisko światła) i widzimy go jako mały biały punkcik. Punkcik ten porusza
się dookoła. Nie widzimy jednak dokładnie, jak biegnie on teraz, w danej właśnie chwili,
z powodu opóźnienia, o którym mówiliśmy. To, co obserwujemy, jest jego ruchem
wcześniejszym. Jednostkowy wektor er wskazuje kierunek pozornego położenia ładunku. Koniec
wektora e„ porusza się oczywiście po torze lekko zakrzywionym tak, że jego przyspieszenie
ma dwie składowe. Jedna — to składowa transwersalna, ponieważ koniec wektora porusza
się w dół i w górę. a druga - to składowa radialna, ponieważ wektor stale leży na kuli.
Łatwo pokazać, że ta ostatnia składowa jest znacznie mniejsza i dla bardzo dużych r
zmienia się jak odwrotność kwadratu r. Wyobraźmy sobie bowiem, że nasze źródło
odsuwamy coraz dalej. Kołysanie się wektora er będzie coraz to mniej widoczne, odwrotnie
proporcjonalnie do odległości, natomiast radialna składowa przyspieszenia będzie się zmieniała
znacznie szybciej. Do celów praktycznych musimy więc zrzutować ruch na płaszczyznę
w odległości jednostkowej. W ten sposób dochodzimy do następującej reguły: Przedstawmy
sobie, że patrzymy na poruszający się ładunek i wszystko widzimy opóźnione — tak jak
widzi to malarz starający się namalować jakąś scenę na ekranie w odległości jednostkowej.
,2 PBOMIENIOWANIF
43
prawdziwy malarz nie bierze jednak pod uwagę faktu, że światło porusza się z pewną
szybkością. a'e maluje świat tak, jak go widzi. Zastanówmy się, jak będzie tutaj wyglądał jego
0braz. Zobaczymy punkcik przedstawiający ładunek, poruszający się dookoła na obrazie.
Przyspieszenie tej kropki jest proporcjonalne do pola elektrycznego. 1 to jest wszystko,
czego potrzebujemy.
Tak więc równanie (28.5) stanowi pełny i poprawny wzór dla promieniowania; nawet
wszystkie efekty relatywistyczne są w nim zawarte. Często jednak chcemy stosować wzór
w jeszcze prostszych warunkach, w których ładunki przesuwają się niewiele ze stosunkowo
małą prędkością. Poruszając się powoli nie oddalają się znacznie od punktu wyjścia,
tak że opóźnienie jest praktycznie stałe. Prawo staje się wówczas jeszcze prostsze, ponieważ
opóźnienie jest ustalone. Wtedy możemy sobie wyobrazić, że ładunek wykonuje niewielkie
ruchy w praktycznie stałej odległości.
Opóźnienie w odległości r wynosi r/c. Wobec tego nasza reguła staje się następująca:
jeżeli naładowany przedmiot wykonuje małe ruchy i poprzecznie przesuwa się o odległość
x(t), kąt, o który przesuwa się wektor er-, wynosi x/r, a ponieważ r jest praktycznie stałe,
więc składowa x-owa d2er-/dt2 jest po prostu przyspieszeniem samego x wziętym we
wcześniejszym czasie. W ten sposób dostajemy wreszcie szukane prawo, które brzmi:
£,(')=—~-\ax(t-r). (28.6)
4n£0 er \ c)
Ważna jest tylko składowa ax, prostopadła do kierunku obserwacji. Zobaczymy, dlaczego
tak się dzieje. Jeżeli ładunek porusza się tam i z powrotem dokładnie w naszym kierunku,
to jednostkowy wektor w tym kierunku nie kołysze się wcale i nie doznaje przyspieszenia.
A więc ważny jest jedynie ruch poprzeczny, tylko to przyspieszenie, które widzimy zrzutowa-
ne na ekran.
28-3. Dipol promieniujący
Przyjmiemy teraz, że nasze podstawowe „prawo" promieniowania elektromagnetycznego
jest dane wzorem (28.6), czyli że pole elektryczne, wytworzone przez przyspieszany ładunek
poruszający się nierelatywistycznie, przyjmuje postać (28.6) w przybliżeniu dla bardzo dużej
odległości r. Pole elektryczne zmienia się jak odwrotność r i jest proporcjonalne do rzutu
przyspieszenia ładunku na „płaszczyznę obserwacji". Przyspieszenie to jest nie
przyspieszeniem ładunku w danej chwili, ale przyspieszeniem w czasie wcześniejszym o wielkość
r\c Pozostałą część tego rozdziału poświęcimy omówieniu tego właśnie prawa. Chodzi
° to, żeby lepiej zrozumieć jego sens fizyczny, ponieważ posłuży nam ono do zrozumienia
wszystkich zjawisk z dziedziny rozchodzenia się światła i fal radiowych, tzn. zjawisk
odbicia, załamania, interferencji, ugięcia i rozpraszania. Prawo to jest kluczowe i obejmuje
Wszystko, co potrzebujemy. Cała reszta równania (28.3) została wypisana tylko „dla
dekoracji", tak abyśmy mogli zdać sobie sprawę, skąd się bierze wzór (28 6) i w jakim
sensie należy go rozumieć.
Szerzej będziemy omawiać wzór (28.3) dopiero w drugim tomie. Na razie założymy,
44
28. PROMIENIOWANIE ELEKTROMAGNETYCZNE
że jest on słuszny, ale nie tylko teoretycznie.
Możemy obmyśleć kilka doświadczeń, które
zilustrują charakter tego prawa. Będzie nam
do tego potrzebny przyspieszany ładunek.
Powinien to być ładunek pojedynczy, ale
wiemy, że wprawiając w taki sam ruch wielką
liczbę ładunków, otrzymujemy pole będące
sumą przyczynków od każdego z nich: po prostu
dodamy je razem. Rozważmy jako przykład
dwa kawałki drutu połączone z generatorem
tak, jak pokazano na rys. 28.1. Idea polega na tym, że generator wytwarza różnicę
potencjałów, czyli pole, które w pewnej chwili wyciąga elektrony z części A i wpycha je w B, a
następnie, po bardzo krótkim czasie, odwraca działanie i wyciąga elektrony z części B
przepompowując je z powrotem do A\ A więc ładunki w obu drutach zostaną w pewnym momencie
przyspieszone powiedzmy do góry w drucie A i do góry w drucie B, w chwilę później zaś
zostaną przyspieszone do dołu w drucie A i do dołu w drucie B. Układ dwu drutów z
generatorem stanowi tylko pewien sposób wykonania doświadczenia. W istocie chodzi tu o to,
że mamy po prostu ładunek przyspieszany tam i z powrotem, tak jak gdyby A i B stanowiły
jeden drut. Drut, który jest bardzo krótki w porównaniu z odległością przebywaną przez
światło w jednym okresie drgań, nazywamy elektrycznym dipolem drgającym. Znajdujemy
się więc w sytuacji, w której trzeba zastosować nasze prawo mówiące, że ładunek taki
wytwarza pole elektryczne. Do wykrycia tego pola potrzebny jest nam jakiś przyrząd.
Posłużymy się w tym celu parą takich samych drutów jak A i B\ Pole elektryczne działając
na takie urządzenie wytwarza w obu drutach siłę pchającą elektrony w górę lub w dół.
Sygnał ten zostanie wykryty za pomocą prostownika włączonego między druty A i B,
cienki zaś drut przeniesie informację do wzmacniacza, który wzmocni ją tak, że
usłyszymy ton o częstości akustycznej, którą jest modulowana częstość radiowa. Gdy taka
sonda wyczuje pole elektryczne, pojawia się donośny dźwięk z głośnika, gdy zaś
wzbudzającego ją pola elektrycznego nie będzie, nie pojawi się również i dźwięk.
Ponieważ pokój, w którym wykonujemy pomiary, zawiera także inne przedmioty,
nasze pole elektryczne będzie i w nich poruszało elektrony. Pole elektryczne spowoduje
ruch tych ładunków tam i z powrotem, one zaś z kolei będą też miały wpływ na naszą sondę.
Aby zatem doświadczenie wypadło należycie, musimy poszczególne części układu ustawić
dość blisko siebie, tak aby działanie ścian i nas samych, czyli fale odbite, były stosunkowo
małe. Efekt nie będzie więc idealnie zgodny z równaniem (28.6), ale jego zgodność będzie
jednak na tyle dobra, że umożliwi nam ocenę wartości samego prawa.
Włączmy teraz generator i posłuchajmy sygnału dźwiękowego. Wykrywamy silne pole
wtedy, gdy detektor Z) jest równoległy do generatora w punkcie 1 (rys. 28.2). Tę samą
wielkość pola znajdujemy także przy każdym innym azymutalnym kącie względem osi
generatora G, ponieważ zjawisko nie jest kierunkowe. Z drugiej strony, gdy detektor znajduje się
w punkcie 3, pole okazuje się równe zeru. Tak być powinno, ponieważ nasz wzór orzeka,
że pole ma być proporcjonalne do przyspieszenia ładunku zrzutowanego prostopadle
do kierunku obserwacji. Jeśli więc będziemy patrzeć na generator G z punktu 3, ładunek
ł
fc-—-^ ■=
generator
%
28.1. Generator sygnałów o wysokiej
częstości porusza tam i z powrotem ładunki
w dwóch drutach
,j DIPOL PROMIENIUJĄCY
45
będzie się poruszał wzdłuż kierunku GD i
efekt nie wystąpi. W ten sposób sprawdzamy
pierwszą regułę, mówiącą, że nie ma efektu
wtedy, gdy ładunek porusza się prosto na nas.
Wzór nasz również orzeka, że pole elektryczne
ma być prostopadłe do r i do płaszczyzny,
w której leży generator G i promień r.
Umieszczając więc w punkcie / detektor D, obrócony
o90°,nie powinniśmy odebrać sygnału.
Możemy to rzeczywiście stwierdzić; pole elektryczne
jest więc naprawdę pionowe, a nie poziome.
Obracając detektor D o jakiś pośredni kąt
zauważymy, że najsilniejszy sygnał pojawi się
przy takiej orientacji D.jak pokazano to na
rysunku, bo chociaż generator G jest
ustawiony pionowo, to jednak powstające pole nie
jest do niego po prostu równoległe — ważny jest rzut przyspieszenia prostopadły do linii
obserwacji. Sygnał jest słabszy w punkcie 2 nit w 1 właśnie w wyniku rzutowania.
28.2. Chwilowe pole elektryczne na kuli,
której środek pokrywa się ze
zlokalizowanym, liniowo drgającym ładunkiem
28-4. Interferencja
Sprawdźmy teraz, co się dzieje, gdy mamy dwa źródła umieszczone obok siebie w
odległości kilku centymetrów (rys. 28.3). Prawo nasze stwierdza, że efekty obu źródeł dodadzą
się w punkcie / wtedy, gdy oba źródła będą przyłączone do tego samego generatora i oba
będą się w ten sam sposób poruszały tam i z powrotem. Całkowite pole elektryczne będzie
wtedy ich sumą, a więc będzie dwa razy silniejsze niż poprzednio.
Pojawia się teraz ciekawa możliwość. Załóżmy, że przyspieszamy tam i z powrotem
ładunki w punktach S, i S2, ale S2 spóźnia się tak, że ruchy ładunków różnią się w fazie
o 180°. Gdy w danej chwili pole wytwarzane
przez źródło 5i będzie miało pewien kierunek,
pole wytworzone przez źródło S2 będzie miało
kierunek przeciwny. Wobec tego nie
powinniśmy znaleźć żadnego efektu w punkcie /.
Fazę drgań można zręcznie dobrać za pomocą
rury, przenoszącej sygnał do punktji S2. Zmie-
n'ając jej długość zmieniamy czas zużywany
Przez sygnał na dotarcie do punktu S2 i w ten
sPosób zmieniamy fazę drgań. Dobierając
Ją możemy rzeczywiście znaleźć takie miejsce,
w którym nie pojawi się już żaden sygnał,
mimo że zarówno źródło 5,, jak i S2 będą się
Poruszały! Łatwo możemy sprawdzić, że oba
28.3. Ilustracja interferencji źródeł
widok z góry
28.4. Ilustracja
składania źródeł
wektorowego charakteru
ładunki znajdują się w ruchu, usuwając po
prostu jeden z nich i stwierdzając ruch drugiego.
Oba więc łącznie mogą dawać pole równe zeru,
pod warunkiem że wszystko zostało należycie,
dopasowane!
Jest rzeczą interesującą, że dodawanie obu
pól jest naprawdę dodawaniem wektorowym.
Sprawdziliśmy to właśnie dla ruchu w górę i w dół,
ale sprawdźmy i dla dwu kierunków nierówno-
ległych. Najpierw przywracamy źródłom 5, i 52
jednakowe fazy, to znaczy że znowu będą się one
poruszały zgodnie. Obróćmy teraz źródło S,o90D,
jak pokazano na rys. 28.4. W punkcie 1 powinniśmy znaleźć sumę dwu efektów, z których
jeden będzie związany z kierunkiem pionowym, a drugi z poziomym. Pole elektryczne będzie
sumą wektorową tych dwu sygnałów w fazie - oba one będą równocześnie najsilniejsze i oba
jednocześnie przejdą przez zero. Przy 45° całkowite pole powinno dawać sygnał R.
Obracając detektor D w poszukiwaniu maksymalnego dźwięku, powinniśmy go znaleźć przy
położeniu 45°, a nie przy pionowym. Ustawiając detektor D prostopadle do tego kierunku,
powinniśmy otrzymać natężenie zerowe, co łatwo zmierzyć. Takie właśnie zachowanie
możemy stwierdzić w rzeczywistości!
Jak się przedstawia sprawa z retardacją? W jaki sposób możemy wykazać, że sygnał
jest opóźniony? Dysponując wielkim' wyposażeniem moglibyśmy wprawdzie zmierzyć czas
przybycia sygnału, ale istnieje też inny bardzo prosty sposób. Spójrzmy znowu na rys. 28.3
i załóżmy, że źródła Si i S2 są w fazie. Oba one drgają więc zgodnie i wytwarzają równe
pola elektryczne w punkcie /. Przesuńmy się jednak do pewnego punktu 2, znajdującego
się bliżej źródła S2, a dalej od 5,. Ponieważ zasada nasza mówi, że przyspieszenia powinny
być opóźnione o wielkość równą r/c, to skoro retardacje nie będą równe, sygnały nie
będą w fazie. Można więc znaleźć położenie, w którym odległości detektora D do źródeł
S{ i S2 będą się różnić o pewną wielkość A, taką że wypadkowy sygnał wcale się nie pojawi.
Odległość A musi przy tym być odległością, którą światło przebywa w ciągu połowy jednego
drgania generatora. Możemy się przesunąć jeszcze dalej i znaleźć punkt, w którym różnica
wyniesie cały okres, co będzie znaczyło, że sygnał z pierwszej anteny osiągnął punkt 5
z opóźnieniem, które będzie większe niż opóźnienie sygnału z drugiej anteny, dokładnie
o czas potrzebny prądowi elektrycznemu do wykonania jednego drgania. Wobec tego
dwa pola elektryczne wytworzone w punkcie 3 będą znowu w fazie. W punkcie 3 sygnał
będzie więc znowu silny.
W ten sposób wyczerpaliśmy naszą dyskusję, polegającą na doświadczalnym
sprawdzeniu niektórych ważnych cech równania (28.6). Oczywiście, naprawdę nie sprawdziliśmy'
że natężenie pola elektrycznego zmienia się jak l/r, ani że istnieje pole magnetyczne
towarzyszące polu elektrycznemu. Sprawdzenie tego wymagałoby dość złożonej techniki i "lC
prawie by nam nie pomogło w zrozumieniu istoty sprawy. Sprawdziliśmy w każdym razie
te własności, które są najważniejsze dla naszych dalszych zastosowań. W drugim toffii'
wrócimy znowu do badania pozostałych własności fal elektromagnetycznych.
29
interferencja
29-1. Fale elektromagnetyczne
W rozdziale tym będziemy nadal omawiać zagadnienia z poprzedniego rozdziału,
ale ujmiemy je od strony matematycznej. Pokazaliśmy już, posługując się jakościowymi
argumentami, że w polu promieniowania dwóch źródeł istnieją maksima i minima. Obecnie
stoi przed nami problem opisania pola nie tylko jakościowo, ale ze szczegółami
matematycznymi.
Podaliśmy już zupełnie zadowalającą analizę fizycznego sensu wzoru (28.6). Pozostało
nam jeszcze kilka spraw, które ujmiemy od strony matematycznej. Przede wszystkim, gdy
ładunek, przyspieszany tam i z powrotem wzdłuż prostej, wykonuje ruch o bardzo raa-
'ej amplitudzie, pole obserwowane pod pewnym kątem 0 względem osi ruchu
skierowane jest prostopadle do kierunku obserwacji i leży w płaszczyźnie zawierającej ten
kierunek i kierunek przyspieszenia (rys. 29.1). Niech
r będzie odległością; w chwili / pole elektryczne
b?dzie miało wartość
<°K)
— sin 6
29.1. Pole elektryczne E pochodzące od
ładunku, którego opóźnione
przyspieszenie wynosi a'
£(,)= 1 1^ f (29.1)
4ite0 er
« Zle a{t~rjc) jest przyspieszeniem w chwi
~rlc), zwanym przyspieszeniem opóźnionym.
iekawe będzie teraz narysowanie obrazu
adu pola w różnych warunkach. Najbardziej
eresującym czynnikiem we wzorze (29.1) jest
ciście czynnik a(t-rjc). Aby zrozumieć
48
29. 1KTERFERENCJA
29.2. Przyspieszenie ładunku jako funkcja
czasu.
£ '
jego sens, weźmy najprostszy przypadek, gdy
kąt 6 = 90°, i wyrysujmy graficzny obraz pola.
Poprzednio zastanawialiśmy się nad
zagadnieniem jak pole zmienia się z czasem przy
ustalonym położeniu. Teraz natomiast
zobaczymy, jak wygląda pole w różnych punktach
przestrzeni w danej chwili. Chcemy więc podać
coś w rodzaju „migawkowego" zdjęcia, które by
nam powiedziało, jak wygląda pole w różnych
punktach. Zależy ono oczywiście od
przyspieszenia ładunku. Załóżmy, że początkowo ładunek
wykonywał określony ruch: najpierw spoczywał,
potem nagle został przyspieszony w taki sposób,
jak pokazuje rys. 29.2, wreszcie się zatrzymał.
W chwilę później mierzymy pole w jakimś
innym punkcie. Możemy stwierdzić, że będzie ono
wówczas tak wyglądało, jak pokazuje to rys.
29.3. Pole w każdym punkcie określone jest
przez przyspieszenie ładunku w chwili
wcześniejszej o opóźnienie r/c. Pole w coraz dalszych
punktach jest wyznaczone przez przyspieszenie
ładunku w odpowiednio wcześniejszych
chwilach. A więc krzywa na rys. 29.3 rzeczywiście
jest, w pewnym sensie, „odwróconym" wykresem
przyspieszenia jako funkcji czasu; odległość jest związana z czasem poprzez stały czynnik
przeliczeniowy c, który często przyjmujemy równy jedności. Łatwo to widzieć, rozpatrując
zachowanie się funkcji a(t —r/c). Jeśli dodamy niewielki czas At, to otrzymamy oczywiście tę
samą wartość a(t—r/c), którą byśmy otrzymali odejmując niewielką odległość
Ar= -cAt.
Ujmijmy to inaczej: jeśli dodamy niewielki czas At, to poprzednią wartość a(t—r/c)
możemy przywrócić przez dodanie niewielkiej odległości Ar=c At. Znaczy to, że w miarę
upływu czasu pole porusza się jak fala w kierunku od źródła. Dlatego też mówimy niekiedy,
że światło rozchodzi się ruchem falowym. Jest to równoważne powiedzeniu, że pole jest
opóźnione, albo powiedzeniu, że pole elektryczne porusza się w kierunku od źródła w
miarę upływu czasu.
Ciekawy przypadek mamy wtedy, gdy ładunek q porusza się tam i z powrotem ruchem
drgającym. W doświadczalnie badanym przypadku z ostatniego rozdziału przesunięcie X
w każdej chwili t było równe pewnej stałej x0 oznaczającej wielkość drgań, pomnożonej
przez cos cat. Przyspieszenie w tym ruchu wynosi
29.3. Pole elektryczne jako funkcja
położenia w późniejszej chwili (pominięta
jest zmienność typu l/r)
a= — co2x0 cosoof=a0 coscof, (29.2)
gdzie a0 jest przyspieszeniem maksymalnym, równym — o)2x0. Wstawiając ten wzór do
równania (29.1) znajdujemy
■i
FALE ELEKTROMAGNETYCZNE
49
E- —ą sin0
a0 cos co (t —r/c)
(29.3)
4jt£0 rc2
Pomijając teraz kąt 0 i stałe czynniki spójrzmy, jak wygląda pole jako funkcja położenia
lub jako funkcja czasu.
29-2. Energia promieniowania
Zwróćmy przede wszystkim uwagę, że w każdej określonej chwili lub w każdym
określonym miejscu natężenie pola zmienia się jak odwrotność odległości r, zgodnie z tym, cośmy
mówili poprzednio. Natomiast zasób energii w fali albo też działanie energetyczne, jakie
może przejawiać pole elektryczne, jest proporcjonalne do kwadratu pola. Weźmy bowiem
na przykład jakiś ładunek lub oscylator w polu elektrycznym. Działanie pola wprawia go
w ruch. Jeżeli będzie to oscylator liniowy, to przyspieszenie, prędkość i przesunięcie
spowodowane polem elektrycznym działającym na ładunek będą proporcjonalne do pola,
zatem energia kinetyczna ładunku będzie proporcjonalna do kwadratu pola. Przyjmijmy
więc, że energia, którą pole może przekazać układowi, jest w pewien sposób
proporcjonalna do jego kwadratu.
Oznacza to, że energia, którą pole może przekazać, spada w miarę oddalania się od
źródła: zmienia się ona dokładnie jak odwrotność kwadratu odległości. Fakt ten ma bardzo
prostą interpretację: zbierzmy całą możliwą energię fali w pewnym stożku w odległości r,
(rys. 29.4) i zróbmy to samo w innej odległości r2; okazuje się, że ilość energii na jednostkę
powierzchni w każdym miejscu zmienia się jak odwrotność kwadratu r. Pole powierzchni
objętej stożkiem zmienia się wprost jak kwadrat r, zatem energia, którą możemy wybrać
z fali w danym kącie stożkowym, jest zawsze taka sama, bez względu na to, jak daleko
się znajdujemy. W szczególności dokładnie ustaloną wartość ma całkowita energia, jaką
moglibyśmy uzyskać z pełnej fali, umieszczając
wszędzie dookoła pochłaniające oscylatory. Tak więc
zmienność amplitudy £ jak I jr oznacza to samo, co
stwierdzenie, że istnieje strumień energii, który
nigdy się nie gubi, że istnieje energia, która
rozchodzi się coraz dalej i rozprzestrzenia się na coraz
to większej powierzchni efektywnej. Widzimy więc,
że drgający ładunek traci pewną energię, której
n'gdy nie może odzyskać; energia wciąż rozcho-
zi się coraz dalej, bez ubytku. Jeśli więc
znajdziecie tak daleko, że nasze zasadnicze przybliżenie
spełnione, ładunek nie może już odzyskać ener-
e'> która została, jak mówimy, wypromieniowana.
ergia ta naturalnie wciąż gdzieś istnieje i można
Zebrać przy pomocy innych układów. W
rożnie 32 będziemy dalej jeszcze badać tę „stratę"
energii. . .
29.4. Energia zawarta w stożku
O A BCD nie zależy od odległości r,
w której jest mierzona
50
29. INTERFERENCJA
Rozpatrzmy teraz dokładniej zmiany fali określonej wzorem (29.3) jako funkcję czasu /
w danym miejscu i jako funkcję położenia w danym punkcie. Nadal pomijamy zmienność
typu l/r i wszystkie stałe.
29-3. Fale sinusoidalne
Ustalmy najpierw położenie r i przyjrzyjmy się polu jako funkcji czasu. Ma ono
charakter drgań o częstości kątowej co. Częstość kątowa oj może być określona jako szybkość
zmiany fazy w czasie (w radianach na sekundę). Pojęcie to powinno być nam znane,
ponieważ badaliśmy już podobne rzeczy. Okres jest czasem potrzebnym na wykonanie jednego
drgania, jednego całkowitego cyklu, co również już wyprowadzaliśmy; wynosi on 2jt/a>,
ponieważ co pomnożone przez okres daje jeden cykl cosinusa.
Wprowadźmy teraz nową wielkość, bardzo szeroko stosowaną w fizyce. Pojawia się
ona w sytuacji odwrotnej, gdy mianowicie ustalamy / i obserwujemy falę jako funkcję
odległości r. Oczywiście widzimy, że jako funkcja odległości r fala określona równaniem
(29.3) ma także charakter oscylacyjny. To znaczy, że poza pomijanymi wyrazami typu l/r
dostrzegamy drgania £ ze zmianą położenia. Przez analogię z co możemy więc zdefiniować
wielkość zwaną liczbą falową, oznaczaną przez k. Określa się ją jako szybkość zmian fazy
z odległością (w radianach na metr). A więc faza zmienia się, gdy w ustalonej chwili
zmieniamy położenie w przestrzeni.
Istnieje jeszcze inna wielkość, odpowiadająca okresowi. Moglibyśmy ją nazwać okresem
przestrzennym, ale zwykle bywa nazywana długością fali i oznaczana literą X. Długość
fali jest odległością zajmowaną przez jeden całkowity cykl. Łatwo więc widzieć, że długość
fali wynosi 2njk, ponieważ k pomnożone przez długość fali jako iloczyn szybkości zmian
radianów na metr i liczby metrów daje nam zmianę liczby radianów, która w jednym cyklu
wynosi 2n. A więc równość kA = 2n jest analogiczna do równości cot0 — 2n.
Chociaż powyższy związek między częstością i długością fali wyprowadziliśmy tylko
dla naszej szczególnej fali, to jednak podane definicje wielkości k i co są faktycznie zupełnie
ogólne. Znaczy to, że w innych sytuacjach fizycznych długość fali i częstość nie muszą być
ze sobą związane w taki właśnie sposób. W naszym przypadku łatwo wyznaczyć szybkość
zmiany fazy z odległością, ponieważ jeśli fazą nazwiemy ę—co{t — rjc) i zróżniczkujemy
(cząstkowo) względem odległości r, to szybkość zmian dęjdr wyniesie
\dq>
dr
CO
= *=-. (29.4)
c
Wynik ten można przedstawić na wiele sposobów:
X = ct0, (29.5)
co = ck, (29.6)
Av = c, (29.7)
o>k = 2nc. (29.8)
3 FALE SINUSOIDALNE
51
Dlaczego długość fali jest równa okresowi pomnożonemu przez r? Odpowiedź jest
oczywiście bardzo prosta: ponieważ jeśli siedzimy w miejscu czekając na upłynięcie jednego
okresu, fale posuwając się z prędkością c przebywają odległość ct0 i oczywiście przesuwają
się dokładnie o jedną długość fali.
Dla obiektów fizycznych różnych od światła wielkość k nie musi być tak prosto
związana z w. Jeżeli odległość mierzoną wzdłuż pewnej osi oznaczymy x, wzór na cosinusową
falę poruszającą się w kierunku osi x o liczbie falowej k i o częstości kątowej w zapisuje
się ogólnie jako cos{iot~kx).
Ponieważ wprowadziliśmy już pojęcie długości fali, możemy więcej powiedzieć o
warunkach, w których wzór (29.1) jest prawdziwy. Przypomnijmy sobie, że pole zbudowane jest
z kilku części, z których jedna zmienia się jak odwrotność r, druga jak odwrotność r2,
a inne zmieniają się nawet szybciej. Warto by wiedzieć, w jakich warunkach część pola
typu \jr jest najważniejsza, a inne są stosunkowo mało ważne. Odpowiemy oczywiście,
że następuje to wtedy, gdy odsuniemy się „dostatecznie daleko", bowiem wyrazy, które
zmieniają się jak odwrotność kwadratu, można wreszcie pominąć w porównaniu z wyrazem
l/r. Zapytajmy jednak: co rozumieć przez „dostatecznie daleko"? Jakościowa odpowiedź
mówi, że wyższe wyrazy są mniejsze od wyrazu l/r o rząd A/r. Jeśli więc tylko znajdziemy
się dalej niż kilka długości fali, wyrażenie (29.1) stanowić będzie doskonałe przybliżenie
dla pola. Obszar znajdujący sią poza zasięgiem kilku długości fali nazywamy niekiedy
„strefą falową".
29-4. Dwa dipole promieniujące
Rozważmy zagadnienia matematyczne pojawiające się przy składaniu działania dwu
oscylatorów, gdy szukamy wypadkowego pola w ustalonym punkcie. Dla tych kilku
przypadków, które rozważaliśmy w poprzednim rozdziale, jest to bardzo łatwe zadanie.
Wyniki opiszemy najpierw jakościowo, a następnie bardziej ilościowo. Weźmy prosty
przypadek oscylatorów, których środki leżą w tej samej poziomej płaszczyźnie co detektor,
kierunek zaś drgań jest pionowy.
Rysunek 29.5a przedstawia takie dwa oscylatory widziane z góry, przy czym w tym
szczególnym przykładzie odległość ich wynosi pół długości fali w kierunku N-S, a drgają
one zgodnie w fazie, którą nazywamy fazą zerową. Chcemy teraz poznać natężenie
promieniowania w różnych kierunkach. Przez natężenie rozumiemy ilość energii, którą w ciągu
sekundy pole przenosi mimo nas i która jest proporcjonalna do kwadratu pola
uśrednionego w czasie. Gdy chcemy znać jasność światła, wówczas wielkością, na którą trzeba
zwracać uwagę, jest nie samo pole, a jego kwadrat. (Pole elektryczne podaje natężenie
siły odczuwanej przez spoczywający ładunek, zasób zaś przepływającej energii w watach
"a metr kwadratowy jest proporcjonalny do kwadratu pola elektrycznego. Stałą tej
proporcjonalności wyprowadzimy w następnym rozdziale.) Jeśli spoglądamy na nasz układ
°d strony W (zachodniej), oba oscylatory dają przyczynki równe i zgodne w fazie, tak że
Pole elektryczne jest dwukrotnie silniejsze niż pole pochodzące od pojedynczego oscylatora,
więc natężenie będzie cztery razy większe niż natężenie jednego oscylatora. (Liczby na
52
29. IHTERFEREHCJA
-i?*-!'.'
wypromicnłowywane w r&taych kierunkach przez dwa drgające dipole odległe o pót
UH: ft) ffczy zgodne (<*=0), b) fazy ptzesunięte o pól okresu (<*=*)
rys. 29.5 określają w tym przypadku wartość natężenia w porównaniu z pojedynczym
oscylatorem o natężeniu jednostkowym.) Weźmy teraz kierunek wzdłuż linii łączącej
oscylatory; może to być kierunek N lub S. Ponieważ oscylatory są rozsunięte o pół długości
fali, więc efekt jednego z nich będzie przesunięty w fazie względem drugiego dokładnie o pół
drgania i składanie pól da w wyniku natężenie zerowe. Przy pewnym kącie pośrednim
(dokładnie przy 30°) natężenie wynosi 2 i spada: mamy więc natężenie równe 4, 2, 0 i tak
dalej. Musimy się nauczyć znajdowania tych liczb dla innych kątów. Sprawa polega na
dodawaniu dwu drgań z różnymi fazami.
Spójrzmy jeszcze pokrótce na niektóre inne ciekawe przypadki. Załóżmy, że oscylatory
nadal są rozsunięte o połowę długości fali, ale faza a jednego z nich wyprzedza o pół
okresu drgań fazę drugiego (rys. 29.5b). Natężenie w kierunku W jest teraz zerowe,
ponieważ gdy jeden z oscylatorów „pcha", drugi „ciągnie". W kierunku N natomiast sygnał
od bliższego oscylatora w danej chwili wyprzedza o pół okresu sygnał od drugiego. Ale
ten ostatni został od razu ustawiony na spóźnianie się o pół okresu, są więc one teraz
dokładnie zgodne w czasie i natężenie w tym kierunku wynosi zatem 4 jednostki. Natężenie pod
kątem 30° wynosi nadal 2, co wykażemy później.
Dochodzimy teraz do ciekawego przypadku, który wykazuje pewne własności, mogące
mieć znaczenie w zastosowaniach. Zauważmy, że wśród powodów, dla których interesujemy
się związkami fazowymi w oscylatorach, jest sprawa kierunkowych nadajników radiowych.
Wyobraźmy sobie na przykład, że zbudowaliśmy układ anten i chcemy posłać sygnał
radiowy powiedzmy na Hawaje. Ustawiamy wówczas anteny tak, jak na rys. 29.5a, i
nadajemy za pomocą dwóch anten w fazie, ponieważ Hawaje znajdują się na zachód od
Kalifornii. Następnego dnia postanawiamy nadawać w kierunku Alberty w Kanadzie. Ponieważ
kierunek jest teraz północny a nie zachodni, wystarczy odwrócić fazę jednej z naszych anten
i możemy już nadawać na północ. W ten sposób możemy budować rozmaicie ustawione
układy anten. Nasz układ jest jednym z najprostszych możliwych; można budować układy
znacznie bardziej skomplikowane i przez zmiany fazy w różnych antenach wysyłać wiązki
w rozmaitych kierunkach, posyłając większość mocy tam, dokąd chcemy przesłać
informacje, i to nie poruszając nawet anteną! W obu poprzednich przypadkach stosowaliśmy jednak
metodę, w której nadając na przykład w stronę Alberty traciliśmy mnóstwo mocy na rzecz
-j.4 DWA DIPOLE PROMIENIUJĄCE
53
Wyspy Wielkanocnej. Ciekawa byłaby więc kwestia: czy można posyłać moc tylko
w jednym kierunku? Na pierwszy rzut oka wydaje się, że dla pary omawianych anten wynik
zawsze będzie symetryczny. Aby przedstawić nowe możliwości, rozważmy więc przypadek,
który daje w wyniku asymetrię.
Zapytajmy, co się dzieje, gdy anteny są rozsunięte o jedną czwartą długości fali i antena
j\j wyprzedza w czasie antenę S o jedną czwartą okresu (rys. 29.6)? W kierunku W
otrzymujemy natężenia równe 2, jak się później przekonamy. W kierunku S otrzymujemy zaś
zero, ponieważ dla danej chwili sygnał z N przybywa o 90° później w czasie niż sygnał
z S, ale będąc już o 90° w tyle ze względu na swoją własną, fazę, dochodzi przesunięty
ostatecznie o 180° w fazie i efekt jest zerowy. Z drugiej strony, w kierunku N sygnał N
przybywa o 90° wcześniej w czasie od sygnału S, ponieważ antena leży bliżej o jedną czwartą
długości fali. Ale własną fazę ma tak ustawioną, że jego drgania spóźniają się w czasie
o 90°, co dokładnie równoważy różnicę opóźnień i w ten sposób sygnały
pojawiają się zgodnie w fazie czyniąc natężenie pola dwukrotnie większym, a energię cztery
razy większą.
Wykazując więc nieco zręczności przy rozmieszczaniu i nastawianiu naszych anten,
możemy posłać moc całkowicie w jednym kierunku. Nadal jednak jest ona rozłożona
w dużym obszarze kątów. Czy możemy
tak się urządzić, aby moc była jeszcze
ostrzej skupiona w określonym
kierunku? Rozważmy znowu przypadek Hawai,
kiedy to na wschód i na zachód
wysyłamy wiązkę rozłożoną we wcale sporym
kącie. Tracimy moc, ponieważ nawet przy
30° nadal będzie można odbierać
połowę natężenia. Czy możemy coś tu
poprawić? Rozważmy sytuację, w której
odstęp wynosi dziesięć długości fali (rys. 29.7).
Przypomina to sytuację badaną w
poprzednim rozdziale, ponieważ odstępy
wynosiły wówczas wiele długości fali, a
nie mały jej ułamek. Obraz sytuacji staje
S'C teraz zupełnie inny.
Gdy rozsuniemy oscylatory o 10
długości fali (bierzemy dla ułatwienia
przypadek zgodnych faz), widzimy, że w
kierunku E-W są one w fazie i uzyskujemy
duże natężenie, cztery razy większe niż
d'a jednego oscylatora. Z drugiej stro-
ny. już pod bardzo małym kątem w bok
czasy dojścia różnią się o 180° i natężenie
wynosi zero. Mówiąc dokładnie, jeżeli
nadajemy proste od każdego oscylatora
X/4-
C--1T/2
29.6. Para anten dipolowych dających
maksymalną moc w jednym kierunku
29.7. Rozkład natężeń dla dwóch dipoli
rozsuniętych o 10A
do odległego
punktu
54
29. INTERFERENCJA
29.8. Układ 6 anten dipolowych i fragment jego
rozkładu natężeń
do pewnego odległego punktu i różnica A
tych dwóch odległości wyniesie A/2,
połowę oscylacji, drgania wypadną z fazy.
Wspomniane pierwsze zero pojawia się
w takiej właśnie sytuacji (skala rysunku
nie jest właściwa; jest to tylko gruby szkic).
Znaczy to, że rzeczywiście mamy bardzo
ostrą wiązkę w żądanym kierunku, bo
poruszając się nawet niewiele tracimy całe
natężenie. Niestety, gdybyśmy chcieli
praktycznie zbudować w ten sposób
urządzenie radionadawcze, to podwajając
odległość, otrzymalibyśmy niezgodność w
fazach o cały cykl, co jest znowu dokładną
zgodnością faz! Otrzymalibyśmy więc wiele kolejnych maksimów i minimów, takich
jak dla odstępu 2\k, o czym mówiliśmy w rozdz. 28.
Jak można się pozbyć wszystkich tych dodatkowych maksimów, tak zwanych „listków"?
Otóż nie chcianych listków można się pozbyć w dość ciekawy sposób. Umieśćmy inny
układ anten pomiędzy tymi dwoma, które teraz rozważamy (rys. 29.8). Zewnętrzne anteny
są więc nadal odległe o 10,1, ale między nimi, powiedzmy co 2/1, ustawiamy inne anteny
i uruchamiamy je w zgodnej fazie. Mamy więc teraz 6 anten i natężenie w kierunku E-W
będzie oczywiście znacznie większe przy sześciu antenach niż przy jednej. Pole byłoby
większe 6 razy, a natężenie 36(jako kwadrat pola). Uzyskujemy w tym kierunku 36 jednostek
natężenia. W sąsiednich punktach znajdujemy zero, z grubsza tak jak poprzednio, ale
posuwając się dalej, tam gdzie zwykliśmy otrzymywać wielki „garb", otrzymujemy teraz
„garb" znacznie mniejszy. Zobaczmy dlaczego.
Rzecz w tym, że chociaż spodziewamy się wielkiego garbu dla odległości A dokładnie
równej długości fali, to przecież naprawdę tylko dipole 1 i 6 są wtedy w fazie i
współdziałają w wysyłaniu natężenia w danym kierunku. Dipole 3 i 4 są natomiast o około \ długości
fali przesunięte względem I i 6; chociaż 1 i 6 razem pchają, to 3 i 4 też pchają wspólnie,
ale w fazie przeciwnej. Otrzymujemy więc bardzo małe natężenie w rozważanym kierunku,
ale jednak nie znikające - nie zeruje się ono całkowicie. Podobne sytuacje powtarzają się
dalej: garby są bardzo małe, podczas gdy wiązka w żądanym kierunku jest silna. Zauważmy
jednak, co się jeszcze dzieje w tym szczególnym przykładzie: ponieważ odległość między
kolejnymi dipolami wynosi IX, można więc znaleźć taki kąt, dla którego odległość 3 między
kolejnymi dipolami wynosi dokładnie jedną długość fali. Przyczynki od wszystkich dipoli
będą wtedy znowu w fazie, ponieważ każdy z nich jest opóźniony względem następnego
o 360° i otrzymujemy inną silną wiązkę w nowym kierunku! W praktyce łatwo tego uniknąć,
ponieważ można umieścić dipole bliżej siebie niż co jedną długość fali i efekt się nie pojawi.
Ale sam fakt, że efekt taki może się zdążyć przy pewnych kątach, jeżeli tylko odstępy
są większe od jednej długości fali, jest zjawiskiem bardzo ciekawym i użytecznym.
Znajduje ono zastosowanie, wprawdzie nie w nadajnikach radiowych, ale w siatkach
dyfrakcyjnych.
29-5 MATEMATYCZNE UJĘCIE INTERFERENCJI
55
29-5. Matematyczne ujęcie interferencji
Zakończyliśmy w ten sposób naszą jakościową analizę układu dipoli promieniujących
i będziemy się teraz starać zanalizować je ilościowo. Znalezienie wypadkowego
promieniowania dwóch źródeł pod pewnym szczególnym kątem w najbardziej ogólnym przypadku
dwu oscylatorów różniących się o pewną wewnętrzną fazę względną a i o różnych
natężeniach -41 i A2 polega na dodaniu dwu cosinusów o tej samej częstości, ale o różnych fazach.
Znalezienie tej różnicy faz jest bardzo łatwe: składa się ona z opóźnienia pochodzącego
od różnicy w odległości oraz z wewnętrznej, wbudowanej fazy drgań. Matematycznie
rzecz biorąc, mamy znaleźć sumę R dwu fal: R = At cos(cot + ęl)+A2 cos (cot+ q>2)- Jak
się do tego zabrać?
Zadanie to jest naprawdę bardzo łatwe i powinniśmy uznać, że już umiemy je rozwiązać.
Naszkicujemy jednak pewne szczegóły postępowania. Jeden sposób rozwiązania polega
po prostu na wyliczeniu R, co nie powinno nam sprawić trudności, jeżeli potrafimy się
zręcznie posługiwać matematyką i wiemy dosyć o sinusach i cosinusach. Rozważmy
najprostszy przypadek, w którym Ax i A2 są równe i niech A będzie ich wspólną wartością.
W tej sytuacji (moglibyśmy to nazwać trygonometryczną metodą rozwiązania zagadnienia)
mamy
R = A [cos (cot +cpl) + cos (cor + ę2)]. (29.9)
Z trygonometrii powinniśmy znać regułę:
cos.4+cosB = 2cosi04 + .8)cosi04-.B). (29.10)
Znając ją możemy natychmiast napisać R jako
R = 2A cosiię^ ę2) cos(ojt + ięi+i(p2). (29.11)
Otrzymaliśmy więc falę o nowej fazie i o nowej amplitudzie. W ogólnym przypadku
(dodawania fal o różnych amplitudach) wynik będzie falą harmoniczną o nowej amplitudzie
AR, którą nazwiemy amplitudą wypadkową, o tej samej częstości drgań, ale z różnicą
faz </>„, zwaną fazą wypadkową. Uwzględniając to wszystko w naszym szczególnym
przypadku otrzymujemy, że wypadkowa amplituda wynosi
AR = 2Acos±(<pl-ę2), (29.12)
a wypadkowa faza jest średnią arytmetyczną dwu faz i w ten sposób nasze zagadnienie
zostało całkowicie rozwiązane.
Wyobraźmy sobie teraz, że nie pamiętamy, iż suma dwu cosinusów jest równa
podwojonemu cosinusowi połowy sumy razy cosinus polowy różnicy. Możemy posłużyć się
wówczas inną geometryczną metodą. Funkcja cos(cot + (p) (z dowolną stałą fazą ę) może
Dyć uważana za wynik poziomego rzutowania wirującego wektora. Wyobraźmy sobie
wektor A, o długości A{, wirujący tak, że jego kąt względem osi wynosi cat + ęx (za chwilę
°Puścimy cot i zobaczymy, że to nie powoduje różnicy). W chwili f = 0 wykonujemy
migawkowe zdjęcie (rys. 29.9) pamiętając, że w rzeczywistości obraz wiruje z prędkością
Kątową co, Rzut wektora A, na osi poziomej wynosi dokładnie ,4, cos(&>/ + #>,). Drugą
56
29. INTERFERENCJA
falę można w chwili / = 0 przedstawić jako inny
również wirujący wektor A2 o długości A2, ustawiony pod
kątem ę2. Oba wektory wirują z tą samą prędkością
kątową a> i wobec tego ich względne położenie jest
ustalone. Układ obraca się jak ciało sztywne. Rzut
poziomy wektora A2 wynosi A2 cos(cot + <p2). Wiemy
jednak z teorii wektorów, że przy dodawaniu dwóch
wektorów w zwykły sposób, według reguły równole-
głoboku, składowa x-owa wypadkowego wektora AR
jest sumą składowych x-owych dwu pozostałych
wektorów. Zagadnienie nasze jest w ten sposób
rozwiązane. Łatwo sprawdzić, że dla rozważanego poprzednio
szczególnego przypadku AX=A2 = A otrzymujemy
poprawny wynik. Z rysunku 29.9 widać, że w tym
przypadku wektor AR leży w środku między wektorami
A, i A2i tworzy kąt \{ę2 —<Pi)z każdym z nich. Widzimy więc, że AR = 2A cosi(^2-c>|), tak
jak obliczyliśmy poprzednio. Widać także z trójkąta, że gdy obie amplitudy są równe,
faza AR przy obrocie jest średnią kątów wektorów A, i A2. Z równą także łatwością
rozwiążemy oczywiście przypadek nierównych amplitud. Możemy to nazwać geometrycznym
sposobem rozwiązania postawionego zagadnienia.
Istnieje jeszcze inna droga rozwiązania tego problemu, a mianowicie droga analityczna.
Polega ona na tym, że zamiast robienia rysunków, takich jak rys. 29.9, możemy napisać
coś, co jest dokładnie równoważne rysunkowi: zamiast kreślenia wektorów przedstawiamy
je za pomocą liczb zespolonych. Biorąc rzeczywiste części liczb zespolonych, otrzymamy
właściwe wielkości fizyczne. Tak więc w naszym szczególnym przypadku fale można by
zapisać za pomocą liczb Ax exp[i(a>f + c>,)] [jej rzeczywistą częścią jest At cos(a>f + p,)]
oraz A2 e\p[i(cot + ę2)]. Możemy teraz dodać je razem otrzymując:
29.9. Geometryczna metoda
składania dwóch fal cosinusowych.
Należy sobie wyobrazić, że cały
wykres obraca się z częstością
kątową co przeciwnie do ruchu
wskazówek zegara
R =/4,exp[i(<yf+ c>i)]-M2exp[i'(<yf+ ^2)] = [/41exp(i>1) + /42exp(i^2)]exp(/(y/)
(29.13)
albo
R =/41exp(i>1) + /42exp(i>2) = /4Rexp(i>J,).
(29.14)
Jest to rozwiązanie naszego zagadnienia, ponieważ przedstawia wynik jako liczbę zespoloną
o module AR i o fazie ęR.
Zobaczmy, jak działa ta metoda, i znajdźmy amplitudę AR, która jest „długością"
k. Aby otrzymać „długość" wielkości zespolonej, zawsze mnożymy tę wielkość przez
liczbę zespoloną do niej sprzężoną, co daje nam kwadrat długości. Liczbę sprzężoną
zespoloną otrzymujemy zamieniając w liczbie pierwotnie danej znak przy / na przeciwny.
Mamy więc
^=[^(1exp(i>1)+'42exP(,>2)] [^iexp(-i>1) + /42exp(-if2)]. (29.15)
Wykonując mnożenie, otrzymujemy A\ + A\ (funkcje wykładnicze bowiem się tu znoszą),
29-5. MATEMATYCZNE UJĘCIE INTERFERENCJI
57
dla wyrazów zaś mieszanych mamy
At A2{exp[i(ęl- ę2)]+exp[i(ę2- ę^]} ,
ponieważ zaś
e" + e~ "= cos d + i sin 0 + cos 9 - i sin 6 ,
to e" + e"" = 2 cos 6. Naszym końcowym wynikiem jest więc
A2r = A\ + A\ + 2A{ A2cos(ę2-<Pi) ■
(29.16)
Zgadza się to, jak widać z rys. 29.9, z długością AR obliczoną za pomocą praw
trygonometrii.
Wobec tego fala będąca wynikiem nałożenia się fal z dwóch źródeł ma natężenie A\
(jednej z nich) plus natężenie A\ (pochodzące tylko od drugiej) plus pewna poprawka.
Poprawkę tę nazywamy efektem interferencyjnym. Jest to różnica między tym, co
otrzymujemy dodając po prostu natężenia, a tym, co się dzieje naprawdę. Wyraz ten nazywamy
poprawką interferencyjną, niezależnie od tego, jaki będzie on miał znak. Przypadek,
w którym wyraz interferencyjny jest dodatni, nazywamy interferencją konstruktywną.
Przypadek przeciwny nazywamy interferencją destruktywną.
Zastosujmy teraz nasz ogólny wzór (29.16) do układu dwu oscylatorów, w tych
szczególnych przypadkach, które omawialiśmy od strony jakościowej. Aby zastosować wzór
ogólny, wystarczy znaleźć różnicę faz ęy —ę2 między sygnałami dochodzącymi do danego
punktu (wszystko zalety oczywiście tylko od różnicy faz, a nie od samych faz). Rozważmy
więc przypadek dwóch oscylatorów, o równej amplitudzie, odległych od siebie o d i
różniących się o wewnętrzną względną fazę a (gdy jeden z nich jest w fazie zero, faza
drugiego wynosi a). Zapytujemy, jakie będzie natężenie w pewnej azymutalnej odległości 6
od linii E-W. [Zauważmy, że nie chodzi tutaj o wielkość 9, pojawiającą się we wzorze
(29.1). Mimo obawy o nieporozumienie, zamiast jakiegoś nowego niezwykłego symbolu,
użyjemy jednak przyjętego symbolu 6 (rys. 29.10).] Zależność fazową znajdujemy
zauważając, że różnica odległości od punktu P do obu oscylatorów wynosi d sin 0. Daje ona
przyczynek do różnicy faz, równy liczbie
długości fali zawartych w d sin 0 razy 2rt.
(Czytelnik lepiej przygotowany możet/sin 0
Pomnożyć przez liczbę falową, która daje
szybkość zmiany fazy z odległością; wynik
Jest dokładnie taki sam.) Różnica faz
pochodząca z różnicy odległości wynosi zatem
2nd sin Ojk, z powodu zaś różnic w
drganiach obu oscylatorów dochodzi jeszcze
dodatkowa faza a. W chwili przybycia
sygnału różnica faz będzie zatem
wynosiła
<p2-ęt=<x + 2ndsindjX. (29.17)
29.10. Dwa oscylatory o jednakowej
amplitudzie, których fazy różnią się o a
nktu P
58
29. INTERFERENCJA
Wzór ten obejmuje wszystkie przypadki. Wystarczy więc podstawić to wyrażenie do
wyrażenia (29.16) dla AX = A2 i otrzymać najrozmaitsze wyniki dla dwu anten o równym
natężeniu.
Zobaczmy, co się dzieje w różnych przypadkach. Wiemy na przykład, że według rys.
29.5 natężenie przy 30° wynosi 2, przyczyna zaś jest następująca. Oba oscylatory są
rozsunięte o \X, więc przy 30° dńvtQ=\\\. Wobec tego ę1—ę^—2TiXj^X = \ii i wyraz
interferencyjny jest równy zeru (dodajemy dwa wektory prostopadłe). Geometrycznie wynik
odpowiada przeciwprostokątnej trójkąta o kącie 45°, która jest równa amplitudzie
jednostkowej razy ,/2. Podnosząc ją do kwadratu, otrzymujemy podwojone natężenie
pojedynczego oscylatora. Wszystkie inne przypadki można wyliczyć w taki sam sposób.
T
30
dyfrakcja
30-1. Wypadkowa amplituda promieniowania n
jednakowych oscylatorów
Rozdział ten jest bezpośrednią kontynuacją poprzedniego, mimo że nie jest on już
zatytułowany interferencja, ale dyfrakcja. Nikomu nie udało się zadowalająco określić
różnicy między interferencją a dyfrakcją. Jest to tylko sprawa zwyczaju i nie ma żadnej
ważnej, wyraźnie określonej różnicy fizycznej między obu zjawiskami. Najlepiej chyba
z grubsza powiedzieć, że interferencją nazywamy zwykle wynik nakładania się fal świetlnych
z nielicznych źródeł, np. dwóch, gdy zaś liczba źródeł jest wielka, używa się częściej nazwy
dyfrakcja. Nie przejmujmy się więc nazwą interferencja czy dyfrakcja, ale podejmijmy
przerwany w środku temat poprzedniego rozdziału.
Rozważmy zatem układ n równoległych oscylatorów o takich samych amplitudach,
ale różniących się między sobą fazami albo dlatego, że ich fazy zostały inaczej ustawione,
albo dlatego, że obserwujemy je pod kątem powodującym różnicę w opóźnieniu
czasowym. Niezależnie od przyczyny tej różnicy faz musimy obliczyć następującą sumę cosi-
nusów:
R = /l{coswt+cos(wl + p) + cos(a)f + 2p) + ...+cos[a)l+(n-l)¥>]} , (30.1)
gdzie ę jest różnicą faz między kolejnymi oscylatorami obserwowanymi z ustalonego
kierunku. Dokładnie mówiąc <p = <x + (2ndsin0//.). Musimy teraz pododawać wszystkie te
wyazy. Zrobi my to sposobem geometrycznym. Pierwszy wyraz ma moduł A i fazę zero.
astępny ma także moduł A, ale fazę równą </>. Dalszy ma znowu moduł A, ale fazę równą
V i tak dalej. Widać więc, że na płaszczyźnie posuwamy się wzdłuż kolejnych n boków
w,elokąta równobocznego (rys. 30.1).
60
30. DYFRAKCJA
Wszystkie wierzchołki tego wielokąta leżą oczywiście na pewnym okręgu i wypadkową
amplitudę najłatwiej znajdziemy obliczając jego promień. Załóżmy, że punkt Q jest
środkiem koła. Wiemy wówczas, że kąt OQS jest kątem fazowym ę. (Ponieważ promień QS
pozostaje w takim samym stosunku geometrycznym do wektora A2, jak QO do A,, tworzą
one kąt ę.) Wobec tego promień r musi być taki, żeby A — 2r sin (ę/2), co nam ustala
wartość r. Ale duży kąt O QT jest równy nę i stąd wynika, że AR = 2r sin(nę/2). Pozbywając
się r z tych dwóch wyrażeń otrzymujemy
AR = A
sin (n p/2)
sin (p/2) '
Wypadkowe natężenie wynosi więc
/=/0
sin2 (n ę/2)
sin2(W2) '
(30.2)
(30.3)
Zbadajmy teraz to wyrażenie i rozpatrzmy niektóre wynikające z niego konsekwencje.
Możemy najpierw sprawdzić wzór dla n=l. Wzór się sprawdza: I—I0. Sprawdzamy go
następnie dla n=2: pisząc sin ę=2 sin (ę/2) cos (ę/2) znajdujemy, że AR = 2A cos (ę/2), co
jest w zgodzie z wyrażeniem (29.12).
Pomysł rozpatrzenia wyniku dodawania szeregu źródeł wziął się z nadziei, że w jednym
kierunku uda się nam uzyskać znacznie większe natężenie niż w innym, że bliskie
maksima występujące przy dwu tylko źródłach powinny przy wielu źródłach mieć znacznie
słabsze natężenie. Zjawisko to zauważymy wykreślając krzywą odpowiadającą wzorowi
(30.3) dla ogromnej liczby n w obszarze bliskim ę—O. Przede wszystkim, dla ę dokładnie
równego zeru, otrzymujemy wyrażenie typu 0/0, ale gdy ę jest nieskończenie małe, iloraz
kwadratów dwu sinusów wynosi po prostu n2, bo sinus i kąt są w przybliżeniu sobie równe.
A więc natężenie maksimum krzywej jest n2 razy większe od natężenia jednego oscylatora.
Przekonać się o tym łatwo, bo gdy wszystkie oscylatory są w fazie, wówczas względne kąty
małych wektorów są równe zeru i n
oscylatorów dodaje się tak, że amplituda jest większa
n-krotnie, a natężenie n2-krotnie.
W miarę jak wzrasta faza ę, stosunek dwu
sinusów zaczyna maleć i po raz pierwszy
osiąga zero, gdy nę/2=n, bo simt = 0. Innymi
słowy, ę=2n/n odpowiada pierwszemu
minimum krzywej (rys. 30.2). Opisując przebieg
zjawiska za pomocą strzałek na rys. 30.1,
widzimy, że pierwsze minimum pojawia się, gdy
wszystkie strzałki powracają do punktu
wyjściowego. Oznacza to, że na to, aby móc
zamknąć koło, całkowity kąt zakreślony przez
wszystkie strzałki, czyli całkowita różnica faz
między pierwszym a ostatnim oscylatorem, musi
wynosić 2%.
30.1. Wypadkowa amplituda n = 6
równoodległych źródeł, dla których różnica
między sąsiednimi fazami wynosi <p
30-1. WYPADKOWA AMPLITUDA
61
0 12 3 4 5 n<p/27T
30.2. Natężenie jako funkcja kąta fazowego dla wielkiej liczby oscylatorów o równym natężeniu
Przechodzimy teraz do następnego maksimum i chcemy naocznie stwierdzić, że tak jak
przypuszczamy, jest ono rzeczywiście znacznie mniejsze od pierwszego. Będzie nam trudno
znaleźć dokładne położenie maksimum, ponieważ zarówno licznik, jak i mianownik ułamka
we wzorze (30.3) ulegają zmianie, ale sin(c>/2) zmienia się dość powoli w porównaniu
z sin(/ic>/2) dla dużych n, tak że gdy sin(/ic>/2)= 1, maksimum jest już bardzo blisko.
Następne maksimum sin2(nęj2) pojawia się dla «9>/2 = 3rt/2, czyli dla ę = 3n/n. Odpowiada to
półtorakrotnemu obiegnięciu okręgu przez strzałki. Aby znaleźć wielkość maksimum,
przyjmujemy we wzorze (30.3) ę = 3n/n i znajdujemy, że sin2(3rt/2)= 1 w liczniku
(właśnie dlatego wybraliśmy przecież ten kąt), w mianowniku zaś mamy sin2(3rt/2«). Dla
dostatecznie dużego n kąt ten jest bardzo mały i sinus staje siew przybliżeniu równy kątowi, tak
że we wszystkich praktycznych obliczeniach możemy przyjąć sin (3rt/2«) = 3rt/2«. Znajdujemy
zatem natężenie w maksimum, które wynosi /=/0(4«2/9rt2). Ponieważ n2I0 było
natężeniem maksymalnym, mamy teraz 4/9rt2 jego wartości, co wynosi około 0,047; mniej niż
5%! Dla jeszcze większych wartości fazy natężenia oczywiście nadal się zmniejszają.
Mamy więc bardzo ostre centralne maksimum z bardzo słabymi dodatkowymi maksimami
po bokach.
Można udowodnić, że pole całej krzywej, włączając wszystkie małe garbki, równe jest
2t«/0, czyli podwojonemu polu kropkowanego prostokąta z rys. 30.2.
Teraz zastanówmy się jeszcze, jak w różnych okolicznościach możemy stosować
równanie (30.3) i spróbujmy zrozumieć, co się wtedy dzieje. Wyobraźmy sobie, że wszystkie
nasze źródła leżą na prostej, jak pokazuje rys. 30.3. Mamy ich n, odstępy między nimi
wynoszą d; załóżmy, że własna faza względna dwu sąsiednich źródeł wynosi a. Przy
dokonywaniu obserwacji w danym kierunku 0 względem normalnej pojawia się dodatkowa
taza 2nd sin ęj)., wynikająca ze wspomnianego poprzednio opóźnienia czasowego między
dwoma sąsiednimi oscylatorami.
A więc
ę = x + (2nd sin 0/A) = a + kd sin 0 . (30.4)
Rozpatrzymy najpierw przypadek a = 0. Znaczy to, że wszystkie oscylatory są w fazie
62
30. DYFRAKCJA
30.3. Liniowy układ n jednakowych oscylatorów włączonych z fazami a,=sa
zgodnej, my zaś chcemy poznać natężenie jako funkcję kąta 9. Aby ją znaleźć, wystarczy
przyjąć ę = kd sin 9 we wzorze (30.3) i spojrzeć, co z tego wynika. Najpierw mamy
maksimum dla ę = 0. Znaczy to, że dla wszystkich oscylatorów w fazie zgodnej otrzymujemy
duże natężenie w kierunku kąta #=0. Rodzi się dalej ciekawe pytanie: gdzie leży pierwsze
minimum? Zachodzi ono wtedy, gdy ę=2n/n. Mówiąc inaczej, dla 2ndńn9/X = 2n/n
uzyskujemy pierwsze minimum krzywej. Pozbywamy się 2rt dla większej przejrzystości
wzoru i odczytujemy z niego:
ndsin6 = X. (30.5)
Postarajmy się teraz zrozumieć fizyczne przyczyny, dla których minimum pojawia się
właśnie w tym położeniu; nd jest całkowitą długością L urządzenia. Odwołując się do rys.
30.3 stwierdzamy, że nd sin 9=Lsin9=A. Wzór (30.5) mówi, że minimum pojawia się,
gdy A jest równe jednej długości fali. Dlaczego otrzymujemy minimum właśnie dla A = A?
Ponieważ przyczynki od rozmaitych oscylatorów mają wówczas fazy rozłożone
równomiernie od 0° do 360°. Strzałki (rys. 30.1) obiegają cały okrąg - sumujemy równe wektory
o różnych kierunkach, a taka suma jest równa zeru. Minimum zachodzi więc dla takich
kątów, dla których A = ).. Jest to pierwsze minimum.
Wzór (30.3) wykazuje jeszcze inną ważną właściwość. Jeżeli kąt ę wzrasta o dowolną
wielokrotność 2rt, nie powoduje to we wzorze żadnej różnicy. Otrzymamy więc dalsze
silne maksima dla <p = 2n, An, 6rt i tak dalej. W pobliżu każdego z tych wielkich maksimów
obraz z rys. 30.2 powtarza się. Zapytajmy zatem: jakie warunki geometryczne prowadzą
do innych dużych maksimów? Warunkiem na to jest równość: ę=2nm, gdzie m jest
dowolną liczbą całkowitą. Znaczy to, że 2ndsin9/?. = 2nm. Dzieląc obie strony przez 2n
znajdujemy
dsind = mX. (30.6)
Wzór ten przypomina wzór (30.5), ale niezupełnie; poprzedni wzór miał postać: nd sin 0 = /-
Różnica polega na tym, że tam rozważaliśmy poszczególne źródła, a gdy mówimy t/sin 0
=/wyznaczy, że bierzemy kąt ó = m).. Innymi słowy, każde źródło daje swój przyczynek, a że
poszczególne źródła są kolejno przesunięte w fazie o całkowitą wielokrotność 360°, wi?c
nrzvczvnki te są zgodne w fazie, ponieważ przesunięcie w fazie o 360° jest tym samy11
I WYPADKOWA AMPLITUDA
63
co zgodność fazy. Składanie następuje więc w fazie zgodnej i daje takie samo maksimum jak
poprzednio omawiane dla m = 0. Dodatkowe garby, w ogóle cały charakter rysunku jest
dokładnie taki sam jak w pobliżu <p = 0, z dokładnie tymi samymi minimami po obu
stronach i z wszystkimi innymi szczegółami. Rozważany przez nas układ będzie więc wysyłał
wiązki w rozmaitych kierunkach. Każda z nich będzie miała silne centralne maksimum
i pewną liczbę słabych „bocznych listków". Kolejną wiązkę określa się jako wiązkę rzędu
pierwszego itd., zgodnie z wartością m; m nazywamy rzędem wiązki.
Zauważmy, że jeśli t/jest mniejsze od A, to równanie (30.6) może nie mieć rozwiązań
poza m = 0. Jeżeli więc odstępy są za małe, możliwa jest tylko jedna wiązka rzędu
zerowego ześrodkowana w kącie 0 = 0 (oczywiście, istnieje także wiązka w kierunku
przeciwnym). Aby otrzymać dodatkowe wielkie maksimum, odstępy w naszym urządzeniu muszą
być większe od pojedynczych długości fali.
30-2. Siatka dyfrakcyjna
W technice anten i przewodów możliwe są urządzenia, w których wszystkie fazy małych
oscylatorów albo anten są równe. Powstaje pytanie: czy i jak można zrobić coś podobnego
ze światłem? W tym wypadku nie możemy zwyczajnie zbudować małych stacji radiowych
o częstości optycznej, połączonych nieskończenie małymi drutami i następnie uruchomić
ich z daną fazą. Istnieje jednak bardzo łatwy sposób zbudowania urządzenia, które w
wyniku daje dokładnie to samo.
Załóżmy, że mamy wiele równoległych drutów, równo rozstawionych z odstępem d,
oraz bardzo daleko, praktycznie w nieskończoności, źródło o częstości radiowej, które
wytwarza pole elektryczne przybywające do każdego z drutów z tą samą fazą (pole powstaje
tak daleko, że przesunięcie w czasie jest jednakowe dla wszystkich drutów). (Można
rozważać przypadki urządzeń zakrzywionych, ale my weźmiemy płaskie.) Zewnętrzne
pole elektryczne pierwotnego źródła będzie poruszać tam i z powrotem elektronami
w drucie. Elektrony te poruszając się stanowić będą nowe generatory. Zjawisko takie
nazywa się rozpraszaniem: fala świetlna z pewnego źródła może indukować ruch elektronów
w jakimś ośrodku materialnym, ruchy te zaś powodują powstawanie swoich własnych
fal. Trzeba więc tylko ustawić wiele równoodległych drutów, wzbudzić je za pomocą
odległego źródła o częstości radiowej i tak oto mamy żądany układ, bez mnóstwa specjalnych
Połączeń. Jeżeli fala pada prostopadle, fazy będą równe i otrzymamy dokładnie te wa-
runki, które już rozważaliśmy. Jeżeli wobec tego odstępy między drutami będą większe
°d długości fali, otrzymamy rozpraszanie o silnym natężeniu w kierunku normalnej i w
niektórych innych kierunkach danych wzorem (30.6).
To samo można zrobić ze światłem\ Zamiast drutów posługujemy się płaskim kawałkiem
SzMa, robiąc na nim nacięcia tak, aby rozpraszały one światło nieco inaczej niż reszta szkła.
ezeli teraz puścimy światło na szkło, każde z nacięć stanie się nowym źródłem światła.
^dy zaś odstępy między liniami będą bardzo małe, ale nie mniejsze niż długość fali (co
Jest w każdym razie technicznie prawie niemożliwe), możemy się spodziewać wspaniałego
JavWska: światło nie tylko będzie przechodziło na wprost, ale pojawi się także jako silna wiąz-
64
30. DYFRAKCJA
ka pod kątem różnym od zera, zależnie od odstępów między szczelinami. Takie urządzenia
naprawdę się buduje i powszechnie się ich używa — nazywa się je siatkami dyfrakcyjnymi.
Jedna z postaci siatki dyfrakcyjnej — to po prostu płaska warstwa przezroczystego
i bezbarwnego szkła pokrytego rysami. Często przypada ich kilkaset na milimetr i są one
bardzo starannie sporządzone, tak aby ich odległości były stałe. Jak działa taka siatka,
można zobaczyć ustawiając rzutnik tak, aby dawał wąski pionowy prążek światła (obraz
szczeliny) na ekranie. Umieszczając w wiązce siatkę tak, aby rysy były pionowe, przekonamy
się, że prążek będzie nadal widoczny, ale ponadto pojawia się z każdej jego strony silna
barwna plama świetlna. Jest to oczywiście obraz szczeliny rozmyty w szerokim obszarze
kątowym, ponieważ kąt 9 ze wzoru (30.6) zależy od długości X, światło zaś różnej barwy
odpowiada, jak wiemy, różnym częstościom, zatem różnym długościom fali. Najdłuższą
widzialną długość fali ma czerwień, a ponieważ d sin 9 = 1, więc kąt musi być większy.
I rzeczywiście, odnajdujemy czerwień przesuniętą o większy kąt w stosunku do centralnego
obrazu! Musi także istnieć wiązka po drugiej stronie, i rzeczywiście, odnajdujemy ją na
ekranie. Następnie powinny się odnaleźć rozwiązania (30.6) dla m = 2. Widzimy w
odpowiednim miejscu coś niewyraźnego — bardzo słabego — a dalej są nawet inne wiązki.
Dowodziliśmy przed chwilą, że wszystkie te wiązki powinny mieć to samo natężenie,
ale widzimy, że wcale nie mają i nawet pierwsze wiązki po prawej i lewej stronie nie są
jednakowe! Przyczyna leży w tym, że siatka dyfrakcyjna została starannie zbudowana
z myślą o takim właśnie działaniu. Jak to uzyskano? Gdyby siatka składała się z bardzo
subtelnych, nieskończenie cienkich, równo rozstawionych nacięć, wówczas wszystkie
natężenia rzeczywiście byłyby równe. Rozważaliśmy tylko najprostszy przypadek, ale
moglibyśmy przecież rozważać także zespół par anten, w których każdy partner miałby
swoje natężenie i swoją fazę względną. W tym przypadku można by uzyskać rozmaite
natężenia w różnych rzędach. Siatkę robi się często z małych nacięć „piłowatych", a nie
symetrycznych. Starannie ustawiając „zęby piły" można więcej światła skierować do
jednego rzędu widma niż do innego. Praktycznie w siatce chcielibyśmy mieć jak najwięcej
światła w jednym tylko rzędzie. Rozwiązanie jest bardzo dowcipne, mimo że wydaje się
trudne do zrealizowania, a dzięki niemu siatka staje się bardziej użyteczna.
Rozważaliśmy dotąd przypadek, gdy wszystkie fazy źródeł były takie same. Mamy
jednak też wzór na ę wtedy, gdy kolejne fazy różnią się o kąt a. Wymaga to połączenia
naszych anten z małym przesunięciem fazowym. Czy coś takiego daje się zrobić ze światłem?
Owszem, daje się to zrobić bardzo łatwo. Weźmy bowiem źródło w nieskończoności
pod takim kątem, że światło dochodzi pod kątem #przych, i badajmy wiązkę
rozproszoną, wychodzącą powiedzmy pod kątem 9^^ (rys. 30.4). #wych jest tym samym kątem 9,
który mieliśmy poprzednio, a wprowadzenie kąta 0przych jest po prostu środkiem, który
zapewnia, że faza każdego źródła jest odmienna. Światło przychodzące z odległego źródła
pobudzającego uderza najpierw w jedną rysę, potem w następną, znowu następną i tak
dalej, z przesunięciem fazowym między jednym a drugim uderzeniem, wynoszącym, jak
widzimy, a= -d sin 9pnycJX. Mamy wobec tego wzór na dyfrakcję na siatce, w której
światło przychodzi i wychodzi pod pewnym kątem:
• <P = 2nd(sindwyJl)-2nd(sin6pnyJX). (30.7)
1.2. SIATKA DYFRAKCYJNA
65
Spróbujmy zobaczyć, gdzie w tych
warunkach pojawiają się duże natężenia.
Warunek dużego natężenia wymaga
oczywiście, żeby ę było wielokrotnością 2jt.
Zasługuje przy tym na uwagę wiele
ciekawych spraw.
Je'dnym z bardziej chyba ciekawych
przypadków jest przypadek, w którym
m—Q. Wtedy d może być mniejsze od A;
dokładniej, jeżeli d< X, to jedynym możli- ,„„„..■ . - ,,
uu J J < j j j 30 4 Różnica torów dla promieni rozproszo-
wym rozwiązaniem jest w = 0. W tym wy- nych na dwóch sąsiednich liniach sjatki dyfrak-
padku widzimy, że sin 0wych = sin 0przych, co Cyjnej wynosi rfsin 6wych~if sin 0przyCh
oznacza, że światło wychodzące ma ten sam
kierunek, co światło pobudzające siatkę.
Można by sądzić, że światło „po prostu przechodzi", ale tak nie jest, teraz mówimy o innym
świetle. Światło przechodzące pochodzi wprost z pierwotnego źródła: a to, o którym teraz
mówimy, jest nowym światłem, wytworzonym w wyniku rozpraszania. Okazuje się więc, że
światło rozproszone biegnie w tym samym kierunku, co światło pierwotne. Rzeczywiście,
mogą one z sobą interferować — własnością tą będziemy się zajmować w
przyszłości.
W tym przypadku istnieje jeszcze inne rozwiązanie. Przy danym kącie #pr2ych kąt 0wych
może być dopełnieniem kąta 0pTZych. Otrzymujemy więc nie tylko wiązkę w tym samym
kierunku, co wiązka padająca, ale także wiązkę w innym kierunku, takim (do czego możemy
dojść po chwili zastanowienia), że kąt padania jest równy kątowi rozpraszania. Wiązkę
tę nazywamy wiązką odbitą.
Zaczynamy więc rozumieć podstawowy mechanizm odbicia: padające światło
wytwarza ruch atomów w ośrodku odbijającym; ruch ten jest następnie przyczyną powstania
nowej fali, równanie zaś dla kierunku rozpraszania ma jedno takie rozwiązanie, że kąt,
pod którym światło pada, jest równy kątowi, pod którym ono wychodzi. Gdy
odległość między centrami rozpraszającymi jest mała, rozwiązanie to jest jedynym
rozwiązaniem!
Rozważmy dalej szczególny przypadek, gdy rf-+0. Wtedy, mówiąc po prostu,
mamy lity kawałek substancji o skończonej długości. Chcemy ponadto, aby przesunięcie
fazowe między sąsiednimi centrami rozpraszającymi dążyło do zera. Wstawiamy,
innymi słowy, coraz to więcej anten między już istniejące, tak że każda z różnic fazowych
maleje, liczba zaś anten wzrasta, ale całkowita różnica faz między jednym a drugim
końcem linii pozostaje stała. Zobaczmy, co się dzieje z wzorem (30.3), jeżeli przechodzimy
z liczbą n do nieskończoności, a pojedynczym przesunięciem fazowym do zera, utrzymując
stałą różnicę fazy nę między jednym końcem a drugim (niech nę=<P). Kąt ę staje się tak
mały, że sin ę = ę, i jeżeli uznamy n2I0 za Im, maksymalne natężenie w środku wiązki, to
/ = 4/nsin2(±<Ż>)/<*>2. (30.8)
Ten właśnie graniczny przypadek widzimy na rys. 30.2.
66
30. DYFRAKCJA
30.5. Rozkład natężenia ciągłej linii oscylatorów ma pojedyncze silne maksimum i wiele słabych
„bocznych listków"
Ogólnie w tym przypadku znajdujemy taki sam typ obrazu, jak przy skończonym
odstępie dla d>k; wszystkie boczne listki są praktycznie takie jak poprzednio, ale nie ma
maksimów wyższego rzędu. Jeśli wszystkie czynniki rozpraszające mają zgodne fazy,
to otrzymujemy maksimum dla kierunku #^,.,, = 0, a minimum wtedy, gdy odległość A
jest równa X, tak jak dla skończonych d i n. Możemy więc uwzględnić w naszej analizie
nawet ciągły rozkład centrów rozpraszających lub oscylatorów, posługując się
całkowaniem zamiast sumowania.
Rozważmy jako przykład długą linię oscylatorów, z ładunkami drgającymi wzdłuż
kierunku linii (rys. 30.5). Natężenie promieniowania z takiego układu jest największe
w kierunkach prostopadłych do linii. Istnieje niewielkie natężenie także nad i pod
płaszczyzną równikową, ale jest ono bardzo nikłe. Znajomość tego wyniku pozwala nam na
zajęcie się bardziej złożoną sytuacją. Załóżmy, że mamy układ linii, z których każda
wytwaiza wiązkę tylko w płaszczyźnie do siebie prostopadłej. Sprawa znalezienia
przestrzennego rozkładu natężenia pochodzącego od układu długich drutów (a nie
nieskończenie małych) wygląda tak samo jak i dla drutów nieskończenie małych, jeśli tylko
znajdujemy się w centralnej płaszczyźnie prostopadłej do drutów. Rzecz polega po prostu
na dodaniu przyczynków od każdego z długich drutów. Dlatego właśnie, po
przeanalizowaniu właściwie tylko cienkich anten, mogliśmy otrzymany wynik zastosować do siatki
z długimi, wąskimi szczelinami. Każda z długich szczelin daje efekt tylko w swoim
własnym kierunku, a nie do niego prostopadle, a interferencja bierze się stąd, że szczeliny są
ustawione poziomo blisko siebie.
Korzystając z tego możemy budować bardziej skomplikowane układy, biorąc czynniki
rozpraszające rozłożone liniowo, płasko lub przestrzennie. Najpierw rozważyliśmy
przypadek, kiedy czynniki rozpraszające były ułożone wzdłuż linii; przed chwilą naszą
analizę rozszerzyliśmy na przypadek pasów; aby wszystko dokładnie wyliczyć, musimy po
prostu wykonać konieczne sumowanie przyczynków od poszczególnych centrów
rozpraszających. Zasada pozostaje jednak zawsze taka sama.
30-3. ZDOLNOŚĆ ROZDZIELCZA SIATKI
67
30-3. Zdolność rozdzielcza siatki
Nasze obecne wiadomości pozwalają nam już zrozumieć wiele ciekawych zjawisk.
Rozważmy, na przykład, sprawę wykorzystania siatki do rozdzielania fal o różnych
długościach. Widzieliśmy, jak na ekranie całe widmo zostało rozciągnięte, siatka może być
więc wykorzystana jako narzędzie do rozdzielenia światła na składniki o różnych
długościach fali.
Oto wiążące się z tym ciekawe zagadnienie: weźmy dwa źródła światła o nieco
różniących się częstościach, czyli o nieco różniących się długościach fal. Pytamy: jak dalece
można zmniejszyć różnicę obu częstości, aby za pomocą siatki nie dało się stwierdzić,
ze rzeczywiście mamy do czynienia z dwiema różnymi długościami fali? Czerwień i błękit
jawnie się rozdzielały. Niech jednak pierwsza fala będzie czerwona, a druga tylko trochę
czerwieńsza. Jak blisko siebie mogą one leżeć? Wchodzącą tu w grę własność nazywamy
zdolnością rozdzielczą siatki, a oto jeden ze sposobów analizy problemu: załóżmy, że dla
światła o określonej barwie znaleźliśmy maksimum ugiętej wiązki, pod określonym
kątem. Jeśli zmieniamy długość fali, faza 2nd sin 0/X staje się inna, maksimum pojawia się
więc oczywiście pod innymi kątami. Dlatego to czerwień i błękit są rozmyte. Jaką różnicę
kątów jesteśmy w stanie jeszcze dostrzec? Jeżeli dwa maksima dokładnie pokrywają się
wierzchołkami, to oczywiście nie można ich odróżnić. Jeśli jedno maksimum jest
dostatecznie daleko od drugiego, w rozkładzie światła daje się dostrzec podwójny garb.
Dla dokładnego odróżnienia wzrokiem podwójnego garbu korzysta się zwykle z prostego
kryterium, zwanego kryterium Rayleigha, przedstawionego na rys. 30.6. Rzecz polega na
tym, aby pierwsze minimum jednego garbu pokrywało się z maksimum garbu drugiego.
Bardzo łatwo teraz obliczyć, jaka jest różnica długości fali, kiedy jedno minimum „siedzi"
na drugim maksimum. Najlepiej zrobić to metodą geometryczną.
Aby otrzymać maksimum dla długości fali A', odległość A (rys. 30.3) musi wynosić
nk', a jeśli rozważamy wiązkę m-tego rzędu, to odległość musi wynosić mnX'. Innymi słowy,
2nd sin 0/X' = 2nm, a więc nd sin d, czyli A, jest równe X razy n lub mnX'. Dla drugiej
wiązki, o długości fali X, chcemy mieć w tym miejscu minimum. Żądamy więc, aby A było
dokładnie o jedną długość fali X większe od mnX. Znaczy to, że A = mnX + X=mnX'. Jeżeli więc
X' = X+AX, to
AX/X=l/mn. (30.9)
Stosunek X/AX nazywany jest zdolnością rozdzielczą siatki. Widzimy, że jest ona równa
całkowitej liczbie linii w siatce pomnożonej przez rząd wiązki. Nietrudno udowodnić
30.6. Ilustracja kryterium Rayleigha.
Maksimum jednego rozkładu przypada na
pierwsze minimum drugiego
68
30. DYFRAKCJA
równoważność tego wzoru z następującą formułą mówiącą, że rozmycie częstości jest
równe odwrotności różnicy czasów między skrajnymi drogami, dla których może
zachodzić interferencja*'
jv=i/r.
Niewątpliwie jest to najlepsza postać do zapamiętania, ponieważ wzór ten jest ogólnie
słuszny nie tylko dla siatek, ale i dla dowolnych przyrządów, podczas gdy szczególny
wzór (30.9) jest słuszny tylko wtedy, gdy posługujemy się siatką.
30-4. Antena paraboliczna
Rozważmy teraz inne zagadnienie, wiążące się ze zdolnością rozdzielczą. Zajmiemy
się anteną radioteleskopu używanego do wyznaczania położenia źródeł radiowych na
niebie, to znaczy do stwierdzania, jakie są ich rozmiary kątowe. Gdybyśmy do
szukania sygnałów użyli którejś z dawniej rozważanych anten, to oczywiście nie moglibyśmy się
dowiedzieć, z jakiego one przychodzą kierunku. Ale powinniśmy jednak wiedzieć, czy
światło znajduje się w tym, czy w innym miejscu. W związku z tym może się nasunąć pomysł
ułożenia szeregu równoodległych drutów dipolowych w krajobrazie australijskim. Wtedy
możemy połączyć razem wszystkie przewody prowadzące od tych anten i zasilić nimi
jeden odbiornik tak, aby wszystkie opóźnienia w liniach zasilających były jednakowe.
W ten sposób odbiornik otrzyma sygnały od wszystkich drutów w zgodnej fazie. Znaczy
to, że doda on z tą samą fazą wszystkie fale od każdego dipola. I co wtedy? Otóż jeśli
źródło będzie leżało dokładnie ponad układem, w nieskończoności lub prawie tak daleko,
jego fale radiowe będą pobudzały anteny w jednakowej fazie i będą one zgodnie zasilały
odbiornik.
Załóżmy teraz, że źródło radiowe znajduje się pod niewielkim kątem 9 względem pionu.
Poszczególne anteny odbiorą wówczas sygnały nieco przesunięte w fazie. Odbiornik
zsumuje wszystkie te niezgodne w fazie sygnały i otrzymamy zero, jeżeli kąt 0 będzie
dostatecznie duży. Jak wielki musi być ten kąt? Odpowiedź brzmi: otrzymujemy zero, gdy kąt
A/L = 9 (rys. 30.3) odpowiada przesunięciu fazowemu 360°, to znaczy, gdy A równa się
długości fali A. Dzieje się tak dlatego, że przyczynki wektorowe tworzą razem pełny
wielokąt o wypadkowej równej zeru. Najmniejszy kąt, jaki może być rozróżniony przez układ
antenowy o długości Z,, wynosi 9 = A/L. Zauważmy, że opisany obraz odbioru sygnałów
przez antenę wygląda dokładnie tak samo jak rozkład natężeń, który otrzymalibyśmy
zamieniając odbiornik na nadajnik. Jest to przykład tak zwanej zasady wzajemności.
Jest ona rzeczywiście ogólnie słuszna dla dowolnego układu anten, dowolnych kątów
i tak dalej. Wyliczmy najpierw względne natężenia w różnych kierunkach, tak jak gdyby
odbiornik był nadajnikiem. Względna czułość kierunkowa odbiornika o takich samych
zewnętrznych połączeniach i o takim samym układzie anten jest dokładnie równa
względnemu natężeniu obliczonej emisji.
*' W naszym przypadku T=djc = mnXlc, gdzie c jest prędkością światła. Częstość v = c/X, więc
Jv = cAXIX2. ,
30-4. ANTENA PARABOLICZNA
69
Niektóre anteny radiowe są wykonane inaczej. Zamiast całego mnóstwa dipoli
umieszczonych na długiej prostej, co wymaga wielu drutów zasilających, możemy ułożyć dipole
nie na prostej, ale na krzywej, a odbiornik umieścić w takim punkcie, w którym może on
wykrywać fale rozproszone. Krzywą tę dobiera się tak zręcznie, że gdy fale radiowe padają
z góry, tworząc nową falę, wszystkie fale rozproszone na drutach osiągają odbiornik w takim
samym czasie (rys. 26.12). Inaczej mówiąc, krzywa jest parabolą i gdy źródło znajduje się
dokładnie na jej osi, otrzymujemy bardzo silne natężenie w ognisku. Łatwo w tym
przypadku zrozumieć, jaka jest zdolność rozdzielcza przyrządu. Ustawienie anten na krzywej
parabolicznej nie jest sprawą istotną. Jest tylko wygodnym sposobem zebrania wszystkich
sygnałów w jednym punkcie, bez względnego opóźnienia i bez drutów zasilających. Kąt,
który daje się rozróżnić w takim urządzeniu, może wynosić nadal 0 = 1/L, gdzie L jest
odległością między pierwszą i ostatnią anteną. Nie zależy on od wzajemnej odległości
anten i mogą one znajdować się bardzo blisko siebie albo nawet stanowić po prostu
jednolity kawałek metalu. Mamy teraz oczywiście na myśli zwierciadło teleskopu. Tak więc
znaleźliśmy zdolność rozdzielczą teleskopu! Zdolność rozdzielcza zapisywana jest niekiedy
jako 0=\,22/./L, gdzie L jest średnicą teleskopu. Nie jest ona jednak dokładnie równa
).jL z następującego powodu. Wynik 0 = ).jL otrzymaliśmy przyjmując równe natężenia
dla wszystkich linii dipolowych, gdy jednak mamy teleskop kulisty (taki, jakie zwykle
się buduje), wówczas z brzegów zewnętrznych dochodzi mniej sygnałów. Nie jest to bowiem
przypadek kwadratu, dla którego otrzymujemy jednakowe natężenia wzdłuż całego brzegu.
W rezultacie korzystamy tylko z części teleskopu i efekt jest nieco mniejszy. Łatwo więc
zrozumieć, że efektywna średnica jest nieco krótsza niż średnica prawdziwa. Z tego właśnie
zdaje nam sprawę czynnik 1,22. Mimo to korzystanie z takiej dokładności we wzorze na
zdolność rozdzielczą wydaje się trochę pedanterią**.
30-5. Warstewki barwne; kryształy
Przedstawiliśmy powyżej niektóre efekty interferencyjne uzyskane przez dodawanie
rozmaitych fal. Jest wiele innych przykładów tego rodzaju i chociaż podstawowego ich
mechanizmu na razie nie rozumiemy, kiedyś stanie się on dla nas jasny, a już teraz możemy
zrozumieć jak się interferencja odbywa. Weźmy na przykład światło padające w kierunku
normalnej na powierzchnię ośrodka o współczynniku załamania n. Część światła zostaje
wówczas odbita. Przyczyny odbicia nie możemy na razie zrozumieć; będziemy ją badać
później. Załóżmy jednak, że część światła zostaje odbita zarówno przy wchodzeniu, jak i przy
wychodzeniu z ośrodka załamującego. Spoglądając na odbicie źródła światła w cienkiej
warstewce, zobaczymy sumę dwu fal. Jeżeli grubość warstewki będzie dostatecznie mała,
*' Przede wszystkim dlatego, że już samo kryterium Rayleigha jest pojęciowo przybliżone. Mówi
ono, kiedy pojawiają się duże trudności w stwierdzeniu, czy obraz został wywołany przez jedną, czy
przez dwie gwiazdy. Ale właściwie, jeżeli daje się dostatecznie starannie zmierzyć dokładny rozkład
natężenia na dyfrakcyjnej plamce obrazu, to można wykazać, że plamka została wytworzona przez
dwa źródła nawet wtedy, gdy 6 jest mniejsze niż X/L.
70
30. DYFRAKCJA
obie fale ulegną interferencji bądź konstruktywnej, bądź destruktywnej, zależnie od znaków
faz. Może się na przykład zdarzyć, że dla światła czerwonego uzyskujemy odbicie
spotęgowane, a dla światła niebieskiego, o innej długości fali, fala odbita interferuje
destruktywnie tak, że widzimy tylko jasne odbicie czerwone. Zmieniając grubość warstewki, na
przykład patrząc w inne miejsce, gdzie warstewka jest grubsza, możemy spostrzec zjawisko
odwrotne - czerwień się znosi, a błękit nie, tak że w rezultacie pojawia się silna barwa
błękitna albo zielona, albo żółta, albo jeszcze jakaś inna. Patrząc na cienką warstwę
dostrzegamy więc barwy, które się zmieniają, gdy spoglądamy pod różnymi kątami, bo jak wiemy,
stosunki czasowe są różne przy różnych kątach. Tak oto w jednej chwili wyjaśniają się
tysiące nowych sytuacji, w których obserwujemy pod różnymi kątami barwy na
warstewkach oleju, na bańkach mydlanych i tak dalej. Zasada pozostaje jednak zawsze ta sama:
po prostu dodajemy fale z różnymi fazami.
Jako inne ważne zastosowanie dyfrakcji wspomnijmy sprawę następującą. Widzieliśmy
na ekranie obraz dyfrakcyjny utworzony za pomocą siatki dyfrakcyjnej. Gdybyśmy użyli
światła jednobarwnego, obraz znalazłby się w pewnym określonym miejscu. Pojawiłyby
się wtedy także różne obrazy wyższego rzędu. Gdyby długość fali światła była znana,
to z położeń obrazów można by wywnioskować, jak odległe są od siebie linie na siatce.
Z różnicy natężeń poszczególnych obrazów moglibyśmy znaleźć kształt rys na siatce
i stwierdzić, czy została ona zrobiona z drutów, piłowatych szczerb czy inaczej, chociaż
nie możemy przecież tego zobaczyć. Zasadę tę wykorzystuje się do wykrywania położeń
atomów w krysztale. Trudność polega tylko na tym, że kryształ jest trójwymiarowy; jest
to powtarzający się, trójwymiarowy układ atomów. Nie możemy także użyć zwykłego
światła, bo jeżeli efekt ma się pojawić, musimy użyć promieniowania, które ma długość
fali mniejszą niż odległość między atomami. Musimy więc użyć promieniowania o bardzo
małej długości fali, to znaczy promieni Róntgena. Tak więc oświetlając kryształ
promieniami rentgenowskimi i badając, jakie jest natężenie odbić w różnych rzędach wiązki,
możemy określić wewnętrzny układ atomów nie mogąc ich zobaczyć na własne oczy! W ten
sposób poznajemy ułożenie atomów w różnych substancjach i dzięki temu mogliśmy
w pierwszym rozdziale (t. I, cz. 1) rysować obrazki pokazujące układ atomów w soli
kamiennej i tak dalej. Wrócimy później do tego tematu i omówimy go bardziej
szczegółowo, dlatego nie będziemy teraz już więcej o tej ciekawej sprawie mówić.
30-6. Ugięcie na nieprzezroczystych ekranach
Zajmiemy się teraz bardzo ciekawą sprawą. Załóżmy, że mamy nieprzezroczystą
kartkę papieru z otworami i światło padające z jednej jej strony. Chcemy wiedzieć, jakie
natężenie panuje z drugiej strony kartki. Mówi się na ogół, że światło świeci poprzez
otwory wytwarzając po drugiej stronie jakiś efekt. Okaże się, że w doskonałym
przybliżeniu poprawną odpowiedź można otrzymać, jeżeli się założy, że źródła są rozłożone
z jednostajną gęstością w otworach i że fazy tych źródeł są takie, jakby nieprzezroczystego
materiału wcale nie było. Oczywiście, nie ma naprawdę żadnych źródeł w otworach, jest
to właściwie jedyne miejsce, gdzie na pewno źródeł nie ma. Uzyskujemy jednak poprawny
30-6. UGIĘCIE NA NIEPRZEZROCZYSTYCH EKRANACH
71
obraz dyfrakcyjny uważając otwory za jedyne miejsce, gdzie są źródła. Jest to dosyć dziwne
i wyjaśnimy sobie później, dlaczego jest prawdziwe. Na razie załóżmy po prostu, że tak
jest.
W teorii dyfrakcji istnieje jeszcze inny rodzaj ugięcia, który powinniśmy krótko omówić.
Zwykle nie robi się tego tak wcześnie w kursie elementarnym po prostu dlatego, że wzory
matematyczne polegające na dodawaniu omawianych dawniej małych wektorów są trochę
skomplikowane. Poza tym jednym szczegółem dyskusja nie różni się od tego, co robiliśmy
dotąd. Wszystkie zjawiska interferencyjne są takie same; ich teoria nie zawiera niczego
bardziej skomplikowanego. Warunki mogą być tylko bardziej złożone, co utrudnia
dodawanie wektorów. To wszystko.
Załóżmy, że światło przychodzące z
nieskończoności rzuca na ekran cień
jakiegoś przedmiotu. Rysunek 30.7 pokazuje
ekran, na którym cień przedmiotu AB
utworzony jest przez źródło światła
bardzo odległe w porównaniu z pojedynczą
długością fali. Spodziewamy się pewnie, że
na zewnątrz cienia jest wszędzie jasno,
a wewnątrz wszędzie ciemno. W
rzeczywistości, jeżeli wykreślimy natężenie w
pobliżu granicy cienia jako funkcję położenia,
to wzrasta ono i opada, waha się i
oscyluje koło krawędzi w bardzo dziwny
sposób (rys. 30.8). Zbadamy teraz przyczynę
tego zjawiska. Korzystając z nie
udowodnionego dotąd twierdzenia, możemy
zastąpić właściwy układ przez zbiór
efektywnych źródeł jednostajnie
rozłożonych w niezasłoniętej części przestrzeni
za przedmiotem.
Wyobraźmy sobie układ wielu bardzo
gęsto rozstawionych anten; szukamy
natężenia w pewnym punkcie P. Sprawa
wygląda prawie tak, jak to, co robiliśmy
dotąd. Ale niezupełnie: nasz ekran nie
znajduje się bowiem w nieskończoności,
ale w odległości skończonej. Aby obliczyć
natężenie w pewnym określonym punkcie,
dusimy pododawać przyczynki od
wszystkich anten. Najpierw mamy antenę w
Punkcie D, dokładnie naprzeciw punktu
P Jeżeli przesuniemy się o niewielki kąt,
odpowiadający na przykład wysokości h.
A
przedmiot
nieprzezroczysty
30.7. Odległe źródło światła rzuca na ekran cień
nieprzezroczystego przedmiotu
30.8. Dodawanie amplitud dla wielu
oscylatorów o zgodnej fazie, których opóźnienie fazowe
zmienia się jak kwadrat odległości od punktu D
z poprzedniego rysunku
72
30. DYFRAKCJA
J-i
-To
1,0
,
Q^y
r
1 V/*r
następuje wzrost opóźnienia. (Następuje
także zmiana w amplitudzie,
spowodowana zmianą odległości, ale efekt ten
jest bardzo mały, gdy znajdujemy się dość
daleko. Jest on znacznie mniej ważny
niż różnica w fazach.) Różnica dróg
ED-DP wynosi teraz h2/2s, tak że róż-
x° * nica faz jest proporcjonalna do kwadra-
„„„ v, . . ,_,.. , J . . . _ , tu odległości od D, natomiast w naszych
30.9. Natężenie w pobliżu krawędzi cienia. Cień geo-
metryczny wypada w punkcie *„ poprzednich rachunkach s było
nieskończone i różnica faz była liniowo
proporcjonalna do h. Gdy fazy są proporcjonalne
liniowo, wektory ustawiają się tak, że kąt między dwoma sąsiednimi wektorami jest
stały. My zaś szukamy krzywej powstającej z dodawania wielu nieskończenie małych
wektorów, z tym że kąty między tymi wektorami wzrastają nie liniowo, ale jak kwadrat długości
krzywej. Konstrukcja takiej krzywej wymaga trochę wyższej matematyki, ale za wsze możemy
ją zbudować rysując po prostu strzałki i mierząc kąty. Tak czy inaczej, otrzymujemy
zdumiewającą krzywą (zwaną spiralą Cornu), pokazaną na rys. 30.8. Jak się nią mamy
posługiwać?
Chcąc znaleźć natężenie na przykład w punkcie P dodajemy mnóstwo przyczynków
dawanych przez fazy od punktu D w górę aż do nieskończoności i od D w dół tylko do
punktu BP. Zaczynamy więc od punktu BP na rys. 30.8 i rysujemy szereg strzałek pod
stale wzrastającym kątem. Wobec tego całkowity przyczynek powyżej punktu BP stale
posuwa się wzdłuż zwijającej się krzywej. Zaprzestając całkowania w jakimś punkcie
otrzymalibyśmy całkowitą amplitudę jako wektor od punktu B do tego właśnie punktu.
W naszym szczególnym przypadku posuwamy się aż do nieskończoności i pełnym
rozwiązaniem jest wektor BPcc. Położenie na krzywej, odpowiadające punktowi BP na
przedmiocie, zależy od położenia punktu P, ponieważ D, punkt przegięcia, zawsze odpowiada
położeniu punktu P. Zależnie więc od tego, gdzie leży punkt P ponad B, punkt początkowy
będzie przyjmował rozmaite położenia na lewej dolnej części krzywej, a wypadkowy
wektor BP=C będzie przechodził przez liczne maksima i minima (rys. 30.9).
Jeżeli jednak znajdujemy się w punkcie Q, po przeciwnej stronie punktu P,
uwzględniamy tylko jeden koniec spirali, a nie korzystamy w ogóle z drugiego. Inaczej mówiąc, nie
zaczynamy wcale od punktu D, ale od punktu BQ, tak że po tej stronie otrzymujemy
natężenie spadające w sposób ciągły, w miarę jak punkt Q zagłębia się w cieniu
Dla pokazania, że naprawdę rozumiemy całą sprawę, możemy natychmiast obliczyć
z łatwością natężenie akurat naprzeciw krawędzi. Natężenie wynosi tutaj i padającego
światła. Przyczyna: dokładnie na krawędzi (wtedy gdy końcowy punkt B strzałek
znajduje się w D na rys. 30.8) pozostaje nam z krzywej połowa wartości osiąganej daleko
w jasnym obszarze. Gdy nasz- punkt R leży daleko w obszarze oświetlonym, posuwamy
się od jednego końca krzywej do drugiego, to znaczy o jeden pełny wektor jednostkowy.
Gdy zaś znajdujemy się na krawędzi cienia, mamy tylko pół amplitudy - i natężenia.
Zajmowaliśmy się w tym rozdziale natężeniem wytwarzanym w różnych kierunkach
30-6. UGIĘCIE NA NIEPRZEZROCZYSTYCH EKRANACH
73
przez rozmaite rozkłady źródeł. Teraz rozpatrzymy ostatni nasz przykład prowadzący
do wzoru, który będzie nam potrzebny w następnym rozdziale, dotyczącym teorii
współczynnika załamania. Dotąd do naszych celów wystarczała znajomość względnych natężeń,
teraz jednak znajdziemy pełny wzór na pole.
30-7. Pole pochodzące od płaszczyzny drgających ładunków
Załóżmy, że mamy płaszczyznę wypełnioną źródłami zgodnie wykonującymi w
płaszczyźnie ruchy drgające o takich samych amplitudach i fazach. Jakie jest pole w skończonej,
ale bardzo wielkiej odległości od płaszczyzny? (Oczywiście, nie możemy się bardzo zbliżać
do płaszczyzny, ponieważ nie mamy odpowiednich wzorów na pole blisko źródeł.) Niech
ładunki leżą w płaszczyźnie AT, my zaś będziemy szukali pola w punkcie P daleko na osi Z
(rys. 30.10). Zakładamy, że na jednostce powierzchni płaszczyzny znajduje się r\ ładunków,
z których każdy ma wielkość q. Wszystkie ładunki poruszają się ruchem drgającym prostym
o tym samym kierunku, amplitudzie i fazie. Niech ruch każdego ładunku względem jego
własnego położenia średniego będzie opisany przez x0 cos cot. Posługując się zaś zapisem
zespolonym i pamiętając, że właściwy ruch przedstawiony jest przez część rzeczywistą,
możemy go opisać przez x0 e10".
Obliczamy teraz w punkcie P pole wszystkich ładunków, znajdując najpierw pole
każdego ładunku q, a następnie dodając przyczynki od nich wszystkich. Wiemy, że pole
promieniowania jest proporcjonalne do przyspieszenia ładunku, które wynosi -uj2x0 e""'
(i jest takie samo dla każdego ładunku). Pole elektryczne w punkcie P, pochodzące od
ładunku w punkcie Q, jest proporcjonalne do przyspieszenia ładunku q, przy czym musimy
pamiętać, że pole w punkcie P w chwili ł dane jest przez przyspieszenie ładunku we
wcześniejszej chwili t' = t-rjc, gdzie r/c jest czasem zużytym przez fale na przebycie odległości
r od punktu Q do P. Wobec tego pole w punkcie P jest proporcjonalne do
-aj2x0eM'_,/c). (30.10)
Gdy wartość przyspieszenia, mierzoną w
punkcie P, wstawimy do naszego wzoru na
pole elektryczne w dużych odległościach od 30 ,0 PoIe pr0mieniowania płaszczyzny drga-
promieniującego ładunku, otrzymamy jących ładunków
(pole elektryczne w punkcie P\ q
od ładunku w punkcie Q I 4ne0 c2
2„ Jia(t- r/c)
W XOe
X-— (w przybliżeniu). (30.11)
r
W obecnej postaci wzór ten nie jest
zupełnie ścisły, ponieważ powinniśmy wstawić
nie przyspieszenie ładunku, ale jego
składową prostopadłą do linii QP. Bierzemy jednak
drgający ładunek
płaszczyzna drgających
ładunków
74
30. DYFRAKCJA
tak dużą odległość punktu P w porównaniu z odległością punktu Q od osi (odległość p
na rys. 30.9), że dla tych zmian, które uwzględniamy, czynnik cosinusowy (i tak prawie
równy 1) można pominąć.
Aby uzyskać całkowite pole w punkcie P, dodajemy teraz wszystkie przyczynki od
ładunków na płaszczyźnie. Suma powinna oczywiście być sumą wektorową. Ponieważ
jednak kierunek pola elektrycznego jest prawie taki sam dla wszystkich ładunków,
możemy zgodnie z naszym poprzednim przybliżeniem po prostu dodawać wartości pól.
W przybliżeniu tym pole w punkcie P zależy od odległości r i wszystkie ładunki o tym
samym r wytwarzają tu jednakowe pola. Dodajemy więc najpierw pola ładunków w
pierścieniu o szerokości dp i o promieniu p. Całkowite pole otrzymamy wykonując następnie
całkowanie po wszystkich p.
Liczba ładunków w pierścieniu jest iloczynem pola powierzchni pierścienia 2np dp
i liczby ładunków na jednostkowej powierzchni tj. Mamy więc
-f.
<o2x0e,ol'-"e)
całkowite pole w punkcie P= I j rjlnpdp. (30.12)
47ie0c r
Zamierzamy obliczyć tę całkę w granicach od p = 0 do p=oo. Zmienna t musi być
oczywiście ustalona podczas całkowania, a jedynymi zmieniającymi się wielkościami będą
p i r. Po opuszczeniu na chwilę wszystkich stałych czynników, włącznie z czynnikiem
e"0', otrzymamy szukaną całkę:
/• g-iwr/c
pdp. (30.13)
p = 0
Aby ją obliczyć, musimy skorzystać ze związku między p i r:
r2 = p2 + z2. (30.14)
Ponieważ z nie zależy od p, różniczkujemy więc to równanie i otrzymujemy
2r dr = 2p dp ,
co jest bardzo szczęśliwą okolicznością, ponieważ w naszej całce możemy zastąpić
iloczyn p dp iloczynem r dr i r zniesie się z r w mianowniku. Poszukujemy więc
prostszej całki:
J e'^dr. (30.15)
r = z
Całkowanie funkcji wykładniczej jest bardzo łatwe. Dzielimy ją przez współczynnik przy
zmiennej r w wykładniku i wyliczamy funkcję wykładniczą na krańcach przedziału
całkowania. Ale granice r nie są takie same jak granice p. Gdy p = 0, r = z, tak że r zmienia się
w granicach od z do oo i dla całki otrzymujemy wartość
-^[e-ioo-e-(iw/c)2], (30.16)
« ioa
30-7. POLE POCHODZĄCE OD PŁASZCZYZNY DRGAJĄCYCH ŁADUNKÓW 75
6=
A8=
~c t
o>Ar 1
"C "
— ■■■ ^ *~ n
S'
c.
oś urojona
oś rzeczywista
^8
\ v4e
\ 4r\>
A T Ae
gdzie napisaliśmy oo zamiast (co/c)oo, ponieważ oba te wyrażenia oznaczają po prostu
bardzo dużą liczbę!
Wyrażenie e-,a) jest bardzo dziwne. Tak na przykład jego część rzeczywista wynosi
cos(-oo), który z punktu widzenia matematyki jest całkowicie nieoznaczony (chociaż
możemy się spodziewać, że znajdziemy go w pewnym punkcie — albo też w jakimś
przedziale (?) - między + 1 a -1!). Ale z punktu widzenia fizyki wyrażenie to może oznaczać
coś zupełnie sensownego i zwykle bywa po prostu uznawane za zero. Aby się o tym i w
naszym przypadku przekonać, wracamy znowu do badania początkowej całki (30.15).
Możemy rozumieć całkę (30.15) jako sumę wielu małych liczb zespolonych, z których
każda ma moduł Ar i fazę 9= -cor/c w płaszczyźnie zespolonej. Spróbujmy obliczyć tę
sumę sposobem graficznym. Na rysunku 30.11 zaznaczyliśmy pierwsze pięć wyrazów
tej sumy. Każdy odcinek krzywej ma długość Ar i jest ustawiony pod kątem A6= -co Arjc
względem poprzedniego. Suma tych
pięciu składników jest
przedstawiona jako strzałka od punktu
początkowego do końca piątego odcinka!
W miarę dalszego dodawania
odcinków zakreślamy wielobok, aż
dojdziemy z powrotem do punktu
początkowego (w przybliżeniu) i
wówczas znowu rozpoczyna się ruch
dookoła. Dodając coraz więcej
odcinków po prostu wędrujemy wkoło,
stale pozostając blisko okręgu,
którego promień, jak łatwo pokazać,
wynosi cjm. Widać teraz, dlaczego
całkowanie nie daje określonej
odpowiedzi!
Wróćmy jednak znowu do fizyki
całej sytuacji. W każdym
rzeczywistym układzie płaszczyzna
ładunków nie może być nieskończenie
rozciągła, ale musi się gdzieś kończyć.
Gdyby kończyła się nagle i miała
dokładnie kształt koła, nasza całka
przyjmowałaby jakąś wartość leżącą
na okręgu z rys. 30.11. Jeżeli jednak
gęstość ładunków na płaszczyźnie
będzie w pewnej dużej odległości od
środka stopniowo maleć (albo też
spadać nagle, ale wzdłuż
nieregularnej krzywej, tak aby dla większych p
całkowity pierścień o szerokości dp
suma\
30.11. Graficzne rozwiązanie funkcji fe ""r'c<fr
30.12. Graficzne rozwiązanie funkcji J' 7 e ,w,/e dr
o
urojona
76
30. DYFRAKCJA
nie dawał już przyczynków), współczynnik 77 w ścisłej całce będzie spadał do zera.
Jeżeli dodajemy zmniejszające się odcinki, ale nadal obracamy się o ten sam kąt, to wykres
naszej całki przybiera kształt krzywej spiralnej. Spirala osiąga wreszcie kres w środku
naszego początkowego okręgu, jak to przedstawia rys. 30.12. Fizycznie poprawną wartością
całki jest zespolona liczba A, pokazana na rysunku jako odległość od punktu początkowego
do środka koła, równa dokładnie
~e-i0,z/c, (30.17)
ico
co można sobie samemu obliczyć. Jest to taki sam wynik, jaki otrzymalibyśmy z równania
(30.16), przyjmując w nim e""x' = 0.
(Z innego jeszcze powodu przy dużych wartościach r przyczynki do całki ubywają;
chodzi mianowicie o czynnik opuszczony przez nas przy rzutowaniu przyspieszenia na
płaszczyznę prostopadłą dla linii PQ.)
Interesują nas oczywiście tylko sytuacje fizyczne, przyjmiemy więc, że e~lco jest równe
zeru. Wracając do naszego początkowego wzoru (30.12) dla pola i wstawiając z powrotem
wszystkie czynniki towarzyszące całce, otrzymujemy:
całkowite pole w punkcie P= ia;x0eM'_I/c) (30.18)
2e0c
(pamiętamy, że l/<=-<)•
Warto zauważyć, że (ia>x0 t'0") jest dokładnie równe prędkości ładunków. Możemy
więc także napisać równanie dla pola w postaci:
całkowite pole w punkcie /*= [prędkość ładunków] , (30.19)
££q ^ tot — zfc
co wygląda dość dziwnie, ponieważ opóźnienie jest spowodowane dokładnie przez
odległość z, czyli przez najkrótszą odległość punktu P od płaszczyzny ładunków. Ale taki właśnie
jest wynik rachunków, które na szczęście dają raczej prosty wzór. (Możemy przy okazji
dodać, że chociaż nasze wyprowadzenie jest ważne tylko dla dużych odległości od
płaszczyzny drgających ładunków, końcowe jednak wzory (30.18) lub (30.19) są, jak się okazuje,
poprawne dla każdej odległości, nawet dla odległości z<k.)
31
skqd się bierze współczynnik załamania
31-1. Współczynnik załamania
Powiedzieliśmy poprzednio, że światło rozchodzi się w wodzie wolniej niż w powietrzu,
w powietrzu zaś nieco wolniej niż w próżni. Opisując to zjawisko posługujemy się pojęciem
współczynnika załamania n. Teraz chcielibyśmy zrozumieć, skąd się bierze taka
zmniejszona prędkość. W szczególności postaramy się zobaczyć, jak to się wiąże z pewnymi
założeniami czy stwierdzeniami fizycznymi, które wypowiedzieliśmy już wcześniej. Były one
następujące:
1. Całkowite pole elektryczne w dowolnych warunkach fizycznych można zawsze
przedstawić jako sumę pól pochodzących od wszystkich ładunków we wszechświecie.
2. Pole promieniowania pochodzące od pojedynczego ładunku jest proporcjonalne do
przyspieszenia ładunku, wziętego z opóźnieniem odpowiadającym zawsze prędkości c.
My jednak rozważamy światło rozchodzące się w kawałku szkła. Narzuca się więc
myśl zmiany naszych założeń. Czy nie należy raczej powiedzieć, że opóźnienie odpowiada
prędkości cjnl Otóż nie jest to prawda i trzeba zrozumieć dlaczego.
W przybliżeniu prawdą jest, że w substancji, której współczynnik załamania wynosi
n, światło albo jakakolwiek fala elektryczna pozornie rozchodzi się z szybkością c/n.
Jednakże pola zawsze powstają wskutek ruchu wszystkich ładunków — włączając w to i ładunki
poruszające się w substancji - i ostateczna prędkość tych wszystkich przyczynków do
pola wynosi c. Wynika więc sprawa zrozumienia, skąd się tu bierze pozornie mniejsza
prędkość.
Zjawisko to postaramy się zrozumieć, rozpatrując bardzo prosty przypadek. W dużej
odległości od cienkiej płytki wykonanej z przezroczystej substancji, np. szkła, umieszczamy
źródło, które będziemy nazywać „źródłem zewnętrznym". Jakie będzie pole w dużej
odległości po przeciwnej stronie płytki? Sytuację przedstawia rys. 31.1, przy czym należy sobie
wyobrazić, że punkty 5 i P są bardzo odległe od płytki. Zgodnie z wypowiedzianymi
78
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
źródło fali
elektrycznej
31.1. Fale elektryczne przechodzące przez warstwę przezroczystego ośrodka
poprzednio zasadami pole elektryczne gdzieś daleko od wszystkich poruszających się
ładunków jest sumą (wektorową) pól wytworzonych przez zewnętrzne źródło (w punkcie 5)
i pól wytworzonych przez każdy z ładunków poruszających się w płytce szkła. Wszystkie
te pola występują w tej sumie ze swoimi własnymi opóźnieniami odpowiadającymi prędkości c.
Pole pochodzące od każdego ładunku nie zmienia się przy tym wskutek obecności
innych ładunków. To są właśnie podstawowe zasady. Pole w punkcie P można więc
zapisać w postaci:
E= l_ -każdego ładunku (-»1-1)
wszystkie
ładunki
albo
E = E, + 2, -każdego ładunku ' (31-2)
wszystkie
ładunki
gdzie Es jest polem pochodzącym od samego tylko źródła. Byłoby ono dokładnie równe
polu w punkcie P, gdyby pomiędzy punktami S i P nie było żadnego ośrodka. Przewidujemy,
że pole w punkcie P będzie różne od pola E,, jeżeli wprowadzimy jeszcze inne poruszające
się ładunki.
Skąd jednak w szkle mają się znaleźć poruszające się ładunki? Otóż wiemy, że każdy
ośrodek materialny składa się z atomów zawierających elektrony. Pole elektryczne źródła
działając na te atomy porusza elektronami tam i z powrotem, ponieważ działa na nie siłą.
Poruszające się zaś elektrony wytwarzają pole, czyli stają się nowymi źródłami
promieniowania. Te nowe źródła są związane ze źródłem 5, ponieważ wzbudzane są przez jego
pole. Całkowite pole nie jest więc już dokładnie polem źródła S, bo zmieniło się o
dodatkowe przyczynki od innych poruszających się ładunków. Znaczy to, że pole nie jest już
takie, jakie było przed umieszczeniem szkła, ale uległo zmianie i zmiana ta jest taka, że
pole wewnątrz szkła pozornie porusza się z inną prędkością. Taka jest główna myśl, którą
będziemy chcieli ująć ilościowo.
Jest to zadanie dość skomplikowane, jeżeli sprawę mamy potraktować ściśle. Nie jest
bowiem całkowicie prawdziwe, że wszystkie poruszające się ładunki są pobudzane tylko
przez pole źródła. Skupmy uwagę na określonym ładunku. Zauważmy, że odczuwa on nie
tylko obecność źródła, ale jak wszystko inne na świecie odczuwa on także wpływ wszystkich
fala
padająca
/
fala
„odbita'
fala
.przepuszczona"
A
p
czemu się równa
pole elektryczne
w tym punkcie?
płytka szklana
31-1. WSPÓŁCZYNNIK ZAŁAMANIA
79
poruszających się ładunków, a w szczególności wpływ ładunków poruszających się w
innych miejscach szkła. Całkowite pole, działające na określony ładunek, składa się z pól
od innych ładunków, których ruchy zależą z kolei od tego, co robi nasz wybrany ladunekl
Widać, że do uzyskania pełnego i dokładnego wzoru trzeba skomplikowanego układu
równań. Sprawa jest tak złożona, że odkładamy to zagadnienie do następnego tomu.
Zamiast tego zbadamy bardzo prosty przypadek, który pozwoli nam jasno zrozumieć
wszystkie zasady fizyczne. Rozważmy sytuację, w której wpływ innych atomów jest bardzo
słaby w porównaniu z wpływem źródła. Innymi słowy, rozważmy ośrodek, w którym
całkowite pole nie zmienia się wskutek ruchu innych ładunków. Odpowiada to ośrodkowi,
którego współczynnik załamania jest bardzo bliski 1. Tak się dzieje na przykład wtedy,
gdy gęstość atomów jest bardzo mała. Nasz rachunek będzie ważny w dowolnym przypadku,
w którym współczynnik załamania jest z jakiegokolwiek powodu bliski 1. Unikniemy w ten
sposób komplikacji towarzyszących najbardziej ogólnemu, pełnemu rozwiązaniu.
Warto tu przy okazji zauważyć, że ruch ładunków w płytce powoduje jeszcze inne
zjawisko. Ładunki te będą promieniowały fale także z powrotem w kierunku źródła 5. Takie
biegnące wstecz pole jest światłem, które widzimy jako odbite od powierzchni
przezroczystych substancji. Nie pochodzi ono po prostu z powierzchni. Promieniowanie biegnące
wstecz pochodzi z całego wnętrza, ale okazuje się, że całkowity wynik równoważny jest
odbiciu od powierzchni. Takie zjawiska odbicia przekraczają chwilowo zakres naszego
przybliżenia, ponieważ w rachunkach ograniczamy się do substancji o współczynniku
załamania tak bliskim jedności, że tylko bardzo mała ilość światła ulega odbiciu.
31.2. Związek między załamaniem
i zmianą prędkości
/
Zanim uczynimy dalszy krok w badaniu, skąd się bierze współczynnik załamania,
musimy sobie uprzytomnić, że zrozumienie zjawiska załamania sprowadza się do zrozumienia
tego, dlaczego pozorna szybkość fali jest różna w
różnych substancjach. Zakrzywianie się promieni
świetlnych zachodzi po prostu dlatego, że
wypadkowa prędkość fal zależy od ośrodka. Dla
przypomnienia skąd się to bierze, narysowaliśmy na rys. 31.2
kilka kolejnych grzbietów fali elektrycznej,
padającej z próżni na powierzchnię szklanego bloku.
Strzałka prostopadła do grzbietów wskazuje
kierunek ruchu fali. Zauważmy, że wszystkie drgania
fali muszą mieć tę samą częstość. (Widzieliśmy, że
drgania wzbudzone mają tę samą częstość co źródło
pobudzające.) Oznacza to też, że grzbiety fal po
obu stronach powierzchni granicznej muszą leżeć
"a niej w równych odstępach. Muszą one bowiem
poruszać się razem tak, aby ładunek znajdujący się
na granicy ośrodka odczuwał tylko jedną częstość.
Ale najkrótszą odległością między grzbietami
fali jest długość fali równa prędkości podzielonej
próżnia
/
A
'i '
I /
V /
grzbiety fal
/u /szk,°
80
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
przez częstość. Dla próżni mamy ?.0 = 2nc/oj, a po drugiej stronie X = 2nv/co, czyli 2nc/a>n,
gdzie v = cin oznacza prędkość fali. Z rysunku można dostrzec, że jedyny sposób właściwego
„dopasowania się" fal na powierzchni granicznej polega na tym, aby fale w ośrodku
posuwały się pod zmienionym kątem względem powierzchni. Z zależności geometrycznych
wynikających z rysunku można się przekonać, że dla „dopasowania" musi zachodzić
/.o/sinOo = /./sin0 , czyli sin 0Q; sin 0 = « ,
co stanowi treść prawa Snella. W pozostałej części naszych rozważań będziemy się
zastanawiać tylko nad tym, dlaczego w substancji o współczynniku załamania n światło ma
efektywną szybkość c/n. Sprawą zakrzywienia kierunku światła nie będziemy się w tym
rozdziale więcej zajmować.
Wracamy znowu do sytuacji przedstawionej na rys. 31.1. Widzimy, że sprawa polega
na obliczeniu pola wytwarzanego w punkcie P przez wszystkie ładunki drgające w szklanej
płytce. Tę część pola oznaczymy jako Ea. Ona właśnie stanowi sumę napisaną jako drugi
■wyraz w równaniu (31.2). Gdy dodamy ją do wyrazu £s, pochodzącego od źródła,
otrzymamy całkowite pole w punkcie P.
To, o czym teraz będziemy mówić, jest zapewne najtrudniejszym fragmentem materiału
tego tomu. Ale trudność bierze się tylko stąd, że na całość rozumowania składa się wiele
części, które trzeba złożyć razem każda część z osobna jest jednakże bardzo prosta.
W odróżnieniu od większości przypadków, kiedy to możemy powiedzieć: „Co tam
wyprowadzenie, ważny jest wynik!", tym razem nie zależy nam tyle na wyniku, ile na
wyprowadzeniu. Innymi słowy, trzeba teraz zrozumieć fizyczne przyczyny pojawiania się
współczynnika załamania.
Aby zrozumieć tok postępowania, trzeba najpierw znaleźć takie „pole-poprawkę" Ea,
aby całkowite pole w punkcie P wyglądało jak promieniowanie ze źródła, spowolnione
podczas przechodzenia przez cienką płytkę. Gdyby płytka nie miała na nie wpływu, polem
fali poruszającej się w prawo (wzdłuż osi z) byłoby
Es = E0cos [w(f-zje)] ' (31.3)
albo, używając zapisu wykładniczego,
£s = £0eM'-r/c). (31.4)
Co by się teraz stało, gdyby fala przechodząc przez płytkę rozchodziła się wolniej?
Niech Az będzie grubością płytki. Gdyby płytki nie było, fala przebyłaby odległość Az
w czasie Azje. Jeżeli jednak porusza się ona pozornie z prędkością cjn, to przejście
zabierze jej dłuższy czas n Azje, czyli dodatkowy czas At = {n- \)Azjc. Po wyjściu z płytki będzie
się ona rozchodzić znowu z prędkością c. Możemy uwzględnić dodatkowe opóźnienie
spowodowane przechodzeniem przez płytkę, jeśli zastąpimy w równaniu (31.4) t przez
(t — At), czyli przez [f-(n-l)/fz/c]. A więc po wstawieniu płytki fala powinna być
zapisana w postaci
, Łz* płytką -Ł0e • (Jl-J)
l.|. WSPÓŁCZYNNIK ZAŁAMANIA
81
Równanie to możemy także napisać jako
P _ -iu>(n-1 I Jz/cp iui(t-zlc)
•^za płytką — c C0C
(31.6)
Mówi nam ono, że fala za płytką powstaje z fali rozchodzącej się bez płytki, to jest z £,'
pomnożonej przez czynnik e_"u<',-1><li/r Wiemy jednak, że mnożenie przez czynnik e'8
funkcji oscylującej e"°* oznacza po prostu zmianę fazy drgań o kąt 9. Jest to oczywiście
spowodowane dodatkowym opóźnieniem przy przechodzeniu przez płytkę o grubości
Az. Z tego właśnie powodu faza została cofnięta o wielkość a>(n-\)Az (cofnięta,
ponieważ występuje znak minus w wykładniku).
Poprzednio powiedzieliśmy sobie, że płytka powinna dodać jakieś pole £a do
właściwego pola £s= £0e"*"-I/e), a tymczasem stwierdziliśmy, że działanie płytki polega na
mnożeniu pola przez czynnik przesuwający jego fazę. Wszystko jest jednak w zupełnym
porządku, gdyż ten sam wynik możemy uzyskać przez dodanie odpowiedniej liczby
zespolonej. Liczbę tę szczególnie łatwo można znaleźć w przypadku małego o grubości Az,
pamiętamy bowiem, że jeśli x jest małą liczbą, to e* jest w przybliżeniu równe 1 +x.
Możemy więc napisać
e"to("",Ml/c=l-iw(«-l)Jz/c. (31.7)
Wykorzystując tę równość w równaniu (31.6) mamy
£ _P eM«-./r> M"-0^
Łza płytką — ^0 c
£0e
,i<o(i-2/c)
(31.8)
Pierwszy wyraz określa właśnie pole źródła, a drugi musi być dokładnie równy polu £a
wytwarzanemu na prawo od płytki przez jej drgające ładunki. Pole to jest tutaj wyrażone
za pomocą współczynnika załamania i zależy, oczywiście, od natężenia fali ze źródła.
31.3. Wykres fali przepuszczonej w
określonym czasie t i przy określonym z
Przeprowadzone rozumowanie łatwo jest zilustrować na płaszczyźnie liczb
zespolonych przedstawionej na rys. 31.3. Najpierw przedstawiamy geometrycznie liczbę £s
(wybierając takie wartości na z i t, aby wektor Es był
poziomy, ale to nie jest konieczne).
Opóźnienie wywołane spowolnieniem w płytce cofnie
fazę o pewną liczbę, to znaczy obróci wektor
E, o kąt ujemny. Jest to równoważne dodaniu
małego wektora Ea prostopadłego w
przybliżeniu do wektora Es. Takie właśnie znaczenie
ma czynnik -iw drugim wyrazie równania
(31.8). Mówi on, że jeżeli Es jest liczbą
rzeczywistą, to £a jest liczbą ujemną urojoną
albo, ogólnie biorąc, że wektory Es i Ea
tworzą między sobą kąt prosty.
''oś urojona
kąt=w(n-1)4z/c
82
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
31-2. Pole pochodzące od ośrodka materialnego
Musimy teraz postawić sobie pytanie: Czy pole Ea przedstawione matematycznie jako
drugi wyraz wyrażenia (31.8) jest takie właśnie, jakiego oczekujemy od drgających ładunków
w płytce? Jeżeli się nam uda to pokazać, to tym samym obliczymy wielkość, która powinna
być współczynnikiem załamania n\ [Ponieważ n jest jedyną niepodstawową wielkością
w równaniu (31.8).] Zajmiemy się więc obliczaniem pola Ea wytwarzanego przez ładunki
w ośrodku. (Dla ułatwienia orientacji zebraliśmy w tab. 31.1 liczne używane dotąd
oznaczenia, którymi będziemy się jeszcze posługiwać w pozostałej części naszego rachunku.)
Tabela 31.1. Oznaczenia używane w rachunkach
E, — pole źródła
Ec — pole wytworzone przez ładunki w płytce
Az — grubość płytki
z — prostopadła odległość od płytki
n — współczynnik załamania
w — częstość (kątowa) promieniowania
N — liczba ładunków na jednostkę objętości płytki
r\ — liczba ładunków na jednostkę powierzchni płytki
qe — ładunek jednego elektronu
m — masa elektronu
to0 — rezonansowa częstość elektronu związanego w atomie
Jeżeli źródło S (z rys. 31.1) znajduje się daleko na lewo, to pole Es ma tę samą fazę
wszędzie na płytce. Możemy więc napisać, że w sąsiedztwie płytki
ą = £0ei<o"-z/c). (31.9)
Dokładnie na płytce, tam gdzie z = 0, będziemy mieli
Es = £0eia" (na płytce). (31.10)
Każdy z elektronów w atomach płytki odczuje obecność tego pola elektrycznego.
Będzie ono poruszało nimi w górę i w dół (zakładamy, że pole E0 ma kierunek pionowy)
działając na nie elektryczną siłą qE. Dla znalezienia spodziewanego ruchu elektronów
będziemy zakładali, że atomy są małymi oscylatorami. Znaczy to, że elektrony są
przyczepione do atomów sprężyście, co z kolei oznacza, że wychylenie elektronu z położenia
normalnego jest proporcjonalne do siły działającej na ten elektron.
Ktoś, kto słyszał o elektronach kręcących się po orbitach, mógłby pomyśleć, że podajemy
tu dość zabawny model atomu. A jednak właśnie obraz orbit jest uproszczony. Poprawny
obraz atomu, podany przez teorię mechaniki falowej, mówi, że w zakresie zjawisk
związanych ze światłem elektrony zachowują się tak, jak gdyby były utrzymywane na sprężynach.
Będziemy więc zakładać, że na elektrony działa wprost proporcjonalna do wychylenia
siła przywracająca, która wraz z ich masą m sprawia, że zachowują się one jak małe oscy-
3|-2. POLE POCHODZĄCE OD OŚRODKA MATERIALNEGO
83
latory o częstości rezonansowej a>0 .Oscylatory takie już badaliśmy i wiemy, że ich równanie
ruchu zapisuje się wzorem:
d2x
^2+o>Sx) = F. (31.11)
gdzie F jest silą pobudzającą.
W naszym zagadnieniu silą pobudzająca pochodzi od pola elektrycznego fali źródła,
powinniśmy więc przyjąć
F = qeEs = qeE0e"»', (31.12)
gdzie qe jest elektrycznym ładunkiem jednego elektronu, Es zastępujemy zaś wyrażeniem
Es = E0e'"" z wzoru (31.10). Naszym równaniem ruchu elektronu jest więc
m(-^ + u>lx\ = ąeE0ck°'. (31.13)
Równanie to rozwiązaliśmy już przedtem i wiemy, że jego rozwiązaniem jest
x = x0e"°', (31.14)
gdzie x0, po podstawieniu do równania (31.13), okazuje się równe
qeE0
tak że
*o:
m
m(u>l-
1eE0
(tol-to
-»2)
t/"'
(31.15)
(31.16)
Mamy więc to, czego szukaliśmy — opis ruchu elektronów w płytce. Ruch ten jest taki sam
dla każdego elektronu, z tym jednak że średnie położenie („punkt zerowy" ruchu) każdego
elektronu jest oczywiście inne.
Teraz jesteśmy przygotowani do znalezienia pola Ea wytwarzanego w punkcie P przez
atomy, gdyż już przedtem (na końcu rozdz. 30) obliczyliśmy pole wytwarzane przez warstwę
ładunków zgodnie się poruszających. Odwołując się do wzoru (30.19) stwierdzamy, że
pole Ea w punkcie P jest po prostu równe pewnej ujemnej stałej pomnożonej przez prędkość
ładunków opóźnioną w czasie o wielkość z/c. Zróżniczkowanie x w wyrażeniu (31.16)
w celu otrzymania prędkości i wprowadzenie opóźnienia [albo po prostu wstawienie
x0 z wzoru (31.15) do (30.18)] daje
W,
2e
qjL \ico q'E° e*»(.-x/c>] (3U7)
0c(_ m(o}0-(o ) J
Wynik jest właśnie taki, jakiego się spodziewaliśmy. Wzbudzony ruch elektronów
wytworzył dodatkową falę poruszającą się w prawo [to właśnie mówi czynnik e"°('_z/c)].
Amplituda tej fali jest proporcjonalna do liczby atomów na jednostkę powierzchni płytki (czynnik
V) i do natężenia źródła (czynnik E0). Występują tu ponadto pewne czynniki, które zależą
°d własności atomowych {qe, m i a>0), czego się również należało spodziewać.
84
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
Najważniejsze jednak jest to, że wzór (31.17) dla E0 wygląda bardzo podobnie do
wyrażenia na E0 uzyskanego we wzorze (31.8). Założyliśmy wtedy, że fala wyjściowa została
opóźniona na skutek przejścia przez ośrodek o współczynniku załamania n. Oba te wyrażenia
będą rzeczywiście identyczne, jeżeli
ml
(n-\)Az=- —2 T (31.18)
2e0m(eu0 —eu )
Zauważmy, że obie strony tego równania są proporcjonalne do Az, ponieważ n, liczba
atomów na jednostkę powierzchni, jest równa A' Az, gdzie A' oznacza liczbę atomów na
jednostkę objętości płytki. Podstawiając wyrażenie N Az zamiast n i skracając przez Az
otrzymujemy nasz główny wynik — wzór na współczynnik załamania wyrażony przez
własności atomów ośrodka — i przez częstość światła:
Na2
n=l+ « (3U9)
2ł0 m (eu0 — a> )
Równanie to daje nam „wyjaśnienie" współczynnika załamania, co właśnie chcieliśmy
uzyskać.
31-3. Dyspersja
Zauważmy, że powyższe przekształcenia dały nam w wyniku coś bardzo ciekawego.
Nie tylko bowiem mamy liczbową wartość współczynnika załamania, którą możemy
obliczyć z podstawowych wielkości atomowych, ale widzimy także, jak współczynnik załamania
powinien się zmieniać z częstością światła co. Nigdy do tego byśmy nie doszli opierając
się tylko na stwierdzeniu, że „światło w przezroczystym ośrodku rozchodzi się wolniej".
Pozostaje oczywiście nadal otwarta sprawa, ile atomów przypada na jednostkę objętości
i jaka jest ich naturalna częstość co0. Sprawy tej nie możemy teraz rozstrzygnąć, ponieważ
wielkości te są różne dla różnych substancji, a nie mamy na razie ogólnej teorii zjawiska.
Sformułowanie ogólnej teorii własności różnych ośrodków materialnych - ich naturalnych
częstości itd. — jest możliwe tylko przy pomocy kwantowej mechaniki atomowej. Poza
tym różne ośrodki mają różne własności i różne współczynniki załamania, tak że nie ma
co liczyć na uzyskanie ogólnego wzoru dla współczynnika załamania, który by można było
stosować do wszystkich substancji.
Otrzymany przez nas wzór przedyskutujemy jednak w rozmaitych możliwych warunkach.
Przede wszystkim, dla większości zwykłych gazów (np. dla powietrza, większości
gazów bezbarwnych, wodoru, helu i tak dalej) naturalne częstości oscylatorów
elektronowych odpowiadają światłu nadfioletowemu. Częstości te są wyższe od częstości światła
widzialnego, a zatem co0 jest znacznie większe od w dla światła widzialnego. W pierwszym
przybliżeniu możemy więc opuścić co2 w porównaniu z w0, ponieważ współczynnik
załamania jest prawie stały. A więc dla gazu współczynnik załamania powinien być prawie
stały. Jest to słuszne także dla większości innych przezroczystych substancji, np. dla szkła.
Jeśli jednak przyjrzymy się dokładniej naszemu wyrażeniu, zauważymy, że w miarę jak
31-3. DYSPERSJA
85
co rośnie, uszczuplając nieco mianownik, wzrasta także współczynnik załamania. A więc
n powoli rośnie z częstością. Współczynnik załamania jest większy dla światła niebieskiego
niż dla czerwonego. Dlatego właśnie pryzmat bardziej ugina światło w niebieskiej niż
w czerwonej części widma.
Zjawisko polegające na zależności współczynnika załamania od częstości nazywamy
zjawiskiem dyspersji. Równanie dla współczynnika załamania jako funkcji częstości
nazywamy równaniem dyspersyjnym. Tak więc otrzymaliśmy równanie dyspersyjne. (W ostatnich
kilku latach „równania dyspersyjne" znalazły nowe zastosowanie w teorii cząstek
elementarnych.)
Nasze równanie dyspersyjne wskazuje na jeszcze inne ciekawe możliwości. Jeżeli
naturalna częstość w0 leży w obszarze widzialnym albo jeżeli dla takiego ośrodka
materialnego jak szkło mierzymy współczynnik załamania w nadfiolecie, gdzie a; jest bliskie to0,
to widać, że przy częstościach bardzo bliskich częstości naturalnej współczynnik załamania
może osiągnąć ogromną wartość, ponieważ mianownik wyrażenia wchodzącego do
równania zbliża się do zera. Załóżmy dalej, że co>co0. Jest to możliwe np. wtedy, gdy szkło
oświetlimy promieniowaniem rentgenowskim. Ponieważ zaś wiele ośrodków
nieprzezroczystych dla widzialnego światła, np. grafit, wykazuje przezroczystość dla promieniowania Rónt-
gena, możemy więc mówić także o współczynniku załamania węgla dla promieni
rentgenowskich. Wszystkie naturalne częstości atomów węgla będą znacznie niższe od częstości
promieniowania rentgenowskiego, ponieważ częstość tego promieniowania jest bardzo
duża. Współczynnik załamania będzie dany przez nasze równanie dyspersyjne, jeżeli
przyjmiemy w nim to0 równe zeru (pomijamy iol w porównaniu z to2).
Podobna sytuacja może wyniknąć, jeżeli skierujemy fale radiowe (albo światło) na gaz
swobodnych elektronów. Gaz taki występuje na przykład w górnej części atmosfery, gdyż
nadfioletowe światło słońca uwalnia tam elektrony z atomów. Dla swobodnych elektronów
wo = 0 (nie wykonują one więc ruchów drgających, gdyż odpowiedzialna za to siła sprężysta
znika). Położenie co0 = 0 w naszym równaniu dyspersyjnym daje poprawny wzór na
współczynnik załamania fal radiowych w stratosferze, przy czym N oznacza teraz gęstość
(tzn. liczbę na jednostkę objętości) swobodnych elektronów w stratosferze. Ale spójrzmy
znowu na równanie. Jeżeli skierujemy promienie Róntgena na materię albo fale radiowe
(lub jakiekolwiek inne fale elektryczne) na swobodne elektrony, wyraz (w0—w2) stanie się
ujemny, a tym samym n będzie mniejsze od jedności. Oznacza to, że efektywna prędkość fal
w substancji będzie większa od r! Czy aby tu wszystko jest w porządku?
Istotnie. Chociaż bowiem twierdzimy, że nie można przesyłać sygnałów szybciej niż
z prędkością światła, to jednak współczynnik załamania różnych ośrodków przy określonej
częstości może być albo większy, albo mniejszy od 1. Znaczy to akurat tyle, że przesunięcie
fazowe spowodowane przez światło rozproszone może być albo dodatnie, albo ujemne.
Można jednak pokazać, że szybkość, z jaką daje się przesłać sygnał, nie jest określona
Przez współczynnik załamania przy jednej częstości, ale zależy od wartości współczynnika
załamania przy wielu częstościach. Współczynnik załamania daje nam tylko szybkość
Posuwania się węzłów (czyli grzbietów) fal, a węzeł fali sam przez się nie jest sygnałem.
O fali doskonałej, która nie ma żadnej modulacji, to znaczy jest stałą oscylacją, nie można
^ ogóle powiedzieć gdzie się „zaczyna też" i dlatego nie można jej użyć do sygnału synchro-
86
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
nizującego. Aby przesłać sygnał, musimy w jakiś sposób falę zmienić, zrobić w niej szczerbę,
uczynić ją nieco grubszą lub cieńszą. Znaczy to, że fala musi mieć więcej niż jedną częstość
i można pokazać, że prędkość, z jaką przenoszą się sygnały, zalety nie od samego
współczynnika załamania, ale od tego, jak się on zmienia z częstością. Także i ten temat musimy na
razie odłożyć (aż do rozdz. 48). Obliczymy sobie wtedy rzeczywistą prędkość sygnałów
w kawałku szkła i przekonamy się, że nie jest ona większa od prędkości światła, mimo
że węzły, które są punktami matematycznymi, poruszają się szybciej niż światło.
Napomykając tylko o tym zjawisku zauważmy, że, cała trudność polega na tym, iż
siła reakcji ładunków jest skierowana przeciwnie do wektora pola, to znaczy że znak
uległ odwróceniu. Wobec tego w naszym wyrażeniu na x [równanie (31.16)] przesunięcie
ładunku następuje w kierunku przeciwnym do pola wzbudzającego, ponieważ różnica
coq —co2 jest ujemna dla małych co0. Wzór ten mówi, że pole ciągnie w jednym kierunku,
ładunek porusza się w przeciwnym.
Skąd się jednak bierze ten przeciwny kierunek ruchu ładunku? Z całą pewnością ładunek
nie rusza w kierunku przeciwnym dokładnie w chwili włączenia pola po raz pierwszy.
W chwili gdy rozpoczyna się ruch, powstaje stan nieustalony, który wkrótce się ustala
i tylko wówczas drgania ładunku są przeciwne w fazie do wzbudzającego pola. Właśnie
wtedy faza przekazywanego pola może wyprzedzać falę źródła. Właśnie to wyprzedzenie
w fazie mamy na myśli, gdy mówimy, że „prędkość fazowa" albo prędkość węzłów jest
większa od c. Na rysunku 31.4 podajemy schematycznie wygląd fal w wypadku, gdy fala
zostaje nagle włączona (aby wytworzyć sygnał). Z wykresu widać, że sygnał (tzn. początek
fali) wcale nie jest wcześniejszy dla fali kończącej się wyprzedzeniem w fazie.
Wracamy teraz znowu do naszego równania dyspersyjnego. Trzeba zaznaczyć, że nasza
analiza współczynnika załamania daje wynik nieco prostszy od rzeczywiście
obserwowanego w przyrodzie. Dla zupełnej dokładności trzeba by uwzględnić w tym równaniu jeszcze
kilka rzeczy. Powinniśmy się po pierwsze spodziewać, że nasz model atomowego oscyla-
31.4. „Sygnały" falowe
początek
Ó) w nieobecności ■ ■■ f \—/ \—/ \—/ \»
ośrodka I ! V/ \T\Jt
v fala
u) przepuszczona,
gdy n>1
fala
Ćf przepuszczona,
gdy n<i
wyprzedzanie
w fazie
31-3. DYSPERSJA
87
1.1 n!
1
0
IV
\
Al
III
l\ /
\\J
0)2 itd.
ltd.
*-
U)
31.3. Współczynnik załamania jako funkcja częstości
torą uwzględni istnienie siły tłumiącej (w przeciwnym wypadku oscylator raz poruszony
drgałby wiecznie, a tego przecież nie oczekujemy). Ruch tłumionego oscylatora
wyliczyliśmy już poprzednio [równanie (23.8), t.I, cz. 1] i otrzymaliśmy, że mianownik w równaniu
(31.16), a zatem i w (31.19), zmienia się z (»J-w2) po prostu na {<u>l — co2 + iyco), gdzie
y oznacza współczynnik tłumienia.
Druga potrzebna tu modyfikacja powinna wziąć pod uwagę fakt, że dla danego rodzaju
atomów istnieje szereg częstości rezonansowych. Łatwo to można uwzględnić w naszym
równaniu dyspersyjnym zakładając, że istnieje wiele różnych rodzajów oscylatorów i każdy
tak działa oddzielnie, że przyczynki od nich wszystkich po prostu się dodają. Przypuśćmy,
że na jednostkę objętości przypada Nk elektronów, których naturalna częstość wynosi cok,
a czynnikiem tłumiącym jest yk. Wtedy nasze równanie dyspersyjne przyjmie postać:
n = \ +
ć
Nt
2e0m k (Dk—co +iykco
(31.20)
Mamy wreszcie pełne wyrażenie opisujące współczynnik załamania mierzony dla wielu
ośrodków materialnych*'. Współczynnik załamania opisany tym wzorem zmienia się
z częstością z grubsza tak, jak pokazuje rys. 31.5.
Zauważmy, że jeżeli wartość częstości w nie zbliża się zbytnio do jednej z wartości
częstości rezonansowych, nachylenie krzywej jest dodatnie. Takie dodatnie nachylenie
zwane jest dyspersją „normalną" (ponieważ, oczywiście, zdarza się najczęściej). Bardzo
blisko częstości rezonansowych mamy jednak mały obszar wartości co, dla których
nachylenie jest ujemne. Takie ujemne nachylenie przeważnie bywa nazywane dyspersją „anomalną"
(czyli nienormalną), ponieważ wydała się ona niezwykła ludziom, którzy ją po raz pierwszy
zaobserwowali, o wiele wcześniej niż znane były takie obiekty jak elektrony. Z naszego
punktu widzenia oba nachylenia są najzupełniej „normalne"!
*' W mechanice kwantowej równanie (31.20) jest nadal ważne, chociaż jego interpretacja jest
właściwie trochę inna. W mechanice kwantowej nawet atom z jednym elektronem, np. wodór, ma
szereg częstości rezonansowych. Wobec tego AT* naprawdę nie oznacza liczby elektronów mających
częstości oj», ale zostaje zastąpione przez Nfk, gdzie N jest liczbą atomów, przypadających na
jednostkę objętości, a/» (zwane siłą oscylatora) jest czynnikiem mówiącym jak silnie atom przejawia każdą
ze swoich rezonansowych częstości oj, .
88
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
31-4. Pochłanianie (absorpcja)
Zwróćmy uwagę na pewien dość dziwny szczegół w ostatniej postaci naszego równania
dyspersyjnego [równanie (31.20)]. Wyraz iy, który wstawiliśmy, aby uwzględnić tłumienie,
powoduje, że współczynnik załamania stał się liczbą zespoloną*. Co to oznacza?
Rozdzielając rzeczywistą i urojoną część n możemy napisać
n = n'-in", (31.21)
gdzie ri i n" są liczbami rzeczywistymi. (Piszemy znak minus przed in", ponieważ n"
okazuje się wtedy liczbą dodatnią, co czytelnik sam może dowieść.)
Dla przekonania się, co oznacza taki zespolony współczynnik załamania, wrócimy do
równania (31.6). Jest to równanie fali, która przeszła przez płytkę ośrodka materialnego
o pewnym współczynniku załamania n. Wstawiając nasze zespolone n do tego równania
i dokonując przegrupowań, otrzymamy
..... F _ -wn"dz/c -M(B'-l)i!/cr i<u((-z/c) /ii -,-,-.
^za płytką-e c ^O* • l.-31-",)
Czynniki oznaczone symbolem B w równaniu (31.22) mają dokładnie tę postać, którą
znamy z poprzednich rachunków. Opisują one falę, której faza, przy przechodzeniu przez
materię, została opóźniona o kąt co(ri — l) Az/c. Pierwszy wyraz (A) jest nowy, stanowi
pewien czynnik wykładniczy z wykładnikiem rzeczywistym, który powstał w wyniku
mnożenia dwóch wyrazów czysto urojonych. Wykładnik jest poza tym ujemny, a więc cały czynnik
jest liczbą rzeczywistą mniejszą od jedności. Tak, jak się spodziewamy, opisuje ona spadek
wielkości pola o wartość, która jest tym większa, im większe jest Az. W miarę przechodzenia
przez materię fala ulega osłabieniu. Materia „pochłania część fali". Fala wychodzi z drugiej
strony płytki z mniejszą energią. Nie ma się czemu dziwić, ponieważ tłumienie, które
uwzględniliśmy w oscylatorach, jest rzeczywiście siłą tarcia i trzeba było się spodziewać,
że spowoduje stratę energii. Widać więc, że urojona część n" zespolonego współczynnika
załamania opisuje pewne pochłanianie (albo „uszczuplenie") fali. Istotnie, n" bywa
niekiedy nazywane „współczynnikiem pochłaniania".
Należy zwrócić uwagę także i na to, że urojonej części współczynnika załamania n
odpowiada na rys. 31.3 odchylenie strzałki wektora Ea w stronę początku układu. Oczywiste
jest, dlaczego przepuszczane pole zostaje wówczas zmniejszone.
Normalnie, np. w szkle, pochłanianie światła jest bardzo małe. Spodziewamy się tego
na podstawie naszego równania (31.20), ponieważ urojona część mianownika, iykio, jest
znacznie mniejsza od wyrazu (cok —co2). Jeśli jednak częstość światła co jest bardzo bliska cok,
rezonansowy wyraz (a>k —oj2) może być mały w porównaniu z wyrazem iykta i współczynnik
stanie się prawie całkowicie urojony. Pochłanianie światła jest wtedy zjawiskiem
dominującym. Właśnie to zjawisko stanowi przyczynę powstawania ciemnych linii — linii
absorpcyjnych — w widmie światła, które otrzymujemy ze Słońca. Światło z powierzchni słonecznej
przeszło poprzez atmosferę Słońca (tak jak i Ziemi) i zostało silnie pochłonięte przy
rezonansowych częstościach atomów atmosfery słonecznej.
Obserwacja takich linii widmowych w świetle słonecznym pozwala nam znaleźć częstości
31-4. POCHŁANIANIE
89
rezonansowe atomów, a stąd skład chemiczny atmosfery Słońca. Obserwacje tego rodzaju
mówią nam też o materii w gwiazdach. Dowiadujemy się z nich, że pierwiastki chemiczne
w Słońcu i gwiazdach są takie same, jak znajdowane na Ziemi.
31-5. Energia niesiona przez falę elektryczną
Przekonaliśmy się, że urojona część współczynnika załamania oznacza pochłanianie.
Korzystając z tego znajdziemy teraz ilość energii niesioną przez falę świetlną.
Argumentowaliśmy poprzednio, że energia niesiona przez światło jest proporcjonalna do E2, średniej
czasowej kwadratu elektrycznego pola fali. Spadek wartości E na skutek absorpcji musi
oznaczać stratę energii. Przejdzie ona w tarcie elektronów i jak się domyślamy, odnajdzie
się jako ciepło w ośrodku materialnym.
Rozważając światło padające na powierzchnię jednostkową, np. na 1 cm2 naszej płytki
z rys. 31.1, możemy napisać następujące równanie energii (jeśli, energia jest zachowana,
co w istocie zakladamyl):
energia wchodząca na sekundę =
= energia wychodząca na sekundę 4- praca wykonana na sekundę. (31.23)
Zamiast pierwszego wyrazu możemy napisać a£s2, gdzie a jest nieznaną dotąd stałą
proporcjonalności, która wiąże średnią wartość E2 z niesioną energią. Do drugiego wyrazu musimy
włączyć udział promieniujących atomów substancji, tak że trzeba wziąć a(Es + Ea)2 albo
(obliczając kwadrat) (E?+2EsEa + E2).
Wszystkie nasze rachunki zostały przeprowadzone dla cienkiej warstwy substancji,
której współczynnik załamania niezbyt się różni od 1, tak że wartość Ea będzie zawsze
znacznie mniejsza od Es (po prostu dla ułatwienia rachunków). Trzymając się naszego
przybliżenia możemy więc odrzucić wyraz E2, ponieważ jest on dużo mniejszy od wyrazu
E*Ea. Można by powiedzieć, że wobec tego trzeba odrzucić także wyraz EsEa, ponieważ
jest on znacznie mniejszy od wyrazu E2. Rzeczywiście, wyraz EsEa jest o wiele mniejszy
od wyrazu £s2, ale EsEa musimy zachować, bo inaczej nasze przybliżenie polegałoby na
całkowitym pominięciu obecności ośrodka! Jednym ze sposobów sprawdzenia wewnętrznej
zgodności naszych rachunków jest stwierdzenie, że zawsze zachowujemy wyrazy
proporcjonalne do -N Az, do gęstości atomów ośrodka, opuszczamy zaś wyrazy proporcjonalne
do (N Az)2 albo do jakiejkolwiek wyższej potęgi N Az. Przybliżenie nasze powinno nazywać.
S'C „przybliżeniem niskiej gęstości".
Rozumując dalej w ten sposób, zauważmy, że w naszym równaniu energii pominęło
S'C energię fali odbitej. Jest to uzasadnione, ponieważ także i ten wyraz jest proporcjonalny
do (N Az)2, bo amplituda fali odbitej jest proporcjonalna do N Az.
Przechodząc do ostatniego wyrazu w równaniu (31.23), chcemy obliczyć szybkość,
z jaką wchodząca fala wykonuje pracę na elektronach. Wiemy, że praca - to siła razy
odległość, zatem szybkość wykonywania pracy (zwana także mocą) — to siła razy prędkość.
Ściśle mówiąc wynosi ona Fv, ale nie musimy się przejmować iloczynem skalarnym, gdy
90
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
tak jak tutaj, prędkość i siła mają ten sam kierunek (z wyjątkiem być może znaku minus).
Przyjmujemy więc dla każdego atomu qeEsv jako średnią szybkość wykonywania pracy.
Ponieważ na jednostkowej powierzchni znajduje się N Az atomów, więc ostatni wyraz
w równaniu (31.23) powinien być równy N AzqeEsv. Nasze równanie energii wygląda zatem
następująco:
a.E25=a.E2s+2a. EsEa + N Azq^v. (31.24)
Wyrazy E? znoszą się i mamy
2EJEa = NAzqe~E^. " (31.25)
Wracamy znowu do równania (30.19), które mówi nam, że dla dużych z
NAzqe
Ea = v (opóźnione o zjc) (31.26)
2e0c
(pamiętamy, że rj = N Az). Wstawiając wyrażenie (31.26) do lewej strony równania (31.25)
otrzymujemy
NAzqe
2<x £ (opóźnione o z) • v (opóźnione o z/ć).
2e0c
Ale pole E, (w punkcie z) jest równe polu Es (w atomach) opóźnionemu o z/c.
Ponieważ zaś wartość średnia jest niezależna od czasu, więc jest ona taka sama, czy to
wzięta teraz, czy to opóźniona o z/c, czyli wynosi Es (w atomach)-vs, co daje tę samą
średnią, która pojawia się po prawej stronie równania (31.25). Obie strony są więc sobie
równe, jeżeli
— = 1 czyli a=£0c. (31.27)
t0c
Okazało się, że jeżeli energia ma być zachowana, energia niesiona w fali elektrycznej
przypadająca na jednostkę powierzchni i czas jednostkowy (czyli to, co nazwaliśmy
natężeniem) musi być dana przez e0c£2. Jeśli natężenie oznaczymy S, to mamy
natężenie
czyli
energia / powierzchnia / czas
£0cE2, (31.28)
gdzie kreska oznacza średnie czasowe. Mamy więc w nagrodę jeszcze i ten wniosek z naszej
teorii współczynnika załamania.
31-6. Ugięcie światła na ekranie
Zajmiemy się teraz nieco innym zagadnieniem, korzystając z tego, że też możemy je
ująć przy pomocy formalizmu tego rozdziału. W ostatnim rozdziale mówiliśmy o tym, że
nieprzezroczysty ekran, zaopatrzony w otwory, przez które może przechodzić światło,
31-6. UGIĘCIE ŚWIATŁA NA EKRANIE
91
daje dokładnie taki rozkład dyfrakcyjny, jaki
można otrzymać wyobrażając sobie, że otwory -S E=0 P
zostały zastąpione przez źródła (oscylatory) " 5 vekran
..... . \ nieprzezroczysty
jednostajnie rozłożone w całym otworze. a)
Innymi słowy, fala ugięta jest taka, jak gdyby
otwór stanowił nowe źródło. Fakt ten wyma- i
ga wyjaśnienia, ponieważ otwór oczywiście do- 5 £=£$ *■ E=ES+Eprzest
kładnie znajduje się tam, gdzie nie ma źródeł, * 1^ .
gdzie więc nie ma przyspieszanych ładun- jj\ |—przesłona
ków.
Zadajmy sobie przede wszystkim pytanie: I
„ . , 0., -, ... i Kzatyczka P
„Cotojestnieprzezroczysty ekran? Załóżmy I •
dalej, że całkowicie nieprzezroczysty ekran £=£s %£=£s+£pries<.+Eiatyczka=0
znajduje się między źródłem S, a obserwa- c) |— przesłona
torem w punkcie P, tak jak na rys. 31.6a. Jeśli
ekran jest „nieprzezroczysty", to w punkcie P 31.6. Ugięcie światła na ekranie
pola nie ma. Zastanówmy się, dlaczego.
Przecież według podstawowych zasad powinniśmy
otrzymać pole w punkcie Pjako opóźnione pole E, od źródła plus od wszystkich innych
ładunków dookoła. Ale z naszych poprzednich rozważań wynika, że ładunki ekranu będą
wprawiane w ruch przez pole E„ ruchy te tworzą zaś nowe pole, które - jeżeli ekran jest
nieprzezroczysty — musi dokładnie znosić pole Es po odwrotnej stronie ekranu. Czyżby
to był cud, że pole znosi się dokładniel A niechby tak znoszenie się nie zachodziło ściśle?
Gdyby pola nie znosiły się dokładnie, wówczas pole w pobliżu tylnej ściany ekranu nie
byłoby dokładnie równe zeru (pamiętajmy, że ten nieprzezroczysty ekran ma pewną
grubość). Gdyby nie było równe zeru, wprawiłoby w ruch inne ładunki w materiale ekranu
i w ten sposób wytworzyłoby dodatkowe pola, dążąc do pełnego zrównoważenia. Jeśli
więc ekran uczynimy dostatecznie grubym, pola szczątkowego nie będzie, ponieważ jest
wtedy dość sposobów na to, aby całe pole ostatecznie doprowadzić do zerowania się.
W języku naszych poprzednich wzorów powiemy, że ekran ma duży i urojony współczynnik
załamania, tak że przechodzące przezeń fale zostają pochłonięte w stosunku wykładniczym.
Wiadomo przecież, że dostatecznie cienka warstwa najbardziej nieprzezroczystego
materiału, nawet złota, jest jednak przezroczysta.
Zobaczmy teraz, co się dzieje z nieprzezroczystym ekranem mającym otwory jak na rys.
31.6b. Jakiego pola oczekujemy w punkcie PI Pole w punkcie P może być przedstawione
jako suma dwu pól: pola pochodzącego od źródła S i pola pochodzącego od ściany, to
znaczy pochodzącego z ruchu ładunków w ścianach. Spodziewamy się, że ruchy ładunków
w ścianach będą skomplikowane, ale pole przez nie wytwarzane daje się znaleźć dość prosto.
Weźmy pod uwagę taki sam ekran, ale z zatkanymi otworami jak pokazuje część c)
rysunku. Wyobraźmy sobie, że zatyczki i ściana są zrobione z dokładnie takiego samego
materiału. Pamiętamy dalej, że zatyczki wchodzą dokładnie tam, gdzie w przypadku b)
znajdowały się otwory. Obliczmy teraz pole w punkcie P. W przypadku c) pole w punkcie P
Jest dokładnie równe zeru, ale jest także równe polu pochodzącemu od źródła plus pole
92
31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA
pochodzące od wszystkich atomów w ścianach i zatyczkach. Możemy napisać następujące
równania:
przypadek b) EwP = Es + £ściana,
przypadek c) Kp = 0=E:i+E^+E'^^ ,
gdzie znaki prim odnoszą się do przypadku, gdy zatyczki są na swoim miejscu, Es zaś w obu
przypadkach jest oczywiście takie samo. Odejmując teraz od siebie oba równania
otrzymujemy:
Ł*P V'-'ściana -^ściana^ -^zatyczka"
Jeśli tylko otwory nie będą zbyt małe (niech mają szerokość wielu długości fali), nie
spodziewamy się, aby obecność zatyczek zmieniła pole przychodzące do ścian, co najwyżej
zmieni je trochę wokół krawędzi otworów. Pomijając ten mały efekt, możemy przyjąć
Ąciana = Ąciana ' Otrzymać, Że
Ew p = — Patyczka •
Wynika stąd, że gdy w ekranie są otwory (przypadek b) pole w punkcie P jest (z
dokładnością do znaku) takie samo jak pole wytworzone przez tę część całkowicie nieprzezroczystej
ściany, która jest umieszczona na miejscu otworowi (Znak nie jest bardzo istotny, ponieważ
zwykle obchodzi nas tylko natężenie proporcjonalne do kwadratu pola.) Wygląda to na
zabawne dowodzenie na opak, a przecież jest nie tylko prawdziwe (w przybliżeniu dla
niezbyt małych otworów), ale i użyteczne; stanowi uzasadnienie podawanej zwykle teorii
dyfrakcji.
W każdym szczególnym przypadku możemy obliczyć pole E^lyczka pamiętając, że ruch
ładunków wszędzie w ekranie znosi dokładnie pole Es za ekranem. Znając te ruchy
dodajemy w punkcie P pola promieniowania pochodzące dokładnie od ładunków w
zatyczkach.
Przypomnijmy znowu, że taka teoria ugięcia jest tylko przybliżona. Jest ona dobra
tylko wtedy, gdy otwory nie są zbyt małe. W wypadku za małych otworów wyraz £2'atycIka
będzie mały i wówczas różnica między J?4iana i 4iu« (którą to różnicę przyjęliśmy równą
zeru) może być albo porównywalna z małym wyrazem 'Ezatyczka> ^^bo nawet od niego większa
i nasze przybliżenie nie będzie już wtedy ważne.
32
tłumienie promieniowania • rozpraszanie światła
32-1. Opór promieniowania
Dowiedzieliśmy się z ostatniego rozdziału, że drganiom dowolnego układu towarzyszy
wypływanie z niego energii, i wyprowadziliśmy wzór na energię wypromieniowaną przez
taki układ drgający. Mając dane pole elektryczne, wiemy, że średnia jego kwadratu
pomnożona przez c0c jest równa ilości energii przechodzącej w ciągu sekundy przez metr
kwadratowy powierzchni prostopadłej do kierunku rozchodzenia się promieniowania:
P = e0c(E2). (32.1)
Energię promieniuje dowolny drgający ładunek, np. pobudzona antena. Skoro układ
promieniuje energię, musimy uznać, że dla jej zachowania po drutach prowadzących do
anteny płynie pewna moc. Znaczy to, że w obwodzie wzbudzającym antena zachowuje
się jak opór, czyli jak miejsce, w którym „traci się" energię (w rzeczywistości energii sienie
traci, zostaje ona wypromieniowaną, ale jeśli ograniczymy się do rozpatrywania samego
obwodu, energia jest tracona). W zwykłym oporze „stracona" energia przechodzi w ciepło,
a w tym wypadku uchodzi w przestrzeń. Jednakże z punktu widzenia teorii obwodów,
która nie wnika w sprawę dokąd uchodzi energia, ostateczny „efekt" jest zawsze taki sam
~ obwód taki „traci" energię. Wobec tego generatorowi wydaje się, że antena wykazuje
°pór, nawet jeżeli jest zrobiona z doskonałej miedzi. 1 rzeczywiście, jeżeli antena jest dobrze
zbudowana, to będzie się zachowywać prawie jak czysty opór o bardzo małej indukcyjności
1 Pojemności, ponieważ chcemy, aby wypromieniowywała jak najwięcej energii. Opór,
Wykazywany przez antenę nazywamy oporem promieniowania.
Jeśli do anteny dopływa prąd o natężeniu /, to średnia szybkość, z jaką dostarczana
Jest do niej moc, równa się średniej kwadratu natężenia prądu pomnożonej przez opór.
94
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
Szybkość,z jtką moc zostaje wypromieniowana przez antenę, jest oczywiście proporcjonalna
do kwadrati natężenia prądu w antenie, ponieważ pola są zawsze proporcjonalne do
prądów, awjizielona energia jest proporcjonalna do kwadratu pola. Współczynnik
proporcjonalności między wypromieniowana mocą a </2> jest właśnie oporem
promieniowania.
Ciekawy jest problem: skąd w ogóle pochodzi opór promieniowania? Weźmy prosty
przykład: załóżmy, że prądy w antenie są pobudzane do płynięcia tam i z powrotem.
Okazuje się,że na to, aby antena promieniowała energię, musimy włożyć w nią pracę.
Weźmy naładowane ciało i przyspieszajmy je tam i z powrotem: promieniuje ono energię.
Gdyby zaśnie było naładowane, energii by nie promieniowało. Inną sprawą jest obliczenie
z zasady zachowania energii, jaka energia została stracona, a inną jest odpowiedź na
pytanie: przeciwko jakiej sile wykonujemy pracę? Pytanie to jest ciekawe i bardzo trudno na
nie odpowiedzieć. Nie potrafimy dotąd dać na nie wyczerpującej i zadowalającej
odpowiedzi, jeżeli rozważamy elektrony, chociaż znamy odpowiedź w przypadku anten. Sprawa
przedstawia się następująco: pola wytworzone w antenie przez ładunki poruszające się
w jednej jej części oddziałują na ruch ładunków w drugiej części. Siły te możemy obliczyć
i znaleźć, jatą wykonują pracę. Znajdziemy w ten sposób odpowiedni wzór na opór
promieniowania Ściśle mówiąc, nie mamy jednak prawa powiedzieć: „Możemy obliczyć".
My sami me możemy, ponieważ jeszcze nie badaliśmy praw elektryczności na małych
odległościach; pole elektryczne znamy tylko dla odległości dużych. Oglądaliśmy wprawdzie
wzór (28.3),ale jest on dla nas obecnie zbyt skomplikowany na to, aby móc obliczyć pola
wewnątrz strefy falowej. Ponieważ, oczywiście, obowiązuje zasada zachowania energii,
możemy jednak znaleźć poprawny wynik nie znając pól na małych odległościach.
(Istotnie, jeśli posłużymy się tym argumentem w drugą stronę, okaże się, że
korzystając tylko z praw zachowania energii można znaleźć wzór dla siły na małych
odległościach, znająt pole tylko bardzo daleko. Nie będziemy się jednak w to teraz zagłębiać.)
Dla pojedynczego elektronu zagadnienie przedstawia się następująco: jeśli istnieje
tylko jeden ładunek, to jaka siła będzie w ogóle na niego działać? Stara klasyczna teoria
proponowała, żeby ładunek uważać za małą piłkę, której jedna część działa na drugą.
Na skutek opóźnienia w oddziaływaniu poprzez malutki elektron siła i ruch nie są
dokładnie zgodne w fazie. Jeśli elektron spoczywa, to jak wiemy, „akcja równoważy
reakcję", co oznacza, że rozmaite wewnętrzne siły są sobie równe i nie powstaje żadna
siła wypadkowa. Gdy jednak elektron zostaje przyspieszony, wówczas siła, która działa
od tylu do przodu, nie jest taka sama, jak siła działająca od przodu do tyłu, a jest to
spowodowane opóźnieniem przy przechodzeniu przez elektron. To przesunięcie w przebiegu
czasowym jtst przyczyną braku równowagi i w ostatecznym wyniku elektron jakby sam
się „ciągnąłza włosy"! Powyższe wyjaśnienie pochodzenia oporu ujawniającego się przy
przyspieszaniu, czyli oporu promieniowania poruszającego się ładunku, napotkało
liczne trudności, ponieważ zgodnie z naszymi obecnymi poglądami elektron nie jest
jednak „małą piłką". Zagadnienie to nie zostało jeszcze dotąd rozwiązane. Możemy jednak
dokładnie obliczyć, jaka musi być wypadkowa siła oporu promieniowania, to znaczy,
jakie muszą być straty podczas przyspieszania ładunku, mimo że nie znamy samego
mechanizmy działania tej siły.
32-2. SZYBKOŚĆ WYPROM1ENIOWYWAN1A ENERGII
95
32-2. Szybkość wypromieniowywania energii
Obliczmy teraz całkowitą energię wypromieniowywaną przez przyspieszany ładunek.
Dla ogólności rozważań weźmy przypadek ładunku przyspieszanego w dowolny sposób,
byle nierelatywistycznie. Wiemy, że w chwili gdy przyspieszenie jest na przykład pionowe,
wytwarzane pole elektryczne jest proporcjonalne do ładunku- pomnożonego przez rzut
opóźnionego przyspieszenia i podzielonego przez odległość. Stąd znamy pole elektryczne
w każdym punkcie, a zatem i kwadrat pola elektrycznego i wreszcie energię e0cE2
wychodzącą w ciągu sekundy przez jednostkową powierzchnię.
Wielkość e0c pojawia się dość często w wyrażeniach opisujących rozchodzenie się
fal radiowych. Jej odwrotność nazywamy impedancją próżni; jest ona liczbą łatwą do
zapamiętania: ma wartość l/e0c = 377 ft. Tak więc moc w watach na metr kwadratowy
jest równa średniej kwadratu pola podzielonej przez 377.
Korzystając z naszego wyrażenia (29.1) dla pola elektrycznego znajdujemy, że
.2,
S =
q2a'2 sina0
16n2e,
,rV
(32.2)
jest mocą na metr kwadratowy, wypromieniowaną w kierunku kąta 9. Widzimy, że
zachowuje się ona jak odwrotność kwadratu odległości, zgodnie z tym, co powiedzieliśmy
poprzednio. Poszukajmy teraz całkowitej energii wypromieniowanej we wszystkich
kierunkach: musimy zatem scałkować wyrażenie (32.2) po wszystkich kierunkach. Najpierw
wykonujemy mnożenie przez pole powierzchni, aby znaleźć ilość energii, która przepływa
przez mały kąt dO (rys. 32.1). Potrzebne nam jest do tego pole powierzchni wycinka kuli.
Rozumujemy w taki sposób: jeżeli r jest promieniem kuli, szerokość wycinka pierścienia
na niej wynosi r d9, a jego obwód 27trsin0, gdyż r sin 9 jest promieniem koła. A więc
powierzchnia małego kawałka kuli wynosi 2nr sin 9 razy r d9:
dA = 2nr2 sin 9 d9.
Mnożąc strumień [wzór (32.2), moc przypadająca na
metr kwadratowy] przez powierzchnię (w metrach
kwadratowych) zawartą w małym kącie dO znajdujemy ilość
energii wychodzącą w tym kierunku w przedziale
między 9 a 9 + d9. Całkujemy następnie to wyrażenie po
wszystkich kątach 9 od 0 do 180°:
(32.3)
32.1. Powierzchnia wycinka
kulistego wynosi 2nr sin 9r dd
f 1 a f
>= SdA = ~ , si
sin3 9 d9.
(32.4)
Plsząc sin30 = (l-cos20)sin0 łatwo pokazać, że
J sin30</0 = 5. Korzystając z tego faktu otrzymujemy w
końcu
P =
bne0 c3
(32.5)
96
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
Wyrażenie to zasługuje na chwilę uwagi. Przede wszystkim, ponieważ a' jest wektorem
i ma pewien określony kierunek, a'2 we wzorze (32.5) ma znaczenie kwadratu wektora
a' czyli a'-a', a wiec jest długością wektora w kwadracie. Po wtóre, strumień wyrażony
wzorem (32.2) został obliczony za pomocą opóźnionego przyspieszenia, tzn. jest
wartością przyspieszenia w chwili, gdy została wypromieniowana energia teraz właśnie
przechodząca przez kulę. Skłonni jesteśmy sądzić, że energia ta została rzeczywiście wysłana
w tej wcześniejszej chwili, ale nie jest to dokładne; jest to tylko pogląd przybliżony. Nie
można ściśle określić chwili, w której energia została wysłana. Naprawdę dokładnie
możemy obliczyć tylko to, co się dzieje podczas całego ruchu, np. w ciągu jednego drgania
lub też innego ruchu, na którego końcu przyspieszenie znika. Obliczamy w ten sposób,
że całkowity strumień energii w jednym okresie jest proporcjonalny do średniej kwadratu
przyspieszenia w pełnym okresie i właśnie ta wielkość powinna pojawić się we wzorze
(32.5). Jeśli zaś rozważamy ruch, w którym przyspieszenie znika na początku i na końcu,
to całkowita energia, która wypłynęła, jest równa wyrażeniu (32.5) scałkowanemu
względem czasu.
Aby zilustrować konsekwencje wynikające z wzoru (32.5) w przypadku układu
drgającego, zobaczymy, co się dzieje, jeżeli przesunięcie x ładunku zmienia się tak, że
przyspieszenie a wynosi — co2x0e,a". Średnia kwadratu przyspieszenia w ciągu okresu
(pamiętajmy, że musimy być bardzo ostrożni, gdy podnosimy do kwadratu wielkości
zapisane w notacji zespolonej — naprawdę chodzi tu o cosinus, a średnia cos2 cot wynosi
ł) jest zatem równa
<a'2> = tco*x20.
Wobec tego
2 4 2
ą co xa
P=- %. . (32.6)
I2ne0c
Wzory, które teraz rozważamy, reprezentują stosunkowo zaawansowaną i dość
nowoczesną teorię; datują się z początku XX w. Są to bardzo słynne wzory i właśnie ze
względu na ich wartość historyczną musimy umieć je czytać tak, jak są podane w starych
książkach. Prawdę mówiąc, w książkach tych posługiwano się jednostkami odmiennymi
od naszego układu mks. Wszystkie jednak komplikacje można usunąć już w ostatecznych
wzorach opisujących elektrony. Reguła jest następująca: wielkość q2/4ne0> gdzie ge
oznacza ładunek elektronu (w kulombach), była tradycyjnie oznaczana e2. Bardzo łatwo
obliczyć, że e w układzie mks jest liczbowo równe 1,5188-10-14, ponieważ wiemy, że
liczbowo tfe= 1,60206-10~19 a l/4ne0 = 8,98748■ 109. Będziemy więc często używać
wygodnego skrótu
.2 4
.2
e2 = -^. (32.7)
47I£0
Jeśli w starszych wzorach będziemy używali podanej wartości liczbowej e i traktowali
je tak, jak gdyby były zapisane w jednostkach mks, to otrzymane wyniki numeryczne
będą poprawne. Tak na przykład starszą postacią wzoru (32.5) jest wzór P=$e2a2/c3-
Podobnie energia potencjalna protonu i elektronu w odległości r wynosi q2!4ne0r albo
e2lr, z wartością e= 1,5188-10~14 mks.
32-3. TŁUMIENIE PROMIENIOWANIA
97
32-3. Tłumienie promieniowania
Z tego, że oscylator traci pewną energię, wnioskujemy, że ładunek zawieszony na
)<ońcu sprężyny (albo elektron w atomie) wprawiony w drgania z naturalną częstością
(X>0 nie będzie drgał wiecznie nawet wtedy, gdyby znajdował się w próżni w odległości
wielu milionów kilometrów od innych przedmiotów. Nie ma tu smarów, ani żadnego
oporu w zwykłym sensie — w sumie żadnej „lepkości". Mimo to układ taki, jak już
powiedzieliśmy, nie będzie drgał „wiecznie", bo jako naładowany wypromieniowuje energię
i dlatego jego drgania będą powoli zamierać. Jak wolno? Jaka jest wartość Q takiego
oscylatora, spowodowana przez efekty elektromagnetyczne, czyli tzw. opór
promieniowania albo tłumienie promieniowania takiego oscylatora? Dla dowolnego układu
drgającego wartość Qjest równa całkowitej energii zawartej w każdej chwili w oscylatorze,
podzieloną przez stratę energii na radian:
W
Q-
dW\dę
Mamy też (zapisując to samo w inny sposób),
coW
1-IwTm- <32'8)
ponieważ dWld(p = (dW/dt)/(d<p/dt) = (dW/dt)co. Jeżeli znamy Q, powyższy wzór nam
mówi. jak spada energia drgań, bo dW/dt = —{(ojQ)W, co daje po rozwiązaniu W=
= W0e~"il,Q, gdzie W0 oznacza energię początkową (dla r=0).
Aby znaleźć Q dla układu promieniującego, wracamy do wzoru (32.8) i wstawiamy
zależność (32.6) na miejsce dWfdt.
Zastanówmy się teraz, czemu jest równa energia W oscylatora? Energia kinetyczna
oscylatora jest równa \ mv2, a średnia energia kinetyczna wynosi mco2x0/4. Przypomnijmy
sobie teraz, że średnio połowa całkowitej energii oscylatora jest energią kinetyczną, a druga
połowa — energią potencjalną, tak że ostatnią liczbę musimy podwoić, aby otrzymać
całkowitą energię oscylatora:
W = \mco2x20. (32.9)
Co podstawiamy za częstość w obu powyższych wzorach? Bierzemy naturalną częstość
wo. ponieważ dla wszystkich celów praktycznych jest to częstość, z którą nasz atom
promieniuje, a jako wartość m bierzemy masę elektronu me. Dokonujemy następnie
koniecznych dzieleń i uproszczeń, w których wyniku wzór (32.8) przyjmuje postać
± = -l^-2. (32.10)
(Dla lepszej orientacji przedstawiliśmy wzór ten w bardziej tradycyjnej postaci używając
skrótu q2/4ne0 = e2, a opuszczony czynnik oi0jc zapisując jako 2n/A.) Ponieważ wielkość
Q jest wielkością bezwymiarową, kombinacja e2/mec2 powinna być właściwością samego
98
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
tylko ładunku i masy elektronu, wewnętrzną cechą elektronu, a do tego powinna mieć
wymiar długości. Nazwano ją klasycznym promieniem elektronu, ponieważ wszystkie
wczesne modele atomowe, które miały wyjaśnić opór promieniowania przy pomocy siły
działającej między różnymi częściami elektronu a innymi, wymagały, aby jego rozmiary
były właśnie wielkością tego rzędu. Obecnie wielkość ta nie ma już tak dużego znaczenia
i nie musimy wierzyć, że promień elektronu jest naprawdę taki. Jego wartość
wynosi
r0 = 2 = 2,82- 10-15m. (32.11)
<;>. mec
Obliczmy wreszcie wartość Q dla jakiegoś atomu wysyłającego światło, np. dla atomu
sodu. Długość fali wynosi wtedy około 6000 A; długość ta należy do żółtej części widma
widzialnego i jej wartość jest bardzo typowa. Wobec tego
3A
2 = *5-107, (32.12)
47ir0
tak że Q atomu jest rzędu 108. Oznacza to, że oscylator atomowy będzie drgał przez 108 rd,
czyli wykona I07 drgań, zanim jego energia spadnie o czynnik l/e. Częstość drgań światła
o długości fali 6000 A, v = c/A, jest rzędu 10" Hz. Wobec tego czas życia, czas, w ciągu
którego energia promieniującego atomu spada o czynnik l/e, jest rzędu 10~8 s. W
normalnych warunkach swobodnie emitujący atom promieniuje zwykle przez taki właśnie
okres czasu. Jest to możliwe tylko dla atomów znajdujących się w próżni, nie zakłócanych
w żaden sposób. Gdy elektron znajduje się w ciele stałym i ulega zderzeniom z innymi
atomami lub innymi elektronami, wówczas pojawiają się dodatkowe opory i inne
tłumienia.
Efektywny opór y występujący we wzorze na opór oscylatora można znaleźć ze związku
\/Q = y/co0; pamiętajmy przy tym, że wielkość y określa szerokość krzywej rezonansu
(rys. 23.2 z t. I, cz. I). W ten więc sposób obliczyliśmy szerokość linii widmowych
dla swobodnie promieniujących atomów! Ponieważ X = 2ncjco, znajdujemy że
/fA = 2ncz/a>/ca2 = 27icy/a>o = 2nc/ea>0 = A/g = 4nr0/3 = l,18-10-14m. (32.13)
32-4. Niezależne źródła
Przygotowując się do naszego drugiego tematu, rozpraszania światła, musimy już
teraz omówić pewną cechę zjawiska interferencji, którą pominęliśmy w poprzednich
rozważaniach. Chodzi tu o odpowiedź na pytanie: kiedy interferencja nie zachodzi? Weźmy
dwa źródła St i S2 o amplitudach Ax i A2 i obserwujmy je z kierunku, w którym
mierzone fazy dwu sygnałów wynoszą ęx i ę2 (wynikają one z pewnej kombinacji
właściwego czasu drgania i opóźnienia zależnego od miejsca, w którym dokonujemy obserwacji).
Odbieraną przez nas energię można znaleźć składając dwa zespolone wektory Ax i A2
32-4. NIEZALEŻNE ŹRÓDŁA
99
ustawione odpowiednio pod kątem c?, i ę2 (tak jak robiliśmy w rozdz. 30). Wynika stąd,
że wypadkowa energia jest proporcjonalna do
A2R = A2i+A22 + 2AlA2cos((pi-ę2). (32.14)
Gdyby nie występował tutaj wyraz mieszany 2A1A2cos(<p1—<p2), całkowita energia
odbierana w danym kierunku byłaby po prostu sumą energii A2 + Al- wysyłanych przez
każde źródło osobno. Otrzymalibyśmy więc to, czego zwykle oczekujemy, mianowicie,
że wypadkowe natężenie światła padającego na jakiś przedmiot z dwóch źródeł stanowi
sumę natężeń obu świateł. Jeśli jednak sprawę stawiamy poprawnie i zachowujemy wyraz
mieszany, to nie otrzymujemy dokładnie sumy, ponieważ pojawia się także pewna
interferencja. Gdy zdarzają się warunki, w których ten wyraz nie ma znaczenia, możemy
powiedzieć, że interferencja pozornie się gubi. Oczywiście, występuje ona zawsze w
przyrodzie, ale możemy nie być w stanie, aby ją wykryć.
Rozważmy kilka przykładów. Załóżmy najpierw, że dwa źródła są odległe
o 7 000 000 000 długości fali, co jest sytuacją zupełnie prawdopodobną. Mamy wówczas
dla danego kierunku bardzo dobrze określoną wartość omawianej różnicy faz. Gdy zaś
przesuniemy się w pewnym kierunku choćby o włos, o kilka długości fali, co można w ogóle
pominąć (bo nasze własne oko ma tak duży otwór, że średniuje zjawiska w obszarze
o wiele szerszym niż pojedyncza długość fali), wówczas zmieniamy jednak fazę względną,
a wartość cosinusa zmienia się bardzo szybko. Jeśli bierzemy teraz średnią natężenia
po małym obszarze, cosinus przybiera wartość na przemian plus, minus, plus, minus
i przy obchodzeniu całego zakresu uśrednia się do zera.
Jeśli więc bierzemy wartość średnią z obszarów, gdzie faza zmienia się bardzo szybko
ze zmianą położenia, to interferencji nie uzyskujemy.
Weźmy inny przykład. Załóżmy, że dwa źródła są dwoma niezależnymi oscylatorami
radiowymi — chodzi tu nie o jeden oscylator zasilany przez dwa druty, co zapewnia,
że fazy są utrzymywane razem, ale o dwa niezależne źródła. Załóżmy dalej, że nie są
one nastrojone dokładnie na tę samą częstość (bardzo trudno ustawić je na tę samą
częstość, jeżeli nie są naprawdę połączone razem). Mamy w tym przypadku układ zwany
dwoma niezależnymi źródłami. Skoro ich częstości nie są dokładnie równe, to oczywiście
nawet gdy oba źródła mają początkowo zgodne fazy, jedno z nich zaczyna po chwili
wyprzedzać drugie i wkrótce ich fazy stają się niezgodne, po czym to samo źródło nadal
wysuwa się naprzód i wkrótce fazy stają się znowu zgodne. W ten sposób różnica faz
między obu źródłami zmienia się stopniowo w czasie. Jeśli teraz nasze obserwacje nie są
wystarczające, aby odróżnić tak małe czasy, jeśli zatem dokonujemy uśredniania po
czasie znacznie dłuższym, to narastanie i opadanie natężenia, podobne do tak zwanych
>,dudnień" dźwięku, może być za szybkie na to, aby nasze urządzenie je wyśledziło, i
wyraz interferencyjny zniesie się przy średniowaniu.
Innymi słowy, we wszelkich warunkach, w których przesunięcie fazowe znika przy
średniowaniu, nie otrzymujemy żadnej interferencji!
Istnieje wiele książek, w których się podaje, że dwa odrębne źródła światła nigdy ze
sobą nie interferują. Nie są to jednak wypowiedzi odnoszące się do fizyki, a tylko do
stopnia czułości techniki eksperymentalnej w czasie, gdy książka była pisana. W samym
100
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
źródle światła rzecz odbywa się tak, że najpierw promieniuje jeden atom, potem drugi
itd., a ponieważ przed chwilą stwierdziliśmy, że atomy wypromieniowują ciąg fal tylko
przez około 10~8 s, więc po tym czasie rolę przejmuje prawdopodobnie inny atom, potem
jeszcze inny itd. Tak więc fazy mogą pozostawać naprawdę takie same tylko przez około
10 ~8 s. Przy uśrednianiu po czasie znacznie dłuższym niż 10"8 s nie zauważamy
interferencji światła pochodzącego z dwu różnych źródeł, bo źródła te nie mogą utrzymać
stałej różnicy swoich faz przez dłużej niż 10 ~8 s. Posługując się fotokomórkami, które
umożliwiają bardzo szybką detekcję, można pokazać, że istnieje wtedy interferencja
zmieniająca się w czasie tam i z powrotem w okresie około 10"8 s. Ponieważ większość
urządzeń wykrywających oczywiście nie śledzi tak subtelnych odstępów czasowych,
interferencji nie zauważamy. Z całą pewnością dla dwóch różnych źródeł zwykłego światła
nie ma żadnych szans zauważenia interferencji za pomocą oka, dla którego czas
uśredniania wynosi około ^ s.
Ostatnio udało się zbudować źródła światła, w których powyższe zjawisko nie
zachodzi, ponieważ emisja we wszystkich atomach następuje jednocześnie. Urządzenie,
które tego dokonuje, jest bardzo skomplikowane, a jego działanie trzeba opisywać w
sposób kwantowy. Nazywamy je laserem i można uczynić z niego źródło, w którym częstość
interferencji, czas, w ciągu którego utrzymuje się stałość fazy, jest znacznie dłuższa od
10 ~8 s. Może ona być rzędu ~, -^ albo nawet 1 s i dzięki temu można za pomocą
zwykłych fotokomórek uchwycić względną częstość dwu różnych laserów. Łatwo można wykryć
pulsowanie dudnień ż dwu źródeł laserowych. Niewątpliwie wkrótce będzie można
pokazywać ścianę oświetloną przez dwa źródła, których dudnienia będą na tyle powolne,
że uda się zobaczyć rozjaśnianie i zaciemnianie ściany!
Inny przypadek, w którym interferencja znosi się przy średniowaniu, zdarza się wtedy,
gdy zamiast dwóch źródeł mamy ich wiele. W tym przypadku wyrażenie dla A\ będzie
kwadratem sumy szeregu amplitud przedstawionych jako liczby zespolone. Jako wynik
otrzymamy sumę kwadratów każdej amplitudy plus wyrazy mieszane dla każdej pary
i gdy zdarzy się sytuacja, w której te ostatnie wyrazy wypadną przy średniowaniu, nie
będzie wówczas zjawisk interferencji. Może się zdarzyć tak bezładne rozmieszczenie
poszczególnych źródeł, że różnica faz między np. A2 i A3 będzie dobrze określona, ale
zupełnie odmienna od różnicy faz między np. Ax i A2 itd. W rezultacie z całego mnóstwa
cosinusów — wiele będzie z plusami, wiele z minusami — wszystkie zniosą się w
średniowaniu.
Dlatego właśnie w wielu sytuacjach nie obserwujemy wyników interferencji, a tylko
całkowite, wspólne natężenie, równe sumie wszystkich pojedynczych natężeń.
32-5. Rozpraszanie światła
Omówione wyżej sprawy doprowadzają nas do pewnego zjawiska zachodzącego
w powietrzu, a wynikającego z nieregularnych położeń atomów. Przy omawianiu
współczynnika załamania dowiedzieliśmy się, że wchodząca wiązka światła pobudza elektrony
do ruchu tam i z powrotem i że elektrony te na skutek przyspieszania promieniują. To
32-5. ROZPRASZANIE ŚWIATŁA
101
wiązka padająca
(niespolaryzowana)
promieniowanie
rozproszone
32.2. Wiązka promieniowania pada na atom
i wprawia w ruch jego ładunki (elektrony).
Poruszające się elektrony promieniują z
kolei w rozmaitych kierunkach
rozproszone promieniowanie tworzy wiązkę
o takim samym kierunku jak wiązka
wchodząca, ale o nieco innej fazie i stąd właśnie
bierze się współczynnik załamania.
Co jednak powiedzieć o ilości światła
pochłoniętego i ponownie wypromieniowanego
w jakimś innym kierunku? Jeżeli atomy, jak
zazwyczaj, będą ładnie ustawione, tworząc
piękną konstrukcję, to łatwo pokazać, że w
innych kierunkach nie otrzymamy
rozpraszania, ponieważ przy dodawaniu wielu
wektorów o zmieniających się wciąż fazach wyjdzie
wynik zerowy. Jeśli jednak atomy będą
ustawione bezładnie, to całkowite natężenie w
każdym kierunku będzie sumą natężeń światła rozproszonego przez każdy atom, tak właśnie
jak mówiliśmy poprzednio. W gazie natomiast atomy są właściwie w ruchu, tak że chociaż
w danej chwili względna faza dwu atomów może być dobrze określoną wielkością, to
później stanie się zupełnie inna i w rezultacie każdy cosinus zniknie przy średniowaniu.
Aby więc znaleźć ilość światła rozpraszaną przez gaz w danym kierunku, musimy po
prostu zbadać działanie pojedynczego atomu, a następnie wypromieniowane natężenie
pomnożyć przez liczbę atomów.
Wspomnieliśmy poprzednio, że tego rodzaju zjawisko rozpraszania światła jest
przyczyną tego, że niebo jest błękitne. Wiemy, że światło słoneczne przechodzi przez powietrze
i wiemy, że patrząc w bok od słońca, np. prostopadle do wiązki, widzimy niebieskie
światło. Teraz zaś mamy obliczyć, ile światła widzimy i dlaczego jest ono niebieskie.
Jeśli pole elektryczne wiązki padającej jest równe E = E0e'°" w punkcie, w którym
umieszczony jest atom, to elektron w takim atomie będzie — jak wiemy — pod wpływem
tego pola E (rys. 32.2) drgał tam i z powrotem. Z równania (23.8), t. I, cz. 1, wynika, że
amplituda jego drgania będzie równa
x =
VeE0
m(co0 — co +iyco)
(32.15)
Moglibyśmy uwzględnić tłumienie i możliwość, że atom działa jak szereg oscylatorów
o różnych częstościach, a następnie wykonać względem nich sumowanie, ale dla
uproszczenia weźmy pojedynczy oscylator i pomińmy jego tłumienie. Otrzymamy wówczas
jako wynik działania zewnętrznego pola elektrycznego wielkość, z której już
korzystaliśmy przy obliczaniu współczynnika załamania. Wynosi ona po prostu
x =
?«E0
m(co0 — co )
(32.16)
Korzystając ze wzoru (32.2) moglibyśmy teraz łatwo obliczyć natężenie światła wysyłanego
w rozmaitych kierunkach i przyspieszenie odpowiadające powyższej amplitudzie x.
102
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
Zamiast tego obliczmy jednak dla zaoszczędzenia czasu po prostu całkowitą ilość
światła rozproszonego we wszystkich kierunkach. Całkowita energia świetlna na sekundę,
rozpraszana we wszystkich kierunkach przez pojedynczy atom będzie oczywiście dana
równaniem (32.6). Zbierając razem różne przyczynki i dokonując ich przegrupowania
otrzymujemy więc
P'l2KEoci m,W-^)2~ie° ° 3 V6K24mlcĄ (c2-^)1
= te0cE20^ 7-*-Trt (32'17)
3 (u) -<o0)
dla całej rozproszonej mocy wypromieniowanej we wszystkich kierunkach.
Wynik napisaliśmy w powyższej postaci, gdyż wtedy można go łatwiej zapamiętać.
Przede wszystkim energia rozproszona jest proporcjonalna do kwadratu wzbudzającego
pola. Cóż to znaczy? Kwadrat wzbudzającego pola jest oczywiście proporcjonalny do
energii wchodzącej w ciągu sekundy. Mówiąc dokładnie, energia padająca na metr
kwadratowy w ciągu sekundy wynosi c0c razy średnia <£2> kwadratu pola elektrycznego
i jeżeli E0 jest maksymalną wartością E, <£2> = |£"o- Całkowita energia rozproszona
jest, innymi słowy, proporcjonalna do wchodzącej energii na metr kwadratowy; im
jaśniejsze jest światło słoneczne padające na niebo, tym niebo wygląda jaśniej.
Zapytajmy z kolei, jaki ułamek wchodzącego światła zostaje rozproszony? Wyobraźmy
sobie „tarczę" o pewnej powierzchni, powiedzmy a (nie prawdziwą, materialną tarczę,
ponieważ taka rozpraszałaby światło ze wszystkimi tego konsekwencjami; mamy na
myśli wyimagowaną powierzchnię wyodrębnioną w przestrzeni). Całkowita energia
przechodząca przez powierzchnię a w danych warunkach będzie proporcjonalna zarówno
do wchodzącego natężenia, jak i do er i wyniesie
P = {{e0cEl)a. (32.18)
Przyjmujemy teraz następujący punkt widzenia: zakładamy, że całkowite natężenie
rozproszone przez atom jest równe natężeniu padającemu na pewną powierzchnię
geometryczną. Odpowiedź na nasze pytanie będzie polegała na podaniu pola tej powierzchni.
Jest ona zatem niezależna od padającego natężenia; podaje bowiem stosunek energii
rozproszonej do energii padającej na metr kwadratowy. Innymi słowy, stosunek
całkowita energia rozproszona na sekundę
= pole pewnej powierzchni.
energia padająca na metr kwadratowy na sekundę
Pole tej powierzchni jest dlatego tak ważną wielkością, że padająca na tę powierzchnię
snergia po całkowitym rozproszeniu we wszystkich kierunkach stanowiłaby dokładnie
mergię rozproszoną przez atom.
Pole tej powierzchni nazywamy przekrojem czynnym na rozpraszanie. Pojęcie przekroju
:zynnego jest używane zawsze, ilekroć jakieś zjawisko zachodzi proporcjonalnie do
natężenia wiązki. W takich wypadkach miarę wielkości zjawiska opisuje się zawsze przez
Jodanie pola efektywnej powierzchni, która by zasłoniła dokładnie taką samą część wiązki.
W żadnym razie nie oznacza to, że dany oscylator ma naprawdę taką powierzchnię. Gdy-
32-5. ROZPRASZANIE SWIATŁ-A
103
byśmy mieli w próżni tylko swobodny elektron drgający w górę i w dół, to nie istniałaby,
fizycznie rzecz biorąc, żadna powierzchnia bezpośrednio z nim związana. Jest to tylko
sposób podania odpowiedzi na pewnego rodzaju zagadnienie. Dowiadujemy się, na jak
dużą powierzchnię powinna podać wiązka, aby wytłumaczyć daną ilość energii
wychodzącej. Tak więc w naszym wypadku
8nr* w*
2 ,2\2
3 K-oS)
(32.19)
(wskaźnik r odróżnia przekrój czynny na rozpraszanie).
Rozpatrzmy kilka przykładów. Weźmy najpierw bardzo niską naturalną częstość
«0 albo zajmijmy się całkowicie nie związanymi elektronami, dla których co0 = 0. Czynnik
w skraca się wówczas i przekrój czynny jest wielkością stałą. Taka granica dla niskich
częstości, czyli przekrój czynny swobodnych elektronów, znana jest jako przekrój czynny
rozpraszania Thomsona. Długość boku tej powierzchni wynosi około 10"~15 m, co daje
10~3om2, a więc dość mało!
Weźmy z drugiej strony przypadek światła rozproszonego w powietrzu. Pamiętamy,
że naturalne częstości oscylatorów powietrza są wyższe niż częstości rozważanego światła.
Oznacza to, że w pierwszym przybliżeniu możemy pominąć a>2 w mianowniku i znaleźć,
że rozpraszanie jest proporcjonalne do czwartej potęgi częstości. Wynika stąd, że światło
o częstości, powiedzmy, dwukrotnie wyższej jest rozpraszane 16 razy bardziej intensywnie,
a różnica taka jest dobrze uchwytna. Tak więc światło niebieskie, którego częstość jest
mniej więcej dwa razy większa niż w czerwonym krańcu widma, jest rozpraszane w daleko
większym stopniu niż światło czerwone. Stąd właśnie bierze się widziany przez nas
wspaniały błękit nieba!
Powyższe wyniki wymagają jeszcze kilku wyjaśnień. Ciekawy jest na przykład problem,
dlaczego w ogóle widzimy chmury'] Skąd się biorą chmury? Każdy wie, że stanowią one
skondensowaną parę wodną. Para wodna znajduje się oczywiście w atmosferze, zanim
jeszcze ulegnie kondensacji, dlaczego więc nie widzimy jej przedtem? Gdy para już ulegnie
kondensacji, sprawa staje się oczywista. Skondensowanej pary nie było w jakimś miejscu,
a teraz tam jest. więc ją widać. A więc zagadka, skąd się biorą chmury, nie jest wcale
dziecinną zagadką w rodzaju: „Skąd się bierze woda, Tato?", ale wymaga wyjaśnienia.
Wyjaśniliśmy sobie przed chwila, że każdy atom rozprasza światło i oczywiście para
wodna też będzie je rozpraszać. Cała tajemnica leży w tym, dlaczego woda skondensowana
w chmury rozprasza tak bardzo zwiększoną ilość światła?
Rozważmy, co by się działo, gdybyśmy zamiast pojedynczego atomu mieli na przykład
zlepek dwu atomów, położonych bardzo blisko siebie w porównaniu z długością fali
światła. Pamiętajmy, że średnica atomu wynosi około 1 A, podczas gdy długość fali
wynosi około 5000 A, tak że kilka atomów tworzących grupkę może rzeczywiście leżeć
bardzo blisko siebie w porównaniu z długością fali światła. Pod wpływem pola
elektrycznego oba atomy będą się poruszały razem. Rozproszone pole elektryczne będzie więc sumą
dwu pól o zgodnej fazie, co znaczy, że amplitudę rozpraszania na pojedynczym atomie
należy podwoić, a rozproszoną energię już nie podwoić, ale powiększyć czterokrotnie
w stosunku do pojedynczego atomu! Tak więc grupki atomów promieniują lub rozpra-
104
32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA
szają znacznie więcej energii niż atomy działające pojedynczo. Nasz dawny argument
o niezależności faz oparty był na założeniu, że istnieje rzeczywista i duża różnica w fazie
między dowolną parą atomów, co jest prawdą tylko wtedy, gdy są one oddalone od siebie
o wiele długości fali i bezładnie rozmieszczone lub poruszające się. Jeśli natomiast znajdują
się one tuż obok siebie, muszą rozpraszać zgodnie w fazie i dają spójną interferencję,
która powoduje wzrost rozpraszania.
Jeśli mamy grupę N atomów, a więc malutką kropelkę wody, każdy atom będzie
pobudzany przez pole elektryczne w przybliżeniu jakby był swobodny (oddziaływanie
jednego atomu na drugi nie jest ważne; chodzi po prostu o uchwycenie głównej myśli),
ponieważ zaś amplitudy rozpraszania na każdym z nich będą jednakowe, całkowite pole
rozpraszania będzie N razy większe. Natężenie światła rozproszonego wzrośnie więc jak
kwadrat, /V2-krotnie. Gdyby atomy były bezładnie rozrzucone w przestrzeni,
spodziewalibyśmy się tylko N-krotnego wzrostu natężenia, a w tym przypadku uzyskujemy N2 razy
więcej! Tak więc rozpraszanie na kropelkach wody w grupkach złożonych z N cząsteczek
jest N razy bardziej intensywne niż rozpraszanie na pojedynczych cząsteczkach. Tak
więc rozpraszanie wzrasta, gdy woda ulega skupieniu. Czy jednak wzrasta ono ad
infinitum} Wcale nie! Kiedy więc analiza ta zaczyna się załamywać? He atomów możemy
zebrać razem, aby rozumowanie takie było jeszcze poprawne? Odpowiedź: Gdy krople wody
stają się tak duże, że ich średnica osiąga mniej więcej długość fali, wówczas poszczególne
atomy przestają rozpraszać w fazie, ponieważ są od siebie zbyt odległe. W miarę więc
powiększania się rozmiarów kropelek rozpraszanie wzrasta tylko do chwili, w której
rozmiary kropli wynoszą około jednej długości fali. Odtąd rozpraszanie nie wzrasta już
tak szybko, jak powiększa się kropla. Co więcej — błękit znika, ponieważ graniczna
średnica kropli dla dużych długości fali jest większa niż dla małych. Pojedyncze atomy
silniej rozpraszają krótkie fale niż długie, ale gdy wszystkie krople są większe od
pojedynczej długości fali, efekt bardziej się potęguje dla czerwonego krańca widma niż dla
niebieskiego i w rezultacie zabarwienie przesuwa się od błękitu w stronę czerwieni.
Zróbmy teraz doświadczenie, które bę-
32.3. Ilustracja pochodzenia polaryzacji
promieniowania rozproszonego pod kątem do
padającej wiązki
elektron porusza się
w płaszczyźnie JL k
wiązka padająca
(niespolaryzowana)
atom
promieniowanie
rozproszone 1 k
jest spolaryzowane
liniowo
dzie pokazywać to wszystko. Możemy
utworzyć cząstki, które najpierw będą
bardzo małe, a następnie stopniowo będą
swoje rozmiary powiększać. Posłużymy
się w tym celu roztworem tiosiarczanu sodu
(tzw. hypo) w kwasie siarkowym, z
którego wytrącają się bardzo drobne ziarna
siarki. Ziarna te początkowo są bardzo
małe i rozpraszanie jest trochę
błękitnawe. Przy dalszym wytrącaniu się
zabarwienie staje się coraz bardziej intensywne i w
miarę wzrostu cząstek jest coraz bielsze.
Zauważamy poza tym, że światło
przechodzące na wprost jest pozbawione błękitu.
Dlatego właśnie zachód słońca jest czer-
32-5 ROZPRASZANIE SW1ATŁ.A
105
wony, albowiem w świetle przechodzącym do oka przez grubą warstwę powietrza
ulega rozproszeniu tyle błękitu, że uzyskuje ono barwę żółtoczerwoną.
Omówmy na koniec jeszcze jedną ważną sprawę, która wprawdzie należy już do
tematu następnego rozdziału (do polaryzacji), ale jest tak ciekawa, że warto na nią już
teraz zwrócić uwagę. Chodzi o to, że pole elektryczne światła rozproszonego stara się
wykonywać drgania w pewnym określonym kierunku. Pobudzony oscylator wykonuje
drgania w tym samym kierunku co pole elektryczne światła padającego i jeżeli ustawimy
się w przybliżeniu prostopadle do wiązki, to zobaczymy światło spolaryzowane, tzn.
światło, w którym pole elektryczne drga tylko w jednym kierunku. Na ogół atomy wykonują
drgania w dowolnym kierunku prostopadłym do wiązki, ale gdy zostają pobudzone do
drgań wprost na nas lub od nas, wówczas ich nie widzimy. Gdy zatem pole elektryczne
wchodzącego światła zmienia się i drga w różnych kierunkach, co określamy jako światło
niespolaryzowane, wówczas światło wychodzące pod kątem 90° do wiązki wykonuje
drgania tylko w jednym kierunku (patrz rys. 32.3)!
Istnieje substancja zwana polaroidem, która ma tę własność, że z przechodzącego
przez nią światła wybiera tylko tę część pola elektrycznego, która jest ustawiona wzdłuż
pewnej określonej osi. Możemy jej użyć jako testu polaryzacji i stwierdzić, że światło
rozproszone przez roztwór hypo jest rzeczywiście silnie spolaryzowane.
33
polaryzacja
33-1. Elektryczny wektor światła
W rozdziale tym będziemy rozważać zjawiska wynikające z faktu, że pole elektryczne
opisujące zjawisko światła jest polem wektorowym. W poprzednich rozdziałach nie
zajmowaliśmy się kierunkiem drgań pola elektrycznego. Zauważyliśmy tylko, że wektor
elektryczny leży w płaszczyźnie prostopadłej do kierunku rozchodzenia się światła, a nie
interesował nas określony kierunek w tej płaszczyźnie. Teraz będziemy rozważali
zjawiska, których główną cechą jest właśnie określony kierunek drgań pola elektrycznego.
W doskonale monochromatycznym świetle pole elektryczne musi drgać z dobrze
określoną częstością. Ponieważ zaś składowe w kierunku osi x i y mogą drgać z tą
częstością niezależnie od siebie, musimy najpierw rozważyć wypadkowy efekt nakładania się
dwu niezależnych, wzajemnie prostopadłych drgań. Jakiego rodzaju pole elektryczne
tworzy się ze składowych x i y drgających z tą samą częstością? Jeżeli do drgań x dodać
pewne drgania y o tej samej fazie, wynik będzie drganiem w nowym kierunku w
płaszczyźnie xy. Rysunek 33.1 obrazuje nakładanie się drgań x i drgań y o różnych amplitu-
33.1. Składanie zgodnych w fazie drgań w kierunku osi x i drgań w kierunku osi y
£*=o
£,= 1
33-1. ELEKTRYCZNY WEKTOR ŚWIATŁA
107
£x=coscjt; 1
C)
cos cot; 1
-sinart; i
d)
cos (jjt; 1 cos <ot; 1
zos((Jt+3^/4;ei3"^ -coswt; -1
Ex=cosojt; 1 coswt; f cosŁit; cos^t; f
E^-cosfut+n/Ąi-e1** sinwf; -i -cos(«it+3n/4); -e'3ff^ coswt; f
33.2. Składanie drgań x i drgań > o równych amplitudach, ale rozmaitych fazach względnych.
Składowe E, i E, podane są w zapisie rzeczywistym i zespolonym
dach. Wyniki pokazane na rys. 33.1 nie są jedynymi możliwościami; we wszystkich tych
przypadkach założyliśmy, że drgania x i y mają zgodne fazy, co wcale nie musi zachodzić.
Może się zdarzyć, że drgania x i y będą przesunięte w fazie.
Gdy drgania x i drgania y nie mają zgodnych faz, wektor pola elektrycznego obiega
dookoła po elipsie, co możemy zobrazować za pomocą znanego przykładu. Zawieśmy
kulkę na długim sznurku tak, aby mogła się kołysać swobodnie w płaszczyźnie poziomej.
Będzie ona wówczas wykonywać drgania sinusoidalne. Jeżeli wyobrazimy sobie poziome
współrzędne x i y o początku w położeniu równowagi kulki, to będzie się ona kołysać
bądź w kierunku osi x, bądź osi y z tą samą częstością wahadłową. Wybierając
odpowiednie przesunięcie początkowe i prędkość możemy wprawić kulkę w drgania bądź
wzdłuż osi x, bądź y albo wzdłuż dowolnej linii prostej w płaszczyźnie xy. Ruchy
kulki będą analogiczne do przedstawionych na rys. 33.1 drgań wektora pola
elektrycznego. Ponieważ drgania x i drgania y osiągają swoje maksima i minima w tym samym
czasie, więc w każdej chwili drgania x i y są w fazie zgodnej. Wiemy jednak, że
najogólniejszym ruchem kulki jest ruch po elipsie, odpowiadający drganiom, w których kierunki x
' y nie mają tej samej fazy. Na rysunku 33.2 przedstawiono nakładanie się niezgodnych
w fazie drgań x i v dla różnych wartości kąta między ich fazami. Ogólny wynik jest taki,
ze wektor elektryczny porusza się po elipsie. Ruch po linii prostej jest szczególnym
przypadkiem odpowiadającym różnicy faz 0 (albo całkowitej wielokrotności jt); ruch po okręgu
odpowiada równym amplitudom z różnicą faz wynoszącą 90° (albo całkowitą nieparzystą
wielokrotność k/2).
Na rysunku 33.2 wektory pola elektrycznego w kierunku osi x i y oznaczyliśmy za
Pomocą liczb zespolonych, które pozwalają na wygodne przedstawienie różnicy faz.
Nie należy mylić rzeczywistej i urojonej części przedstawionego w ten sposób zespolo-
nego wektora elektrycznego ze składowymi x i y pola. Składowe x i y wykreślone na rys.
108
33. POLARYZACJA
33.1 i rys. 33.2 są właściwymi, mierzalnymi polami elektrycznymi. Część rzeczywista
i urojona zespolonego wektora pola elektrycznego - to tylko udogodnienie
matematyczne i nie ma żadnego znaczenia fizycznego.
Ustalmy teraz terminologię. Światło jest spolaryzowane liniowo (czasem zwane
światłem spolaryzowanym w płaszczyźnie), gdy pole elektryczne drga wzdłuż linii prostej.
Rysunek 33.1 obrazuje polaryzację liniową. Gdy koniec wektora pola elektrycznego
porusza się po elipsie, światło jest spolaryzowane eliptycznie. Gdy koniec wektora pola
elektrycznego wędruje po okręgu, mamy polaryzację kołową. Jeżeli koniec wektora pola
elektrycznego (gdy obserwujemy go tak, że światło pada wprost na nas) porusza się w
kierunku przeciwnym do wskazówek zegara, nazywamy to prawoskrętną polaryzacją kołową.
Rysunek 33.2g pokazuje prawoskrętną polaryzację kołową, a rys. 33.2c pokazuje lewo-
skrętną polaryzację kołową. W obu przypadkach światło biegnie od stronicy książki do
czytelnika. Nasza umowa oznaczania lewo- i prawoskrętnej polaryzacji kołowej jest
zgodna z umową przyjętą w fizyce dla wszystkich innych cząstek wykazujących polaryzację
(np. elektronów). Mimo to w niektórych książkach z dziedziny optyki przyjęto odmienne
konwencje, tak że należy zachować ostrożność.
Omówiliśmy światło spolaryzowane liniowo, kołowo i eliptycznie, co wyczerpuje
wszystkie przypadki, z wyjątkiem światła niespolaryzowanego. Jak to się dzieje, że światło
może być niespolaryzowane, skoro wiemy, że jego wektor musi poruszać się po pewnej
elipsie? Jeżeli światło nie jest dokładnie monochromatyczne albo jeżeli fazy x i y nie są
idealnie utrzymywane razem, tak że wektor elektryczny najpierw drga w jednym kierunku,
a następnie w innym, polaryzacja stale się zmienia. Pamiętajmy, że emisja z jednego atomu
trwa 10 ~8 s i jeżeli jeden atom wysyła światło o pewnej polaryzacji, a następnie inny o innej,
to będzie się ona zmieniała co 10 ~8 s. Jeśli polaryzacja zmienia się szybciej, niż ją możemy
wykryć, światło nazywamy niespolaryzowanym, ponieważ wszystkie efekty polaryzacyjne
wyśredniowują się. Żaden z interferencyjnych efektów polaryzacyjnych nie objawi się
dla światła niespolaryzowanego. Jednak według definicji światło jest niespolaryzowane
tylko wtedy, gdy nie jesteśmy w stanie stwierdzić,- czy jest spolaryzowane, czy też nie.
33-2. Polaryzacja światła rozproszonego
Pierwszym, omawianym przez nas przykładem efektu polaryzacyjnego, jest
rozpraszanie światła. Weźmy na przykład wiązkę światła słonecznego, padającego na powietrze.
Pole elektryczne wytworzy drgania ładunków w powietrzu, a ruchy tych ładunków
spowodują promieniowanie światła, którego natężenie będzie największe w płaszczyźnie
prostopadłej do kierunku drgań ładunków. Wiązka pochodząca ze Słońca jest niespolary-
zowana i kierunek polaryzacji zmienia się stale, a więc zmienia się i kierunek drgań
ładunków w powietrzu. Jeżeli obserwujemy światło rozproszone pod kątem 90°, drgania
cząstek naładowanych powodują promieniowanie w kierunku obserwatora tylko wtedy,
gdy są prostopadłe do linii obserwacji. Światło będzie wtedy spolaryzowane wzdłuż
kierunku drgań. Rozpraszanie stanowi więc przykład, w jaki sposób można wytworzyć
polaryzację.
33-3, DWÓJLOMNOŚĆ
109
33-3. Dwójlomność
Innym ciekawym zjawiskiem polaryzacyjnym jest istnienie substancji, w których
współczynnik załamania jest różny dla światła spolaryzowanego liniowo w różnych
kierunkach. Wyobraźmy sobie ośrodek materialny, składający się z wydłużonych, niekuli-
stych cząsteczek i załóżmy, że są one w nim ułożone tak, że ich długie osie są wzajemnie
równoległe. Co się dzieje, gdy drgające pole elektryczne przechodzi przez taki ośrodek?
Załóżmy, że na skutek budowy cząsteczek elektrony w ośrodku łatwiej reagują na drgania
pola elektrycznego w kierunku równoległym do osi cząsteczek niż w kierunku
prostopadłym. Dlatego też polaryzacja w pewnym kierunku będzie dawała inny efekt niż
polaryzacja w kierunku do niego prostopadłym. Kierunek osi cząsteczek nazwijmy osią
optyczną. Gdy polaryzacja ma kierunek osi optycznej, współczynnik załamania jest inny
niż dla polaryzacji prostopadłej do osi. Ośrodek taki nazywamy ośrodkiem dwójlomnym.
Załamuje on światło na dwa różne sposoby, czyli ma dwa współczynniki załamania
zależne od kierunku polaryzacji światła w ośrodku. Jakiego rodzaju ośrodki mogą być
dwójłomne? W substancji dwójłomnej musi, z tej lub innej przyczyny, istnieć pewien
stopień uszeregowania niesymetrycznych cząsteczek. Kryształ o symetrii sześciennej
z całą pewnością nie może być dwójłomny. Ale długie, igłowate kryształy niewątpliwie
zawierają niesymetryczne cząsteczki i w nich można bardzo łatwo zauważyć to zjawisko.
Zobaczmy, jakich efektów powinniśmy się spodziewać przy przechodzeniu światła
spolaryzowanego przez płytkę substancji dwójłomnej. Światło przechodzi z pewną
prędkością, jeżeli polaryzacja jest równoległa do osi optycznej, a z inną, jeżeli polaryzacja
jest do niej prostopadła. Ciekawa sytuacja powstaje wtedy, gdy światło jest na przykład
liniowo spolaryzowane pod kątem 45° do osi optycznej. Polaryzację 45° można, jak
wiadomo, przedstawić w postaci superpozycji spolaryzowanych w kierunkach osi x \y fal o
równych amplitudach i o zgodnej fazie, jak pokazano na rys. 33.2a. Ponieważ światło
spolaryzowane w kierunkach xiy rozchodzi się z rozmaitymi prędkościami, więc w miarę
przechodzenia światła przez ośrodek fazy zmieniają się w różnym stopniu. Chociaż więc na
początku drgania w kierunkach osi x i y są w fazie, wewnątrz ośrodka powstanie między
drganiami x i y różnica faz proporcjonalna do stopnia zagłębienia się w materię. W miarę
jak światło przechodzi przez ośrodek, polaryzacja zmienia się tak, jak pokazuje szereg
diagramów na rys. 33.2. Jeżeli grubość płytki tak dobierzemy, aby wprowadzić
przesunięcie fazowe 90° między polaryzacjami .v i y (rys. 33.2c), światło wyjdzie spolaryzowane
kołowo. Płytkę o takiej grubości nazywamy ćwierćfalówką, ponieważ wprowadza między
Polaryzacjami x i y różnicę faz równą {- okresu. Jeżeli światło spolaryzowane liniowo
zostaje przepuszczone przez dwie ćwierćfalówki, to wychodzi ono znowu spolaryzowane
w płaszczyźnie, ale prostopadle do kierunku początkowego, tak jak to widzimy na rys.
33.2e.
Łatwo można pokazać to zjawisko posługując się kawałkiem celofanu. Celofan jest
zbudowany z długich, włóknistych cząsteczek i nie jest izotropowy, ponieważ włókna są
Przeważnie ustawione w określonym kierunku. Aby zobaczyć dwójłomność, potrzebna jest
nam wiązka światła spolaryzowanego liniowo, możemy zaś ją łatwo otrzymać
przepuszczając światło niespolaryzowane przez warstwę polaroidu. Polaroid, o którym później będziemy
110
33. POLARYZACJA
mówić bardziej szczegółowo, ma tę korzystną własność, że bardzo słabo pochłania światło
spolaryzowane liniowo w kierunku równoległym do swej osi, podczas gdy światło
spolaryzowane w kierunku prostopadłym pochłania silnie. Gdy przez warstwę polaroidu
przepuszczamy światło niespolaryzowane, przechodzi tylko część niespolaryzowanej wiązki,
drgająca równolegle do osi polaroidu, i w rezultacie wychodząca wiązka jest
spolaryzowana liniowo. Ta sama własność polaroidu oddaje również usługi przy wykrywaniu
polaryzacji wiązki spolaryzowanej liniowo albo przy określeniu czy wiązka jest
spolaryzowana liniowo, czy nie. Przepuszcza się po prostu wiązkę światła przez warstwę polaroidu
i obraca się nim w płaszczyźnie prostopadłej do wiązki. Wiązka spolaryzowana liniowo nie
będzie przepuszczana przez polaroid wtedy, gdy oś polaroidu będzie prostopadła do
kierunku polaryzacji. Przepuszczana wiązka zostanie tylko nieznacznie osłabiona, gdy
oś warstwy polaroidu obrócimy o 90°. Jeżeli przepuszczane natężenie nie zależy od
orientacji polaroidu, wiązka nie jest spolaryzowana liniowo.
Aby pokazać dwójłomność celofanu, używamy dwóch warstw polaroidu, tak jak to
widać na rys. 33.3. Pierwsza warstwa daje nam liniowo spolaryzowaną wiązkę, którą
następnie przepuszczamy przez celofan i przez drugą warstwę polaroidu. Służy ona do
wykrycia wszelkiego działania, jakie celofan mógłby wywrzeć na przechodzące
spolaryzowane światło. Jeśli najpierw ustawimy osie dwóch warstw polaroidu wzajemnie
prostopadle i usuniemy celofan, to drugi polaroid nie będzie przepuszczał żadnego światła.
Wprowadźmy teraz celofan między dwie warstwy polaroidu i obracajmy arkusz wokół
osi wiązki. Zauważymy, że celofan na ogół powoduje przepuszczenie części światła przez
drugi polaroid. Istnieją jednak dwa wzajemnie prostopadłe ustawienia arkusza celofanu,
przy których światło wcale nie może przejść przez drugi polaroid. Ustawienia, przy których
liniowo spolaryzowane światło jest przepuszczane przez celofan bez zmiany kierunku
polaryzacji, muszą być równoległe do osi optycznej kartki celofanowej.
Przypuszczamy, że przy tych dwu różnych ustawieniach światło wprawdzie przechodzi
przez celofan z dwiema różnymi prędkościami, ale jest przepuszczane bez zmiany kierunku
polaryzacji. Gdy celofan zostanie obrócony o połowę kąta między tymi ustawieniami,
tak jak pokazuje to rys. 33.3, zobaczymy, że
światło przepuszczone przez drugi polaroid
będzie wówczas mocne.
Tak się składa, że zwykły celofan
używany w handlu do opakowań ma grubość
bardzo zbliżoną do połowy długości fali dla
większości barw światła białego. Arkusz taki
obraca oś liniowo spolaryzowanego światła
o 90°, jeżeli padająca wiązka spolaryzowana
liniowo tworzy kąt 45° z osią optyczną, i
wiązka wychodząca zcelofanu drga wtedy w takim
kierunku, że może przejść przez drugą
warstwę polaroidu.
Ponieważ arkusz celofanu ma
odpowiednią półfalową grubość tylko dla pewnej skła-
33.3. Doświadczalne wykazanie dwójłomno-
ści celofanu. Wektory elektryczne światła
są oznaczone liniami przerywanymi. Osie
przepuszczania warstw polaroidu i optyczne
osie celofanu są zaznaczone strzałkami.
Wiązka padająca jest niespolaryzowana
celofan
polaroid'
33-J. DWÓJLOMNOSĆ
111
dowej światła białego, więc przepuszczana wiązka ma barwę tej właśnie składowej, jeżeli
tylko do naszego pokazu użyjemy światła białego. Przepuszczana warstwa zależy od
grubości arkusza i możemy zmieniać efektywną grubość celofanu pochylając go tak, aby
światło przechodziło pod kątem i w rezultacie po dłuższej drodze. W miarę pochylania
arkusza zmienia się przepuszczana barwa. Z celofanu o różnej grubości możemy budować
filtry przepuszczające różne barwy. Filtry te mają ciekawą własność, polegającą na tym,
że przepuszczają jedną barwę, gdy osie obu warstw polaroidowych są wzajemnie
prostopadłe, a barwę dopełniającą, gdy osie te są wzajemnie równoległe.
Uszeregowane cząsteczki znajdują także ciekawe zastosowanie praktyczne. Niektóre
masy plastyczne są zbudowane z bardzo długich i złożonych cząsteczek skręconych razem.
Gdy masę plastyczną zestalamy bardzo ostrożnie, cząsteczki zostają razem skręcone
w masie substancji, tak że ustawiają się bezładnie w różnych kierunkach i masa nie
wykazuje szczególnej dwójłomności. Zwykle jednak przy zestalaniu substancji powstają
odkształcenia i naprężenia, tak że nie jest ona doskonale jednorodna. Przyłożenie zaś
napięcia do kawałka takiej masy plastycznej polega jakby na ciągnięciu całego splotu
sznurków, na skutek czego więcej ich ułoży się równolegle do napięcia niż w innych
kierunkach. Gdy zatem w niektórych masach plastycznych powstają naprężenia, stają się
one dwójłomne, co można stwierdzić przepuszczając przez masę plastyczną światło
spolaryzowane. Badając przepuszczone światło za pomocą warstwy polaroidu, można
zaobserwować obraz jasnych i ciemnych prążków (zabarwionych, jeśli używamy światła białego).
Obraz zmienia się, w miarę jak poddajemy próbkę naciskowi, licząc zaś prążki i
obserwując, gdzie się większość z nich znajduje, można określić wielkość nacisku. Inżynierowie
posługują się tym sposobem do znalezienia naprężeń w elementach o nieregularnym
kształcie, które trudno obliczyć.
Weźmy inny ciekawy przykład uzyskiwania dwójłomności w ośrodkach ciekłych.
Rozważmy ciecz utworzoną z długich asymetrycznych cząsteczek, które obdarzone są na
końcach średnim ładunkiem dodatnim lub ujemnym, tak że cząsteczka stanowi dipol
elektryczny. Na skutek zderzeń w cieczy cząsteczki będą zwykle ustawione bezładnie
i tyle samo cząsteczek ustawi się w jednym kierunku, co w innym. Jeśli przyłożymy pole
elektryczne, cząsteczki będą się starały uszeregować i ciecz stanie się dwójłomna. Za
pomocą dwóch warstw polaroidu i przezroczystej komórki zawierającej taką polarną ciecz
możemy zbudować urządzenie, które ma własność przepuszczania światła tylko wtedy,
gdy zostanie przyłożone pole elektryczne. Mamy więc elektryczny wyłącznik dla światła,
który nazywamy komórką Kerra. Zjawisko polegające na tym, że pole elektryczne może
w pewnych cieczach wytworzyć dwójłomność, nazywamy zjawiskiem Kerra.
33-4. Polaryzatory
Rozważaliśmy dotąd substancje, w których współczynnik załamania był różny dla
światła spolaryzowanego w różnych kierunkach. Dużą wartość praktyczną mają także
kryształy i inne substancje, w których nie tylko współczynnik załamania, ale i współczynnik
Pochłaniania jest różny dla światła spolaryzowanego w różnych kierunkach. Rozumowanie,
112
33. POLARYZACJA
TW////////M^&yyWMM
33.4. Odbicie liniowo
spolaryzowanego światła pod kątem Brewstera.
Kierunek polaryzacji oznaczony jest
strzałkami przerywanymi; punkty
oznaczają polaryzację prostopadłą
do papieru
którym uzasadnialiśmy pojęcie dwójłomności,
tłumaczy też, że pochłanianie może zależeć od
kierunku, w którym pobudzane są do drgań ładunki
ośrodka anizotropowego. Znanym od dawna, słynnym
przykładem jest turmalin. Innym przykładem jest
polaroid. Polaroid składa się z cienkiej warstwy
malutkich kryształków herapatytu (pewnej soli jodu i
chininy), których osie są ustawione równolegle.
Kryształy te pochłaniają światło wtedy, gdy drgania
odbywają się w jednym kierunku, nie wykazują
zaś dostrzegalnego pochłaniania, gdy drgania
odbywają się w kierunku prostopadłym do
pierwszego.
Załóżmy, że na warstwę polaroidu pada światło
spolaryzowane liniowo pod kątem 0 do kierunku
przepuszczania. Jakie natężenie przejdzie na wylot?
Padające światło można rozłożyć na składową prostopadłą do kierunku przepuszczania,
proporcjonalną do sin 9, i składową wzdłuż tego kierunku, proporcjonalną do cos 9. Amplituda
przechodząca przez polaroid stanowi tylko część cosinusową, składowa sinusowa zostaje
pochłonięta. Amplituda przechodząca przez polaroid jest więc mniejsza od amplitudy
wchodzącej o czynnik cos 9. Energia przepuszczona przez polaroid, to znaczy natężenie
światła, jest proporcjonalna do kwadratu cos 9. Tak więc gdy światło padające jest
spolaryzowane pod kątem 9 do kierunku przepuszczania, przechodzące natężenie jest
proporcjonalne do cos2 9. Pochłonięte zaś natężenie jest oczywiście proporcjonalne do
sin2 0.
Zastanówmy się nad następującą ciekawą i paradoksalną sytuacją. Wiemy, że nie
można przepuścić wiązki światła przez dwie warstwy polaroidu o osiach wzajemnie
prostopadłych. Jeśli jednak między takimi dwoma polaroidami umieścimy trzeci, o osi
przepuszczania pod kątem 45° do osi skrzyżowanych, to układ taki przepuści nieco światła.
Wiemy, że polaroid tylko pochłania światło, a nie stwarza nowego. Niemniej jednak
dodanie trzeciego polaroidu pod kątem 45° umożliwia przejście większej ilości światła.
Pozostawiamy analizę tego zjawiska jako ćwiczenie dla czytelnika.
Jednego z najciekawszych przykładów polaryzacji dostarczają nie skomplikowane
kryształy albo jakieś złożone substancje, ale najprostsza i najlepiej znana sytuacja -
odbicie światła od powierzchni. Można w to wierzyć lub nie, ale światło odbite od szklanej
powierzchni może być spolaryzowane, a fizyczne wytłumaczenie tego zjawiska jest bardzo
proste. Brewster odkrył doświadczalnie, że światło odbite od powierzchni jest całkowicie
spolaryzowane wtedy, gdy wiązka odbita i wiązka załamująca się w ośrodku tworzą
między sobą kąt prosty. Sytuację tę przedstawia rys. 33.4. Jeżeli wiązka padająca będzie
spolaryzowana w płaszczyźnie padania, odbicie wcale nie nastąpi. Przyczyna zjawiska jest
bardzo prosta. W ośrodku odbijającym światło jest spolaryzowane poprzecznie, wiemy
zaś, że wychodząca wiązka, którą nazywamy wiązką odbitą, wytwarza właśnie ruch
ładunków w ośrodku. Pochodzenie tak zwanego światła odbitego nie tłumaczy się zwykłym
U-4. POLARYZATORY
113
odbiciem wiązki; po głębszym zbadaniu sprawy okazuje się, że padająca wiązka wzbudza
drgania ładunków w ośrodku, który z kolei wytwarza wiązkę odbitą. Z rysunku 33.4
widać, że w kierunku wiązki odbitej mogą promieniować tylko drgania normalne do
powierzchni papieru i w rezultacie odbita wiązka będzie spolaryzowana prostopadle do
płaszczyzny padania. Jeśli padająca wiązka będzie spolaryzowana w płaszczyźnie padania,
światła odbitego nie będzie.
Zjawisko to łatwo pokazać odbijając liniowo spolaryzowaną wiązkę od płaskiego
kawałka szkła. Obracając szkłem tak, aby wiązka spolaryzowana padała pod różnymi kątami,
zauważymy nagłe osłabienie odbitego natężenia, gdy kąt padania przejdzie przez kąt
Brewstera. Osłabienie to widać tylko wtedy, gdy płaszczyzna polaryzacji pokrywa się
z płaszczyzną padania. Jeżeli płaszczyzna polaryzacji jest prostopadła do płaszczyzny
padania, przy wszystkich kątach spostrzeżemy zwykłe odbite natężenie.
33-5. Aktywność optyczna
Inne ważne zjawisko polaryzacyjne obserwuje się w substancjach złożonych z cząsteczek
nie wykazujących symetrii zwierciadlanej. Chodzi o cząsteczki zbudowane na kształt
korkociągu albo ręki w rękawiczce, albo wreszcie jakiegoś przedmiotu, którego odbicie
zwierciadlane jest odwrócone, podobnie jak odbicie lewej rękawiczki, mające wygląd
rękawiczki prawej. Załóżmy, że wszystkie cząsteczki w substancji są takie same, to znaczy
że żadna z nich nie jest zwierciadlanym odbiciem drugiej. Substancja taka może wykazywać
ciekawe działanie, zwane aktywnością optyczną, na skutek którego liniowo spolaryzowane
światło przechodzące przez ośrodek doznaje skręcania kierunku polaryzacji wokół osi
wiązki.
Zrozumienie zjawiska aktywności optycznej wymaga przeprowadzenia pewnych
rachunków, ale i bez nich możemy właściwie zobaczyć jakościowo, skąd się to zjawisko
bierze. Rozważmy asymetryczną cząsteczkę o kształcie śruby, jak pokazuje rys. 33.5.
Aby przejawiać aktywność optyczną, cząsteczki wcale nie muszą mieć kształtu
korkociągu, ale ten prosty kształt weźmiemy jako typowy przykład obiektu nie wykazującego
symetrii zwierciadlanej. Gdy wiązka światła spolaryzowana liniowo wzdłuż kierunku osi y
pada na taką cząsteczkę, pole elektryczne
porusza ładunkami w górę i w dół po linii śrubowej,
wytwarzając w ten sposób prąd w kierunku osi y 33-5- Cząsteczka, której kształt nie wy-
i powodując wypromieniowanie pola elektryczne- kazuje symetrii z^rciadlanej. Na cząs-
„ , . , . _ teczkę pada wiązka światła spolaryzowa-
go Ły spolaryzowanego w kierunku osi v. Po-
XO
nego liniowo w kierunku osi y
nieważ jednak elektrony muszą pozostawać na
śrubowej, więc pobudzane do ruchu w górę
dół muszą także poruszać się w kierunku osi x. y
Gdy prąd płynie w górę śrubowej, wówczas jego
kierunek na rys. 33.5 jest prostopadły do płasz-
=jw uuck na iys. jj.j jcm piusiupauiy uo piasz- —— Sr. j r"T— 7+a "
czyzny rysunku, przy tym dla z = r, wchodzi za X* * Ccd *
płaszczyznę, a dla z = z, +A — wychodzi, jeżeli -*
♦W=2»—r*—**--
114
33. POLARYZACJA
A jest średnicą naszej śruby cząsteczkowej. Można by sądzić, że prąd w kierunku
osi x nie będzie wytwarzał efektywnego promieniowania, ponieważ po przeciwnych
stronach spirali prądy płyną w przeciwnych kierunkach. Rozważając jednak
składową x pola elektrycznego w punkcie z = z2 stwierdzamy, że pola wypromieniowane
przez prąd w punktach z=z{+Ai z = z{ dochodzą do punktu z2 z różnicą czasu wynoszącą
Ajc i tym samym z różnicą faz n + ojA/c. Jeżeli różnica faz nie wynosi dokładnie n, oba
pola nie znoszą się całkowicie i pozostaje nam mała x-owa składowa pola elektrycznego
wytworzonego przez ruch elektronów w cząsteczce, mimo że wzbudzające pole elektryczne
ma tylko składową y. Mała składowa x dodana do dużej składowej y daje pole wypadkowe
lekko obrócone względem osi y, stanowiącej początkowy kierunek polaryzacji. Kierunek
polaryzacji obraca się wokół osi wiązki, w miarę jak światło porusza się przez ośrodek.
Rozpatrując kilka przykładów i rozważając prądy wzbudzone przez padające pole
elektryczne, można się przekonać, że istnienie aktywności optycznej i znak skręcenia nie
zależą od ustawienia cząsteczki.
Pospolitą substancją wykazującą aktywność optyczną jest cukier rozpuszczony w
wodzie. Zjawisko łatwo pokazać za pomocą urządzenia składającego się z warstwy polaroidu,
która służy do wytworzenia wiązki spolaryzowanej liniowo, komórki, która zawiera
roztwór cukru przepuszczający światło, i drugiej warstwy polaroidu, która wykrywa skręcenie
kierunku polaryzacji przy przechodzeniu światła przez roztwór.
33-6. Natężenie światła odbitego
Omówimy teraz w sposób ścisły współczynnik odbicia jako funkcję kąta. Rysunek
33.6a pokazuje wiązkę światła padającą na powierzchnię szkła, na której częściowo
następuje odbicie, a częściowo załamanie
wiązki w szkle. Załóżmy, że padająca
wiązka ma amplitudę jednostkową i jest
spolaryzowana liniowo w kierunku normalnej
do płaszczyzny papieru. Amplitudę fali tak
odbitej oznaczymy b, a amplitudę fali
załamanej a. Obie fale, odbita i załamana,
będą oczywiście spolaryzowane liniowo,
a wektory pola elektrycznego fali
padającej, odbitej i załamanej będą wzajemnie
do siebie prostopadłe. Rysunek 33.6b
pokazuje analogiczną sytuację, przy czym
fala padająca, o amplitudzie
jednostkowej, jest teraz spolaryzowana w
płaszczyźnie papieru. Amplitudy fali odbitej i
załamanej oznaczamy w tym przypadku
odpowiednio A i B.
Chcemy obliczyć, jak wielkie jest od-
33.6. Padająca fala o amplitudzie jednostkowej
odbija się i załamuje na powierzchni szkła, a)
Fala padająca jest liniowo spolaryzowana
prostopadle do płaszczyzny papieru; b) fala
padająca jest liniowo spolaryzowana w kierunku
pokazanym przez wektor elektryczny
(przerywany)
a) b)
53-6. NATĘŻENIE ŚWIATŁA ODBITEGO
115
bicie w obu przypadkach przedstawionych na rys. 33.6a i 33.6b. Wiemy już, że gdy kąt
między falą odbitą i załamaną jest prosty, wówczas na rys. 33.6b nie ma fali odbitej. Zobaczmy
jednak, czy się nam nie uda znaleźć odpowiedzi ilościowej, ścisłego wzoru dla B i b jako
funkcji kąta padania /'.
Musimy zrozumieć następującą ideę. Prądy wzbudzone w szkle wytwarzają dwie fale;
przede wszystkim falę odbitą. Wiemy także, że gdyby nie było prądów wzbudzonych
w szkle, fala padająca poruszałaby się dalej prosto przez szkło. Pamiętajmy bowiem, że na
wypadkowe pole składają się wszystkie źródła we wszechświecie. Źródło padającego
światła wytwarza pole o amplitudzie jednostkowej, które powinno się rozchodzić
wewnątrz szkła wzdłuż kropkowanej linii na rysunku. Ponieważ pola tego nie obserwujemy,
wnioskujemy, że prądy wzbudzone w szkle muszą wytwarzać pole o amplitudzie -1,
które rozchodzi się wzdłuż linii kropkowanej. Korzystając z tego, obliczmy amplitudy fal
odbitych a i A.
Z rysunku 33.6a widzimy, że pole o amplitudzie b jest wypromieniowywane na skutek
ruchu ładunków reagujących w szkle na pole a i wobec tego b jest proporcjonalne do a.
Ponieważ zaś oba nasze rysunki różnią się od siebie tylko kierunkiem polaryzacji,
moglibyśmy przypuszczać, że stosunek BI A będzie taki sam jak stosunek bja. Nie jest to
jednak całkiem ścisłe, ponieważ na rys. 33.6b kierunki polaryzacji nie są wzajemnie
równoległe w odróżnieniu od sytuacji z rys. 33.6a. Na tworzenie się B ma wpływ tylko składowa A
prostopadła do B, mianowicie A cos(/-f-r). Poprawna proporcja będzie więc dana
wzorem
b B
- = . (33.1)
a A cos (i + r)
Zastosujemy teraz pewien zręczny chwyt. Wiemy, że w przypadkach a) i b) na rys. 33.6
pole elektryczne w szkle musi powodować drgania ładunków, które wzbudzają pole o
amplitudzie -1, spolaryzowane równolegle do padającej wiązki i rozchodzące się w kierunku
linii kropkowanej. Ale z części b) rysunku widać, że w wytwarzaniu tej fali uczestniczy
tylko składowa A, prostopadła do linii przerywanej, która ma odpowiednią do tego
polaryzację. Z rysunku 33.6a wynika natomiast, że działa pełna amplituda a, ponieważ
polaryzacja fali a jest prostopadła do polaryzacji fali o amplitudzie - 1. Możemy więc napisać
A cosii — r) — 1
- = , (33.2)
a -1
ponieważ obie amplitudy po lewej stronie wzoru (33.2) wytwarzają falę o amplitudzie- I.
Dzieląc równanie (33.1) stronami przez (33.2) otrzymujemy
*,"»<'• + '> (33.3)
b cos(i-r)
1 wynik ten możemy sprawdzić na znanym nam przykładzie. Jeżeli bowiem przyjmiemy
*(»" + /■) = 90°, z równania (33.3) wynika, że B=0, tak jak to powinno być według Brewstera,
a wiec przynajmniej w tym przypadku nasze wyniki nie są jawnie błędne.
Założyliśmy, że fale padające mają amplitudy jednostkowe, tak że \B\z/l2 stanowi
116
33. POLARYZACJA
współczynnik odbicia dla fal spolaryzowanych w płaszczyźnie padania, a |6|2/12 jest
współczynnikiem odbicia dla fal spolaryzowanych prostopadle do tej płaszczyzny. Stosunek
tych dwóch współczynników odbicia jest określony przez równanie (33.3).
Teraz dokonamy cudu i obliczymy nie tylko stosunek, ale każdy ze współczynników
\B\2i |£|2 z osobna! Z zasady zachowania energii wiemy, że energia w fali załamanej musi
być równa energii fali padającej mniej energia fali odbitej, czyli 1 - \B\2 w jednym przypadku,
1 — \b\2 — w drugim. Co więcej, energia przechodząca do szkła na rys. 33.6b ma się tak do
odpowiedniej energii na rys. 33.6a jak stosunek kwadratów amplitud załamanych |.4|2/|a|2.
Można by się spytać, czy rzeczywiście wiemy, jak obliczyć energię wewnątrz szkła, bo
przecież obok energii pola elektrycznego są tam energie ruchu atomów. Jest jednak
oczywiste, że wszelkie przyczynki do energii całkowitej będą zawsze proporcjonalne do kwadratu
amplitudy pola elektrycznego. Możemy więc napisać:
1-\B\2 Ul2
—'-L-Jj • (33-4)
Wykorzystujemy teraz równanie (33.2) dla wyeliminowania wielkości A/a z powyższego
wzoru i wyrażamy B przez b za pomocą równania (33.3):
cos-(,>r)
"•"-'» ' (33.5)
l-|fcj2 cos2(i-r)
Równanie to zawiera tylko jedną nieznaną amplitudę b. Rozwiązując je ze względu na
\b\2 otrzymujemy
|2 sin2 (/-r)
H -^-277—;. <33-6)
sin (i + r)
* tt pomocą równania (33.3)
,2 tg2(/-r)
\B\2 = ~ '. (33.7)
1 ' tg2(i + r)
Znaleźliśmy w ten sposób nie tylko współczynnik odbicia \b\2 dla padającej fali,
spolaryzowanej prostopadle do płaszczyzny padania, ale także współczynnik odbicia \B\2
dla padającej fali spolaryzowanej w płaszczyźnie padania!
Można dalej poprowadzić te rozważania i wywnioskować, że wielkość b jest
rzeczywista. Aby to udowodnić, trzeba rozważyć przypadek, w którym światło dochodzi do
obu stron powierzchni szkła w tej samej chwili. Sytuację taką niełatwo zrealizować
doświadczalnie, ale zabawna jest jej analiza teoretyczna. Rozpatrując ten ogólny przypadek,
możemy udowodnić, że b musi być rzeczywiste i że mianowicie b = ± sin (/ —r)/sin (i + r).
Można nawet określić znak, rozważając bardzo cieniutką warstwę, w której następuje
odbicie od przedniej i tylnej powierzchni i obliczając ilość odbitego światła. Wiemy zaś,
ile światła powinna odbijać cienka warstwa, ponieważ znamy wielkość wzbudzonego
prądu, obliczaliśmy nawet wytworzone przez niego pole.
33-6. NATĘŻENIE ŚWIATŁA ODBITEGO 11'
Za pomocą takiego rozumowania można pokazać, że
sin(i-r) tg(i-r)
*>=-—7—:, B=-1tt- • (33.8
sm(j + r) tg(i-t-r)
Powyższe wyrażenia dla współczynników odbicia jako funkcji kątów padania i odbicii
nazywamy wzorami Fresnela dla odbicia.
Gdy rozważamy granice tych wrażeń dla dążących do zera kątów / i r, stwierdzamy
że w przypadku padania w kierunku normalnej B2xb2x(i — r)2/(i + r)2 dla obu polaryzacji
ponieważ wartości sinusów i tangensów są praktycznie równe kątom. Wiemy zaś, żi
sin /'/sin r = n i gdy kąty są małe, i/rxn. Łatwo więc pokazać, że współczynnik odbicia dli
padania w kierunku normalnej wynosi
B2 = b2= -_.
(i + l)2
Ciekawe jest obliczenie, ile światła przy prostopadłym padaniu zostaje odbite tu
przykład od powierzchni wody. Dla wody « = *, tak że współczynnik odbicia (|)2«2%
Przy padaniu prostopadłym tylko 2% światła zostaje odbite od powierzchni wody.
33-7. Anomalne załamanie
Ostatnie zjawisko dotyczące polaryzacji, które zamierzamy rozważać, zostało właści
wie odkryte jako jedno z pierwszych; chodzi o anomalne załamanie. Żeglarze
odwiedzający Islandię przywozili do Europy kryształy szpatu islandzkiego (CaC03), który ma
zabawną własność podwajania wszystkiego, co się przezeń widzi, to znaczy tworzenia
dwu obrazów. Sprawa ta zainteresowała Huygensa i odegrała ważną rolę w odkryciu
polaryzacji. Często się zdarza, że zjawisko najpierw odkryte jest w końcu najtrudniejsze dc
wyjaśnienia. Dlatego też dopiero po dokładnym zrozumieniu idei fizycznej możemy
starannie wybierać zjawiska, które ją najjaśniej i najprościej ilustrują.
Anomalne załamanie jest szczególnym przypadkiem dwójłomności, którą
rozważaliśmy poprzednio. Pojawia się ono wtedy, gdy oś optyczna, dłuższa oś naszych
asymetrycznych cząsteczek, nie jest równoległa do powierzchni kryształu. Na rysunku 33.7
narysowano dwa kawałki kryształu dwójłomnego i zaznaczono kierunek ich osi
optycznych. Na górnym rysunku wiązka padająca na kryształ jest spolaryzowana w kierunku
prostopadłym do osi optycznej. Gdy wiązka ta pada na powierzchnię kryształu, każdy
punkt powierzchni działa jak źródło fali rozchodzącej się w krysztale z prędkością vx,
to znaczy z prędkością światła odpowiadającą polaryzacji prostopadłej do osi optycznej.
Czoło fali jest po prostu obwiednią wszystkich małych fal kulistych i sunie prosto przez
kryształ wychodząc z drugiej jego strony. Jest to zachowanie, jakiego zwykle oczekujemy,
1 promień ten nazywamy promieniem zwyczajnym.
Na dolnym rysunku kierunek liniowej polaryzacji światła padającego na kryształ jest
obrócony o 90° i oś optyczna leży w płaszczyźnie polaryzacji. W tym przypadku małe
Tale powstające w pewnym punkcie powierzchni nie rozchodzą się już jak fale kuliste.
118
33. POLARYZACJA
F
f
1
ł
^
czoło fali
♦
i •
oś optyczna
33.7. a) Tor promienia zwyczajnego w krysztale dwójlomnym, b) tor promienia nadzwyczajnego. Oś
optyczna leży w płaszczyźnie papieru
Światło biegnące wzdłuż osi optycznej rozchodzi się z prędkością vL, ponieważ jego
polaryzacja jest prostopadła do osi optycznej, a światło biegnące prostopadle do osi optycznej
rozchodzi się z prędkością v^, ponieważ jego polaryzacja jest do osi optycznej równoległa.
W substancji dwójłomnejf tj ¥=v±, a na rysunku mamy V\.<v±. Z pełniejszej analizy
wyniknęłoby, że fale rozchodzą się jako powierzchnie elipsoid, których oś główna jest jednocześnie
osią optyczną. Obwiednią wszystkich tych fal elipsoidalnych jest czoło fali sunące przez
kryształ w kierunku zaznaczonym na rysunku. Na tylnej powierzchni kryształu wiązka
zostanie odgięta dokładnie tak samo jak na przedniej. W ten sposób światło wyjdzie
przesunięte równolegle do wiązki padającej. Wiązka ta nie stosuje się oczywiście do prawa Snella,
ale rozchodzi się w niezwykłym kierunku. Dlatego też nazywa się ją promieniem
nadzwyczajnym.
Gdy na anomalnie łamiący kryształ pada wiązka niespolaryzowana, zostaje
rozdzielona na promień zwyczajny, przechodzący na wprost w zwykły sposób, oraz na promień
nadzwyczajny, który przy przejściu przez kryształ zostaje przesunięty. Oba wychodzące
promienie są spolaryzowane liniowo, prostopadle do siebie. Można to pokazać, analizując
za pomocą polaroidu polaryzację wychodzących promieni. Możemy także wykazać, że
nasza interpretacja zjawiska jest poprawna. Puszczamy mianowicie na kryształ światło
liniowo spolaryzowane i ustawiając odpowiednio kierunek polaryzacji możemy
spowodować przechodzenie tego światła bez rozdwojenia na wprost albo bez rozdwojenia, ale
z przesunięciem.
Na rysunkach 33.1 i 33.2 przedstawiliśmy różne przypadki polaryzacji jako wynik
składania dwóch szczególnych przypadków polaryzacyjnych, mianowicie w kierunkach
osi x i y, wziętych w różnym stosunku i z różnymi fazami. Równie dobrze można użyć do
tego celu inne pary. Nadaje się do tego polaryzacja wzdłuż jakichkolwiek dwu
prostopadłych osi x' i y', nachylonych względem osi x i y (każdą polaryzację można utworzyć
np. ze złożenia przypadków a i e z rys. 33.2). Ciekawe jednak, że pomysł ten można
rozciągnąć także na inne przypadki. Tak na przykład dowolną liniową polaryzację można
utworzyć przez złożenia polaryzacji kołowej prawo- i lewoskrętnej (przypadki c i g z rys. 33.2)
w odpowiednim stosunku i z odpowiednimi fazami, ponieważ dodanie dwu różnych
wektorów wirujących w przeciwnych kierunkach daje pojedynczy wektor drgający wzdłuż
13-7. ANOMALNE ZAŁAMANIE
119
33.8. Dwa przeciwnie wirujące
wektory o różnej amplitudzie
dodając się tworzą wektor o ustalonym
kierunku, ale o drgającej
amplitudzie
33.9. Ładunek poruszający się po
kole pod wpływem światła
spolaryzowanego kołowo
linii prostej (rys. 33.8). Jeśli faza jednego wektora jest
przesunięta względem drugiego, to linia jest
nachylona. Tak więc wszystkie części rys. 33.1 można
tłumaczyć jako „złożenie z różnymi fazami względnymi
równych ilości światła spolaryzowanego kołowo
prawo i lewoskrętnie". W miarę jak faza światła lewo-
skrętnego zostaje w tyle za prawoskrętnym, kierunek
polaryzacji liniowej zmienia się. Wobec tego substancje
optycznie czynne można w pewnym sensie uważać za
dwójłomne. Ich własności można tłumaczyć w ten
sposób, że mają różne współczynniki załamania dla
światła spolaryzowanego kołowo prawo i lewoskrętnie.
Złożenie światła spolaryzowanego kołowo prawo- i
lewoskrętnie, o różnych natężeniach, daje światło
spolaryzowane eliptycznie.
Światło spolaryzowane kołowo ma jeszcze inną
ciekawą własność — niesie ono moment pędu
(względem kierunku rozchodzenia się). Aby się o tym
przekonać, załóżmy, że światło takie pada na atom
przedstawiony jako oscylator harmoniczny, który może
się dowolnie przemieszczać w dowolnym kierunku
w płaszczyźnie xy. Przesunięcie x elektronu będzie
wówczas zależne od składowej Ex pola, przesunięcie
zaś ^ będzie zależeć od składowej Ey, takiej samej co
do wartości, ale cofniętej o 9(F w fazie. Znaczy to,
że elektron będzie się obracał po okręgu z
prędkością kątową u w rytmie wirującego pola
elektrycznego światła (rys. 33.9). W zależności od charakterystyki
tłumienia reakcji oscylatora kierunek przesunięcia a
elektronu i kierunek działającej nań siły qtE mogą nie
być takie same, ale mogą wirować dookoła. Pole E
może mieć składową prostopadłą do a, tak że na układzie będzie wykonywana praca i
będzie działał moment skręcający r. Praca wykonana w ciągu sekundy wyniesie toj.
Energia pochłonięta w ciągu czasu T wyniesie xa>T, podczas gdy zT będzie momentem pędu
przekazanym materii pochłaniającej energię. Widzimy więc, że wiązka światła
spolaryzowanego kołowo prawoskrętnie, zawierająca całkowitą energię <f, niesie moment pędu (o
wektorze skierowanym wzdłuż kierunku rozchodzenia się) &\(a. Gdy bowiem wiązka ta zostaje
Pochłonięta, absorbentowi jest przekazywany taki właśnie moment pędu. Światło
spolaryzowane kołowo lewoskrętnie niesie zaś moment pędu o przeciwnym znaku: — <?/«.
34
relatywistyczne efekty w promieniowaniu
34-1. Ruchome źródła
Obecny rozdział poświęcimy opisowi wielu rozmaitych zjawisk związanych z
promieniowaniem i w ten sposób zakończymy omawianie klasycznej teorii rozchodzenia się światła.
Nasze badanie światła przeprowadziliśmy dość wnikliwie, aż do drobnych szczegółów.
Pominęliśmy tylko jedną ważniejszą klasę zjawisk związanych z promieniowaniem
elektromagnetycznym. Co się mianowicie dzieje, gdy fale radiowe albo zostaną zamknięte w pudle
o ścianach odbijających (przy czym rozmiary pudła są porównywalne z długością fali),
albo przepuszczane przez długą rurę? Zjawiska te, zachodzące w tzw. rezonatorach
wnękowych i falowodach, będziemy omawiali później; powrócimy do tego tematu po rozpatrzeniu
innego podobnego przykładu fizycznego, mianowicie dźwięku. Z tym jednym wyjątkiem
obecny rozdział jest ostatnim rozdziałem, który poświęcamy rozważaniu klasycznej teorii
światła.
Wszystkie zjawiska, które teraz będziemy omawiali, możemy krótko opisać jako
odnoszące się do efektów związanych z ruchem źródeł. Teraz już nie zakładamy, że źródło
jest zlokalizowane, a jego ruch odbywa się ze stosunkowo małą prędkością w pobliżu
ustalonego punktu.
Przypominamy, że według podstawowych praw elektrodynamiki pole elektryczne
w dużych odległościach od ruchomego ładunku dane jest wzorem
E^-i-jĄ. (34.1)
47r£0c2 dr
Druga pochodna jednostkowego wektora eR , wskazującego w kierunku pozornego
położenia ładunku, stanowi istotną cechę pola elektrycznego. Ten wektor jednostkowy nic
wskazuje oczywiście kierunku położenia ładunku jednoczesnego z chwilą obserwacji.
34-1 - RUCHOME ŹRÓDŁA
121
ale kierunek, w którym powinien on się znajdować, jeżeli się uwzględni, że informacja
przenosi się od ładunku do obserwatora tylko ze skończoną prędkością c.
Z polem elektrycznym stowarzyszone jest pole magnetyczne, zawsze prostopadłe do
pola elektrycznego i prostopadłe do wektora położenia pozornego źródła. Jest ono dane
wzorem
B=-eR.xE/c. (34.2)
Dotąd zajmowaliśmy się tylko przypadkiem, w którym prędkośpi ładunku były nierela-
tywistyczne, tak że nie trzeba było uwzględniać żadnej znacznej zmiany kierunku źródła.
Teraz zbadamy bardziej ogólny przypadek, w którym ruch odbywa się z dowolną
prędkością. Zobaczymy, jakie zjawiska można zaobserwowaćw tych warunkach. Dopuszczając
dowolną prędkość ruchu źródła będziemy nadal oczywiście zakładać, że znajduje się
ono bardzo daleko od detektora.
Wiemy już z naszych rozważań przeprowadzonych w rozdz. 28, że na wartość d2eR'/dt2
mają wpływ tylko zmiany kierunku wektora eR. Oznaczmy współrzędne ładunku przez
(x, y, z), przy czym niech z będzie mierzone wzdłuż kierunku obserwacji (rys. 34.1). W danej
chwili, dajmy na to w chwili t, trzy składowe wektora określającego położenie ładunku
są równe x(r), y(r), z(r). Odległość R jest zaś w przybliżeniu równa R(r)==R0 + z(r).
Taka zależność R od współrzędnych ładunku sprawia, że kierunek wektora eR. zależy
głównie od x iv, a bardzo mało od z: poprzeczne składowe wektora jednostkowego wynoszą
bowiem xjR i yjR, różniczkując je zatem otrzymamy wyrażenia zawierające R2 w
mianowniku, na przykład
d(xlR)_dxjdt dz x
= £5-
dt
R
dt
Jeśli więc znajdujemy się dostatecznie daleko, to jedyne istotne wyrazy pochodzą ze zmian
x i y. W wyrazach tych możemy ponadto zastąpić czynnik R przez R0 i w rezultacie
otrzymać
d2x' _ q d2y'
£.= -
4ue0c2Rq dl2
£>■=
4ne0c2R0 dt
(34.3)
34.1. Tor poruszającego się ładunku. Prawdziwym położeniem w chwili t jest T, ale położeniem
opóźnionym jett A
122
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
gdzie R0 jest w przybliżeniu odległością od ładunku q; niech będzie to odległość OP od
początku układu współrzędnych (x, y, z). Pole elektryczne jest więc równe stałej,
pomnożonej przez bardzo proste wyrażenie, a mianowicie przez drugie pochodne współrzędnych
x i y (możemy wysłowić to bardziej matematycznie, nazywając x i y transwersalnymi
składowymi wektora r położenia ładunku, ale nie jest to bardziej przejrzyste).
Musimy tu oczywiście pamiętać, że współrzędne te trzeba mierzyć w czasie opóźnionym.
Wtedy stwierdzimy, że w tym wypadku z(t) rzeczywiście musi mieć wpływ na opóźnienie.
Ile więc ono wynosi? Otóż, jeżeli czas, w którym dokonujemy obserwacji, oznaczymy przez
/ (czas w punkcie P), to odpowiadający mu czas x w punkcie A nie jest równy /, ale jest
opóźniony o czas równy całkowitej drodze, którą ma przebyć światło, podzielonej przez
jego prędkość. W pierwszym przybliżeniu opóźnienie to wynosi R0/c, a więc jest stałe (co nie
jest niczym ciekawym), w następnym natomiast przybliżeniu musimy już uwzględnić rolę
składowej z położenia w chwili t, jeśli bowiem ładunek q cofnie się nieco wstecz, opóźnienie
się jeszcze nieznacznie powiększy. Poprzednio pomijaliśmy ten efekt, a stanowi on jedyną
zmianę, jaką trzeba wprowadzić, aby nasze wyniki stały się ważne dla wszystkich prędkości.
Aby osiągnąć nasz cel, należy teraz ustalić pewną wartość /, obliczyć z niej wartość r
i znaleźć stąd położenia x i y w chwili r. Wartości te będą zatem opóźnionymi wartościami
współrzędnych x i y i będziemy je oznaczać przez x' i y'; ich drugie pochodne wyznaczą
pole. Tak więc r określone jest wzorem
R0z(r)
t = T-\ H
c c
oraz
x'(0 = x(t), y'(t) = y(r). (34.4)
Równania te są skomplikowane, ale ich rozwiązania można stosunkowo łatwo
przedstawić graficznie. Przedstawienie takie będzie dobrym jakościowym opisem całej sprawy.
Gdybyśmy natomiast chcieli otrzymać ścisłe wnioski dotyczące tego skomplikowanego
zagadnienia, musielibyśmy posłużyć się wieloma dość specjalnymi faktami
matematycznymi.
34-2. Znajdowanie ruchu „pozornego"
Równania (34.4) dają się ciekawie uprościć. Jeżeli pominiemy nieciekawe stałe
opóźnienie R0/c, które oznacza tylko, że trzeba przesunąć początek układu / o stałą, to wówczas
równania te przyjmą postać
c/ = cr + z(r), x' = x(x), y' = y(x). (34.5)
Szukamy teraz x' i y' jako funkcji / a nie r i możemy je znaleźć w następujący sposób:
równania (34.5) mówią, że powinniśmy wziąć właściwy ruch i dodać do niego stałą
(prędkość światła) pomnożoną przez t. Na rysunku 34.2 widać, co z tego wynika. Bierzemy
właściwy ruch ładunku (pokazany po lewej stronie) i wyobrażamy sobie, że podczas
ruchu dookoła zostaje on uniesiony z punktu P z prędkością c (nie pojawiają się tu żadne
34-2. ZNAJDOWANIE RUCHU „POZORNEGO"
123
34.2. Geometryczne rozwiązanie równania (34.5) w celu znalezienia krzywej *'(')
relatywistyczne skrócenia ani nic podobnego; chodzi tu po prostu o matematyczne
dodanie er). Otrzymujemy w ten sposób nowy ruch, dla którego współrzędną wzdłuż linii
obserwacji jest et, jak widać to z prawej strony. (Rysunek pokazuje wynik dla dość
złożonego ruchu w płaszczyźnie, ale oczywiście ruch nie musi się odbywać w jednej
płaszczyźnie, lecz może być bardziej złożony niż ruch płaski.) Istotne jest to, że odległość pozioma
(tzn. mierzona wzdłuż linii obserwacji) nie jest już równa dawnemu z, ale z+cz i wobec
tego wynosi et. Znaleźliśmy więc zależność x' (i y') od /'. Aby znaleźć pole, trzeba jeszcze
tylko obliczyć przyspieszenie na tej krzywej (czyli przyspieszenie dla ruchów jednostajnych
po tej krzywej), to znaczy dwukrotnie ją zróżniczkować. A więc końcowa odpowiedź brzmi:
aby znaleźć pole elektryczne poruszającego się ładunku, bierzemy ruch tego ładunku
i przesuwamy go wstecz z prędkością c, tak aby się „rozciągnął". Zakreślona w ten sposób
krzywa jest krzywą położeń x' i y' w funkcji /. Przyspieszenie na tej krzywej daje nam pole
elektryczne jako funkcję /. Jeżeli chcemy, możemy sobie wyobrazić, że tor ruchu przesuwa
się „sztywno" z prędkością c i przebija płaszczyznę obserwacji (tzn. płaszczyznę
prostopadłą do kierunku obserwacji, w miejscu obserwacji) właśnie w takiej chwili,
by poruszający się po torze elektron przebił płaszczyznę obserwacji w punkcie o
współrzędnych x' i y'. Przyspieszenie ruchu tego punktu przebicia daje nam pole elektryczne.
Rozwiązanie to jest równie ścisłe, jak nasz początkowy wzór — jest ono po prostu jego
przedstawieniem geometrycznym.
Jeżeli weźmiemy stosunkowo powolny ruch, na przykład ruch oscylatora drgającego
powoli z góry na dół, i przesuniemy go naprzód z prędkością światła, to otrzymamy
oczywiście zwyczajną krzywą cosinusową. Dostajemy w ten sposób wzór, którego szukaliśmy
od dawna: wzór na pole wytworzone przez drgający ładunek. Ciekawszy przykład stanowi
elektron poruszający się po okręgu bardzo szybko, prawie z prędkością światła.
Spoglądając na płaszczyznę koła, widzimy opóźnione x'(t) w postaci pokazanej na rys. 34.3.
Co to jest za krzywa? Wyobraźmy sobie promień wychodzący od środka koła do ładunku
' przedłużmy tę linię radialną nieco poza ładunek (tylko odrobinę, jeżeli ruch jest szybki),
tak aby dojść do punktu poruszającego się z prędkością światła po trochę większym okręgu.
Dokonajmy teraz cofnięcia tego ruchu wstecz z prędkością światła. Będzie to równoważne
umieszczeniu ładunku wewnątrz większego koła, które będzie się toczyć (bez poślizgu)
ruchem wstecznym z prędkością światła. Krzywa będąca śladem na płaszczyźnie ładunku szty-
124
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
—I— »■ __
JC3. Krzywa x' (r) dla cząstki poruszającej się po kole ze stalą szybkością v = 0,94 c
wno związanego z toczącym się kołem będzie bardzo zbliżona do cykloidy - nazywamy ją
cykloidą skróconą, a wykres jej będzie w naszym przypadku odwrócony w porównaniu
z wykresami, jakie można znaleźć w podręcznikach matematyki. Jeżeli ładunek będzie
się poruszał z prędkością światła, „zęby" krzywej będą bardzo ostre, gdyby zaś biegł on
dokładnie z prędkością światła, wówczas „zęby" byłyby nieskończenie ostre, a krzywa
na wykresie byłaby odwróconą cykloidą zwyczajną. Taka „nieskończona ostrość" jest
czymś bardzo ciekawym. Oznacza ona, że w pobliżu zęba druga pochodna osiąga olbrzymią
wartość. Raz na okres uzyskujemy więc ostrą pulsację pola elektrycznego. W ruchu nierela-
tywistycznym efekt ten nie pojawia się wcale, bo w każdym obiegu ładunku uzyskujemy
drgania o natężeniu w przybliżeniu stałym w czasie. Tutaj natomiast mamy bardzo ostre
pulsację pola elektrycznego, oddzielone w czasie interwałami l/7*0, gdzie T0 jest okresem
obiegu. Te silne pola elektryczne wysyłane są w wąskim stożku w kierunku ruchu ładunku.
Gdy ładunek oddala się od punktu P, krzywizna staje się bardzo mała i w kierunku punktu
P zostaje wypromieniowana bardzo niewielka część pola.
34-3. Promieniowanie synchrotronowe
W synchrotronie elektrony poruszają się bardzo szybko po torach kołowych; biegną
one z prędkością bardzo bliską c i można zobaczyć omawiane promieniowanie jako
prawdziwe światlol Omówimy tę sprawę bardziej szczegółowo.
W synchrotronie elektrony biegną dookoła po okręgach w jednorodnym polu
magnetycznym. Zobaczymy najpierw, dlaczego poruszają się one właśnie po okręgach. Z równania
(28.2) wiemy, że siła działająca na cząstkę w polu magnetycznym dana jest wzorem
F = gvxB (34.6)
i skierowana jest prostopadle do pola i do prędkości. Siła jest jak zwykle równa szybkości
zmiany pędu w czasie. Jeżeli pole jest skierowane do góry, od kartki papieru, to pęd
cząstki i siła na nią działająca są takie, jak pokazuje rys. 34.4. Ponieważ siła jest prostopadła
do prędkości, energia kinetyczna, a więc i sama prędkość, pozostaje stała. Działanie pola
magnetycznego polega tylko na zmianie kierunku ruchu. W krótkim odstępie czasu At
34-3. PROMIENIOWANIE SYNCHROTRONOWE
125
wektor pędu zmienia się w kierunku do siebie prostopadłym o wielkość Ap = F At i wobec
tego obraca się o kąt A8-Apjp = qvBAtjp, ponieważ \F\=qvB. Ale w tym samym czasie
cząstka przebywa odległość As = v At. Obie linie, AB i CD, przetną się oczywiście w takim
punkcie O, że OA = OC=R, gdzie As=RA6. Wstawiając to. do poprzednich wyrażeń
znajdujemy, że R A6/At = Rto = v = qvBR/p, skąd otrzymujemy
p = qBR (34.7)
oraz
w = qvB/p. (34.8)
Ponieważ to samo rozumowanie możemy przeprowadzić w następnej chwili i jeszcze
następnej, i tak dalej, stąd wniosek, że cząstka musi się poruszać po okręgu o promieniu R z
prędkością kątową co.
Wynik mówiący, że pęd cząstki jest równy ładunkowi pomnożonemu przez promień
j przez pole magnetyczne, stanowi bardzo ważne prawo, z którego często korzystamy.
Jest ono ważne praktycznie, ponieważ obserwując w znanym polu magnetycznym cząstki
elementarne obdarzone jednakowymi ładunkami, możemy zmierzyć promienie krzywizny
ich orbit i określić w ten sposób ich pędy. Mnożąc obie strony równania (34.7) przez c
i wyrażając ą przez ładunek elektronu, możemy mierzyć pęd w jednostkach zwanych
elektronowoltami. W jednostkach tych wzór nasz wygląda następująco:
Pc(eV) = 3-10a(qlqe)BR, (34.9)
gdzie każda z wielkości B, R i prędkość światła została wyrażona w układzie mks, przy
czym wartość ostatniej z nich jest równa 3 108.
, Jednostką pola magnetycznego w układzie mks jest weber na metr kwadratowy (Wb/m2).
Istnieje starsza jednostka, która jest nadal w powszechnym użyciu: nazywa się ją gausem
(Gs). 1 Wb/m2 jest równy 10* Gs. Aby mieć pojęcie o wielkości pól magnetycznych, uprzy-
tomnijmy sobie, że najsilniejsze pola magnetyczne, jakie zazwyczaj wytwarza się w żelazie,
wynoszą 1,5-10* Gs; powyżej tej wartości posługiwanie się żelazem nie daje żadnych korzy-
34.4. Naładowana cząstka porusza się po kołowym (lub spiralnym) torze w jednorodnym polu
magnetycznym
0
""-^ R
126
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
—- impuls
od elektronu
promieniowanie
rozproszone
przez siatkę
34.5. Światło padające na siatkę jako pojedynczy, ostry sygnał rozprasza się w rozmaitych kierunkach
jako światło różnobarwne
ści. Dzisiejsze elektromagnesy owinięte drutem nadprzewodzącym mogą wytworzyć
trwałe pola o natężeniu ponad 105 Gs, tzn. 10 jednostek mks. Pole Ziemi na równiku wynosi
kilka dziesiątych części gausa.
Wracając do równania (34.9) wyobraźmy sobie synchrotron osiągający 109 eV, tak że
wartość iloczynu pc wynosi 109 (za chwilę powrócimy do tej energii). Widzimy zatem, że
gdyby wartość B odpowiadała np. 10 000 Gs, co stanowi bardzo pokaźne pole o natężeniu
jednej jednostki mks, wówczas R musiałoby wynosić 3,3 m. Promień synchrotronu w
Kalifornijskim Instytucie Techniki jest równy 3,7 m, pole jest nieco większe a energia wynosi
1,5-109, ale synchrotron działa w zasadzie tak samo, jak omawiany wyżej model. Mamy więc
pewne pojęcie o tym, dlaczego synchrotron ma takie właśnie rozmiary.
Obliczyliśmy tylko pęd, ale wiemy, że energia całkowita, włączając energię
spoczynkową, dana jest wzorem W=\Jp2c2 + m2c*. Dla elektronu energia spoczynkowa równa
mc2 wynosi 0,511-106eV, tak że gdy pc równa się 109 eV, możemy pominąć mc2 i dla
wszystkich praktycznych celów przyjąć, że W=pc przy prędkościach relatywistycznych.
Potwierdzenie, że energia elektronu wynosi 10' eV jest równoważne praktycznie
powiedzeniu, że pęd razy c wynosi 109 eV. Jeśli W = 109 eV, łatwo pokazać, że prędkość różni
się od prędkości światła tylko o jedną ośmiomilionową!
Wracamy teraz do promieniowania wysyłanego przez taką cząstkę. Cząstka
poruszająca się po okręgu o promieniu 3,3 m, czyli po 20-metrowym obwodzie, dokonuje jednego
obiegu w mniej więcej takim czasie, jaki światłu zabiera przebycie 20 m. A więc długość fali,
którą taka cząstka powinna wysyłać, będzie wynosić 20 m i znajdować się w dziedzinie
krótkich fal radiowych. Ponieważ jednak pojawia się omawiane już poprzednio zjawisko
„kumulacji'* (rys. 34.3), a promień musimy przedłużyć tylko o jedną ośmiomilionową,
aby osiągnąć prędkość c, więc zęby cykloidy będą ogromnie ostre w porównaniu z
odległościami między nimi. Przyspieszenie, zawierające drugą pochodną względem czasu, ulegnie
dwa razy „czynnikowi ściskającemu", ponieważ skala czasu w sąsiedztwie zęba dwukrotnie
zostanie zmniejszona osiem milionów razy. Powinniśmy więc oczekiwać, że efektywna fa'a
34-3. PROMIENIOWANIE SYNCHROTRONOWE
127
będzie znacznie krótsza, 64-1012 razy mniejsza od 20 m, co odpowiada obszarowi promieni
rentgenowskich. (Prawdę mówiąc, sam ząb nie stanowi jedynego determinującego czynnika;
trzeba uwzględnić także pewien obszar w jego okolicy. Dlatego też „czynnik ściskający"
wystąpi w potędze 5, a nie w kwadracie, ale mimo to znajdziemy się powyżej obszaru
optycznego.) Gdyby więc powoli poruszający się elektron promieniował nawet 20-metrową
falę radiową, to i tak zjawiska relatywistyczne na tyle skurczą jej długość, że będziemy
mogli ją zobaczyćl Światło powinno być oczywiście spolaryzowane; jego pole elektryczne
będzie prostopadłe do jednorodnego pola magnetycznego.
Aby zdać sobie lepiej sprawę z tego, co powinniśmy zobaczyć, skierujmy takie światło
(dla uproszczenia sprawy weźmiemy po prostu jeden sygnał, ponieważ są one i tak bardzo
rozsunięte w czasie) na siatkę dyfrakcyjną zbudowaną z bardzo wielu rozpraszających
drutów. Co zobaczymy po przejściu sygnału przez siatkę? Wydawałoby się, że jeżeli w ogóle
pojawi się jakieś światło, to powinno wystąpić całe jego widmo od barwy czerwonej do
niebieskiej. Co jednak naprawdę zobaczymy? Sygnał czołowo uderza w siatkę i wszystkie
jej oscylatory zostają razem gwałtownie pobudzone, a następnie wracają z powrotem do
położenia równowagi, gdyż zachodzi to tylko raz. Efekty tego drgnięcia rozchodzą się
następnie w różnych kierunkach, tak jak pokazuje rys. 34.5. Ponieważ zaś punkt P leży bliżej
jednego końca siatki niż drugiego, do punktu tego dochodzi najpierw pole elektryczne
od drutu A, następnie od drutu B i tak dalej; na koniec dochodzi wreszcie sygnał od
ostatniego drutu. Krótko mówiąc, suma odbić od kolejnych drutów przedstawia się tak, jak
widać z rys. 34.6a; jest to pole elektryczne składające się z szeregu drgań, bardzo
przypominające falę sinusoidalną, której długością jest odległość między poszczególnymi
sygnałami. Zjawisko przebiega tak, jak gdyby na siatkę padało światło jednobarwne!
Otrzymujemy więc jak należy światło barwne! Czy jednak opierając się na tym samym rozumowaniu,
nie powinniśmy otrzymywać światła z dowolnego rodzaju „drgnień"? Nie. Załóżmy bowiem,
że krzywa jest znacznie gładsza i dodajmy razem wszystkie rozproszone fale, oddzielone
od siebie krótkimi chwilami (rys. 34.6b). Widzimy, że pole nie skacze, wypadkowa krzywa
jest bardzo gładka, ponieważ pojedyncze sygnały niewiele się zmieniają w przedziale czasu,
który je od siebie oddziela.
Promieniowanie elektromagnetyczne wysyłane przez naładowane relatywistyczne cząstki
krążące w polu magnetycznym nazywamy promieniowaniem synchrotronowym. Pochodzenie
tej nazwy jest oczywiste, ale zjawisko zachodzi nie tylko w synchrotronach czy w ogóle
w ziemskich laboratoriach. Podniecające i ciekawe jest to, że zdarza się ono również
w przyrodzie!
34.6. Całkowite pole elektryczne pochodzące od szeregu a) ostrych, b) łagodnych impulsów
a) b)
128
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
34-4. Kosmiczne promieniowanie synchrotronowe
W roku 1054 cywilizacja chińska i japońska należały do najbardziej rozwiniętych na
Ziemi. Chińczycy i Japończycy interesowali się zjawiskami w otaczającym wszechświecie
i w tym właśnie roku w najbardziej godny uwagi sposób zanotowali pojawienie się
wybuchającej, błyszczącej gwiazdy. (Żadnemu zaś z europejskich mnichów piszących
średniowieczne księgi nie przyszło do głowy zapisanie, że na niebie wybuchła gwiazda. Jest to
zastanawiające, ale tak rzeczywiście było.) Jeszcze dzisiaj możemy sfotografować tę gwiazdę
i to, co zobaczymy, pokazano na fot. 34.7. Na zewnątrz mamy dużą masę czerwonych
włókien, wytworzoną przez atomy rzadkiego gazu „dźwięczące" ze swoimi naturalnymi
częstościami; dają one jasne widmo z prążkami odpowiadającymi różnym częstościom.
Czerwień, jak się okazuje, pochodzi w tym wypadku z azotu. Z drugiej strony, w
środkowym obszarze mamy tajemniczą zamazaną plamę świetlną, dającą ciągły rozkład częstości,
to znaczy pozbawioną szczególnych częstości związanych z określonymi atomami. Nie jest
to jednak pył „prześwietlony" przez pobliskie gwiazdy, co mogłoby tłumaczyć pochodzenie
widma ciągłego. Możemy widzieć przez niego gwiazdy, a więc jest przezroczysty, chociaż
wysyła światło.
Na fotografii 34.8 widzimy ten sam obiekt w świetle z takiej części widma, która nie
zawiera żadnej jasnej linii widmowej, widać więc tylko obszar centralny. Ale w teleskopie
zostały tym razem umieszczone polaryzatory i dwa pokazane zdjęcia odpowiadają dwóm
wzajemnie prostopadłym ustawieniom polaryzatorów. Widzimy, że zdjęcia są różne!
Wnioskujemy stąd, że światło jest spolaryzowane. Przyczyną zjawiska jest prawdopodobnie
lokalne pole magnetyczne, w którym kręci się wiele elektronów o dużej energii.
34.7. Mgławica Krab widziana we wszystkich barwach (bez filtru). (Ilustracje 34.7, 34.11-34.13 zostały
przedrukowane z pozwoleniem z pracy. Goldsmith, Sensory Communications, pod red. W. A. Rosen-
blitha, Copyright 1961, Massachusetts Institute of Technology)
)4-4. KOSMICZNE PROMIENIOWANIE SYNCHROTRONOWE 129
34.8. Mgławica Krab widziana przez niebieski filtr i polaroid, a) Wektor elektryczny pionowy, b)
wektor elektryczny poziomy
Wyjaśniliśmy przed chwilą, w jaki sposób elektrony mogą obiegać pole po okręgu.
Możemy naturalnie do tego dodać dowolny ruch jednostajny w kierunku pola, ponieważ
siła <7?xB nie ma składowej w tym kierunku i jak już zauważyliśmy, promieniowanie
synchrotronowe jest wyraźnie spolaryzowane w kierunku prostopadłym do rzutu pola
magnetycznego na płaszczyznę obserwacji.
Łącząc oba te fakty, wnioskujemy, że w obszarze, gdzie pierwszy obraz jest jasny, a
drugi czarny, pole elektryczne światła musi być całkowicie spolaryzowane w określonym
kierunku. Znaczy to, że istnieje tam pole magnetyczne prostopadłe do tego kierunku, podczas
gdy w innych obszarach, gdzie mamy silną emisję widoczną na drugim rysunku, pole
magnetyczne musi mieć inny kierunek. Spoglądając uważnie na fot. 34.8 możemy wyróżnić
na niej, z grubsza biorąc, układ „linii" ustawionych w pewnym kierunku na pierwszym
zdjęciu, a prostopadłych do niego na drugim. To, co widzimy na obrazie, ma budowę
włóknistą. Linie pola magnetycznego rozciągają się na stosunkowo duże odległości w kierunku
pola i stąd prawdopodobnie istnieją duże obszary pola magnetycznego, w których elektrony
kręcą się w jedną stronę, podczas gdy w innych obszarach, w których pole skierowane
jest inaczej, elektrony kręcą się w drugą stronę.
Co utrzymuje energię elektronów na tak wysokim poziomie przez tak długie okresy
czasu? Upłynęło już przecież 900 lat od wybuchu gwiazdy - jak mogą one nadal jeszcze
Pozostawać w tak szybkim ruchu? Przyczyna, dzięki której utrzymują one swoją energię
1 cała rzecz pozostaje wciąż w ruchu, nie jest jeszcze zupełnie jasna.
**-5. Promieniowanie hamowania
Wspomnimy teraz krótko o innym ciekawym zjawisku, mianowicie o promieniowaniu
energii przez szybko poruszającą się cząstkę. Idea jest bardzo podobna do tego, co przed
chwilą omawialiśmy. Wyobraźmy sobie bardzo szybki elektron, który przechodzi w pobliżu
"aładowanych jąder (rys. 34.9). Na skutek istnienia pola elektrycznego wokół jądra ato-
130
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANI J
• jądro
a) b)
34.9. Szybki elektron prttchoózący w pobliżu jądra promieniuje energię w kierunku swego ruchu
mowego na elektron działa siła i zostaję on tak przyspieszony, że jego tor wykazuje lekkie
skręcenie albo ugięcie. Jakie pole elektryczne zostanie wytworzone w kierunku C, jeżeli
elektron będzie się poruszał prawie z prędkością światła? Przypomnijmy sobie naszą regułę:
bierzemy rzeczywisty ruch, cofamy go z prędkością c i to daje nam krzywą, której krzywizna
jest miarą pola elektrycznego. Elektron biegł do nas z prędkością v, a więc wsteczny ruch
daje obraz ściśnięty w takim stosunku, w jakim c—v ma się do c. Jeśli więc 1— v/c<s:\,
w punkcie B' pojawi się ostra, gwałtowna krzywizna i biorąc w tym punkcie drugą pochodną
otrzyma się bardzo wielkie pole w kierunku ruchu. Tak więc bardzo energiczne elektrony
poruszając się przez materię wyrzucają ku przodowi promieniowanie. Nazywa się je
promieniowaniem hamowania. Warto zauważyć, że synchrotronu używa się nie tyle do
otrzymywania elektronów o wielkiej energii (nie mówilibyśmy zresztą o tym, gdyby istniał
wygodniejszy sposób ich produkcji), ile do otrzymywania fotonów o wielkiej energii — promieni
gamma. Przepuszczając mianowicie elektrony o dużej energii przez masywną „tarczę"
wolframową, zmusza się je do promieniowania fotonów, właśnie na skutek zjawiska
hamowania.
34-6. Zjawisko Dopplera
Przechodzimy teraz do omówienia niektórych przykładów zjawisk spowodowanych
ruchem źródeł promieniowania. Załóżmy, że źródłem tym jest stacjonarny atom, drgający
zjedna ze swoich częstości własnych a>0. Częstość obserwowanego wtedy przez nas światła
też będzie, jak wiemy, wynosiła coc. Jako drugi przykład weźmy inny podobny oscylator
drgający z częstością a>,, który w całości przesuwa się z prędkością v w kierunku do
obserwatora. Jego rzeczywisty ruch w przestrzeni wygląda wtedy oczywiście tak, jak pokazuje
rys. 34.10a. Posługujemy się teraz naszym zwykłym chwytem - dodajemy er, to znaczy,
cofamy całą krzywą i stwierdzamy, że oscyluje ona tak, jak na rys. 34.10b. W czasie 7,
w którym oscylator przebyłby odległość vr, na wykresie x' względem et przesuwa się on
o odległość (c—v)t. Wszystkie drgania o częstości wv w czasie Ar odnajdują się więc teraz
w przedziale At=(\ —v/c) Ar; są one ściśnięte razem i gdy krzywa taka przybywa do nas
z prędkością c, widzimy światło o wyższej częstości, wyższej mianowicie o współczynnik
;r~;t„;»,*■,v n _»iM Ohsenvuiemv wiec częstość
34-6, ZJAWISKO DOPPLERA
131
l-»/c
(34.10)
Sytuację tę możemy oczywiście analizować na liczne inne sposoby. Załóżmy, że zamiast
fal sinusoidalnych atom wysyła serię sygnałów: pip, pip, pip, pip — z pewną częstością a>,.
Z jaką częstością byłyby one przez nas odbierane? Pierwszy dochodzący sygnał ulega
pewnemu opóźnieniu, ale następny jest opóźniony mniej, ponieważ w tym czasie atom
zbliżył się do odbiornika. A więc czas między „piśnięciami" na skutek ruchu się zmniejsza.
Analizując stosunki geometryczne tej sytuacji stwierdzamy, że częstość piśnięć wzrasta
o czynnik 1/(1 -f/c).
Czy zatem co = coQl(\ —vjc) jest obserwowaną częstością zwykłego atomu o naturalnej
częstości to0, poruszającego się w kierunku odbiornika z prędkością vi Nie, bo dobrze
wiemy, że z powodu relatywistycznego wydłużenia szybkości upływania czasu naturalna
częstość a>i poruszającego się atomu nie jest taka sama, jak częstość co0 zmierzona w spoczynku.
Jeżeli więc a>0 jest prawdziwą, naturalną częstością, zmodyfikowana częstość naturalna
jest równa
' """ (34.11)
)l=(o0\/l —v2lc2
Stąd obserwowana częstość co wynosi
2/„2
,Vl-»2/c
1-p/c
(34.12)
Obserwowane w tych warunkach przesunięcie częstości nazywamy zjawiskiem Dopplera:
jeśli jakiś obiekt porusza się w naszą stronę, to wysyłane przezeń światło wydaje się bardziej
fioletowe, a gdy obiekt oddala się od nas, wydaje się ono bardziej czerwone.
Podamy teraz dwa dalsze wyprowadzenia tego samego ciekawego i ważnego wyniku.
Załóżmy, więc że źródło znajduje się w spoczynku i wysyła fale o częstości coQ, a obserwator
porusza się z prędkością v w stronę źródła. Po upływie czasu t obserwator przesunie się
do nowego położenia odległego ovt od położenia w chwili 7 = 0. Jaka będzie zaobserwowana
przez niego faza (w radianach) mijającej go fali? W dowolnym ustalonym punkcie w czasie 7
faza zmieni się o oj0t, a ponadto na skutek swego własnego ruchu obserwator dojdzie do
34.10. Krzywe x — z oraz x' — t dla poruszającego się oscylatora
A'
a)
-(c-v)t
b)
B'
et
132
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
»
punktu, w którym faza w porównaniu z punktem wyjścia będzie zmieniona o liczbę vtk0
(liczbę radianow na metr razy odległość). Tak więc całkowite przesunięcie fazy względem
obserwatora w czasie /, mierzone w radianach, czyli obserwowana częstość, wyniesie
col=co0 + k0v. Analizy tej dokonaliśmy jednak z punktu widzenia obserwatora
spoczywającego, chcielibyśmy zaś wiedzieć, jak ona wygląda dla obserwatora poruszającego się.
Musimy znowu wziąć pod uwagę różnicę w biegu zegarów u obu obserwatorów, co tym
razem oznacza, że częstość musimy dzielić przez vi —v2jc2. Jeśli więc k0 jest liczbą falową,
liczbą radianow na metr w kierunku ruchu, a co0 jest częstością, obserwowana częstość dla
poruszającego się obserwatora wyniesie
i~nl: :< CO0 + k0V
VI-u/c
Wiemy, że dla światła k9=><o0/c. W tym więc szczególnym zagadnieniu równanie to
przyjmie postać
VoV+v/c) ......
a>= r , ~ , (34.14)
zupełnie niepodobną do postaci wzoru (34.12)! Czyżby częstość, którą obserwujemy
poruszając się w kierunku źródła, była różna od częstości obserwowanej, gdy źródło się do nas
przybliża? Oczywiście, że nie! Teoria względności mówi nam, że obie te częstości muszą być
dokładnie równe. Gdybyśmy byli wystarczająco biegłymi matematykami, poznalibyśmy
pewnie, że oba te wyrażenia matematyczne są dokładnie sobie równe! Konieczna równość
obu wyrażeń jest rzeczywiście jednym ze sposobów, za których pomocą wykazuje się, że
względność wymaga wydłużenia czasu, ponieważ gdybyśmy nie wstawili tam czynników
pierwiastkowych, wyrażenia te nie byłyby już sobie równe.
Skoro wiemy coś o teorii względności, zanalizujmy nasze zjawisko jeszcze inną metodą,
która wydawać się może nieco bardziej ogólna (naprawdę nie jest to nic nowego, ponieważ
sposób postępowania nie jest istotny!). Zgodnie z teorią względności istnieje związek
między położeniem i czasem obserwowanym przez jednego człowieka, a położeniem i
czasem obserwowanym przez innego człowieka, poruszającego się względem pierwszego.
Związki te wypisaliśmy sobie już w cz. 1 (rozdz. 16). Jest to przekształcenie Lorentza i jego
odwrotność:
, X + Vt X —Vt'
X ——. = , X =
Vi-»V' vW/c2' (3415)
t + vxlc2 t'-vx'/c2
Gdybyśmy pozostawali w spoczynku na Ziemi, fala miałaby kształt cos(wt-kx);
położenia wszystkich węzłów, maksimów i minimów zgadzałyby się z tym wzorem. Co
jednak zobaczyłby poruszający się człowiek obserwując tę samą fizyczną falę? Punkty
zerowania się pola, czyli położenia wszystkich węzłów, muszą być takie same dla obu
obserwatorów (pole jest zerowe dla każdego obserwatora). Jest to niezmiennik relatywistyczny.
34-6. ZJAWISKO DOPPLERA
133
A więc dla drugiego człowieka fala ma taką samą postać, z tym że musi on ją opisać
w swym układzie odniesienia:
. . . i i -vj. /r
cosf
, v T i'-vx'lc2 x'-vt' 1
; (coi — kx) = cos co , — — k —==:
L y/l-V2lc2 Vl-^/c2J
Jeśli przegrupujemy wyrazy wewnątrz nawiasu, otrzymamy
[to + kv k + vco/c2 1
, t , x =
Vl-ttV y/l-v'lc2 J
= cos[ co' t'- k' x']. (34.16)
Znowu jest to fala, fala cosinusowa, w której występuje pewna częstość co' jako
współczynnik przy t' oraz pewna inna stała k', jako współczynnik przy x'. Stałą k' nazywamy liczbą
falową albo liczbą fal na metr, w nowym układzie odniesienia. Drugi człowiek zmierzy
więc nową częstość i nową liczbę falową dane wzorami:
co + kv
«>'=7=== (34.17)
Vl-V/c2
k + covlc2
k'= -7=4=;. (34.18)
Vl-t;2/c2
Jeśli spojrzymy na wzór (34.17), stwierdzimy, że jest to znany wzór (34.13), który wtedy
wyniknął z bardziej fizycznego rozumowania.
34-7. Czterowektor k, co
Związki dane równaniami (34.17) i (34.18) są bardzo ciekawe, ponieważ mówią, że
nowa częstość to' jest kombinacją dawnej częstości co i dawnej liczby falowej k, nowa zaś
liczba falowa k' jest kombinacją dawnej liczby falowej i dawnej częstości. Liczba falowa
jest, jak wiemy, miarą zmiany fazy z odległością, a częstość - miarą zmiany fazy w czasie.
W wyrażeniach tych dostrzegamy ścisłą analogię z przekształceniem Lorentza dla położenia
i czasu: jeśli wyobrazimy sobie, że a> jest czymś w rodzaju t, a k jest czymś podobnym do x
podzielonego przez c2, to wówczas nowe co' będzie czymś w rodzaju t', a k' czymś podobnym
do x'jc2. Dokładniej możemy to sformułować mówiąc, że przy przekształceniu Lorentza
w i k transformują się w taki sam sposób, jak t i x. Tworzą one razem wielkość, którą
nazywamy czterowektorem; każda bowiem wielkość, która ma cztery składowe transformujące
S'C tak jak czas i przestrzeń, jest czterowektorem. Wydaje się więc, że wszystko jest w
porządku, z wyjątkiem jednej drobnej rzeczy: powiedzieliśmy, że czterowektor musi mieć cztery
składowe. Gdzie są zatem dwie pozostałe? Stwierdziliśmy, że co i k są podobne do czasu
1 Przestrzeni dla jednego kierunku przestrzennego, a nie dla wszystkich i dlatego musimy
zaraz zbadać zagadnienie rozchodzenia się światła w trzech kierunkach przestrzennych,
a nie tylko w jednym, jak to dotąd robiliśmy.
Załóżmy, że mamy układ współrzędnych x, y, z i rozchodzącą się falę, której czoła
134
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
pokazano na rys. 34.11. Długość fali wynosi
k, ale kierunek rozchodzenia się fali nie jest
zgodny z kierunkiem żadnej osi. Jakim
wzorem opisywana jest taka fala? Oczywista
odpowiedź brzmi: cos (cot -ks), gdzie k = 2n/k, a
s jest odległością mierzoną wzdłuż kierunku
rozchodzenia się fali, czyli składową
położenia przestrzennego w kierunku ruchu.
Ujmijmy to w taki sposób: gdy r jest wektorem
położenia punktu w przestrzeni, wtedy
s — rek, gdzie et oznacza jednostkowy
wektor w kierunku ruchu. Oznacza to, że s jest
równe r cos (r, ek), czyli składowej
odległości w kierunku ruchu. Tak więc nasza fala
ma postać cos (cot — kek -r).
Bardzo wygodną rzeczą jest zdefiniowanie wektora k, który nazywamy wektorem
falowym, a który ma długość równą liczbie falowej 2tt/A i kierunek zgodny z kierunkiem
rozchodzenia się fali:
34.11. Fala płaska rozchodząca się ukośnie
k = 2nek/k = kek .
(34.19)
Posługując się tym wektorem możemy zapisać naszą falę jako cos(a>7— kr) albo jako
cos (cot—kxx — kyy-kzź). Jakie znaczenie mają poszczególne składowe wektora k, np.
składowa-? Oczywiście, składowa —jest miarą zmiany fazy w zależności od x. Na rysunku
34.11 widzimy, że przy zmianie x fala zmienia się tak, jak gdyby w kierunku osi x
rozchodziła się fala o większej długości. „Długość fali w kierunku osi x" jest większa od
naturalnej, prawdziwej długości fali, a ich stosunek jest równy sekansowi kąta a między
właściwym kierunkiem rozchodzenia się fali a osią x:
kx = A/cos a..
(34.20)
A więc szybkość zmiany fazy proporcjonalna do odwrotności kz jest mniejsza o czynnik
cos a. Składowa kx będzie się zmieniać jak długość wektora k pomnożona przez cosinus
kąta między wektorem k a osią x\
Na tym właśnie polega istota wektora falowego, którym się posługujemy w
przedstawianiu fali w trzech wymiarach. Cztery wielkości: co, kx, ky, kz transformują się w teorii
względności jak czterowektor, przy czym a> odpowiada czasowi, a kx, ky i kt odpowiadają
składowym x, y i z czterowektora.
Omawiając poprzednio szczególną teorię względności (t. I, cz. 1, rozdz. 17)
dowiedzieliśmy się, że można tworzyć relatywistyczne iloczyny skalarne czterowektorów.
Jeśli posługujemy się wektorem położenia x„, gdzie wskaźnik n przyjmuje cztery wartości
odpowiadające czterem składowym (czasowej i trzem przestrzennym) i jeśli wektor falowy
oznaczymy k„, gdzie wskaźnik fi ma znowu cztery wartości: czasową i trzy przestrzenne,
iloczyn skalarny czterowektorów x„ i — zapisuje się jako £'—x„ (patrz rozdz. 17). Taki
iloczyn skalarny jest pewnym niezmiennikiem niezależnym od układu współrzędnych. Ile
34-7. CZTEROWLKTOR k, u,
135
on wynosi? Z definicji iloczynu skalarnego w czterech wymiarach wynika, że
Y!k^x,, =(i)t-kxx-kyy-kz 2 . (34.21)
Z naszych studiów nad wektorami wiemy, że ^'/c^x^ jest niezmiennikiem przekształcenia
Lorentza, ponieważ A„ jest czterowektorem. Wielkość ta stanowi zaś dokładnie argument
cosinusa dla tali płaskiej, który musi być niezmiennikiem przekształcenia Lorentza. We
wzorach nie mogą występować zmienne wielkości w argumencie cosinusa, ponieważ faza
fali nie może, jak wiadomo, zależeć od zmiany układu współrzędnych.
34-8. Aberracja
Przy wyprowadzaniu równań (34.17) i (34.18) rozważaliśmy prosty przykład, w którym
wektor k pokrywał się z kierunkiem ruchu, ale oczywiście możemy to uogólnić i na inne
przypadki. Weźmy na przykład źródło, które wysyła światło w danym kierunku, z punktu
widzenia jakiegoś człowieka spoczywającego, podczas gdy my poruszamy się na przykład
razem z Ziemią (rys. 34.12). Jak się nam wydaje, z jakiego kierunku przychodzi wówczas
światło? Aby na to odpowiedzieć, powinniśmy wypisać cztery składowe &„ i
zastosować przekształcenie Lorentza. Odpowiedź można jednak znaleźć też za pomocą
następującego rozumowania: aby ujrzeć światło, musimy nasz teleskop ustawić pod pewnym kątem.
Dlaczego? Ponieważ światło pada z góry z prędkością c, a my poruszamy się w bok z
szybkością v, zatem teleskop musi być pochylony do przodu, aby światło biegnące w dół
przechodziło „prosto" przez rurę. Bardzo łatwo stwierdzić, że pozioma odległość wynosi vt, pionowa
zaś jest et i stąd, jeśli 9' jest kątem nachylenia, tg9' = v/c. Prawda, jaki to ładny wynik?
Rzeczywiście, wynik jest bardzo ładny - z wyjątkiem „jednego małego ale": 9' nie jest
kątem, pod jakim powinniśmy ustawić
teleskop względem Ziemi, ponieważ analizy
dokonaliśmy z punktu widzenia
„unieruchomionego" obserwatora. Gdy my mówiliśmy, że
odległość pozioma wynosi vt, człowiek na
Ziemi znalazł inną odległość, ponieważ mierzył
za pomocą „ściśniętej" linijki. Okazuje się,
że z powodu tego efektu skrócenia
tg 0=--—==, (34.22)
vi-pV
c° jest równoważne
sin 0 = d/c. (34.23)
Pouczającym ćwiczeniem dla czytelnika
będzie wyprowadzenie tego wyniku przy użyciu
Przekształcenia Lorentza.
Fakt, że teleskop musi być pochylony, jest
s*utkiem zjawiska, które nazywamy aberracją,
34.12. Odległe źródło S' oglądane przez
a) nieruchomy teleskop, b) teleskop
poruszający się poprzecznie
\i
a)
b)
n
i
l'
ifi
U ij,
V
7'
A
1
l
-7
/
/
136
34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU
i rzeczywiście zjawisko to jest obserwowane. W jaki jednak sposób można je w ogóle
zaobserwować? Kto może powiedzieć, gdzie powinna znajdować się dana gwiazda? Przyjmijmy, że
rzeczywiście, powinniśmy patrzeć w niewłaściwym kierunku, aby zobaczyć gwiazdę.
Skąd się możemy dowiedzieć, że kierunek ten jest niewłaściwy? Stąd, że Ziemia obiega
Słońce dookoła. Dzisiaj musimy skierować teleskop w jedną stronę, po sześciu miesiącach
będziemy musieli skierować go w drugą stronę. W ten sposób możemy się przekonać,
że efekt rzeczywiście istnieje.
34 9. Pęd światła
Przechodzimy teraz do innego tematu. W ostatnich kilku rozdziałach nie mówiliśmy
nic o działaniu pola magnetycznego związanego ze światłem. Działanie pola magnetycznego
jest zazwyczaj bardzo małe, powoduje jednak pewne ciekawe i ważne zjawisko. Załóżmy,
że światło przychodzące ze źródła działa na ładunek poruszając nim tam i z powrotem.
Przyjmijmy, że pole elektryczne ma kierunek x, tak że ruch ładunku odbywa się również
w kierunku x. Niech ładunek ma pewne położenie x i pewną prędkość v pokazaną na rys.
34.13. Pole magnetyczne jest prostopadłe do pola elektrycznego. Zapytajmy teraz, co
robi pole magnetyczne, gdy pole elektryczne działa na ładunek poruszając nim tam i z
powrotem? Pole magnetyczne działa na ładunek (niech to będzie elektron) tylko wtedy, gdy jest
on w ruchu, a elektron właśnie się porusza, gdyż jest on pobudzany przez pole elektryczne.
Oba pola działają więc razem: gdy ciało porusza się tam i z powrotem, ma różną od zera
prędkość i działa nań siła, której długość wynosi B razy v razy q; ale jaki jest jej kierunek?
Działa ona w kierunku rozchodzenia się światła. Gdy zatem światło pada na ładunek,
który zaczyna drgać reagując na pole, pojawia się pchająca siła w kierunku wiązki świetlnej.
Nazywa się ją ciśnieniem promieniowania albo ciśnieniem światła.
Wyznaczmy teraz wielkość ciśnienia promieniowania. Wynosi ono oczywiście F=qvB,
a ponieważ wszystko drga, jest ona raczej średnią czasową tego wyrażenia: <F>. Ze wzoru
(34.2) wynika, że natężenie pola magnetycznego jest równe natężeniu pola elektrycznego
podzielonemu przez c, trzeba więc znaleźć średnią pola elektrycznego razy prędkość,
razy ładunek, razy l/c: <F> = ^<f£>/c.
Ładunek q pomnożony przez pole E stanowi siłę
elektryczną działającą na ten ładunek, a
siła działająca na ładunek pomnożona przez
prędkość jest pracą dWjdt wykonaną na
ładunku! A więc siła, „pęd pchający",
przenoszony przez światło w ciągu sekundy, jest
równa l/c razy energia pochłonięta ze światła w
jednej sekundzie! Ta reguła jest ogólna,
ponieważ nic nie mówiliśmy, jak silny był
oscylator ani że niektóre ładunki się znosiły. W
dowolnych warunkach, gdy światło jest
pochłaniane, pojawia się ciśnienie. Pęd przenoszony
34.13. Siła magnetyczna działająca na
ładunek poruszany przez pole w kierunku
wiązki światła
v ,\
34-9. PĘD ŚWIATŁA
137
przez światło jest zawsze równy pochłanianej energii podzielonej przez prędkość c:
dWjdt
<F>=^-. (34.24)
c
To, że światło niesie energię, wiedzieliśmy już przedtem. Teraz widzimy, że niesie ono
także pęd i że jest on zawsze równy energii razy l/c.
Gdy światło emitowane jest ze źródła, następuje zjawisko odrzutu; coś analogicznego
do omawianego poprzednio zjawiska zachodzącego w odwrotną stronę. Jeśli atom wysyła
w pewnym kierunku energię W, to istnieje wówczas pęd odrzutu p = W je. Jeśli światło
zostaje odbite prostopadle od zwierciadła, siła zostaje podwojona.
Tyle możemy powiedzieć opierając się na klasycznej teorii światła. Wiemy oczywiście,
że istnieje teoria kwantowa i że pod wieloma względami światło działa jak cząstka. Energia
cząstki świetlnej jest równa stałej razy częstość:
W = hv = hco. (34.25)
Wiemy już, że światło niesie pęd równy energii podzielonej przez c, musi więc być
prawdą, że owe efektywne cząstki, fotony, niosą pęd:
p=Wlc = h(olc = hk. (34.26)
Kierunkiem pędu jest oczywiście kierunek rozchodzenia się światła. Posługując się
zapisem wektorowym mamy więc
W = hco, p = ftk. (34.27)
Wiemy również, że energia i pęd powinny oczywiście tworzyć czterowektor. Odkryliśmy
właśnie, że co i k tworzą czterowektor. Dobrze się więc składa, że we wzorach (34.27)
występują te same stałe; znaczy to, że teoria kwantowa i teoria względności są wzajemnie
zgodne.
Równanie (34.27) można zapisać w bardziej eleganckiej postaci jako p^ — hk^,
relatywistyczne równanie dla cząstki stowarzyszonej z falą. Omówiliśmy je tylko dla fotonów, dla
których k (długość wektora k) jest równe co/c a p—W/c, ale związek ten jest znacznie
ogólniejszy. W mechanice kwantowej wszystkie cząstki, nie tylko fotony, przejawiają
własności falowe, a częstość fali i liczba falowa wiążą się z energią i pędem przy pomocy
wzorów (34.27) (zwanych wzorami de Broglie'a) nawet wtedy, gdy p nie jest równe Wjc.
Dowiedzieliśmy się z ostatniego rozdziału, że wiązka światła spolaryzowanego kołowo
prawo- lub lewoskrętnie niesie także moment pędu w ilości proporcjonalnej do energii &
fali. W obrazie kwantowym wiązka kołowo spolaryzowanego światła uważana jest za
strumień fotonów, z których każdy niesie moment pędu równy ±h i skierowany równolegle
do kierunku rozchodzenia się. Taki właśnie sens ma polaryzacja z korpuskularnego punktu
widzenia - fotony niosą moment pędu podobnie jak wirujące pociski karabinowe. W
rzeczywistości jednak „pociskowy" obraz jest równie niekompletny jak obraz „falowy"
i przedstawione tu idee będziemy musieli omówić bardziej obszernie w dalszym rozdziale
Poświęconym zjawiskom kwantowym (rozdz. 37).
35
widzenie barwne
35-1. Oko ludzkie
Zjawiska barwne częściowo należą do świata fizyki. Omawiamy przecież barwy blonek
mydlanych i tym podobne efekty, powstające na skutek interferencji. Zjawiska te ponadto
zależą oczywiście od oka albo raczej od.tego, co się dzieje za okiem, w mózgu. Fizyka
opisuje światło wchodzące do oka, a następujące potem nasze wrażenia są wynikiem
reakcji fotochemicznonerwowych i psychologicznych.
Istnieje wiele ciekawych zjawisk wzrokowych, w których występują zarówno procesy
fizyczne, jak i fizjologiczne, i aby w pełni zrozumieć naturalne zjawisko widzenia, musimy
wyjść poza obręb fizyki w zwykłym sensie tego słowa. Takie wypady w inne dziedziny wiedzy
są zupełnie usprawiedliwione, ponieważ sam podział zjawisk na różne dziedziny następuje,
jak to już podkreślaliśmy, tylko ze względu na ludzką wygodę i jest w gruncie rzeczy
nienaturalny. Nasze podziały nie obchodzą przyrody i wiele ciekawych zjawisk — to
pomosty między różnymi dziedzinami.
Już w rozdz. 3 (t. I, cz. 1) omówiliśmy z grubsza stosunek fizyki do innych nauk
przyrodniczych. Teraz zajmiemy się dokładniej pewną szczególną dziedziną, która wiąże ściśle
fizykę z innymi naukami. Dziedziną tą jest widzenie. W szczególności omówimy widzenie
barwne. W rozdziale tym omówimy przede wszystkim obserwowalne przejawy ludzkiego
widzenia, a w rozdziale następnym będziemy rozważali fizjologiczne aspekty widzenia
u ludzi i u zwierząt.
Cały proces widzenia ma swój początek w oku, musimy więc najpierw czegoś się o nim
dowiedzieć, aby zrozumieć jak właściwie przebiega całe zjawisko. W następnym rozdziale
będziemy dość szczegółowo omawiali działanie różnych części oka i ich wzajemne
połączenia z układem nerwowym. Obecnie tylko w skrócie opiszemy jak działa oko (rys. 35.1)-
Światło wchodzi do oka przez rogówkę i w znany nam już sposób zostaje załamane
35-1. OKO LUDZKIE 139
- tworząc obraz w tylnej części oka na warstwie zwanej siatkówką - tak, że na różne
części siatkówki pada światło z różnych części zewnętrznego pola widzenia. Siatkówka
nie jest ściśle jednorodna: w środku naszego pola widzenia znajduje się miejsce, plamka,
którą się posługujemy, gdy chcemy coś zobaczyć bardzo dokładnie. W miejscu tym mamy
największą ostrość widzenia; nazywa się je dołkiem środkowym albo plamką żółtą. Własne
doświadczenie mówi nam od razu, że przy oglądaniu przedmiotów boczne części oka nie
są tak sprawne w rozróżnianiu szczegółów, jak jego środek. Na siatkówce znajduje się
też plamka, z której wychodzą nerwy przenoszące wszystkie informacje; jest to plamka
ślepa. Siatkówka w tym miejscu nie jest czuła, co można pokazać zamykając np. lewe oko
i kierując wzrok w jakiś punkt położony na wprost nas. Przesuwając jakiś niewielki
obiekt, np. palec, powoli poza pole widzenia, zauważamy, że znika on gdzieś nagle.
Zjawisko to zostało praktycznie wykorzystane chyba tylko wtedy, gdy pewien fizjolog pokazał je
królowi Francji, stając się dzięki temu jego faworytem. W czasie nudnych posiedzeń ze
swymi dworzanami król mógł się zabawiać „obcinaniem im głów" - patrząc na jednego
z dworzan śledził znikanie głowy drugiego.
Na rysunku 35.2 widać w nieco schematycznej postaci powiększony obraz wnętrza
siatkówki. W poszczególnych częściach siatkówki znajdują się struktury różnego rodzaju.
Obiekty gęściej występujące w pobliżu brzegów siatkówki nazywamy pręcikami. Bliżej
dołka środkowego obok komórek pręcikowych znajdujemy także komórki czopkowe.
Budowę tych komórek opiszemy później. W miarę zbliżania się do dołka liczba czopków
wzrasta i w samym dołku są już tylko komórki czopkowe ułożone tak ciasno, że są one
tutaj o wiele cieńsze lub węższe niż gdzie indziej. Stwierdzamy więc, że w samym polu
widzenia widzimy za pomocą czopków, w miarę zaś przesuwania się do brzegów pojawiają się
inne komórki - pręciki. Ciekawe, że w siatkówce żadna komórka światłoczuła nie jest
połączona włóknem bezpośrednio z nerwem wzrokowym, ale z wielu innymi komórkami,
które z kolei są połączone z sobą. Istnieją różne rodzaje komórek: komórki, które
przenoszą informacje do nerwu wzrokowego, i inne, które przede wszystkim są połączone
35.1. Oko
soczewka
ciało wodniste
więzadło 111
soczewki II
naczyniówka \x^
twardówka
fce£j3»A;
ciało
lir
. rogówka
i-L ♦ - i. ^
12>v. tęczówka
f, «\ micsień
JI soczewki
, szkliste jf /
JrJ- siatkówka
plamka zólta
nerw wzrokowy
140
35. WIDZENIE BARWNE
35.2. Budowa siatkówki (światło wchodzi od dołu)
wzajemnie „poziomo". Rodzajów komórek jest w zasadzie cztery, ale nie będziemy teraz
wchodzić w te szczegóły. Podkreślamy tylko najważniejszą rzecz, że sam sygnał świetlny
zostaje „przemyślany". Znaczy to, że informacje z rozmaitych komórek nie przechodzą
od razu do mózgu, ale że pewna ich ilość zostaje w siatkówce przetworzona dzięki złożeniu
informacji z szeregu receptorów wzrokowych. Bardzo ważne jest zrozumienie, że pewne
zjawiska typu mózgowego zachodzą już w samym oku.
35-2. Barwa zależy od natężenia światła
Jednym z najbardziej uderzających zjawisk wzrokowych jest przystosowanie się oka
do ciemności. Jeśli przejdziemy z jasno oświetlonego pokoju do ciemnego, przez chwilę
widzimy źle, ale stopniowo przedmioty stają się coraz bardziej widoczne i w końcu możemy
coś zobaczyć tam, gdzie przedtem nie było widać niczego. Jeśli natężenie światła jest bardzo
małe, widziane przez nas przedmioty nie mają barwy. Wiadomo, że to widzenie zmierzchowe
zawdzięczamy prawie wyłącznie pręcikom, podczas gdy widzenie w pełnym świetle
zawdzięczamy czopkom. Takie przekazywanie czynności czopków i pręcików razem wziętych
samym pręcikom pozwala nam łatwo zrozumieć szereg zjawisk.
W wielu sytuacjach moglibyśmy widzieć barwy, gdyby natężenie światła było większe.
Przekonalibyśmy się wtedy, że efekty te są bardzo ładne. Tak na przykład przez teleskopy
prawie zawsze widzimy „biało-czarne" obrazy słabych mgławic, ale W. C. Miller z
obserwatoriów na Mt. Wilson i Mt. Palomar miał dość cierpliwości na to, aby wykonać barwne
zdjęcia niektórych z tych mgławic. W rzeczywistości nikt nigdy nie widział tych barw gołym
okiem, ale nie są one sztuczne, po prostu natężenie światła nie jest dość silne na to, aby
czopki w naszym oku moeły na nie zareagować. Wśród najbardziej efektownych obiektów
35-2. BARWA ZALEŻY OD NATĘŻENIA ŚWIATŁA
141
tego rodzaju są: mgławica pierścieniowa i mgławica Krab. Pierwsza ma na zdjęciu piękną
niebieską część wewnętrzną z zewnętrzną jasnoczerwoną aureolą, a druga ukazuje ogólnie
niebieskawą mgiełkę, przetykaną jasnymi czerwonopomarańczowymi włóknami.
W pełnym świetle pręciki prawdopodobnie wykazują bardzo małą czułość, ale w świetle
zmierzchowym zwiększają z upływem czasu swoją zdolność reagowania na światło. Natężenie
światła, do którego można się przystosować, może się zmieniać w granicach od ponad
miliona do jedności. Przyroda nie dokonuje tego za pomocą tylko jednego rodzaju
komórek, ale zadania te przekazują sobie wzajemnie dzienne komórki, czyli reagujące na barwę
czopki, i komórki reagujące na małe natężenie światła, czyli zmierzchowe pręciki. Ciekawą
konsekwencją tego przesuwania się jest to, że najpierw barwy nie ma, a następnie, że istnieje
różnica we względnych jasnościach różnie zabarwionych przedmiotów. Okazuje się, że
pręciki reagują lepiej w dziedzinie niebieskiej niż czopki, czopki zaś mogą na przykład
reagować na światło ciemnoczerwone, czego pręciki zupełnie nie potrafią. Dla pręcików
czerwone światło jest więc czarne. Weźmy dwa kawałki kolorowego papieru, np.
niebieski i czerwony. W dobrym świetle czerwony może być jaśniejszy od niebieskiego, ale o
zmierzchu wrażenie nasze będzie odwrotne. Zjawisko to jest bardzo ciekawe. Jeśli o
zmierzchu weźmiemy ilustrowany barwny magazyn i ocenimy jaśniejsze i ciemniejsze obszary,
nie wiedząc na pewno, jakie tam są barwy, a następnie przeniesiemy magazyn w pełne
oświetlenie, możemy wówczas zobaczyć ważne przesunięcie między tą barwą, która się
wydawała najjaśniejsza przedtem i tą, która wydaje się najjaśniejsza obecnie. Zjawisko
to nazywamy zjawiskiem Purkinjego.
Na rysunku 35.3 krzywa przerywana pokazuje czułość oka zmierzchowego, to znaczy
oka posługującego się pręcikami, krzywa zaś ciągła pokazuje czułość oka dziennego.
Widzimy, że szczytowa czułość pręcików znajduje się w obszarze zielonym, a czopków
bardziej w żółtym. Kartkę barwy czerwonej (czerwień odpowiada około 650 mu) możemy
zobaczyć wtedy, gdy jest jasno oświetlona, w ciemności zaś jest ona prawie niewidoczna.
35.3. Widmowa czułość oka. Linia przerywana — pręciki, linia ciągła — czopki
100
80
N
■o
i
c
■o
©■
60
40
5 20
mA
.
*
i
/
i
/
/
/
►
i
/
/
\ )
A
r
X
'
A
V
\
0
i
\
\
V
\
\
\
\
\
\
.
700 80 60 40 20 600 80 60 40 20 500 80 60 40 20 400
długość fali w mu.
142
35. WIDZENIE BARWNE
Innym następstwem tego, że w ciemności główną rolę odgrywają pręciki, i tego, że w
dołku nie ma pręcików, jest to, że gdy w ciemności patrzymy na wprost, nasze widzenie
nie jest ostre, jak przy patrzeniu w bok. Słabą gwiazdę lub młgawicę można czasem lepiej
widzieć wtedy, gdy patrzy się na nią nieco z boku niż na wprost, ponieważ w środku dołka
nie mamy czułych na słabe światło pręcików.
Ciekawą konsekwencją faktu, że liczba czopków maleje w miarę przesuwania się do
brzegu pola widzenia jest to, że nawet w pełnym świetle barwa znika, gdy przedmiot
ucieka daleko w bok. Sposób sprawdzenia tego polega na patrzeniu przez nas w pewnym
ustalonym kierunku, podczas gdy inna osoba podchodzi z boku z barwnymi kartami.
Spróbujmy ustalić, jakiej są one barwy, zanim znajdą się na wprost nas. Okazuje się, że
same karty można zobaczyć na długo przedtem, zanim daje się określić ich barwy.
Przeprowadzając doświadczenie należy podchodzić do osoby patrzącej od strony przeciwnej do jej
plamki ślepej, bo inaczej będzie dość mylące najpierw prawie rozróżnianie barw, następnie
niewidzenie niczego, a potem znowu widzenie barw.
Jeszcze innym ciekawym zjawiskiem jest wielka wrażliwość brzegu siatkówki na ruch
przedmiotów. Kątem oka nie możemy wprawdzie bardzo dobrze widzieć, ale jeśli
nadlatuje drobny owad, natychmiast na to reagujemy, nawet gdy z tamtej strony nie oczekujemy
niczego poruszającego się. Jesteśmy wszyscy „nastawieni" na patrzenie za czymś
poruszającym się na brzegu pola widzenia.
35-3. Mierzenie wrażenia barwnego
Zajmiemy się teraz widzeniem za pomocą czopków, czyli widzeniem dziennym,
dochodząc w ten sposób do zjawiska najbardziej charakterystycznego dla widzenia, mianowicie
do barwy. Białe światło można, jak wiadomo, rozłożyć za pomocą pryzmatu na widmo
świetlne o różnych długościach fal, które, jak nam się wydaje, mają różne barwy. Barwy
bowiem nie są oczywiście niczym innym jak wrażeniami. Każde źródło światła można
analizować za pomocą siatki dyfrakcyjnej czy pryzmatu i można określić jego rozkład
widmowy, to znaczy „ilość" każdej długości fali. Dane światło może zawierać wiele błękitu,
sporo czerwieni, bardzo mało żółtego i tak dalej. Wszystko to jest bardzo dobrze określone
w sensie fizyki, ale powstaje pytanie, jaką będzie wydawać się barwa tego światła?
Oczywiście, różne barwy zależą w pewien sposób od widmowego rozkładu światła, ale sprawa
polega na wykryciu cech rozkładu widmowego, które powodują powstawanie określonych
wrażeń. Jak na przykład mamy postąpić, aby otrzymać wrażenie barwy zielonej?
Wiemy wszyscy, że możemy po prostu wziąć tzw. zieloną część widma. Ale czy jest to jedyny
sposób uzyskania wrażenia zielonej, czy pomarańczowej, czy jakiejkolwiek innej barwy?
Czy istnieje więcej niż jeden rozkład widmowy, który powoduje takie samo
wrażenie wzrokowe? Odpowiedź jest zdecydowanie twierdząca. Liczba wrażeń wzrokowych
jest bardzo ograniczona, ich rozmaitość - jak wkrótce zobaczymy - jest dokładnie
trójwymiarowa, podczas gdy dla światła przychodzącego z różnych źródeł możemy
wyrysować nieskończoną liczbę różnych krzywych — jego rozkładów widmowych.
Zagadnieniem wymagającym teraz omówienia jest to, w jakich warunkach różne rozkłady widmowe
światła dają oku wrażenie dokładnie tej samej barwy?
35-3. MIERZENIE WRAŻENIA BARWNEGO
143
Najbardziej skuteczna technika psychofizyczna przy ocenie barwy polega na przyjęciu
oka za narzędzie zerowe. Znaczy to, że nie usiłujemy określić, co stanowi istotę wrażenia
zieleni, ani też mierzyć, w jakich warunkach powstaje wrażenie zieleni, ponieważ okazuje
się, że sprawy te są niezmiernie złożone. Badamy tylko warunki, w których dwa bodźce
są nierozróżnialne. Nie musimy wtedy rozstrzygać tego, czy dwaj ludzie odbierają takie
samo wrażenie wzrokowe w różnych warunkach, a tylko — czy dwa wrażenia takie same
dla jednej osoby są też takie same i dla innej. Nie musimy rozstrzygać, czy ktoś widzący
coś zielonego odczuwa wewnętrznie to samo, co ktoś inny widzący coś zielonego; o tym
nic nie wiemy.
Dla pokazania możliwych sytuacji posłużymy się układem czterech lamp projekcyjnych
zaopatrzonych w filtry. Jasność lamp można regulować w sposób ciągły w szerokim
zakresie: jedna z lamp ma filtr czerwony i na ekranie daje plamę światła czerwonego, następna
ma filtr zielony i daje plamę zieloną, trzecia ma filtr niebieski, a czwarta daje białe koło
z czarnym punktem w środku. Puszczając na ekran trochę światła czerwonego, a następnie
trochę zielonego, zobaczymy, że w obszarze pokrywania się świateł wywołują one wrażenie,
którego nie nazwiemy czerwonawą zielenią, bo stanowi ono nową barwę, w tym wypadku
żółtą. Zmieniając wzajemny stosunek czerwieni i zieleni możemy przejść przez różne
odcienie pomarańczowego i tak dalej. Wyobraźmy sobie, że otrzymaliśmy w ten sposób pewien
odcień żółty. Tę samą żółtą barwę możemy także otrzymać nie przez mieszanie
wspomnianych dwu barw, ale inaczej, przepuszczając np. białe światło przez filtr żółty albo
wywołując w inny sposób takie samo wrażenie. Innymi słowy, mieszając światło przechodzące
przez rozmaite filtry można różne barwy utworzyć na więcej niż jeden sposób.
To, co właśnie odkryliśmy, można analitycznie wyrazić jak następuje. Określoną żółtą
barwę można na przykład przedstawić za pomocą symbolu Y, który określa „sumę" pewnych
ilości przefiltrowanego światła czerwonego (/?) i zielonego (G). Używając dwóch liczb r i g
do opisu jasności (/?) i (G) możemy dla naszej barwy żółtej napisać wzór:
Y = rR+gG. (35.1)
Powstaje pytanie: czy można wytworzyć pełną rozmaitość barw przez dodawanie do
siebie światła o dwóch lub trzech różnych, ale ustalonych barwach? Zobaczmy, co z tego
założenia może wyniknąć. Drogą mieszania tylko czerwieni i zieleni nie uda się z
pewnością uzyskać pełnej rozmaitości barw, ponieważ w takiej kombinacji nie pojawi się nigdy
np. błękit. Dodając jednak trochę błękitu można dojść do tego, że obszar centralny,
w którym trzy plamki się nakładają, będzie się wydawał prawie zupełnie biały. Mieszając
rozmaite barwy i przypatrując się obszarowi centralnemu stwierdzamy, że zmieniając
wzajemne proporcje możemy w nim uzyskać spory zakres barw. Nie jest więc
wykluczone, że wszystkie barwy można utworzyć przez mieszanie tych trzech barw. Zastanowimy
się teraz, w jakim stopniu jest to prawdziwe. Rzeczywiście, jest to w zasadzie prawda.
Przekonamy się wkrótce, jak to założenie można lepiej sformułować.
Dla zilustrowania tej sprawy zsuńmy 3 barwne plamki na ekranie tak, aby nakładały
S'C całkowicie na siebie i starajmy się odtworzyć barwę, którą widać w pierścieniu
kołowym, utworzonym przez czwartą lampę. Wychodzące z niej światło, które dawniej
wydawało się nam „białe", teraz wygląda żółtawo. Spróbujmy odtworzyć tę barwę dopaso-
144
35. WIDZENIE BARWNE
wując czerwień, zieleń i błękit, jak umiemy najlepiej, metodą prób i błędów. Stwierdzamy,
że udało się nam wcale dokładnie odtworzyć ten szczególny odcień „kremowy". Łatwo
uwierzyć, że możemy w ten sposób utworzyć wszystkie barwy. Za chwilę będziemy się
starali utworzyć barwę żółtą, ale zanim się do tego zabierzemy, weźmy jeszcze jedną
barwę, której utworzenie może być bardzo trudne. W większości wykładów o barwach
tworzy się wszystkie „żywe" barwy, a nigdy się nie tworzy brązowej i trudno sobie nawet
przypomnieć, czy się kiedykolwiek widziało brązowe światło. Istotnie, barwy tej nie używa
się nigdy do żadnego efektu scenicznego, nigdy też nie widzi się świetlnej plamy barwy
brązowej; możemy więc sądzić, że utworzenie brązu okaże się niemożliwe. Aby się
przekonać, czy można go wytworzyć, zauważmy najpierw, że światła brązowego nigdy nie
widujemy bez tła. Istotnie, możemy je utworzyć mieszając trochę czerwieni i żółtego.
Aby wykazać, że patrzymy na światło brązowe, wystarczy po prostu zwiększyć jasność
tła pierścieniowego, na którym to światło widzimy. Stwierdzamy, że rzeczywiście, ma
ono barwę, którą nazywamy brązową! Brązową jest zawsze ciemna barwa, sąsiadująca
z jaśniejszym tłem. Charakter brązu możemy łatwo zmienić. Zabierając na przykład
trochę czerwieni, uzyskujemy czerwonawy brąz, wyglądający jak czekoladowoczerwonawy
brąz, a wkładając stosunkowo więcej zieleni, uzyskujemy znaną barwę mundurów
wojskowych, która jest obrzydliwa, chociaż światło o tej barwie samo przez się nie jest takie
okropne; jest ono żółtawozielone, tyle tylko, że oglądane na jasnym tle.
Wstawmy teraz żółty filtr do czwartej lampy i starajmy się odtworzyć widzianą barwę
(natężenie musi znajdować się w zakresie natężenia pozostałych lamp; nie możemy dobierać
czegoś, co jest za jasne, ponieważ moc w lampie nie będzie wystarczająca). Barwę żółtą
możemy jednak odtworzyć; bierzemy mieszaninę czerwieni i zieleni i dodajemy odrobinę
błękitu, aby uczynićjąjeszcze doskonalszą. Możemy już chyba uwierzyć, że w
odpowiednich warunkach uda nam się doskonale odtworzyć każdą żądaną barwę.
Omówimy teraz prawa mieszania barw. Stwierdziliśmy najpierw, że różne rozkłady
widmowe mogą dawać wrażenie tej samej barwy; widzieliśmy następnie, że „dowolną" barwę
można utworzyć przez dodawanie trzech szczególnych barw: czerwonej, niebieskiej i
zielonej. Najciekawsza cecha mieszania polega na tym, co następuje: jeśli pewne światło,
które możemy określić jako X, oku wydaje się nierozróżnialne od Y (może to być inny
rozkład widmowy, który wydaje się jednak nierozróżnialny), to barwy te nazywamy
„równymi" w tym sensie, że oko widzi je jako równe, i piszemy:
X = Y. (35.2)
Tak oto dochodzimy do jednego z wielkich praw teorii barw: jeśli dwa rozkłady
widmowe są nierozróżnialne i do każdego z nich dodamy pewne światło Z (pisząc X+ Z
mamy na myśli puszczanie obu rodzajów światła na to samo pole), to nowe mieszaniny
także będą nierozróżnialne:
X + Z = Y + Z. (35.3)
Dopasowaliśmy właśnie naszą barwę żółtą; jeśli oświetlimy teraz wszystko światłem
różowym, to dopasowanie pozostanie. Tak więc dodanie dowolnego światła do świateł
już dopasowanych zachowuje dopasowanie. Wszystkie te zjawiska barwne możemy
innymi słowy streścić następująco: gdy mamy już dopasowane dwa światła barwne, wi-
35-3. MIERZENIE WRAŻENIA BARWNEGO
145
dziane obok siebie w tych samych warunkach, to wówczas w dowolnej innej sytuacji
mieszania barw dopasowanie to pozostaje i jedno światło może być zastąpione przez
drugie. Istotnie, okazuje się - i jest to bardzo ważna i ciekawa sprawa — że
dopasowanie barw światła nie zależy od cech oka w chwili obserwacji. Wiemy, że jeśli po
wpatrywaniu się przez długi czas w żywo czerwoną powierzchnię albo w jasne światło czerwone
spojrzymy na biały papier, wyda się nam on zielonkawy. Podobnie i inne barwy zostaną
zniekształcone na skutek naszego długiego patrzenia na żywą czerwień. Wyobraźmy
sobie teraz dopasowywanie powiedzmy dwóch barw żółtych. Przypatrzywszy się i
dopasowawszy je do siebie wpatrujmy się przez dłuższy czas w jakąś żywą czerwoną
powierzchnię, po czym wróćmy do naszej barwy żółtej. Wcale nie będzie ona już
wyglądała żółto: nie wiem, jaka to będzie barwa, ale na pewno nie będzie miała wyglądu barwy
żółtej. Mimo to, barwy pierwotnie żółte pozostaną nadal dopasowane, bo gdy nawet oko
przystosowuje się do różnych poziomów natężenia, dopasowanie barw pozostaje, chyba że
natężenie światła spadnie tak nisko, że następuje przestawienie się z czopków na pręciki.
Dopasowanie barwne nie jest już wtedy dopasowaniem barwnym, ponieważ posługujemy
się innym układem widzenia.
Inna zasada barwnego- mieszania świateł brzmi następująco: dowolną barwę można
utworzyć z trzech różnych barw, w naszym przypadku ze światła barwy czerwonej,
zielonej i niebieskiej. Odpowiednio mieszając wszystkie te trzy barwy możemy utworzyć w
ogóle każdą barwę, jak pokazaliśmy w naszych dwu przykładach. Poza tym prawa te są bar-
dzociekawe pod w zględem matematycznym. Tym, którzy interesują się stroną
matematyczną całej sprawy, przedstawimy ją następująco. Załóżmy, że bierzemy nasze trzy barwy,
którymi są czerwień, zieleń i błękit, ale oznaczamy je A, B, C i nazywamy naszymi barwami
zasadniczymi. Każdą barwę powinno się więc dać utworzyć z pewnych ilości tych trzech:
niech na przykład pewna ilość a barwy A, pewna ilość b barwy B i pewna ilość c barwy
C dają barwę X:
X = aA + bB + cC. (35.4)
Załóżmy teraz, że z tych samych trzech barw utworzona jest inna barwa Y:
Y = dA + b'B + ćC. (35.5)
Okazuje się, że mieszaninę tych dwóch barw (jest to jedna z konsekwencji praw, o
których już wspomnieliśmy) otrzymuje się biorąc sumę składowych X i Y:
Z = X+Y = (a+d)A+{b + b')B + (c+c')C . (35.6)
Przypomina to dodawanie wektorów, gdzie (a, b, c) odgrywają rolę składowych jednego
wektora, (a', b', c') — składowych innego wektora, nowa zaś barwa Z stanowi „sumę"
'ych wektorów. Zagadnienie to ciekawiło zawsze fizyków i matematyków. Schródinger
napisał nawet o widzeniu barwnym wspaniałą pracę, w której rozwinął sprawę
zastosowania teorii analizy wektorowej do mieszania barw.
Powstaje teraz pytanie: jak należy poprawnie wybrać barwy zasadnicze, którymi
mamy się posługiwać? Otóż okazuje się, że nie istnieje pojęcie „ustalonych" poprawnie
barw zasadniczych przy mieszaniu barw. W praktyce mogą wprawdzie istnieć trzy
146
1
35. WIDZENIE BARWNI.
farby bardziej od innych użyteczne do uzyskiwania większej rozmaitości mieszanych
barwików, ale nie o to nam teraz chodzi. Dowolne trzy światła różnej barwy*1 zmieszane
w odpowiedniej proporcji mogą zawsze utworzyć dowolne wrażenie barwne. Czy możemy
uykazać tę fantastyczną tezę? Zamiast posługiwania się czerwienią, zielenią i błękitem
użyjmy w naszym projektorze barwy czerwonej, niebieskiej i żółtej. Czy możemy się
nimi posłużyć do wytworzenia na przykład barwy zielonej?
Mieszając te trzy barwy w rozmaitych proporcjach uzyskujemy sporą gamę różnych
barw, rozciągającą się w widmo. Ale po wielu próbach i błędach stwierdzimy, że żadna
z tych barw nie przypomina zieleni. Pytanie: czy w ten sposób w ogóle możemy utworzyć
zieleń? Odpowiedź: tak. Jak jednak? Otóż puśćmy trochę czerwieni na zieleń. Otrzymaną
barwę możemy odtworzyć przy pomocy pewnej ilości światła żółtego i niebieskiego! Barwy
dopasowaliśmy więc, tyle że oszukańczo umieściliśmy czerwień po „drugiej stronie"
równania. Ale ponieważ nie brak nam pewnego sprytu matematycznego, więc możemy
uznać, że to, co pokazaliśmy, nie oznaczało naprawdę, że barwę X zawsze można
utworzyć z czerwieni, błękitu i żółtego, ale że stawiając czerwień po „drugiej stronie"
równania, barwa czerwień plus X mogła zostać utworzona z błękitu i żółtego. Pozostawienie
pewnej wielkości po drugiej stronie równania możemy interpretować jako jej ilość ujemną.
Jeśli więc dopuszczamy zarówno dodatnie, jak i ujemne współczynniki w równaniach
typu (35.4) i jeżeli interpretujemy znaczenie ujemnych ilości jako dodawanie ich po
drugiej stronie równania, to dowolną barwę rzeczywiście można odtworzyć przy pomocy
dowolnych trzech barw i nie istnieje pojęcie „ustalonych" podstawowych barw
zasadniczych.
Możemy zapytać: czy istnieją takie trzy barwy, które do wszystkich mieszanin
wchodzą tylko w dodatnich ilościach? Odpowiedź jest przecząca. Każdy układ barw
zasadniczych wymaga ujemnych ilości dla uzyskania pewnych barw i dlatego nie ma
jednoznacznego sposobu określenia barw zasadniczych. W elementarnych podręcznikach mówi się,
że barwami zasadniczymi są czerwona, zielona i niebieska, ale tylko dlatego, że przy ich
pomocy uzyskuje sięszerszy zakres barw, bez ujemnych współczynników w niektórych
zestawieniach.
35-4. Wykres barwności
Omówimy teraz geometryczną interpretację zestawiania barw. Jeśli dowolna barwa
jest przedstawiona za pomocą równania (35.4), to możemy wykreślić ją jako wektor
w przestrzeni odkładając wzdłuż trzech osi liczby a, b, c. Daną barwę reprezentuje
wówczas pewien punkt. Jeśli inną barwę określają liczby a', b', c', barwę tę reprezentuje inny
punkt w przestrzeni. Suma obu barw daje, jak wiemy, barwę wynikającą z ich
dodawania wektorowego. Możemy uprościć tę interpretację i przedstawić wszystko na
płaszczyźnie. Jeżeli bowiem mając określone światło barwne po prostu podwoimy a, b, c, a więc
*' Wyjątek zdarza się oczywiście wtedy, gdy jedna z tych trzech barw może być dobrana przez
zmieszanie dwóch pozostałych.
15-4 WYKRES BARWNOŚCI
147
y
0,8
0,7
U,b
0,5
0,4
0,3
0,2
0,1
I
520
h\o
500
4490
48o\
460
40
!
>^530
^>
~r 1 1 T
-
v540
1 OO50
1
1
&
s \
^ X560
s X
S0\5™
X-sV580
S\\590
nS^oo
^.^»V620 -
^ ^ C X630
uczynimy je dwukrotnie silniejszym, to
otrzymamy tę samą barwę, ale żywszą. Jeśli więc
zdecydujemy się na redukcję wszystkich
składników do tego samego należenia światła,
lo możemy zrzutować wszystko na
płaszczyznę, co właśnie zostało zrobione na rys. 35.4.
Wynika stąd, że dowolna barwa uzyskana
ze zmieszania dwu danych barw w pewnym
stosunku będzie leżała gdzieś na prostej
wykreślonej między dwoma odpowiadającymi
im punktami. Tak na przykład mieszanina pół
na pół pojawi się w połowie ich odległości,
a mieszanina i jednej barwy i J drugiej
pojawi się w l odległości jednego punktu do
drugiego, i tak dalej. Jeśli jako barwy zasadnicze
przyjmiemy czerwoną (C), zieloną (Z) i
niebieską (N), to wszystkie barwy, które
możemy z nich złożyć z dodatnimi
współczynnikami, leżą - jak widzimy — wewnątrz
kropkowanego trójkąta, obejmującego prawie
wszystkie widzialne barwy, ponieważ w
ogóle wszystkie widzialne barwy są zamknięte
w nieregularnym obszarze ograniczonym
krzywą. Skąd wziął się ten obszar? Kiedyś ktoś
bardzo starannie odtworzył wszystkie
widzialne barwy przy pomocy trzech
wybranych barw. My jednak nie musimy
sprawdzać wszystkich barw, które możemy
widzieć, wystarczy sprawdzić tylko czyste
barwy widmowe, linie widma. Światło można
uważać za sumę różnych dodatnich ilości
poszczególnych czystych barw widmowych
~ czystych z fizycznego punktu widzenia.
Dane światło będzie miało określoną zawartość
czerwonej barwy widmowej, żółtej, niebies-
K'ej i dalszych składowych widma. Jeśli się
W|ec dowiemy, ile mamy wziąć każdej z naszych wybranych barw zasadniczych, aby utwo-
rzyć którąś ze wspomnianych czystych składowych, to będziemy mogli obliczyć, ile
każdej barwy zasadniczej trzeba do utworzenia dowolnej barwy. Jeśłi więc znajdziemy
Współczynniki barwne wszystkich barw widmowych przy dowolnie zadanych trzech
barach zasadniczych, to będziemy mogli ułożyć pełną tabelę mieszania barw.
Na rysunku 35.5 podany jest przykładowo wynik takiego doświadczalnego mieszania
^ch barw. Rysunek ten pokazuje ilości każdej z określonych trzech barw zasadniczych,
0 0,1 0,2 0^ 0,4 0,5 0,6 0,7
35.4. Standardowy wykres barwności
35.5. Współczynniki barwne czystych barw
widmowych wyrażone w pewnym układzie
standardowych barw zasadniczych (1 —
czerwona, 2 — zielona, 3 — niebieska)
720 680 640 600 560 520 480 440 400
długość fali w mu.
148
35 WIDZENIE BARWNE
jakie są potrzebne do utworzenia dowolnej barwy widmowej. Czerwona barwa znajduje
się w lewym krańcu widma, potem następuje żółta i tak dalej aż do niebieskiej. Zauważmy,
że w pewnych punktach konieczne są znaki minus. Za pomocą danych tego rodzaju można
ustalić położenie wszystkich barw na wykresie, na którym współrzędne x i y odnoszą
się do różnych ilości przyjętych barw zasadniczych. W taki właśnie sposób znaleziono
krzywą ograniczającą. Jest nią miejsce geometryczne czystych barw widmowych. Każdą
inną barwę można oczywiście utworzyć przez dodawanie barw widmowych. W ten
sposób okazuje się, że dowolna barwa utworzona przez połączenie dwóch punktów tej
krzywej jest barwą występującą w przyrodzie. Linia prosta łączy skrajny fioletowy koniec
widma ze skrajnym końcem czerwonym. Jest to miejsce geometryczne purpur. Wewnątrz
krzywej ograniczającej leżą barwy, które można utworzyć ze świateł o różnych barwach,
a na zewnątrz leżą barwy, których nie daje się utworzyć w ten sposób i których nikt nigdy
nie widział (chyba tylko w powidokach!).
35-5. Mechanizm widzenia barwnego
Dalszym aspektem całej sprawy jest zagadnienie, dlaczego wrażenia barwne mają
takie właśnie cechy? Najprostsza teoria, zaproponowana przez You.nga i Helmholtza,
przyjmuje, że w oku istnieją trzy różne barwiki (pigmenty) odbierające światło. Mają
one różne widma absorpcyjne, tak że jeden barwik silnie pochłania na przykład w
dziedzinie czerwonej, inny pochłania silnie w dziedzinie niebieskiej, a jeszcze inny w
dziedzinie zielonej. Jeśli zatem puścimy na nie światło, otrzymujemy w trzech obszarach różne
pochłanianie i aby określić barwę, zbiera się w pewien sposób te trzy elementy informacji
w mózgu, czy w oku, czy jeszcze gdzie indziej. Łatwo wykazać, że wszystkie reguły
mieszania barw są konsekwencją tej teorii. Wszystkie te sprawy były bardzo roztrząsane,
ponieważ powstała natychmiast sprawa znalezienia charakterystyk pochłaniania każdego
z tych barwików. Ponieważ jednak współrzędne barwne możemy przekształcać w dowolny
sposób, więc okazuje się, niestety, że na drodze doświadczalnego mieszania barw możemy
znaleźć tylko wszelkie rodzaje liniowych kombinacji krzywych pochłaniania a nie krzywe
dla poszczególnych barwików. Ludzie różnymi sposobami usiłowali uzyskać jakąś określoną
krzywą, która by opisywała pewną szczególną fizyczną własność oka. Jedną z krzywych
tego rodzaju nazywamy krzywą wrażliwości świetlnej. Przedstawiają rys. 35.3. Na rysunku
tym mamy dwie krzywe, jedną dla oka zmierzchowego, drugą dla oka dziennego. Ta
ostatnia jest krzywą wrażliwości świetlnej receptorów czopkowych. Wrażliwość tę mierzy
się znajdując, jaka jest najmniejsza ilość barwnego światła, które można ledwie dostrzec.
Stanowi to miarę czułości oka w różnych obszarach widmowych. Istnieje także inny
bardzo ciekawy sposób mierzenia tej wielkości Weźmy dwie plamy barwne, widoczne
na jakiejś powierzchni, i poruszajmy nimi szybko tak, że na zmianę tylko jedna będzie
widoczna. Jeżeli częstość będzie za niska, zauważymy migotanie. Gdy będzie ona
wzrastać, migotanie przy pewnej częstości zależnej od jasności światła całkowicie zniknie
Załóżmy, że następuje to przy 16 Hz. Dopasowujmy teraz jasność albo natężenie jednej
barwy do drugiej; dojdziemy do takiego natężenia, że migotanie przy 16 Hz zniknie. Aby zo-
35-5. MECHANIZM WIDZENIA BARWNEGO
baczyć migotanie przy tak dopasowanej
jasności, będziemy musieli znacznie
obniżyć częstość. Otrzymamy w ten sposób
to, co nazywamy migotaniem jasności
przy większej częstości, a migotaniem
barwy przy mniejszej częstości. Tą
techniką migotania można dopasować dwie
barwy do „równej jasności". Wynik jest
prawie, choć nie dokładnie taki sam,
jak wynik mierzenia progowej czułości
oka na widzenie słabego światła przez
czopki. Większość badaczy posługuje się
systemem migotania do wyznaczenia
krzywej wrażliwości świetlnej.
Jeśli w oku naprawdę istnieją trzy
barwoczułe pigmenty, to zagadnienie
polega na określeniu kształtu widma
absorpcyjnego każdego z nich. W
jaki'sposób? Wiemy, że istnieją ludzie ślepi na
barwy — stanowią oni 8 % wszystkich
mężczyzn i 0,5% wszystkich kobiet.
Większość ludzi ślepych na barwy lub o
nienormalnym widzeniu barwnym ma
wprawdzie różny od innych ludzi stopień
czułości na zmianę barwy, ale jednak
potrzebuje trzech barw do dopasowywania.
Istnieją jednak i tacy, których nazywamy di-
chromatami, a którzy każdą barwę mogą
dobrać przy użyciu tylko dwu barw
zasadniczych. Nasuwa się oczywiście myśl,
że brakuje im jednego z trzech
barwików. Gdybyśmy zatem mogli znaleźć
trzy rodzaje ślepych na barwy dichro-
matów, u których występowałyby różne
reguły mieszania barw, wówczas
jednemu rodzajowi brakowałoby czerwonej,
'nnemu zielonej, a jeszcze innemu -
niebieskiej pigmentacji. Dokonując
pomiarów na tych trzech typach
moglibyśmy wyznaczyć trzy szukane krzywe!
Okazje się, że rzeczywiście istnieją trzy typy
^'chromatycznej ślepoty barwnej; dwa
'ypy są pospolite, a trzeci iest bardzn
149
35.6. Miejsce geometryczne barw mylonych przez
deuteranopów
35.7. Miejsce geometryczne barw mylonych przez
protanopów
150
35. WIDZENIE BARWNE
2,0
1,0
4000
5000
6000 o 7000
35.8. Krzywe czułości widmowej normalnych
receptorów trichromaty (/ — niebieska, 2 -
zielona, 3 — czerwona)
rzadki*'. Ich istnienie umożliwiło
poznanie widma absorpcyjnego barwików.
Rysunek 35.6 pokazuje mieszanie barw
u pewnego typu osoby ślepej na barwy,
zwanej deuteranopem. Miejsca
geometryczne stałych barw są dla niego nie
punktami, ale pewnymi prostymi, wzdłuż
których barwa wydaje mu się taka sama.
Jeśli teoria, że brak mu jednego z trzech
składników informacji, jest prawdziwa,
to wówczas wszystkie proste powinny
przecinać się w jednym punkcie. Jeśli
dokładnie pomierzymy podany wykres, to
okaże się, że proste rzeczywiście przecinają
się doskonale. Stąd oczywisty wniosek, że
wykres został sporządzony przez matematyka i nie przedstawia wyników rzeczywistych
pomiarów! Istotnie, jeśli sięgniemy do najnowszej pracy z wynikami rzeczywistych pomiarów,
to się okaże, że punkt ogniskowy wszystkich prostych z rys. 35.6 nie leży dokładnie we
właściwym miejscu. Posługiwanie się prostymi z powyższego rysunku nie prowadzi do
sensownych widm; w różnych obszarach konieczne są zarówno ujemne, jak i dodatnie
absorpcje. Jeśli jednak skorzysta się z nowych danych Yustovej, okaże się, że każda z
krzywych absorpcyjnych jest wszędzie dodatnia.
Rysunek 35.7 ilustruje inny rodzaj ślepoty barwnej, mianowicie protanopię, przy
której ognisko znajduje się w pobliżu czerwonego krańca krzywej ograniczającej. W tym
przypadku Yustova otrzymuje w przybliżeniu takie samo położenie. Korzystając z
istnienia trzech rodzajów ślepoty barwnej wyznaczono ostatecznie trzy krzywe czułości
barwików; pokazano je na rys. 35.8. Czyżbyśmy więc wreszcie je mieli? Być może.
Pozostaje jeszcze otwarty problem, czy idea trzech barwików jest w ogóle słuszna, czy ślepota
barwna rzeczywiście wynika z braku jednego barwika, a nawet czy dane o ślepocie
barwnej uzyskane z mieszania barw są w ogóle prawdziwe. Różni badacze uzyskują różne
wyniki. Dziedzina ta jest w dużym stopniu wciąż jeszcze w stadium rozwoju.
35-6. Fizjochemia widzenia barwnego
Zapytajmy teraz, jak wygląda porównanie tych krzywych z wynikami dla
rzeczywistych barwików w oku? Barwiki, które można wydobyć z siatkówki, składają się głównie
z tzw. czerwieni (purpury) wzrokowej. Najciekawszą jej własnością jest po pierwsze to,
że znajdujemy ją w oku prawie każdego kręgowca, a po drugie, że jej krzywa
reaktywności doskonale się zgadza z krzywą czułości oka, jak to widać z rys. 35.9. Na wykresie
*' Dichromatów dzieli się zwykle na cztery typy: protanopów, deuleranopów, tritanopów i ie-
tratanopów. (Przyp. tłum.)
15-6. FIZJOCHEMIA WIDZENIA BARWNEGO
151
5 1,0
n
| 0,8
1o,6
a
Z °>4
O
% °.2
o
J 0
fi O \
400
500 600
długość fali w m^i
przedstawionym na tym rysunku odłożono w
tej samej skali pochłanianie czerwieni
wzrokowej i czułość oka zmierzchowego. Barwik
ten niewątpliwie pozwala nam widzieć o
zmroku: czerwień wzrokowa jest barwikiem
pręcików i nie ma nic wspólnego z widzeniem
barwnym. Fakt ten odkryto w roku 1877 i jeszcze
po dziś dzień nikt nie zebrał do probówki
barwnych pigmentów czopkowych. W roku
1958 można było jeszcze mówić, że barwnych
pigmentów w ogóle nikt nigdy nie widział, ale
od tego czasu dwa z nich odkrył Rushton za
pomocą bardzo prostej i pięknej techniki.
Trudność polega przypuszczalnie na tym,
że ponieważ oko jest bardzo mało czułe na
pełne światło, w porównaniu z czułością na
światło o niskim natężeniu, więc potrzebuje do widzenia wiele czerwieni wzrokowej,
a niewiele barwnych pigmentów do widzenia barwnego. Idea Rushtona
polega na wykonywaniu pomiaru na barwiku bez usuwania go z oka. Oto jak
postępuje Rushton. Istnieje przyrząd zwany oftalmoskopem, który służy do
wpuszczania światła do oka przez soczewkę i do ogniskowania światła powracającego. Za
jego pomocą można zmierzyć ilość odbitego światła. Mierzy się więc współczynnik
pochłaniania światła, które dwukrotnie przeszło przez barwik (po odbiciu od tylnej warstwy w gałce
ocznej przeszło ono znowu przez barwik czopka). Przyroda nie zawsze daje nam takie
szerokie możliwości. Czopki są bardzo ciekawie zbudowane, bo wchodzące światło
odbija się dookoła szukając sobie drogi do wnętrza, do małych czułych punktów w
wierzchołku czopka. Światło, które przechodzi do środka aż do czułego punktu, odbija się
na dnie i wychodzi znowu przez znaczną ilość pigmentu widzenia barwnego. Jeśli po-
35.9. Krzywa czułości oka zmierzchowego
porównana z krzywą pochłaniania czerwieni
wzrokowej
35.10. Widmo absorpcyjne barwnego pigmentu w ślepym na barwy oku protanopa (kwadraty) i w oku
normalnym (kropki)
0 500
650 K,m^
152
36. WIDZENIE BARWNE
nadto będziemy spoglądali na plamkę żółtą, gdzie nie ma pręcików, to nie będzie nas
myliła czerwień wzrokowa. Barwa samej siatkówki jest znana już od dawna: jest ona
pomarańczoworóżowa; ponadto musimy uwzględnić barwę naczyń krwionośnych, barwę
substancji dna oka i tak dalej. Skąd więc dowiemy się, że w ogóle oglądamy pigment?
Odpowiedź: Po pierwsze - bierzemy osobę ślepą na barwy, która ma mniej barwików,
a zatem analizę jest łatwiej przeprowadzić. Po wtóre - rozmaite barwiki, takie jak
czerwień wzrokowa, wykazują zmianę natężenia przy oświetlaniu, zmieniają swoje stężenie,
gdy pada na nie światło. Aby więc znaleźć widmo absorpcyjne, Rushton wpuścił
dodatkowo do całego oka jeszcze inną wiązkę, zmieniającą stężenie barwika, i zmierzył
zmianę w widmie, która oczywiście nie ma nic wspólnego z ilością krwi, czy barwą warstw
odbijających, ani czymś podobnym, ale zależy tylko od pigmentu. W ten sposób dla
barwika oka protanopa Rushton otrzymał krzywą pokazaną na rys. 35.10.
Druga krzywa na rys. 35.10 jest krzywą otrzymaną dla oka normalnego. Posłużono
się okiem normalnym i mając wyznaczony już jeden barwik rozjaśniano drugi w
dziedzinie czerwonej, tam gdzie pierwszy jest nieczuły. Czerwone światło nie działa na oko
protanopa, ale działa na oko normalne i w ten sposób można było otrzymać krzywe dla
brakującego barwika. Kształt jednej z krzywych pasuje pięknie do zielonej krzywej Yusto-
vej, ale krzywa czerwona jest trochę przemieszczona. Może więc trafiliśmy na właściwy
ślad. Ale może i nie — ostatnie prace nad deuteranopami nie wykazują braku żadnego
określonego barwika.
Barwa nie jest sprawą samej tylko fizyki światła. Barwa jest wrażeniem, a wrażenia
barwne są różne w różnych okolicznościach. Mając na przykład światło różowe,
utworzone przez nałożenie krzyżujących się wiązek światła białego i czerwonego (ze światła
białego i czerwonego możemy oczywiście otrzymać jedynie różne odcienie barwy różowej),
możemy pokazać, że białe światło wyda się nam niebieskie. Umieśćmy na drodze
wiązek jakiś przedmiot. Rzuca on dwa cienie: jeden oświetlony tylko światłem białym, a drugi
czerwonym. Dla większości ludzi „biały" cień przedmiotu wyda się niebieski, ale jeśli
rozprzestrzenimy cień, aż do pokrycia całej ściany, zobaczymy nagle, że wydaje się on
biały, a nie niebieski! Inne zjawiska tego rodzaju możemy otrzymać mieszając czerwone,
żółte i białe światło. Czerwone, żółte i białe światło może dawać odcienie tylko pomarań-
czowożółte i podobne. Tworząc jednak w świetle cienie różnego kształtu, które dają
nakładanie się barw, można otrzymać spory zakres pięknych barw, które występują nie
w samym świetle (bo ono jest tylko pomarańczowe), ale w naszych wrażeniach. Bez
wątpienia widzimy wiele różnych barw, które są zupełnie niepodobne do barw „fizycznych"
w wiązce. Należy zdać sobie sprawę z tego, że już siatkówka „myśli" o świetle;
nieświadomie porównuje to, co widzi w jednym obszarze, z tym, co widzi w innym. W następnym
rozdziale będziemy mówili o tym, co wiemy na temat jej działania.
I
36
mechanizm widzenia
36-1. Wrażenie barwy
Omawiając rolę zmysłu wzroku musimy sobie zdawać sprawę, że na ogół (poza
galeriami sztuki nowoczesnej) nie widzimy bezładnych plam barwnych ani plam świetlnych.
Patrząc na jakiś obiekt widzimy człowieka lub rzecz; innymi słowy, mózg interpretuje
to, co widzimy. Nikt nie wie, na czym polega jego działanie, a jest ono naturalnie bardzo
skomplikowane. Wiadomo np., że dopiero po wielu doświadczeniach uczymy się
rozpoznawać człowieka z wyglądu. Istnieje jednak szereg bardziej elementarnych cech widzenia,
które także obejmują łączenie informacji z różnych części oglądanego obiektu. Aby
łatwiej zrozumieć, w jaki sposób dokonujemy interpretacji pełnego obrazu, warto
przebadać początkowe stadia łączenia informacji pochodzących z różnych komórek siatkówki.
W rozdziale tym skupimy się głównie na tym aspekcie widzenia, chociaż rozwijając ten
temat będziemy musieli wspomnieć i o kilku sprawach pobocznych.
Przypomnijmy sobie niebieski cień w białym świetle, widziany na ekranie oświetlonym
biało i czerwono. Stanowi on przykład, że już przy odbieraniu bardzo prostych
wrażeń wzrokowych wykazujemy umiejętność jednoczesnego gromadzenia informacji zrozma-
'tych części oka niezależną od kontroli naszej woli lub zdolności uczenia się. O zjawisku tym
musimy wiedzieć co najmniej to, że tło ekranu jest różowe, mimo że do określonego punktu
w oku dochodzi tylko „białe" światło, gdy patrzymy na niebieski cień; różne elementy
informacji zostały gdzieś połączone razem. Im lepiej i kompletniej znamy rzeczywistość, tym
bardziej oko koryguje niezwykłe cechy widoku. Istotnie, Land pokazał, że jeśli wspomniany
Pozorny błękit i czerwień zmieszamy w rozmaitych proporcjach za pomocą dwóch
przezroczy fotograficznych pochłaniających w różnym stopniu czerwień i biel, to można je
Uzyć do dość wiernego przedstawienia jakiejś rzeczywistej sceny z rzeczywistymi
przedmiotami. W tym przypadku „widzimy" także wiele barw pośrednich, analogicznych do
154
3«. MECHANIZM WIDZENIA
36.1. Podczas wirowania
krążka lego rodzaju barwy
pojawiają się tylko w
jednym z dwu ciemniejszych
„pierścieni". Gdy
odwrócimy kierunek obrotu, barwy
pojawiają się w drugim
pierścieniu
barw otrzymanych z mieszania barw czerwonej i niebies-
kozielonej. Sprawiają one wrażenie pełnego kompletu barw,
i dopiero dokładniejsze wpatrywanie się w nie pokazuje, że
tak nie jest. Mimo to jest rzeczą zdumiewającą, ile można
uzyskać ze zwykłej czerwieni i bieli. Im bardziej scena
przypomina rzeczywistą sytuację, tym bardziej oku udaje
się skompensować fakt, że całe światło jest właściwie
tylko różowe!
Innym przykładem jest pojawianie się „barw" na biało-
czarnej wirującej tarczy, której białe i czarne pola są
widoczne na rys. 36.1. Przy obrocie tarczy zmiany świateł i cieni
wzdłuż każdego promienia są dokładnie takie same;
jedynie tło jest różne dla dwóch rodzajów „pasów". Mimo to
jeden z „pierścieni" wydaje się inaczej zabarwiony niż drugi*'.
Nikt dotąd nie zna przyczyny występowania tych barw, ale
jest jasne, że informacje zostają połączone już w bardzo
wczesnym stadium procesu widzenia, najprawdopodobniej
w samym oku.
. Prawie wszystkie współczesne teorie widzenia barwnego zgadzają się, że dane o
mieszaniu barw wskazują na istnienie tylko trzech barwików w czopkach oka i że zasadniczą
przyczyną powstawania wrażenia barwnego jest pochłanianie widmowe w tych trzech
barwikach. Mimo to pełne wrażenie związane z charakterystykami pochłaniania trzech
współdziałających barwików nie musi być sumą pojedynczych wrażeń. Zgadzamy się
wszyscy, że kolor żółty wcale nie wygląda na czerwonawą zieleń i dla wielu ludzi straszną
niespodzianką byłoby pewnie odkrycie, że światło jest w istocie mieszaniną barw.
Wrażenie wzrokowe jest prawdopodobnie wynikiem jakiegoś procesu, który istotnie różni się od
prostego mieszania przypominającego akord muzyczny, w którym trzy nuty są
jednocześnie obecne i można je usłyszeć oddzielnie, uważnie się wsłuchując. Wpatrując się
pilnie w żółtą barwę nie możemy jednak zobaczyć czerwieni i zieleni.
Najwcześniejsze teorie dotyczące widzenia głosiły, że istnieją trzy barwiki i trzy
rodzaje czopków, z których każdy zawiera tylko jeden barwik; że nerw biegnie od każdego
czopka do mózgu i przenosi tam trzy składniki informacji, a cała reszta procesu
zachodzi już w mózgu. Pogląd taki nie jest oczywiście pełny: samo bowiem odkrycie, że jakaś
informacja przenoszona jest wzdłuż nerwu wzrokowego do mózgu, niczego nie daje,
ponieważ nic nie wiemy jeszcze o samym zagadnieniu. Musimy postawić bardziej
podstawowe pytanie. Czy istotne jest, gdzie informacje są łączone razem? Czy jest
istotne, aby były one przenoszone wzdłuż nerwu wzrokowego wprost do mózgu, czy też
sama siatkówka mogłaby najpierw dokonywać pewnej analizy? Pokazany obraz siatkówki
ukazał nam ją jako coś niezwykle złożonego, z mnóstwem wewnętrznych połączeń (rys.
35.2) i wydaje się, że mogłaby ona przeprowadzać pewne analizy.
Rzeczywiście, badacze, którzy zajmują się anatomią i rozwojem oka, wykazali, że
•' Barwy zależą od prędkości obrotu, od jasności oświetlenia, a w pewnym slopniu lakże od
tego, kto na nie patrzy i jak się im pilnie przypatruje.
w
36-1. WRAŻENIE BARWY
155
siatkówka istotnie należy do mózgu: w czasie rozwoju embrionu część mózgu wysuwa
się do przodu, a do tyłu rosną długie włókna łączące oczy z mózgiem. Siatkówka zbudowana
jest tak samo jak mózg, co ktoś pięknie ujął słowami: „Mózg rozwinął sobie' sposób
wyglądania na świat". Oko stanowi część mózgu, o której można powiedzieć, że dotyka
zewnętrznego świata. Jest więc rzeczą zupełnie prawdopodobną, że częściowa analiza
barwy dokonuje się już w siatkówce.
Otwiera to przed nami bardzo ciekawą możliwość. Żaden inny zmysł nie wymaga
wielkiej liczby czynności przypominających obliczenia, zanim jeszcze sygnał dostanie się
do nerwu, na którym można wykonywać pomiary. Dla wszystkich pozostałych zmysłów
podobne obliczenia wykonywane są zwykle w samym mózgu. W mózgu zaś bardzo trudno
dokonywać pomiarów w określonym miejscu z powodu wielu krzyżujących się połączeń.
Zajmując się zmysłem wzroku, spotykamy tak różne elementy, jak światło, trzy warstwy
komórek wykonujących obliczenia i nerw wzrokowy, wzdłuż którego przesyłane są wyniki
obliczeń. Pojawia się więc pierwsza możliwość fizjologicznej obserwacji działania
pierwszych warstw mózgu już na najniższym szczeblu. Sprawa jest więc podwójnie
ciekawa i ze .względu na widzenie, i ze względu na całokształt zagadnień
fizjologicznych.
istnienie trzech barwików nie oznacza, że wrażenia mają być trzech rodzajów. Pewna
odmienna teoria widzenia barwnego utrzymuje, że naprawdę istnieją antagonistyczne
schematy barwne (rys. 36.2). Oznacza to, że jedno z włókien nerwowych przenosi wiele
bodźców, gdy oglądamy żółtą barwę, a mniej bodźców niż zwykle, przy barwie niebieskiej.
Inne włókno nerwowe w taki sam sposób
przenosi czerwoną i zieloną informację, a jeszcze
inne białą i czarną. Mówiąc inaczej, ktoś w tej
teorii zaczął już snuć przypuszczenia na temat
istniejącego układu połączeń, czyli sposobu
obliczania.
Snując domysły co do tych pierwotnych
obliczeń staramy się rozwiązać takie zagadnienia jak:
sprawy tyczące się pozornych barw widzianych
na różowym tle, sprawy przystosowywania się
oka do różnych barw, a także tak zwane
zjawiska psychologiczne. Psychologiczne zjawiska
połgają na przykład na tym, że bieli nie „odczu-
Wa się" jako czerwieni, żółci i błękitu, a teoria,
która się tym zajmuje, została wysunięta dlatego,
2e według psychologów istnieją cztery barwy,
które wydają się czyste: „Istnieją cztery bodźce, któ-
re mają wybitną zdolność wywoływania psycho-
'°gicznie prostych odcieni, mianowicie niebies-
klego, żółtego, zielonego i czerwonego. W od-
r°2nieniu od sjeny, karmazynu, purpury lub
W|?kszości rozkładalnych barw, te proste odcie-
36.2. Połączenia nerwowe według „an-
tagonistycznej" teorii widzenia barwnego.
(N — niebieska, Ż — żółta, Z -zielona,
C — czerwona, B — biała, Cz — czarna)
reakcje nerwowe
pochłanianie fotochemiczne
C-Z = k2(>x + y~2p),
B-Cz=ks(z + Y+P)-k*(z + P+Y)-
156
36. MECHANIZM WIDZENIA
nie nie są mieszaninami w tym znaczeniu, że żaden z nich nie dzieli swej istoty
z drugą; w szczególności niebieski nie jest ani żółtawy, ani czerwony, ani
zielonkawy i tak dalej; są to psychologicznie zasadnicze odcienie". Ma to rzekomo być
tak zwanym faktem psychologicznym. Aby stwierdzić, na czym się to opiera,
musimy nadzwyczaj pilnie prześledzić literaturę z tej dziedziny. Wszystko, co
znajdujemy na ten temat w nowoczesnej literaturze, jest powtórzeniem albo dokładnie
tego stwierdzenia, albo podobnego, które pochodzi od pewnego niemieckiego
psychologa. Ten zaś wśród swoich autorytetów podaje Leonarda da Vinci, którego oczywiście
wszyscy znamy jako wielkiego artystę. Psycholog ten mówi: „Leonardo sądził, że istnieje pięć
barw". Sięgając do jeszcze starszych książek znajdziemy na ten temat świadectwo tego
rodzaju: „Purpura jest czerwononiebieska, barwa pomarańczowa jest czerwonożółta,
ale czy można sobie wyobrazić, że czerwień jest pomarańczowopurpurowa? Czyż barwy
czerwona i żółta nie są bardziej jednolite od purpurowej i pomarańczowej? Przeciętny
człowiek zapytany o to, które barwy są jednolite, wymienia ich trzy: czerwoną, żółtą i
niebieską, a niektórzy obserwatorzy dodają jeszcze czwartą: zieloną. Psychologowie zwykli
przyjmować te cztery odcienie za pierwotne". Psychologiczna analiza tego zagadnienia
przedstawia się więc następująco: jeśli wszyscy mówią, że jest trzy, a ktoś mówi, że jest
cztery i chce się, żeby było cztery, to niech będzie cztery. Ukazuje to trudności w
badaniach psychologicznych. Jest oczywiste, że odczucia nasze są właśnie takie, ale bardzo
trudno czegoś więcej się o nich dowiedzieć.
Inną drogą postępowania jest więc podejście fizjologiczne, aby doświadczalnie
stwierdzić, co właściwie dzieje się w mózgu, w oku, w siatkówce czy gdziekolwiek indziej. Uda
się wtedy może odkryć, że pewne kombinacje bodźców z rozmaitych komórek poruszają
się wzdłuż określonych włókien nerwowych. Nawiasem mówiąc, zasadnicze pigmenty
nie muszą znajdować się w oddzielnych komórkach; można sobie wyobrazić komórki,
w których znajdują się mieszaniny rozmaitych barwików, komórki z pigmentem
czerwonym i zielonym, komórki zawierające wszystkie trzy (informacja o wszystkich trzech
jest wówczas informacją białą), i tak dalej. Istnieje wiele sposobów połączenia całego
układu, a do nas należy stwierdzenie, której drogi użyła przyroda. Prowadząc badania
w tym kierunku mamy nadzieję, że gdy zrozumiemy powiązania fizjologiczne, w końcu
uda się nam też trochę zrozumieć niektóre wyżej wymienione aspekty psychologiczne.
36-2. Fizjologia oka
Rozpoczniemy od omówienia nie tylko procesu widzenia barwnego, ale widzenia
w ogóle, aby sobie po prostu przypomnieć wewnętrzne połączenia w siatkówce pokazanej
na rys. 35.2. Siatkówka wygląda rzeczywiście jak powierzchnia mózgu. Chociaż jej
prawdziwy obraz pod mikroskopem jest bardziej skomplikowany niż ten dość schematyczny
rysunek, to jednak uważna analiza pozwala dostrzec wszystkie wewnętrzne połączenia.
Nie ulega wątpliwości, że każda część powierzchni siatkówki jest połączona z innymi
i że wszystkie informacje wychodzące po długich włóknach osiowych (aksonach),
tworzących nerw wzrokowy, są kombinacjami informacji z wielu komórek. Istnieją trzy
warstwy komórek, według kolejności działania: komórki siatkówki, na które działa światło,
36-2. FIZJOLOGIA OKA
157
36.3. Wzajemne połączenia nerwów
dła mechanicznego działania oczu
pewna pośrednia komórka, która odbiera
informacje od jednej lub kilku komórek siatkówki
i przekazuje je dalej komórkom w trzeciej
warstwie, skąd informacje przechodzą do mózgu.
Między komórkami we wszystkich warstwach istnieją
wszelkie możliwe połączenia krzyżowe.
Wróćmy teraz do pewnych aspektów budowy
i działania oka (patrz rys. 35.1). Ogniskowania
światła dokonuje głównie rogówka, ponieważ ma
ona zakrzywioną powierzchnię, która „ugina"
światło. Gdy patrzymy w wodzie, nie możemy widzieć
wyraźnie, ponieważ różnica między
współczynnikiem załamania rogówki, wynoszący ml,37, a
wody, wynoszącym 1,33, jest niewystarczająca „do
ugięcia" światła. Za rogówką znajduje się
praktycznie woda o współczynniku załamania 1,33,
a za nią soczewka, która ma bardzo ciekawą
budowę: składa się ona z szeregu warstw, jak cebula,
z tym że jest cała przezroczysta i jej warstwy
środkowe mają współczynnik załamania 1,40, a warstwy
brzegowe 1,38. (Byłoby pięknie, gdybyśmy umieli produkować szkło optyczne, w którym
można by regulować współczynnik załamania; nie musielibyśmy wtedy zakrzywiać takiego szkła
tak silnie, jak szkła, które ma jednorodny współczynnik załamania.) Rogówka nie jest
poza tym kulista. Soczewka kulista wykazuje w pewnym stopniu aberrację sferyczną.
Rogówka na brzegu jest „bardziej płaska" niż kula, tak że jej aberracja sferyczna jest
mniejsza niż u odpowiedniej soczewki kulistej! Układ rogówka-soczewka ogniskuje
światło na siatkówce. Gdy patrzymy na obiekty bliskie lub dalekie, soczewka kurczy
się lub rozluźnia, zmieniając ogniskową, aby ją dostosować do różnych odległości.
Do regulowania całkowitej ilości wpadającego światła służy tęczówka, od której zależy
kolor oka, brązowy lub niebieski. W miarę jak ilość światła zwiększa się i zmniejsza,
tęczówka otwiera się i zamyka.
Spójrzmy teraz na pokazany schematycznie na rys. 36.3 mechanizm nerwowy, który
kontroluje akomodację soczewki, ruch oka, mięśnie obracające oko w oczodole i
źrenicę. Większość informacji, która wychodzi z nerwu wzrokowego A, odłącza się do jednej
7 dwu wiązek (o których będziemy mówić później) i stąd wędruje do mózgu. Istnieją
Jednak pewne interesujące nas teraz włókna, które nie biegną wprost do kory wzrokowej
mózgu, czyli do miejsca, gdzie „widzimy" obrazy, ale zamiast tego biegną do śródmózgo-
wia H. Są to włókna, które mierzą średnie światło i powodują dostosowywanie się
tęczówki; jeżeli zaś obraz jest zamglony, to starają się one skorygować soczewkę; jeżeli wreszcie
°brazjest podwójny, starają się dopasować oko do widzenia dwuocznego. W każdym razie
biegną one do śródmózgowia i są sprzężone zwrotnie z okiem. W miejscu oznaczonym na
rysunku literą K znajdują się mięśnie, które uruchamiają akomodację soczewki, awi
znajduje się inny mięsień, który ściąga tęczówkę. Tęczówka ma dwa układy mięśniowe. Je-
158
36. MECHANIZM WIDZENIA
przyskroniowa potowa
pola widzenia
przynosowa
połowa pola
widzenia
36.4. Połączenia nerwów oczu z
mózgową
korą
dnym z nich jest okrężny mięsień (Z,), który
pobudzony kurczy się i zamyka tęczówkę;
działa on bardzo szybko, a nerwy bezpośrednio łączą
mózg krótkimi aksonami z tęczówką. Mięśnie
przeciwstawne mają układ promienisty, tak że
gdy robi się ciemno i mięsień okrężny
rozluźnia się, mięśnie promieniste się kurczą. Tutaj,
podobnie jak i w wielu miejscach ciała, mamy
parę mięśni pracujących w kierunkach
przeciwnych. Prawie w każdym takim przypadku
kontrolujące układy nerwowe są bardzo
precyzyjnie ze sobą zgrane, tak że sygnałowi
nakazującemu ściągnąć jeden z mięśni automatycznie
towarzyszy sygnał, aby drugi mięsień zwolnić.
Tęczówka jest jednak osobliwym wyjątkiem: nerwy,
które właśnie opisaliśmy, powodują kurczenie się
tęczówki, ale nerwy, które powodują
rozszerzanie się tęczówki, wychodzą nie wiadomo
dokładnie skąd, schodzą do części piersiowej rdzenia
kręgowego z tyłu za klatkę piersiową,
wychodzą z rdzenia do góry przez węzły szyjne i
wracają tą samą drogą z powrotem do głowy, aby
w końcu uruchamiać drugi koniec tęczówki. Rzeczywiście, sygnał przechodzi przez zupełnie
odmienny układ nerwowy, mianowicie nie przez centralny układ nerwowy, ale przez
układ współczulny. Cały mechanizm działa więc w bardzo dziwny sposób.
Zwracaliśmy już uwagę na inną dziwną cechę budowy oka: światłoczułe komórki
znajdują się po niewłaściwej stronie siatkówki, tak że światło, zanim dostanie się do
receptorów, musi przejść przez kilka warstw innych komórek - oko jest zbudowane na
opak! Widać więc, że niektóre jego cechy są wprost wspaniałe, inne wydają się
nielogiczne.
Rysunek 36.4 pokazuje połączenia oka z częścią mózgu, która jest najbardziej
bezpośrednio związana z procesem widzenia. Włókna nerwów wzrokowych wchodzą do
pewnego obszaru położonego wprost za miejscem oznaczonym na rysunku literą D:
obszar ten nazywamy ciałem kolankowatym bocznym, skąd włókna nerwów wybiegają
do części mózgu zwanej korą wzrokową. Zauważmy, że niektóre włókna od każdego
oka przechodzą na przeciwną stronę mózgu, tak że tworzący się obraz nie jest zupełny.
Nerwy wzrokowe z lewej strony prawego oka przechodzą przez skrzyżowanie nerwów
wzrokowych w punkcie B, podczas gdy nerwy z lewej strony lewego oka omijają punkt B
i biegną dalej. Tak więc do lewej strony mózgu dochodzi pełna informacja z lewej strony
gałki ocznej każdego oka, to znaczy z prawej strony pola widzenia, podczas gdy prawa
strona mózgu widzi lewą stronę pola widzenia. Informacje od każdego z dwojga oczu
są w ten sposób łączone razem, dzięki czemu można ocenić, jak daleko znajdują się
przedmioty. System ten nazywamy widzeniem dwuocznym.
36-2. FIZJOLOGIA OKA 159
Ciekawe są połączenia między siatkówką i korą wzrokową. Jeżeli jakiś obszar
siatkówki zostaje wycięty lub w inny sposób zniszczony, całe włókno obumiera i dzięki temu
możemy stwierdzić, gdzie ono było połączone. Okazuje się, że połączenia zasadniczo są
wzajemnie jednoznaczne - każdemu punktowi siatkówki odpowiada jeden punkt w korze
wzrokowej — i punkty, które leżą blisko siebie w siatkówce, leżą też blisko siebie w korze
wzrokowej. Tak więc kora wzrokowa odtwarza przestrzenny układ pręcików i czopków,
chociaż oczywiście jest on bardzo zniekształcony. Obiektom, znajdującym się w środku pola
widzenia, zajmującym małą część siatkówki, odpowiada obszar rozciągający się na
przestrzeni wielu komórek w korze wzrokowej. Jest oczywiście rzeczą bardzo wygodną, że
temu, co pierwotnie leżało blisko siebie, nadal odpowiadają obiekty położone blisko.
Najbardziej godnym uwagi jest jednak następujący aspekt całej sprawy. Ktoś mógłby
sądzić, że najistotniejsze powinno być zestawienie blisko siebie tego, co odpowiada
dokładnie środkowi pola widzenia. Tymczasem można wierzyć lub nie, ale prosta
poprowadzona z góry na dół w naszym polu widzenia ma własność, że informacje z punktów
po jej prawej stronie przechodzą do lewej strony mózgu, a informacje z punktów po jej lewej
stronie przechodzą do prawej strony mózgu. Obszar pola widzenia jest przecięty dokładnie
wśrodku, tak że wszystko to, co znajduje się dokładnie w środku pola widzenia bardzo blisko
siebie, staje się bardzo oddalone od siebie w mózgu! Jest więc naprawdę zdumiewające,
że informacja musi przez jakieś kanały przechodzić z jednej strony mózgu na drugą.
Jest bardzo ciekawe jak w ogóle sieć ta zostaje połączona w całość. Od bardzo dawna
stawiano sobie pytanie, ile jest w niej z góry połączone, a ile zostaje wyuczone. Dawniej
sądzono zwykle, że nie jest ona wcale połączona starannie, ale powiązana tylko z grubsza
i dopiero na drodze doświadczeń małe dziecko uczy się, że gdy jakaś rzecz znajduje się
„tam", powoduje to pewne wrażenie w mózgu (lekarze zawsze nam mówią, co „czuje"
małe dziecko, ale skąd właściwie oni wiedzą, co czuje dziecko mające rok?) Roczne dziecko
przypuszczalnie widzi, że jakiś przedmiot znajduje się „tam", odbiera pewne wrażenia
i uczy się „tam" sięgać, ponieważ gdy sięga „tu", nic z tego nie wychodzi. Podejście to
prawdopodobnie nie jest poprawne, ponieważ jak się już przekonaliśmy, w wielu wypadkach
istnieją pewne szczególne, dobrze określone powiązania wzajemne. Bardziej konkretne
są pewne znakomite doświadczenia wykonane na salamandrze. (Nawiasem mówiąc u
salamandry istnieją bezpośrednie połączenia krzyżowe, bez krzyżowania nerwów
wzrokowych, ponieważ oczy znajdują się na bokach głowy i nie mają wspólnego pola widzenia.
Salamandry nie posiadają widzenia dwuocznego.) Doświadczenia polegały na
następującym. Gdy przetniemy nerw wzrokowy salamandry, wyrośnie on znowu z oka. Tysiące
Włókien komórkowych odtworzą się więc same. Trzeba zaś wiedzieć, że w nerwie
wzrokowym włókna nie są równo ułożone obok siebie — wygląda on raczej jak wielki, niedbale
Zrobiony kabel telefoniczny, w którym wszystkie druty są posplatane i pokręcone. Gdy
jednak nerw dociera do mózgu, wszystkie włókna zostają znowu rozdzielone. Przecinając
nerw wzrokowy salamandry stajemy przed ciekawym zagadnieniem, czy się on w ogóle
fozplącze? Odpowiedź jest zastanawiająca: tak. Jeśli odrośnie przecięty nerw wzrokowy
Mlamandry, odzyskuje ona dobrą ostrość wzroku. Jeśli jednak przetniemy nerw wzro-
i. kowy i obrócimy oko tak, że jego górna część znajdzie się na dole, a nerwowi pozwolimy
j§ odrosnąć, to zwierzę odzyska wprawdzie dobra ostrość wzroku al<> w ct-o„ i-»-j
160
36. MECHANIZM WIDZENIA
salamandra widząc muchę „u góry" skacze na nią „w dół" i nie może się tego oduczyć.
Musi wiec istnieć jakiś tajemniczy sposób, dzięki któremu wiele tysięcy włókien odnajduje
swoje pierwotne miejsca w mózgu.
Sprawa, ile połączeń jest wrodzonych, a ile nie, stanowi ważne zagadnienie teorii
rozwoju stworzeń. Odpowiedź nie jest znana, prowadzone są jednak intensywne badania.
To samo doświadczenie przeprowadzone na złotej rybce pokazuje, że w miejscu,
gdzie nerw wzrokowy został przecięty, pojawia się na nim straszne zgrubienie, jakby wielka
blizna lub węzeł, a mimo to włókna odrastają do swoich pierwotnych miejsc w mózgu.
W tym celu włókna odrastające w starych kanałach nerwu wzrokowego muszą
podejmować wiełe decyzji, w jakim kierunku powinny rosnąć. Jak to się dzieje? Wydaje się, że
istnieją pewne bodźce chemiczne, na które różne włókna reagują w różny sposób.
Pomyślmy o olbrzymiej liczbie rosnących włókien, z których każde stanowi pewne indywiduum,
różniące się od swoich sąsiadów. Reakcja na jakiś bodziec chemiczny musi być
wystarczająco jednoznaczna, aby włókno znalazło właściwe miejsce swojego końcowego połączenia
w mózgu! Sprawa jest fantastycznie ciekawa. Stanowi jedno z ostatnio odkrytych zjawisk
biologicznych i jest niewątpliwie związana z wielu starszymi, nie rozwiązanymi dotąd
zagadnieniami wzrostu, organizacji i rozwoju żywych organizmów, a w szczególności
embrionów.
Inne ciekawe zjawisko odnosi się do ruchu oka. Oczy muszą się poruszać, aby zapewnić
koincydencję dwóch obrazów w różnych warunkach. Ruchy te są rozmaite: jeden z nich
polega na śledzeniu przedmiotów; wymaga to ruchu obojga oczu w tym samym kierunku,
w prawo lub w lewo; drugi ruch połega na kierowaniu oczu w to samo miejsce przy roz-
maitych odległościach, co wymaga przeciwstawnego ruchu oczu. Nerwy biegnące do
mięśni oka są od razu połączone odpowiednio z tym właśnie przeznaczeniem. Jeden
układ nerwów ściąga mięśnie wewnętrznej strony jednego oka i zewnętrznej drugiego,
zwalniając mięśnie przeciwstawne tak, aby oczy poruszały się razem. Inny ośrodek
pobudzania powoduje ruch oczu od położenia równoległego wzajemnie ku sobie. Każde
oko może się obracać do kącika, jeżeli drugie obraca się w stronę nosa, ale nie można
świadomie bądź nieświadomie jednocześnie obrócić obojga oczu na zewnątrz. Przyczyną
nie jest brak odpowiednich mięśni, ale to, że nie ma sposobu przesłania sygnału obrócenia
obojga oczu na zewnątrz, chyba że spotkał nas wypadek albo że istnieje jakiś inny powód,
na przykład nerw został przecięty. Mimo że mięśnie jednego oka mogą kierować je w różne
strony, nawet jogin nie potrafi swobodnie obracać obojga oczu na zewnątrz pod kontrolą
woli. Wydaje się bowiem, że nie sposób tego dokonać. Od początku istnieją w nas pewne
połączenia. Sprawa ta jest ważna, ponieważ w większości starszych książek z dziedziny
anatomii, psychologii itp. nie docenia się albo nie podkreśla faktu, że istnieje w nas tyle
wrodzonych połączeń — twierdzi się tam, że wszystko jest po prostu wyuczone.
36-3. Komórki pręcikowe
Rozpatrzmy teraz bardziej szczegółowo, co się dzieje w komórkach pręcikowych
Rysunek 36.5 pokazuje elektronową mikrografię środka komórki pręcikowej (komórka
r~36-3. KOMÓRKI PRĘCIKOWE
161
~210A
36.5. Elektronowa
pręcikowej
mikrografia komórki
pręcikowa wychodzi poza pole widzenia).
Warstwa za warstwą występują tu płaskie
struktury pokazane z prawej strony w
powiększeniu, zawierające substancję zwaną
rodopsyną (czerwienią wzrokową), to znaczy
barwik lub pigment umożliwiający zjawisko
widzenia w pręcikach. Rodopsyna, która
stanowi ten barwik, jest wielką proteiną,
zawierającą szczególną grupę, zwaną retinenem.
Grupę tę można oddzielić od proteiny i ona
niewątpliwie stanowi główną przyczynę
pochłaniania światła. Przyczyny występowania
wspomnianych płaskich struktur nie
rozumiemy, ale najprawdopodobniej z jakiegoś
powodu wszystkie cząsteczki rodopsyny
utrzymywane są w położeniach równoległych.
Zjawisko to od strony chemicznej zostało już
w dużym stopniu opracowane, ale może być
potrzebne jeszcze trochę fizyki. Możliwe, że
wszystkie cząsteczki są ułożone w rodzaj
rzędu, tak że gdy jedna z nich zostaje pobudzona, wytworzony elektron na przykład
przebiega wzdłuż rzędu aż do pewnego miejsca na końcu, umożliwiając sygnałowi wyjście na
zewnątrz. To zagadnienie jest bardzo ważne i nie jest jeszcze opracowane. W dziedzinie tej
zostaną pewnie w końcu wykorzystane wspólnie biochemia i fizyka ciała stałego lub inne
jeszcze gałęzie wiedzy.
Warstwowa budowa tego rodzaju pojawia się i w innych warunkach, gdzie światło
odgrywa istotną rolę, np. w chloroplastach roślin, w których powoduje ono fotosyntezę.
1 Oglądając je w powiększeniu znajdujemy tę samą budowę z warstwami prawie takiego
samego rodzaju, choć oczywiście występuje tutaj chlorofil zamiast retinenu. Wzór chemiczny
retinenu pokazano na rys. 36.6. Retinen ma szereg na przemian podwójnych wiązań wzdłuż
bocznego łańcucha, co jest charakterystyczną cechą prawie wszystkich silnie
pochłaniających substancji organicznych, jak chlorofil, krew itp. Istoty ludzkie nie mogą wytworzyć
tej substancji w swoich własnych komórkach — musimy ją przyjmować w jedzeniu.
Zjadamy ją w postaci specjalnej substancji mającej taki sam wzór chemiczny, z tym tylko,
& na prawym jej końcu przyczepiony jest
:- Wodór. Substancję tę nazywamy witaminą A
1 jeśli jej nie zjadamy w dostatecznej ilości,
nie jesteśmy zaopatrywani w retinen, oko zaś
"lega tak zwanej nocnej ślepocie, ponieważ
[ * rodopsynie nie wystarcza pigmentu do
Wierzchowego widzenia pręcikowego.
Przyczyna, dla której wspomniany szereg
Podwójnych wiązań bardzo silnie pochłania CHi
36.6. Budowa retinenu
i i
-CH3
CHi
I
C\ .Cs
CHj
"O
162
.1ft MFCHAN17M WIDZfcNU
światło, jest znana. O sprawie tej wspomnimy krótko: szereg na przemian podwójnych
wiązań nazywamy sprzężonym wiązaniem podwójnym; wiązanie podwójne oznacza, że
znajduje się tam dodatkowy elektron, który łatwo się przesuwa w prawo lub w lewo
Gdy światło zderza się z cząsteczką, elektrony z każdego podwójnego wiązania zostają
przesunięte o jedno miejsce. Wszystkie elektrony w całym łańcuchu przesuwają się jak
szereg przewracających się kamieni domina i chociaż każdy z nich przesuwa sie
niewiele (powinniśmy się spodziewać, że w pojedynczym atomie przesunięcie
elektronu będzie niewielkie), w ostatecznym wyniku elektron z jednego końca przesunie się
jak gdyby na drugi! Wygląda to tak, jak gdyby całą odległość tam i z powrotem przebył
jeden elektron. W ten właśnie sposób pod wpływem pola elektrycznego uzyskujemy
pochłanianie, które jest znacznie silniejsze wtedy, gdy elektron może przesuwać się o odległość
związaną z jednym tylko atomem. Ponieważ więc łatwo przesuwać elektrony tam i z
powrotem, retinen bardzo silnie pochłania światło; na tym polega mechanizm jego
fizykochemicznego przeznaczenia.
36-4. Oko złożone (owadzie)
Powróćmy teraz do biologii. Oko ludzkie nie jest jedynym rodzajem oka. Wprawdzie
u kręgowców prawie wszystkie oczy mają zasadniczo taką samą budowę, jak oko ludzkie,
ale wśród niższych zwierząt występuje jednak wiele innych rodzajów oczu. Są to plamki
oczne, różne oczy kubkowate i inne mniej czułe obiekty, których nie mamy czasu omawiać
U bezkręgowców istnieje jednak jeszcze inne, wysoko rozwinięte oko, mianowicie złożone
oko owadzie (większość owadów mających duże oczy złożone posiada również rozmaite
dodatkowe prostsze oczy). Owadem, którego widzenie zostało zbadane bardzo starannie,
jest pszczoła. Badanie własności widzenia u pszczół jest łatwe, ponieważ można je
przywabić do miodu. W doświadczeniu identyfikujemy miód przez umieszczenie go na nie
bieskim lub czerwonym papierze i patrzymy, do którego z nich pszczoły przychodzą.
Metodą tą odkryto wiele ciekawych zjawisk z dziedziny widzenia u pszczół.
W pierwszym rzędzie próbowano zmierzyć, jak wyraźnie pszczoły mogą dostrzec
różnicę barwy między dwoma kawałkami „białego" papieru. Niektórzy badacze stwierdzili.
że sprawność pszczół w tym zakresie nie jest wielka, inni zaś znaleźli, że jest wprost
fantastyczna. Pszczoły były w stanie odróżnić dwa kawałki białego papieru, nawet gdy kawałki
te były prawie dokładnie takie same. Eksperymentatorzy wzięli jeden kawałek papieru
koloru bieli cynkowej, a drugi koloru bieli ołowiowej i chociaż dla nas wyglądają one
dokładnie tak samo, pszczoły mogą łatwo je odróżnić, ponieważ farby te w różnym
stopniu odbijają nadfiolet. W ten sposób odkryto, że oko pszczoły jest czułe w szerszym zakresie
widma niż nasze. Nasze oko działa w zakresie od 7000 A do 4000 A, od czerwieni do
fioletu, oko zaś pszczoły może widzieć aż do 3000 A, w nadfiolecie! Powoduje to wiele
różnych ciekawych zjawisk. Przede wszystkim pszczoły mogą rozróżniać wiele kwiatowi
które dla nas wyglądają tak samo. Musimy oczywiście przy tym zdawać sobie sprane
z tego, że barwy kwiatów nie są przeznaczone dla naszych oczu, ale dla oczu pszczół,
są one sygnałami, które przyciągają pszczoły do określonego kwiatu Wiemy wszyscy,
^36-4 OKO ZŁOŻONE (OWADZIE)
163
że istnieje wiele „białych" kwiatów. Prawdziwa bie! najwyraźniej nie bardzo interesuje
pszczoły, ponieważ wszystkie białe kwiaty mają, jak się okazuje, różne współczynniki odbicia w
nadfiolecie; nie odbijają 100% nadfioletu, tak jak powinna czynić prawdziwa biel. Nie całe
światło powraca, brak w nim nadfioletu, a to stanowi już pewną barwę; dokładnie tak jak
u nas, gdzie brak barwy niebieskiej powoduje barwę żółtą. W ten sposób dla pszczół
wszystkie kwiaty są barwne. Wiemy jednak, że pszczoły nie mogą widzieć czerwieni.
Moglibyśmy się zatem spodziewać, że wszystkie czerwone kwiaty w oczach pszczół
wyglądają czarno. Nic podobnego! Staranne badanie czerwonych kwiatów dowodzi, że po
pierwsze — nawet naszym własnym okiem możemy zauważyć niebieskie zabarwienie
u znacznej większości czerwonych kwiatów, ponieważ przeważnie odbijają one dodatkową
ilość błękitu, który leży w części widma widzianej przez pszczoły. Po drugie —
doświadczenie wykazuje, że kwiaty te różnią się swoimi własnościami odbijania nadfioletu w
różnych częściach płatków itp. Gdybyśmy więc mogli widzieć kwiaty tak, jak je widzą pszczoły,
wydałyby się nam one jeszcze piękniejsze i różnorodniejsze!
Wykazano jednak, że istnieją pewne czerwone kwiaty, które nie odbijają światła w
dziedzinie błękitu i wobec tego pszczołom powinny wydawać się czarne! Niepokoiło to bardzo
zajmujących się tymi sprawami, ponieważ wydaje się, że czerń jest nieciekawą barwą, bo
trudno odróżniać brudne cienie. Okazało się, że rzeczywiście kwiaty te nie są odwiedzane przez
pszczoły, odwiedzane są zaś przez kolibry, a kolibry mogą widzieć czerwień!
Innym ciekawym aspektem widzenia u pszczół jest to, że patrząc na skrawek błękitnego
nieba mogą one niewątpliwie określić kierunek słońca, nie widząc jego samego. My nie
możemy łatwo tego dokonać. Czy patrząc przez okno na niebo i widząc, że jest ono błękitne,
wiemy na pewno, w którym kierunku znajduje się słońce? Pszczoła może to określić,
ponieważ jest dość wrażliwa na polaryzację światła, a rozproszone światło nieba jest
spolaryzowane*' Nadal roztrząsa się problem, jaki jest mechanizm tej wrażliwości. Nie wiadomo
jeszcze, czy dzieje się tak dlatego, że odbicie światła jest różne w różnych warunkach,
czy też że samo oko pszczoły jest bezpośrednio wrażliwe**'.
Mówi się także, że pszczoła może zauważyć migotanie aż do częstości 200 drgań na
sekundę, podczas gdy my widzimy je tylko do 20. Ruchy pszczół w ulu są bardzo szybkie:
nogi ich poruszają się, a skrzydła drgają, ale naszym okiem bardzo trudno zauważyć te
ruchy. Moglibyśmy je zobaczyć, gdyby proces widzenia zachodził u nas szybciej. Fakt,
te oko pszczoły wykazuje taką szybką reakcję, przypuszczalnie ma dla niej duże znaczenie.
Omówimy teraz ostrość widzenia, jakiej możemy oczekiwać u pszczół. Oko pszczoły
jest okiem złożonym i składa się z wielkiej liczby specjalnych komórek, zwanych fasetkami
{ommatidia) ułożonych stożkowo na powierzchni kulistej (w przybliżeniu) na zewnątrz
głowy pszczoły. Rysunek 36.7 przedstawia obraz jednej takiej fasetki. Na szczycie znaj-
*' Oko ludzkie również wykazuje niewielką wrażliwość na polaryzację światła i można nauczyć
■, *•? określania położenia Słońca! Zjawisko, które tu wchodzi w grę, nazywamy figurą Haidingera. Jest
j «0 niewyraźny, żółtawy, klepsydrowaty obraz pojawiający się w środku pola widzenia, gdy patrzymy
| P*2ez polaryzujące szkła na szeroką bezkształtną przestrzeń. Można ją także zobaczyć na błękitnym
L-webie bez szkieł polaryzacyjnych, jeśli się obraca głową tam i z powrotem wokół osi wzroku.
fef •*> Dane uzyskane od czasu, w jakim wygłoszono ten wykład, wskazują, że oko jest bezpośrednio
E*Ąrażliwe.
fii»
164
36. MECHANIZM WIDZENIA
duje się przezroczysty obszar, rodzaj „soczewki", ale właściwie przypomina on bardziej
filtr lub rurę świetlną przeprowadzającą światło wzdłuż wąskiego włókna, w którym
przypuszczalnie zachodzi pochłanianie. Z drugiego końca fasetki wychodzi włókno nerwowe.
Środkowe włókno otoczone jest po bokach sześcioma komórkami, które w ogóle wydzieliły
z siebie włókno. Opis ten wystarczy dla naszych celów; istotne jest to, że w grę wchodzi
przedmiot stożkowaty i że wiele ich można ułożyć obok siebie na całej powierzchni oka
pszczoły.
Omówmy teraz zdolność rozdzielczą oka pszczoły. Rysując kreski (rys. 36.8),
przedstawiające fasetki na powierzchni będącej z założenia kulą o promieniu r, możemy właściwie
obliczyć jak szeroka jest każda fasetka, korzystając z własnego rozumu i zakładając, że
ewolucja powinna doprowadzić do rozwiązań, które sami uznalibyśmy za najmądrzejsze!
Jeśli fasetka będzie bardzo szeroka, nie osiągniemy dużej zdolności rozdzielczej. Znaczy
to, że jedna komórka odbierze część informacji z jednego kierunku, a przyległa komórka
odbierze część informacji z drugiego kierunku, i tak dalej, w wyniku czego pszczoła nie
będzie mogła bardzo dobrze widzieć przedmiotów pośrednich. Tak więc błąd w ostrości
widzenia będzie na pewno odpowiadać pewnemu kątowi, mianowicie kątowi rozwarcia
końca fasetki względem środka krzywizny oka (komórki oczne leżą oczywiście tylko na
powierzchni kuli; wewnątrz niej znajduje się głowa pszczoły). Kąt ten mierzony między
sąsiednimi fasetkami jest oczywiście średnicą fasetki podzieloną
przez promień powierzchni oka:
A8% = 5lr (36.1)
Możemy więc powiedzieć: „Im weźmiem mniejsze 5, tym większa
będzie ostrość widzenia. Dlaczego więc pszczoły nie mają po prostu
bardzo drobnych fasetek?" Odpowiedź: Fizykę znamy
wystarczająco dobrze, żeby zrozumieć, że usiłując złapać światło w wąską
szczelinę nie możemy patrzeć dokładnie w wybranym kierunku
z powodu zjawiska dyfrakcji. Ponieważ wpadać może światło
przychodzące z wielu kierunków, na skutek dyfrakcji odbierzemy
też światło wchodzące pod kątem ABA takim, że
A0d = X/8. (36.2)
Widzimy teraz, że jeżeli weźmiemy za małe ó, wówczas z powodu
dyfrakcji każda fasetka będzie patrzeć nie tylko w wybranym
kierunku, ale i obok! Jeśli fasetki będą za duże, to wprawdzie każda
będzie patrzeć w określonym kierunku, ale liczba ich nie wystarczy
do uzyskania dobrego widzenia scenerii. Musimy więc dobrać 6
w taki sposób, aby całkowity wpływ powyższych dwu efektów
był minimalny. Dodając je razem i szukając punktu, w którym
suma ma minimum (rys. 36.9) znajdziemy, że
36.7. Budowa fasetki
(ommatidiuni) —
pojedynczej komórki
oka złożonego
d(J0, + J0d) J__
db
co daje nam wartość
<5 = 7>lr
(36.3)
(36.4)
36-4. OKO ZŁOŻONE (OWADZIE)
165
36.8. Schematyczny obraz ułożenia fasetek w oku
pszczoły
36.9. Optymalnym rozmiarem dla fasetki jest Sm
Jeśli założymy, że r wynosi około
3 mm, przyjmiemy, że światło widziane
przez pszczołę ma długość fali 4000 A,
zbierzemy to razem i wyciągniemy
pierwiastek kwadratowy, to znajdziemy
<5 = (3-10~3-4-10"7)im =
= 3,5-10-5m = 35u. (36.5)
Podręczniki podają, że średnica ta
wynosi 30 u, otrzymaliśmy zatem dość
dobrą zgodność! Widocznie więc cały
rachunek jest rzeczywiście sensowny
i możemy zrozumieć, jakie czynniki
określają rozmiary oka pszczoły! Łatwo
także wstawić z powrotem powyższe
liczby i znaleźć, jaka jest właściwie
sprawność oka pszczoły w rozdzielaniu
kątowym. Okazuje się, że jest ono pod
tym względem znacznie gorsze od
naszego. My dostrzegamy przedmioty
o pozornych rozmiarach 30 razy
mniejszych niż te, które widzi
pszczoła. W porównaniu z tym, co my
możemy widzieć, wzrok pszczoły daje
raczej mętny i nieostry obraz. Mimo
to pszczołom tyle wystarcza i to jest wszystko, na co je stać. Moglibyśmy się
zapytać, dlaczego pszczoły nie rozwinęły sobie dobrego oka, podobnego do naszego,
z soczewką i tak dalej. Można podać szereg ciekawych przyczyn. Po pierwsze, pszczoła
jest na to za mała: gdyby miała takie oko jak nasze, ale w swojej skali, wówczas otwór
miałby średnicę około 30 u i dyfrakcja odgrywałaby tak ważną rolę, że pszczoła zupełnie
by nie mogła bardzo dobrze widzieć. Oko nie jest dobre, jeśli jest za małe. Po wtóre, gdyby
oko było tej wielkości co głowa pszczoły, zajmowałoby jej całą głowę. Piękno oka
złożonego polega na tym, że nie zajmuje ono dużo miejsca, stanowi po prostu bardzo cienką
warstwę na powierzchni głowy pszczoły. Gdy więc dowodzimy, że pszczoły powinny były
rozwinąć sobie oko na nasz sposób, musimy pamiętać, że stały one przed swoimi
własnymi problemami!
68
Mm
i
^^Mfl5 -d/r
A6d**\/6
36-5. Jeszcze inny rodzaj oczu
Poza pszczołami wiele innych zwierząt może widzieć barwy. Ryby, motyle, ptaki i gady
'nogą widzieć barwy, ale większość ssaków nie może, jak się przypuszcza. Naczelne (Prima-
s| *w) mogą widzieć barwy. Ptaki z pewnością widzą barwy, co uzasadnia ich własne ubar-
166
J6. MECHANIZM WIDZENIA
wienie. Nie miałoby celu istnienie tak świetnie
barwnie upierzonych samców, gdyby samice nie
mogły tego zauważać! Tak więc rozwój
płciowego „wabika" u ptaków jest wynikiem
zdolności samicy do widzenia barw. Gdy więc
w przyszłości będziemy się przyglądać pawiowi
i pomyślimy sobie, jaki też świetny widzimy
pokaz bogatych barw i jak delikatne są wszystkie
odcienie i jakie wspaniałe wrażenie estetyczne
daje podziwianie tego wszystkiego, to
powinniśmy gratulować nie pawiowi, a pawicy,
ponieważ ona to właśnie dzięki ostrości wzroku
i zmysłowi estetycznemu jest prawdziwym
twórcą tego pięknego widowiska!
Wszystkie kręgowce mają oczy bardzo
podobne do naszych, wszystkie zaś bezkręgowce mają albo słabo rozwinięte oczy, albo
oczy złożone. Jest jednak jeden wyjątek. Rozpatrując najwyższe formy zwierzęce,
mówimy zwykle „to my". Jeśli jednak przyjmiemy bardziej skromny punkt widzenia
i ograniczymy się do bezkręgowców, aby wykluczyć nas samych, i zapytamy, jakie
bezkręgowe zwierzę jest na najwyższym stopniu rozwoju, to większość zoologów zgodzi
się na ośmiornicę] Bardzo ciekawe, że rozwijając mózg, jego reakcje itd. odpowiednie
dla bezkręgowca? ośmiornica rozwinęła jednak niezależnie, zupełnie inne oko. Nie
jest to ani oko złożone, ani plamka oczna — ma ono rogówkę, ma powieki, tęczówkę,
soczewkę, dwie komory i siatkówkę z tyłu. Jest ono zasadniczo takie samo jak oko
kręgowców! Mamy tu dobitny przykład zbieżności ewolucyjnej; przyroda dwa razy
odkryła rozwiązanie tego samego zagadnienia, z jednym małym ulepszeniem.
Zdumiewające, że siatkówka ośmiornicy jest, jak się okazuje, kawałkiem mózgu, który w swoim
rozwoju embrionalnym wysunął się w taki sam sposób jak u kręgowców. Ciekawą
jednak cechą odróżniającą oko ośmiornicy jest to, że komórki światłoczułe znajdują się od
wewnątrz, a komórki dokonujące obliczeń — za nimi, a nie są „wywrócone na lewą stronę"
jak w naszym oku. Widzimy więc wreszcie, że nie ma ważnego powodu tego wywrócenia.
Gdy przyroda ponowiła próbę budowy oka, otrzymała już poprawne rozwiązanie (patrz
rys. 36.10). Największymi oczami na świecie są oczy archikalmara. Znaleziono takie,
które mają do 36 cm średnicy!
36-6. Neurologia widzenia
Jednym z głównych punktów naszego zagadnienia jest wzajemny związek informacji
pochodzących z różnych części oka. Rozważmy złożone oko skrzypłocza (Limulus poly-
phemuś), na którym przeprowadzono wiele doświadczeń. Musimy przede wszystkim
zdać sobie sprawę, jaki rodzaj informacji może biec wzdłuż nerwów. Nerw przenosi rodzaj
zaburzenia, które przejawia się jako łatwe do wykrycia działanie elektryczne, rodzaj
biegnącego wzdłuż nerwu zakłócenia falowego, które wytwarza pewne działanie na końcu:
36-6. NEUROLOGIA WIDZENIA
167
informacje przenosi długi odcinek ko- a)
morki nerwowej zwany włóknem osio- J v
wym (aksonem). Jeśli pobudzamy go - * H £ ;. ,,
z jednego końca, przebiega po nim '.,' \v *"*
u'* i ^ V * • *
specjalny rodzaj impulsu, zwany „po- j\*»"X» '** "• •* *
tencjałem szczytowym" („iglicą"). Gdy »** *' - ' *•*•
taki potencjał szczytowy przebiega
wzdłuż nerwu, następny nie może
natychmiast za nim podążać. Wszystkie
potencjały szczytowe są tej samej
wysokości, gdy więc akson zostaje silniej ' m %
pobudzony, otrzymujemy nie wyższe
potencjały szczytowe, lecz więcej
potencjałów szczytowych na sekundę. i Jl
Wysokość potencjału szczytowego jest ^
określona przez samo włókno. Trzeba y
zdawać sobie z tego sprawę, aby móc *
śledzić, co się dalej dzieje.
Rysunek 36.1 la pokazuje złożone 36u. złożone 0ko skrzyplocza: a) widok normalny,
oko skrzypłocza; oko to nie ma bardzo b) przekrój
wyszukanej budowy, liczy zaledwie
około tysiąca fasetek. Rysunek 36.1 Ib
przedstawia przekrój układu; można na nim zobaczyć fasetki i włókna nerwowe, które
z nich wychodzą i biegną do mózgu. Ale zauważmy, że nawet u skrzypłocza istnieje
mało wewnętrznych połączeń. Są one znacznie mniej wyszukane niż w oku ludzkim
i daje to nam możność badania prostszego przykładu.
Spójrzmy teraz na doświadczenia, które przeprowadzano umieszczając cienkie elektrody
w nerwie wzrokowym skrzypłocza. Następnie puszczano światło tylko na niektóre fasetki,
co łatwo zrobić za pomocą soczewek. Włączając światło w pewnej chwili t0 i mierząc
wychodzące impulsy elektryczne stwierdzimy, że po niewielkim opóźnieniu (okresie
utajenia) następuje szereg szybkich wyładowań, które stopniowo zwalniają do jednostajnej
częstości, jak pokazuje rys. 36.12a. Gdy światło się wyłącza, wyładowania ustają. Ciekawe,
że gdy puszczamy światło nie na tę fasetkę, której włókno nerwowe jest połączone ze
wzmacniaczem, wówczas nic się nie dzieje; sygnału nie ma!
Przeprowadzamy teraz inne doświadczenie: puszczamy światło na początkowo wybraną
fasetkę i otrzymujemy tę samą reakcję co poprzednio; jeśli teraz oświetlamy także i
sąsiednie fasetki, drgania na krótko ustają, a następnie płyną ze znacznie mniejszą częstością.
A więc tempo działania jednej fasetki jest hamowane przez impulsy przychodzące z drugiej.
Inaczej mówiąc, każde włókno przenosi informacje od jednej tylko fasetki, ale liczba
przenoszonych informacji jest hamowana przez sygnały z innych fasetek. Jeśli więc na
Przykład całe oko będzie oświetlone w przybliżeniu jednostajnie, to informacja
przychodząca z określonej fasetki będzie stosunkowo słaba, ponieważ jest ona hamowana przez
wiele innych. Hamowanie jest rzeczywiście addytywne —jeśli oświetlamy wiele sąsiadu-
168
36 MECHANIZM WIDZENIA
splot
boczny
a)
receptory
nerw Wl*^ ~*- do
wzrokowy—Jr wzmacniacza
i.i i I l l i i
światło
w: ł
splot l
boczny ""
receptory
b)
nerw
w7rnknwv ' rin ''1Tl """" ' i .'iihliiid'UMillniu iii rriiiiKiini.r.frlnh rffiiri
wzmacniacza
36.12. Odpowiedzi na światło włókien nerwowych w oku skrzypłocza
jących fasetek, hamowanie jest bardzo duże. Staje się ono większe, gdy fasetki znajdują
się bliżej siebie, a jeśli znajdują się dostatecznie daleko, hamowania praktycznie nie ma.
Jest ono więc addytywne i zależy od odległości. Mamy tu pierwszy przykład tego, jak są
zestawiane w oku informacje z różnych jego części. Zastanawiając się przez chwilę,
zauważymy może, że system ten służy do wzmacniania kontrastu na krawędziach
przedmiotów, ponieważ jeżeli część pola widzenia jest jasna, a część czarna, fasetki w jasnym
obszarze wytwarzają impulsy hamowane przez całe pozostałe światło w sąsiedztwie. W
rezultacie są one stosunkowo słabe. Z drugiej zaś strony pewna graniczna fasetka odbierająca
„biały" impuls jest wprawdzie hamowana przez sąsiednie fasetki, ale nie tak liczne,
ponieważ niektóre z nich są czarne; wypadkowy sygnał jest więc silniejszy. W rezultacie
powstanie więc krzywa podobna do krzywej z rys. 36.13. Skrzypłocz zobaczy wzmocnienie
konturu.
Fakt wzmacniania konturów był znany od dawna; to naprawdę ważne zjawisko było
wiele razy komentowane przez psychologów. Aby narysować jakiś przedmiot, wystarczy
podać tylko jego zarys (sylwetkę). Jakże
jesteśmy przyzwyczajeni do patrzenia na
obrazy, na których widać tylko zarys!
Czym jest zarys? Jest to tylko ostra granica
między światłem a ciemnością albo między
jedną barwą a drugą. Nie jest to coś dobrze
określonego. Można wierzyć w to lub nie,
ale nieprawda, że każdy przedmiot jest
ograniczony pewną linią! Takiej linii
w przyrodzie nie ma. Jest ona tylko
wynikiem naszej własnej kosmetyki
psychologicznej. Zaczynamy więc rozumieć,
dlaczego linia jest wystarczającym kluczem
36.13. Czyste odpowiedzi fasetek skrzypłocza
w pobliżu ostrej zmiany oświetlenia
•
m— odpowiedź fasetki
■
»
i
— oświetlenie
> ..
16-6 NEUROLOGIA WIDZENIA
169
do zobaczenia całego przedmiotu. Przypuszczalnie bowiem nasze własne oko działa
w sposób, podobny do wyżej opisanego, chociaż znacznie bardziej złożony.
Na koniec krótko opiszemy pewną znacznie bardziej pomysłową pracę, na bardzo
wysokim poziomie, wykonaną na żabie. W doświadczeniu tym, wprowadzając bardzo
delikatne, pięknie zrobione igłowe sondy do nerwu wzrokowego żaby, można odebrać
sygnały biegnące wzdłuż jednego określonego aksonu. Okazuje się, że jak w przypadku
skrzypłocza, informacja zależy nie tylko od jednego punktu w oku, ale jest sumą informacji
z wielu punktów.
Według najnowszych poglądów obraz działania oka żaby jest następujący. Można
znaleźć cztery rodzaje włókien nerwu wzrokowego, różne w tym sensie, że istnieją cztery
różne rodzaje ich reakcji. Doświadczenia te nie były wykonane metodą włączania i
wyłączania puszczanych impulsów światła, ponieważ nie na tym polega normalne widzenie
żaby. Żaba po prostu siedzi sobie na przykład na liściu lilii wodnej i jej oczy nigdy się nie
poruszają, chyba że liść faluje. W tym wypadku oczy tak właśnie łypią, że obraz pozostaje
nieruchomy. Żaba nie zwraca swoich oczu w określoną stronę. Jeśli cokolwiek porusza się
w jej polu widzenia, np. mały owad (żaba musi umieć dostrzegać coś małego poruszającego
się na nieruchomym tle), wówczas okazuje się, że następuje w tej chwili wyładowanie w
czterech różnych rodzajach włókien. Dane dotyczące ich własności zebrane są w tab. 36.1.
Pierwsze hasło w tej tabeli (niewymazywalne wykrywanie nieruchomej krawędzi) oznacza, że gdy
wprowadzimy pewien przedmiot krawędzią do pola widzenia żaby, wówczas w danym
włóknie pojawią się w czasie ruchu przedmiotu liczne impulsy, które potem spadną do
pewnego stałego poziomu, utrzymującego się tak długo, jak długo krawędź nawet nieruchoma
będzie znajdowała się w polu widzenia. Impulsy ustają, jeśli wyłączamy światło. Jeśli je znowu
włączamy, a krawędź nadal pozostaje w polu widzenia, impulsy zaczynają się od nowa.
Nie są one wymazywalne. Drugi rodzaj włókien jest bardzo podobny do pierwszego,
z tym tylko, że nie działają one, gdy krawędź spoczywa. Krawędź ta musi być wypukła i
zaciemniona od strony przedmiotu! Jakże złożony musi być układ wzajemnych połączeń
w siatkówce oka żaby, aby mogła ona zrozumieć, że w polu widzenia pojawiła się wypukła
figura! Poza tym włókno to reaguje wprawdzie na stan stacjonarny, ale jednak nie tak
długo jak poprzednio i jeśli wyłączamy światło, a potem znowu je włączamy, reakcja
Tabela 36.1. Typy odpowiedzi we włóknach nerwu wzrokowego żaby
Typ
1. Wykrywanie nieruchomego
brzegu (niewymazywalne)
2. Wykrywanie wypukłej
krawędzi (wymazywalne)
3. Wykrywanie zmieniającego się
kontrastu
4. Wykrywanie przyciemnienia
5. Wykrywanie ciemności
Szybkość
0,2-0,5 m/s
0,5 m/s
1-2 m/s
do i m/s
7
Pole kątowe
1°
2°-3°
7°-10°
do 15°
bardzo duże
170
36 MECHANIZM WIDZENIA
się nie odbudowuje. Jest ona związana z
ruchem wypukłej figury. Oko widzi, że
figura wsunęła się w pole widzenia, i pamięta,
że w nim pozostała, ale jeśli tylko na chwilę
wyłączymy światło, oko po prostu
zapomina o niej i więcej jej już nie widzi.
Innym przykładem zestawiania w oku
informacji jest wykrywanie kontrastu.
Jeśli jakaś krawędź wsuwa się lub wysuwa
z pola widzenia, pojawiają się impulsy,
ale jeśli przedmiot spoczywa, nie ma ich
wcale.
Istnieje następnie w oku żaby
wykrywacz ściemniania. Daje on impulsy
wtedy' gdy natężenie światła spada, ale gdy
nie ulega ono zmianie lub wzrasta, impulsy
ustają. Działa on tylko wtedy, gdy
światło ulega ściemnieniu.
Istnieje tam wreszcie kilka włókien,
wykrywaczy ciemności, które — rzecz
zdumiewająca — są przez cały czas czynne!
36.14. Pokrywa (tectum) żaby Jeśli zwiększymy światło, ich czynność
słabnie, ale nie ustaje. Jeśli zmniejszymy
światło, ich czynność wzrasta bardzo
gwałtownie, choć jest jednostajna. W ciemności jest bardzo intensywna, sygnalizując
„ciemno! ciemno! ciemno!".
Reakcje te wydają się dość skomplikowane i można się zastanawiać, czy doświadczenia
te nie są aby źle interpretowane. Ciekawe jednak, że te same cztery rodzaje włókien można
bardzo wyraźnie rozróżnić w anatomii żaby! Po sklasyfikowaniu powyższych reakcji
(ważne jest tutaj, że po) dzięki innym pomiarom odkryto, że szybkości przenoszenia
sygnałów wzdłuż różnych włókien są różne, mamy więc inną, niezależną drogę sprawdzenia,
który rodzaj włókna znaleźliśmy w danej chwili.
Innym ciekawym zagadnieniem jest sprawa: jak wielki obszar ogarnia w swoich
obliczeniach jedno określone włókno? Odpowiedź jest różna dla różnych rodzajów włókien.
Rysunek 36.14 pokazuje tak zwaną pokrywę (tectum) żaby, gdzie nerwy wzrokowe
wchodzą do mózgu. Wszystkie włókna nerwowe wychodzące z nerwu wzrokowego
włączają się do rozmaitych warstw pokrywy. Ta warstwowa budowa podobna jest do
siatkówki i stąd m. in. wiemy właśnie, że mózg i siatkówka są bardzo do siebie podobne.
Przesuwając elektrodę w dół przez kolejne warstwy możemy stwierdzić, gdzie kończą się różne rodzaje
nerwów wzrokowych. Otrzymujemy piękny i wspaniały wynik, że różne rodzaje włókien
kończą się w różnych warstwach! Pierwsze kończą się w typie numer 1, drugie w typie
numer 2, trzecie i piąte kończą się w tym samym miejscu, a numer czwarty znajduje mC
najgłębiej ze wszystkich. (Cóż za nadzwyczajna zgodność, że zostały one ponumerow.me
36-6. NEUROLOGIA WIDZENIA
171
we właściwym porządku! O nie, właśnie z tej przyczyny zostały one uszeregowane w podany
sposób; pierwsza publikacja podawała numery w innym porządku!)
To, czego się nauczyliśmy, możemy teraz krótko podsumować. W oku istnieją
przypuszczalnie trzy pigmenty. Istnieje być może wiele różnych rodzajów komórek
receptorowych zawierających trzy barwiki w różnych stosunkach, ale istnieje też wide połączeń
krzyżowych, które umożliwiają dodawanie i odejmowanie w postaci dodawania i
wzmacniania w układzie nerwowym. Zanim więc naprawdę zrozumiemy, jak przebiega proces
widzenia barwnego, będziemy musieli zrozumieć powstawanie wrażeń końcowych. Temat
ten jest nadal otwarty, ale wspomniane badania za pomocą mikroelektrod i podobne
w końcu dostarczą nam być może więcej informacji o tym, jak widzimy barwy.
37
efekty kwantowe
37-1. Mechanika atomowa
W kilku ostatnich rozdziałach omówiliśmy podstawowe pojęcia niezbędne do
zrozumienia większości zjawisk dotyczących światła lub bardziej ogólnie — promieniowania
elektromagnetycznego. (Kilka zagadnień pozostawiliśmy do omówienia w następnym
tomie, przede wszystkim teorię zjawiska załamania dla ciał o niezbyt małej gęstości oraz
całkowite odbicie wewnętrzne.) To, o czym mówiliśmy dotąd, nosi nazwę „klasycznej
teorii" fal elektrycznych. Jak się okazuje, jest ona całkowicie wystarczającym opisem
przyrody w odniesieniu do dużej liczby zjawisk. Nie musieliśmy się dotąd martwić tym,
że energia światła przybywa w małych „grudkach", zwanych fotonami.
Chcielibyśmy z kolei omówić zachowanie się stosunkowo dużych porcji materii, np.
ich własności mechaniczne i cieplne. Gdy przejdziemy do tego zagadnienia, przekonamy
się, że zastosowanie tu „klasycznej" (czyli starszej) teorii zawodzi niemal natychmiast -
materia bowiem jest zbudowana z cząstek o rozmiarach atomowych. Mimo to będziemy
się zajmować jedynie klasyczną stroną zagadnienia, gdyż tylko to możemy zrozumieć
posługując się mechaniką klasyczną, którą poznaliśmy do tej pory. Jednak wielkich
sukcesów nie osiągniemy. Przekonamy się, że w przypadku materii, w przeciwieństwie do światła,
natrafimy na trudności stosunkowo szybko. Moglibyśmy oczywiście pomijać bez przerwy
efekty atomowe, zamiast tego jednak odbędziemy obecnie krótki wypad w świat
podstawowych pojęć związanych z kwantowymi własnościami materii, tzn. przedstawimy
kwantowe koncepcje fizyki atomowej. Da nam to pewne pojęcie o tym, co pomijamy. Będziemy
bowiem musieli pominąć kilka ważnych zagadnień, do których zbliżenia nie możemy uniknąć.
Obecnie dokonamy więc pewnego wprowadzenia do mechaniki kwantowej, jednak samą
istotę tego przedmiotu będziemy mogli zgłębić dopiero znacznie później.
„Mechanika kwantowa" jest uwzględniającym wszelkie szczegóły opisem zachowania
się materii, w szczególności jest opisem zjawisk zachodzących w skali atomowej. Bardzo
37-1. MECHANIKA ATOMOWA
173
małe obiekty zachowują się zupełnie inaczej niż obiekty, z którymi mamy do czynienia
bezpośrednio. Nie zachowują się ani jak fale, ani jak cząstki, nie zachowują się jak chmury,
czy kule bilardowe lub ciężarki na sprężynach, ani jak coś, co kiedykolwiek widzieliśmy.
Newton uważał, że światło składa się z cząstek, później jednak wykryto, jak
przekonaliśmy się o tym na podstawie poprzednich rozdziałów, że zachowuje się ono jak fale.
Jeszcze później (na początku XX w.) stwierdzono jednak, że światło rzeczywiście
zachowuje się czasami jak cząstki. Początkowo uważano, że elektron zachowuje się jak
cząstka, potem jednak stwierdzono, że pod wieloma względami przypomina on falę. W
rzeczywistości zaś nie zachowuje się ani jak fala, ani jak cząstka. Pogodziliśmy się już z tym
obecnie. Możemy więc powiedzieć: „On nie jest podobny do czegokolwiek".
Jedna rzecz jest w tej sytuacji pocieszająca — elektrony zachowują się tak samo jak
światło. Efekty kwantowe związane z zachowaniem się obiektów atomowych
(elektronów, protonów, neutronów, fotonów itd.) są takie same; wszystkie są falami materialnymi,
czy jak je nazwiemy. To, czego dowiemy się o własnościach elektronów (którymi będziemy
operować przykładowo), będzie więc również słuszne dla innych „cząstek", z fotonami
włącznie.
Stopniowe nagromadzenie informacji o zjawiskach atomowych, dokonane podczas
pierwszego ćwierćwiecza naszego stulecia, dało pewne wyobrażenie o tym, jak zachowują
się małe obiekty, równocześnie jednak powstało pewne zamieszanie, z którego wyjście
zostało wskazane w latach 1926 i 1927 przez Schródingera, Heisenberga i Borna.
Otrzymali oni w końcu niesprzeczny opis zachowania się materii w bardzo małej skali.
Głównymi cechami tego opisu zajmiemy się w tym rozdziale.
Ponieważ zachowanie się atomów w niczym nie przypomina zachowania się obiektów,
z jakimi mamy do czynienia na co dzień, bardzo trudno to zachowanie zrozumieć i wydaje
się ono bardzo dziwne każdemu — zarówno nowicjuszowi, jak i doświadczonemu fizykowi.
Nawet eksperci nie rozumieją go tak, jak by tego pragnęli i jest to zupełnie zrozumiałe,
całe bowiem nasze bezpośrednie doświadczenie i intuicja odnoszą się do dużych obiektów.
Wiemy, jak się będą one zachowywać. Obiekty bardzo małe nie zachowują się jednak
tak jak duże. Trzeba poznawać je na drodze abstrakcyjnej, a nie przez powiązanie z naszym
bezpośrednim doświadczeniem.
W rozdziale tym zajmiemy się od razu przypadkiem, w którym tajemniczość zjawisk
atomowych występuje szczególnie jaskrawo. Opiszemy zjawisko, którego zupełnie, ale to
zupełnie nie można wytłumaczyć w jakikolwiek klasyczny sposób i w którym tkwi sama
istota mechaniki kwantowej. W gruncie rzeczy nie potrafimy całkowicie wyjaśnić
tajemniczego charakteru tego zjawiska, to znaczy nie umiemy „wytłumaczyć", dlaczego ono
przebiega w taki a nie inny sposób, możemy natomiast opowiedzieć, w jaki sposób ono przebiega,
a mówiąc o tym, opowiemy równocześnie o podstawowych osobliwościach mechaniki
kwantowej w ogóle.
37-2. Doświadczenie z pociskami
Aby spróbować zrozumieć kwantowe zachowanie się elektronów, porównamy i
przeciwstawimy ich zachowanie się zachowaniu się pocisków i fal, w rodzaju fal wodnych, w okre-
174
37. HFFKTY KWANTOWf
ruchomy
detektor
**
karabin *^>. "^
12
przesłona
a)
37.1. Doświadczenie z pociskami
V
pochłaniacz
b)
/}2-/',+p2
c)
ślonym zestawie eksperymentalnym. Zaczynamy od zbadania zachowania się pocisków
w zestawie doświadczalnym pokazanym schematycznie na rys. 37.1. Mamy tu karabin
maszynowy, 7 którego nieustannie wylatują pociski. Nie jest to zbyt dobry karabin, gdyż
jak widzimy z rysunku, wyrzuca on pociski w sposób przypadkowy w obszar stosunkowo
dużego kąta. Przed karabinem mamy ścianę (wykonaną z płyt pancernych) z dwoma
otworami na tyle dużymi, aby pocisk mógł przez nie przejść. Za ścianą tą znajduje się pochłaniacz
pocisków. Może nim być np. gruba drewniana ściana, w której pociski grzęzną. Przed ta
drewnianą ścianą mamy urządzenie, które będziemy nazywać detektorem pocisków.
Może to być pudełko z piaskiem. Pociski wchodzące do detektora będą się w nim
zatrzymywać i gromadzić. Od czasu do czasu możemy opróżnić pudełko i przeliczyć pociski, które
do niego wpadły. Detektor można przesuwać tam • z powrotem w kierunku, który będziemy
nazywać kierunkiem x. Za pomocą tego urządzenia możemy udzielić odpowiedzi na pytanie:
„Jakie jest prawdopodobieństwo tego, że pocisk, który przeszedł przez otwory w ścianie,
dotrze do pochłaniacza w odległości x od środka"? Trzeba sobie przede wszystkim zdać
sprawę z tego, że musimy posługiwać się pojęciem „prawdopodobieństwa", nie możemy
bowiem powiedzieć z całą pewnością dokąd dany pocisk dotrze Pocisk, który trafi w jeden
z otworów, może odbić się od jego krawędzi i trafić w dowolne miejsce. Przez
„prawdopodobieństwo" rozumiemy tu szansę znalezienia pocisku w detektorze: można je 7mierzyć
obliczając liczbę pocisków, które znajdą się w detektorze w pewnym okresie czasu,
a następnie znajdując stosunek tej liczby do całkowitej liczby pocisków, które w iyr»
samym czasie ugrzęzły w pochłaniaczu. Jeśli założymy, że karabin w czasie pomiaru
strzela z tą samą szybkością, prawdopodobieństwo o które nam chodzi, jest po prostu
proporcjonalne do liczby pocisków, które osiągnęły detektor w pewnym standardowym
przedziale czasu.
37-2. DOŚWIADCZENIE Z POCISKAMI
175
Dla naszych obecnych celów przyjmiemy, że mamy do czynienia z cokolwiek
wyidealizowanym doświadczeniem. Pociski nie są zwykłymi pociskami, lecz są niezniszczalne —
nigdy nie rozpadają się na połowę. W naszym doświadczeniu zawsze przybywają one
w takich samych porcjach i jeżeli znajdziemy coś w detektorze, jest to zawsze cały
pocisk. Jeśli szybkość, z jaką strzela karabin maszynowy, będzie bardzo mała, stwierdzimy,
że w danej chwili albo nic nie przybywa, albo jeden i tylko jeden pocisk dociera do
pochłaniacza. Również rozmiary dochodzącego pocisku nie zależą od szybkości, z jaką
strzelamy. W związku z tym mówimy: „Pociski zawsze przybywają w jednakowych »grud-
kach«". Za pomocą naszego detektora mierzymy prawdopodobieństwo pojawienia się
takiej grudki. Przy tym mierzymy je jako funkcję x. Wyniki pomiarów wykonanych za
pomocą tego urządzenia (doświadczenie takie nie zostało dotychczas wykonane,
wyobrażamy więc sobie tylko wyniki) podano w postaci wykresu w części c rys. 37.1. Na
wykresie odłożono prawdopodobieństwo na osi poziomej, a x na osi pionowej, oś x
przebiega więc w takim samym kierunku, jaki ma wielkość x, którą określiliśmy w urządzeniu.
Zmierzone prawdopodobieństwo oznaczamy jako Pl2, gdyż kule mogły przejść albo
przez otwór /, albo przez otwór 2. Nie powinno nas dziwić, że wartość Pxl jest duża dla
środkowej części wykresu i staje się bardzo mała, gdy x jest bardzo duże. Moglibyśmy się
jednak zastanowić, dlaczego prawdopodobieństwo Pl2 ma wartość maksymalną dla
x = 0. Fakt ten można jednak zrozumieć, jeżeli przeprowadzimy ponownie nasze
doświadczenie, zasłaniając za pierwszym razem otwór 2, a za drugim — otwór /. Gdy otwór
2 będzie zasłonięty, pociski będą mogły przechodzić tylko przez otwór / i wówczas
otrzymamy krzywą oznaczoną w części b rysunku jako P,. Jak można było oczekiwać, jej
maksimum leży na przecięciu się osi x z prostą przechodzącą przez karabin i otwór 1.
Gdy otwór l będzie zasłonięty, otrzymamy symetryczną względem poprzedniej, widoczną
na rysunku krzywą P2. Krzywa P2 jest krzywą rozkładu prawdopodobieństwa dla kul
przechodzących przez otwór 2. Porównując części b i c rys. 37.1 otrzymujemy ważny
wynik:
PI2 = P,+P2. (37.1)
Prawdopodobieństwa po prostu się dodają. Efekt występujący przy odsłoniętych obu
otworach jest sumą efektów występujących, gdy jeden z otworów jest zasłonięty. O
otrzymanym wyniku - z przyczyn które poznamy później - mówimy, że stwierdziliśmy
„brak interferencji". Tyle o pociskach. Przybywają one w „grudkach", a
prawdopodobieństwo ich pojawienia się nie wykazuje interferencji.
37-3. Doświadczenie z falami
Obecnie rozpatrzymy doświadczenie z falami wodnymi. Urządzenie, którego użyjemy,
Pokazano schematycznie na rys. 37.2. Mamy tu płytki zbiornik z wodą, w którym
pewien mały przedmiot, nazywany „źródłem fal", jest wprawiany mechanicznie w ruch
' wywołuje fale koliste. Na prawo od źródła mamy podobnie jak w poprzednim
doświadczeniu ścianę z dwoma otworami, za nią znajduje się druga ściana, która, aby uniknąć
176
37. EFEKTY KWANTOWE
przesłona pochłaniacz A = |/?i|2 ^n=\^\+hl\Z
h~\hl\Z
a) b) c)
37.2. Doświadczenie z falami wodnymi
zbytnich komplikacji, jest „pochłaniaczem", tak że fale, które docierają do niej, już
się nie odbijają. W tym celu można na przykład zbudować stopniowo wznoszący się
brzeg piaszczysty. Przed brzegiem umieszczamy detektor, który podobnie jak
poprzednio, można przesuwać w górę i w dół w kierunku x. Detektor jest tu teraz przyrządem,
który mierzy „natężenie" ruchu falowego. Możecie sobie wyobrazić przyrząd, który
mierzy wysokość fali, lecz jest wykalibrowany proporcjonalnie do kwadratu wysokości,
a więc wskazuje natężenie fali. Wskazania naszego detektora są więc proporcjonalne
do energii, jaką niesie fala, lub raczej proporcjonalne do szybkości, z jaką energia
dociera do detektora.
Operując tym urządzeniem, stwierdzamy przede wszystkim, że natężenie fali może
być całkiem dowolne. Gdy źródło porusza się nieznacznie, detektor rejestruje niewielki
ruch falowy. Gdy ruch źródła się zwiększa, wskazania detektora są większe. Natężenie
fali może przybierać każdą wartość. Nie motemy powiedzieć, że stwierdziliśmy
jakąkolwiek „grudkowatość" natężenia.
Zmierzmy obecnie natężenie fali dla różnych wartości .v (ruch źródła jest przy tym
przez cały czas taki sam). Otrzymujemy w ten sposób interesująco wyglądającą krzywą,
oznaczoną w części c rys. 37.2 jako /, 2.
Gdy zajmowaliśmy się interferencją fal elektrycznych, przekonaliśmy się już, w jaki
sposób otrzymujemy taką krzywą. W tym przypadku również początkowa fala zostaje
ugięta na dwóch otworach, z których rozchodzą się dwie nowe fale koliste. Jeżeli
zasłonimy jeden z otworów i zmierzymy rozkład natężenia, otrzymamy zupełnie
nieskomplikowane krzywe, pokazane w części b rys. 37.2. /, przedstawia natężenie fali rozchodzącej
się z otworu / (które znajdujemy dokonując pomiaru, gdy otwór 2 jest zasłonięty), a h
37-J. DOŚWIADCZENIE Z FALAMI
177
przedstawia natężenie fali wychodzącej z otworu 2 (zmierzone, gdy otwór / jest
zasłonięty).
Natężenie /, 2, obserwowane gdy oba otwory są odsłonięte, z całą pewnością nie jest
sumą natężeń /, i I2. Mówimy, że występuje „interferencja" obu fal. W pewnych miejscach
(w których krzywa 712 ma maksima) fale są zgodne w fazie i dodają się, dając większą
amplitudę, a więc i większe natężenie. Mówimy, że w tych miejscach obie fale „inter-
ferują konstruktywnie". Taka konstruktywna interferencja wystąpi, gdy tylko odległość
od detektora do jednego z otworów jest o pełną liczbę długości fali większa (lub
mniejsza) niż odległość od detektora do drugiego z otworów.
W tych miejscach, w których obie fale docierają do detektora z różnicą faz rt (tam,
gdzie są „niezgodne w fazie"), amplituda ruchu falowego notowanego przez detektor
będzie różnicą obu amplitud. Fale „interferują destruktywnie" i otrzymujemy małą
wartość natężenia. Takich małych wartości oczekujemy wszędzie tam, gdzie odległość
między otworem / a detektorem różni się od odległości między otworem 2 a detektorem
o nieparzystą liczbę połówek fali. Małe wartości /,2 na rys. 37.2 odpowiadają miejscom,
w których obie fale interferują destruktywnie.
Jak pamiętamy, ilościową zależność między natężeniami /,, /2 i 1,2 można
przedstawić w następujący sposób: wysokość fali wodnej wychodzącej z otworu / i zmierzonej
w detektorze w określonej chwili można zapisać jako (część rzeczywistą) h, e'°", gdzie
„amplituda"/!, jest w ogólności liczbą zespoloną. Natężenie jest proporcjonalne do
wartości średniej kwadratu wysokości, czyli gdy używamy liczb zespolonych, do \hi\2.
Podobnie dla otworu 2 wysokość dana jest przez /^e""', a natężenie jest proporcjonalne do
|/!2|2. Gdy oba otwory są odsłonięte, wysokości obu fal dodają się, dając (/!, +h2) e'"",
i natężenie wynosi |fi|+/!2|2. Opuszczając zbyteczne dla naszych celów stałe
proporcjonalności, otrzymujemy obowiązujące dla interferujących fal związki:
/. = N2- '2 = N2, ',2 = 1^+^. (37.2)
Zauważmy, że wynik jest zupełnie inny niż w przypadku pocisków (37.1). Jeżeli
rozwiniemy wyrażenie |fii+/i2|2, stwierdzimy, że
|fi,+fi2|2 = |«l|2 + |fi2|2 + 2|/l1j|/i2|cosó, (37.3)
gdzie S jest różnicą faz między fi, i fi2. Wprowadzając natężenia możemy napisać
Il2 = Il+I2 + 2sJllI1cosó. (37.4)
Ostatni człon we wzorze (37.4) — to „człon interferencyjny". Tyle o falach wodnych.
Ich natężenie może mieć dowolne wartości i wykazuje interferencję.
37-4. Doświadczenie z elektronami
Wyobraźmy sobie teraz podobne doświadczenie z elektronami Schemat tego
doświadczenia pokazano na rys. 37.3. Sporządzamy działo elektronowe, które składa się z
ogrzewanego przez prąd elektryczny drutu tungstenowego umieszczonego w metalowym pu-
178
37. EFEKTY KWANTOV.H
detektor
działo
elektronowe
przesłona
0)
37.3. Doświadczenie z elektronami
pochłaniacz P, = \ip\2
dełku z otworem. Jeśli drut znajduje się w stosunku do pudełka pod ujemnym
napięciem, elektrony będą przyspieszane w stronę ścianek i któryś z nich przejdzie przez otwór.
Wszystkie elektrony wystrzeliwane z tego działa będą miały (prawie) tę samą energię.
Przed działem podobnie jak w poprzednim doświadczeniu umieszczamy ścianę (po prostu
cienką metalową płytę) z dwoma otworami. Za tą ścianą ustawiona jest inna płyta,
służąca jako pochłaniacz. Przed pochłaniaczem umieszczamy ruchomy detektor. Może nim
być licznik Geigera lub jeszcze lepiej mnożnik elektronowy połączony z głośnikiem.
Musimy od razu powiedzieć, że nie należy próbować przeprowadzenia takiego
doświadczenia (w odróżnieniu od dwóch doświadczeń poprzednich, które można było
wykonać). Doświadczenie to nie zostało nigdy wykonane. Rzecz w tym, że aby uzyskać
efekt, który nas interesuje, urządzenie musiałoby być wykonane w niezmiernie malej
skali. Przeprowadzamy więc „eksperyment myślowy", który wybraliśmy z tych względów,
że łatwo o nim mówić i myśleć. Wiemy, jaki wynik otrzymamy, ponieważ przeprowadzono
już wiele eksperymentów, w których zachowano odpowiednią skalę i proporcje, co
pozwoliło uzyskać efekty, które opiszemy.
Pierwsza rzecz, jaką stwierdzamy w naszym doświadczeniu z elektronami, to wyraźne
pojedyncze dźwięki, jakie słyszymy z detektora (tzn. z głośnika). Wszystkie one są takie
same. Me ma „połówek" takich dźwięków.
Stwierdzamy również, że są one bardzo nieregularne. Coś w rodzaju: tik tik-tik
. tik tik-tik tik..., itd., tak jak to już pewnie słyszeliście w czasie pracy licznika
Geigera. Jeżeli będziemy liczyć takie tykanie w ciągu wystarczająco długiego czasu
powiedzmy przez wiele minut, a następnie przeliczymy je jeszcze raz w takim samym
odstępie czasu, stwierdzimy, że obie liczby są niemal takie same. Możemy więc mówić o
średniej częstości, z jaką słyszymy te tykania (średnio tyle a tyle tykań na minutę).
37-4. DOSWlADCZENIL Z ŁLEKTRONAM1
179
Gdy przesuwamy detektor, częstość tych dźwięków jest większa lub mniejsza, lecz
ich wielkość (siła dźwięku) jest zawsze taka sama. Jeżeli obniżymy temperaturę drutu
w naszym dziale elektronowym, częstość rejestrowanych dźwięków zmniejszy się, lecz
dalej każdy z nich będzie brzmiał tak samo. Stwierdzamy poza tym, że jeżeli umieścimy
przed pochłaniaczem dwa detektory, tykać będzie jeden albo drugi, lecz nigdy oba na
raz (chyba, że od czasu do czasu oba tykniccia są tak bliskie siebie, że ucho ich nie
rozdzieli). Stwierdzamy więc, że czymkolwiek jest to, co dociera do pochłaniacza,
przybywa to w „grudkach". Wszystkie grudki są tej samej wielkości: tylko całe grudki
docierają do pochłaniacza i tylko jedna na raz. Mówimy, że „elektrony zawsze przybywają
w jednakowych »grudkach«".
Dokładnie tak samo jak w doświadczeniu z pociskami możemy obecnie znaleźć
doświadczalnie odpowiedź na pytanie: „Jakie jest względne prawdopodobieństwo tego, że
grudka elektronowa dotrze do pochłaniacza w odległości x od środka"? Tak jak
poprzednio, względne prawdopodobieństwo otrzymamy notując częstość tykania przy
niezmienionych warunkach działania działa elektronowego. Prawdopodobieństwo
pojawiania się grudek dla pewnego szczególnego x równa się średniej częstości tykania
zanotowanej dla tego x.
Wynikiem naszego doświadczenia jest interesująco wyglądająca krzywa, oznaczona
jako Pl2 w części c rys. 37.3. Tak jest! W ten właśnie sposób poruszają się elektrony.
37-5. Interferencja fal elektronowych
Spróbujmy obecnie zanalizować krzywą z rys. 37.3 i przekonać się, czy potrafimy
zrozumieć zachowanie się elektronów. Przede wszystkim chciałoby się powiedzieć, że
ponieważ elektrony przybywają w grudkach, każda grudka, którą możemy równie dobrze
nazwać elektronem, przeszła albo przez otwór 7, albo przez otwór 2. Zapiszmy to w
postaci „twierdzenia":
Twierdzenie A: Każdy elektron przechodzi albo przez otwór 7, albo przez otwór 2.
Jeżeli założymy prawdziwość tego twierdzenia, wszystkie elektrony, które docierają
do pochłaniacza, można podzielić na dwie klasy: do klasy pierwszej zaliczamy te, które
przeszły przez otwór 7, do klasy drugiej — te, które przeszły przez otwór 2. Otrzymana
przez nas krzywa musi więc być sumą efektów dotyczących elektronów przechodzących
przez otwór 7 i przechodzących przez otwór 2. Sprawdźmy tę koncepcję doświadczalnie.
Dokonamy najpierw pomiarów dla elektronów przechodzących przez otwór 1.
Zasłaniamy otwór 2 i liczymy dźwięki dochodzące z detektora. Z ich częstości otrzymujemy
prawdopodobieństwo Pt. Wynik pomiarów przedstawia krzywa oznaczona jako P{
w części b rys. 37.3. Wynik ten wydaje się zupełnie sensowny. W podobny sposób
mierzymy P2 — rozkład prawdopodobieństwa dla elektronów, które przeszły przez otwór
2. Wynik tego pomiaru został również podany na rysunku.
^12 — wynik otrzymany przy obu otworach odsłoniętych — najwyraźniej nie jest
sumą P, i P2> prawdopodobieństw dla każdego z otworów z osobna. W analogii z do-
180
17. EFEKTY KWANTOWE
świadczeniem z falami wodnymi mówimy, że „występuje interferencja":
dla elektronów P11¥=P1+P2- (37.5)
W jaki sposób może dojść do takiej interferencji? Być może, powinniśmy powiedzieć:
„Prawdopodobnie oznacza to, że nie jest prawdą, że grudki przechodzą bądź przez otwór
7, bądź przez otwór 2, gdyż gdyby tak było, prawdopodobieństwa dodawałyby się. Być
może, elektrony poruszają się w bardziej skomplikowany sposób. Dzielą się na połowę,
a następnie..." Ależ skąd! To niemożliwe, zawsze zjawiają się w grudkach..." No, to
może niektóre z nich przechodzą przez otwór /, a następnie przez otwór 2 i tak jeszcze
kilka razy dookoła lub poruszają się po jakichś innych skomplikowanych torach... w tym
wypadku zasłoniwszy otwór 2, zmieniamy prawdopodobieństwo tego, że elektron, który
przeszedł na początku przez otwór /, dotrze do pochłaniacza..." Zwróćmy jednak uwagę,
że gdy oba otwory są odsłonięte, do pewnych punktów dociera tylko bardzo mało
elektronów, gdy jednak zasłonimy jeden z otworów, notujemy w tych punktach od razu
znacznie większą liczbę elektronów. Zasłonięcie jednego otworu zwiększa więc liczbę elektronów
przechodzących przez drugi. Z drugiej jednak strony, widzimy, że Pt 2 w środkowej części
wykresu jest więcej niż dwa razy większe od sumy P,+P2. Zasłonięcie jednego z
otworów zmniejsza więc jak gdyby liczbę elektronów przechodzących przez drugi.
Wyjaśnienie obu tych efektów poprzez założenie, że elektrony poruszają się po skomplikowanych
torach, wydaje się bardzo trudne.
Wszystko to jest bardzo tajemnicze. 1 im bardziej się temu przyglądamy, wydaje się
tym bardziej tajemnicze. Wysunięto wiele propozycji mających wyjaśnić przebieg krzywej
Pi2 poprzez skomplikowane tory elektronów. Żadna z nich nie była jednak
zadowalająca. Przy pomocy żadnej z nich nie można było otrzymać prawidłowej krzywej Pl2
wyrażonej poprzez P, i P2.
Okazuje się jednak, że zależności matematyczne potrzebne do powiązania ze sobą
wielkości P,, P2 i PIZ są niezwykle proste. Pl2 jest bowiem krzywą w rodzaju krzywej
/i2 z rys. 37.2, gdzie wszystko było bardzo proste. To, co obecnie zachodzi w
płaszczyźnie pochłaniacza, można opisać przy pomocy dwóch liczb zespolonych, które nazwiemy
<P\ i <P2 (są to oczywiście funkcje x). Kwadrat modułu co, daje efekt, jaki się otrzymuje
przy odsłoniętym jedynie otworze /. tzn. Pi=\<Pi\2- Efekt pojawiający się przy
odsłoniętym otworze 2 dany jest w ten sam sposób przez (j>2. A więc P2 = \<P2\2- Połączony
efekt dla obu otworów - to P,2 = \c>{ +V>2\2- Zależności matematyczne są tu takie same,
jak dla fal wodnych! (Trudno dostrzec, w jaki sposób tak prosty wynik można by
otrzymać ze skomplikowanego zachowania się elektronów, poruszających się tam i z powrotem
poprzez płytkę po jakichś dziwnych torach).
Stwierdzamy więc, że elektrony przybywają w grudkach jak cząstki, a rozkład
prawdopodobieństwa pojawienia się tych grudek jest taki sam jak rozkład natężenia fali. W tym
właśnie sensie elektron zachowuje się „czasami jak cząstka, a czasami jak fala".
Poprzednio, gdy zajmowaliśmy się falami w fizyce klasycznej, zdefiniowaliśmy ich
natężenie jako średnią po czasie kwadratu amplitudy falowej i użyliśmy liczb zespolonych
jako pewnego wybiegu matematycznego, upraszczającego analizę. Jednakże, jak się
okazuje, w mechanice kwantowej amplitudy muszą być reprezentowane przez liczby zespo-
37-5. INTERFERENCJA FAL ELEKTRONOWYCH
181
lone. Same części rzeczywiste nie wystarczą. Chwilowo jest to tylko uwaga o charakterze
technicznym, oba wzory mają bowiem taką samą postać
Ponieważ prawdopodobieństwo przybycia elektronu przy obu otworach
odsłoniętych dane jest przez tak prosty wzór (aczkolwiek nie przez Pi+P2), to już właściwie
wszystko, co można o nim powiedzieć. Pozostaje jednak wiele subtelności związanych
z faktem, że natura zachowuje się właśnie w taki sposób. Chcielibyśmy obecnie
dostarczyć kilku ilustracji tych subtelności. Ponieważ liczba elektronów pojawiających się w
określonym punkcie nie jest równa sumie elektronów, jakie przeszły przez otwór / i przez otwór
2, jakbyśmy to wywnioskowali z twierdzenia A, bez wątpienia musimy więc stwierdzić,
że twierdzenie A jest fałszywe. Nie jest prawdą, że elektron przechodzi bądź przez otwór 1,
bądź przez otwór 2. Jednakże wniosek ten można jeszcze poddać sprawdzeniu w innym
doświadczeniu.
37-6. Obserwacja elektronów
Spróbujmy teraz przeprowadzić następne doświadczenie. Do poprzedniego
urządzenia dołączamy bardzo silne źródło światła, które umieszczamy za ścianą między oboma
otworami, tak jak to pokazano na rys. 37.4. Wiemy o tym, że ładunki elektryczne
rozpraszają światło. Gdy więc elektron będzie się przemieszczać (w jakikolwiek sposób by
się to odbywało) w stronę detektora, rozproszone przez niego światło dojdzie do naszego
oka i zobaczymy, którędy elektron biegnie. Jeśli na przykład podąża przez otwór 2, jak
to naszkicowano na rys. 37.4, zobaczymy błysk światła dochodzący z okolicy miejsca,
37.4. Inne doświadczenie z elektronami
działo
elektronowe
"0r
IV-
i2
źródło
światła
Z
?
a)
i
1
1
i
X ■
182
37. EFŁK.TY KWANT UWF
zaznaczonego na rysunku jako A. Gdy elektron przechodzi przez otwór /, oczekujemy
błysku w sąsiedztwie górnego otworu. Jeżeli zdarzy się, że zaobserwujemy światło w obu
miejscach, ponieważ elektron podzielił się na połowę... Przejdźmy jednak lepiej do
doświadczenia!
Oto co obserwujemy: za każdym razem, gdy słyszymy „tyknięcie"" detektora
(umieszczonego przed pochłaniaczem), widzimy również błysk świetlny albo w pobliżu otworu /,
albo w pobliżu otworu 2, lecz nigdy w obu miejscach na raz! Przy czym to, co
zaobserwowaliśmy, nie zależy zupełnie od tego, w jakim miejscu został umieszczony detektor.
Wnioskujemy więc, że gdy patrzymy na elektrony, stwierdzamy, iż przechodzą one albo przez
jeden, albo przez drugi otwór. Z doświadczenia wynika, że twierdzenie A jest
najwyraźniej prawdziwe.
Czy w naszej argumentacji przeciwko temu twierdzeniu tkwi więc jakiś błąd?
Dlaczego Pl2 nie równa się po prostu P,+P2? Wróćmy do doświadczenia! Obserwujmy dalej
elektrony i patrzmy, co one robią. Dla każdego położenia detektora (ustalone je)
będziemy liczyć elektrony, które do niego docierają, a obserwując równocześnie błyski
świetlne, będziemy notować, przez który otwór przeszły. Można to zrobić w następujący
sposób: za każdym razem, gdy słyszymy „tyknięcie", a błysk widzieliśmy w pobliżu
otworu 7, rejestrujemy elektron w kolumnie 1, gdy natomiast widzieliśmy błysk w pobliżu
otworu 2, rejestrujemy elektron w kolumnie 2. Każdy elektron zostaje zarejestrowany
w jednej z dwóch klas: wśród tych, które przeszły przez otwór 1, albo wśród tych, które
przeszły przez otwór 2. Na podstawie liczby elektronów zarejestrowanych w kolumnie I
obliczamy P\, prawdopodobieństwo tego, że elektron dotrze do detektora przez otwór
/; a na podstawie liczby elektronów zarejestrowanych w kolumnie 2 obliczamy P'2,
prawdopodobieństwo tego, że elektron dotrze do detektora przez otwór 2. Jeżeli powtórzymy
taki pomiar dla wielu wartości x, otrzymamy krzywe P', i P'2 pokazane w części b rys.
37.4.
Jak na razie, nie jest to specjalnie zaskakujące! Otrzymaliśmy jako krzywą P\ krzywą
zupełnie podobną do krzywej P,, której wartości zmierzyliśmy, gdy otwór 2 był
zamknięty. Krzywa P'2 natomiast jest podobna do tej, którą otrzymaliśmy poprzednio, zamykając
otwór /. Nie mamy więc niczego w rodzaju przechodzenia przez oba otwory. Elektrony,
gdy obserwujemy je, poruszają się tak, jak tego oczekujemy. Te, które przechodzą przez
otwór 7, są rozłożone w ten sam sposób, niezależnie od tego, czy otwór 2 jest zamknięty, |
czy otwarty.
Chwileczkę! A czemu się równa obecnie całkowite prawdopodobieństwo pojawienia
się w detektorze elektronu biegnącego po dowolnym torze? Mamy już wszystkie
potrzebne informacje. Udajemy po prostu, że nigdy nic patrzyliśmy na błyski świetlne i
łączymy w jedną całość łyknięcia detektora, które poprzednio rejestrowaliśmy w dwóch
kolumnach. Trzeba po prostu dodać obie liczby. Na prawdopodobieństwo pojawienia
się elektronu, który przeszedł przez dowolnv otwór, otrzymujemy P\2 = P, + P2.
Wprawdzie udało się nam zaobserwować, przez który z otworów przechodzą elektrony, nie
otrzymaliśmy jednak starej krzywej Pl2, lecz nową P\2, która nie wykazuje interferencji.
Jeśli wyłączymy światło, otrzymamy, z powrotem krzywą Pi2.
Musimy więc stwierdzić, że gdy „patrzymy" na elektrony, ich rozkład na ekranie jest
37-6. OBSERWACJA ELEKTRONÓW
183
inny, niż gdybyśmy tego nie robili. Być może, właśnie włączenie światła zaburzyło
wszystko? Prawdopodobnie elektrony są bardzo czułe i gdy światło rozprasza się na nich,
doznają wstrząsu, po którym ruch ich się zmienia. Wiemy, że pole elektryczne światła
działające na ładunek wywiera nań pewną siłę. Być może, należało więc oczekiwać; że ruch
się zmieni. W każdym bądź razie światło wywiera duży wpływ na elektrony. Usiłując
„obserwować" elektrony, zmieniliśmy ich ruch. Wstrząs, jakiego doznaje elektron, gdy
rozprasza się na nim światło, wystarcza, aby ruch elektronu zmienić do tego stopnia,
że jeżeli poprzednio elektron biegł tam, gdzie krzywa Pl2 miała maksimum, obecnie
pobiegnie tam, gdzie krzywa Pl2 ma minimum. Oto dlaczego nie widzimy dłużej efektów
interferencyjnych.
Powiecie być może: „Nie używajmy tak jasnego źródła! Zmniejszmy jego siłę! Fale
świetlne będą wówczas słabsze i nie będą już tak bardzo zaburzać elektronów. Z
pewnością, gdy światło będzie coraz słabsze, jego wpływ będzie w końcu można pominąć".
Doskonale, spróbujmy tak postąpić. Stwierdzimy od razu, że błyski światła rozproszonego
na przechodzących elektronach nie stają się słabsze. Błysk jest zawsze taki sam. Jedyną
rzeczą, jaką stwierdzamy, gdy światło jest słabsze, jest to, że czasami słyszymy „tyknię-
cie", lecz nie widzimy w ogóle błysku. Elektron przeszedł „niezauważony". Widzimy więc,
że światło również zachowuje się jak elektrony; wiedzieliśmy już, że było ono „faliste",
a obecnie przekonaliśmy się, że jest również „ziarniste". Zawsze pojawia się — jest
rozpraszane — w grudkach, które nazywamy „fotonami". Gdy zmniejszyliśmy natężenie
źródła światła, nie zmniejszyliśmy rozmiarów fotonów, a jedynie częstość, z jaką są
emitowane. To wyjaśnia, dlaczego gdy źródło jest bardzo słabe, niektóre elektrony
przechodzą niezaobserwowane. W czasie, w którym elektron przechodził, nie było akurat żadnego
fotonu.
Nie wygląda to wszystko zbyt zachęcająco. Jeśli prawdą jest, że gdy tylko „widzimy"
elektron, obserwujemy zawsze błysk tych samych rozmiarów, wszystkie elektrony, które
widzimy, są zawsze zaburzone. Mimo wszystko wykonamy doświadczenie ze słabym
źródłem światła. Obecnie, gdy usłyszymy tyknięcie detektora, będziemy prowadzić
rejestrację w trzech kolumnach: w kolumnie I zanotujemy elektrony widziane przy otworze
/, w kolumnie 2 elektrony widziane przy otworze 2, a w kolumnie 3 te elektrony, które
nie zostały w ogóle zauważone. Gdy opracujemy dane doświadczalne (obliczając
prawdopodobieństwo), otrzymamy następujące wyniki: elektrony „widziane przy otworze /"
mają taki sam rozkład jak P[; „widziane przy otworze 2" mają rozkład w rodzaju P2
(..widziane albo przy otworze /, albo przy otworze 2" mają więc rozkład w rodzaju P\2):
wreszcie „nie widziane w ogóle" mają rozkład „falisty", taki jak Pl2 na rys. 37.3! Gdy
elektrony nie są „widziane", mamy interferencję*.
Jest to zupełnie zrozumiałe. Jeżeli nie widzimy elektronu, żaden foton go nie zaburza,
jeżeli natomiast elektron był widziany, musiał zostać zaburzony przez foton. Wielkość
zaburzenia jest zawsze taka sama, ponieważ każdy foton powoduje taki sam efekt, zawsze
wystarczająco duży. aby zniszczyć wszelki efekt interferencyjny.
Czy nie ma więc żadnego sposobu obserwowania elektronów bez zaburzenia ich'.'
2 wcześniejszego rozdziału dowiedzieliśmy się, że pęd niesiony przez „foton" jest
odwrotnie proporcjonalny do długości jego fali (p = h A). Z pewnością wstrząs, jakiego
184
37. EFEKTY KWANTÓW
doznaje elektron, gdy foton rozprasza się na nim, zależy od pędu niesionego przez
foton. Aha! Jeżeli chcemy tylko nieznacznie zaburzyć elektrony, powinniśmy nie tyle
zmniejszyć natężenie światła, ile obniżyć jego częstość (to samo co zwiększyć długość fali). Użyjmy
„bardziej czerwonego" światła. Możemy nawet użyć promieniowania podczerwonego lub
fal radiowych (w rodzaju radaru) i obserwować przechodzące elektrony za pomocą
pewnego urządzenia, które może „widzieć" światło o większych długościach fali. Jeżeli
użyjemy „delikatniejszego" światła, unikniemy być może nadmiernego zaburzenia
elektronów.
Wykonajmy więc doświadczenie z dłuższymi falami. Będziemy powtarzać je
wielokrotnie, dobierając za każdym razem światło o większej długości fali. Początkowo nic
się w zasadzie nie zmienia Wyniki są takie same. Po jakimś czasie dzieje się jednak coś
strasznego. Pamiętamy, że rozważając działanie mikroskopu, zwróciliśmy uwagę na to,
że wskutek falowej natury światła mamy ograniczenie na odległość dwóch punktów,
które można widzieć oddzielnie. Odległość ta jest rzędu długości fali świetlnej. Gdy więc
długość fali będzie większa od odległości między obu otworami, wówczas w momencie,
gdy światło zostanie rozproszone przez elektron, zobaczymy duży rozmyty błysk. Nie
można już powiedzieć, przez który z otworów elektron przeszedł! I dopiero przy świetle
o tej barwie stwierdzamy, że wstrząsy doznawane przez elektron są wystarczająco małe
i krzywa P'I2 zaczyna wyglądać jak krzywa Pl2 — to znaczy zaczynamy otrzymywać
pewne efekty interferencyjne. I jedynie dla fal o długościach znacznie większych od
odległości między otworami (gdy nie mamy już w ogóle możliwości stwierdzenia którędy
przeszedł elektron) zaburzenie spowodowane przez światło staje się wystarczająco małe,
abyśmy z powrotem otrzymali krzywą Pl2 z rys. 37.3.
Przekonaliśmy się więc, że w naszym doświadczeniu nie można zastosować światła
w ten sposób, abyśmy mogli powiedzieć, przez który otwór przeszedł elektron, a krzywa
interferencyjna pozostała równocześnie niezaburzona. Heisenberg jako pierwszy zwrócił
uwagę na to, że nowe prawa przyrody mogą być tylko wtedy niesprzeczne, jeżeli istnieje
zasadnicze ograniczenie naszych możliwości doświadczalnych, z którego poprzednio nie
zdawano sobie sprawy. Zaproponował on jako ogólnie obowiązujące prawo — swoją
zasadę nieoznaczoności, którą w języku naszego doświadczenia można wypowiedzieć
następująco: „Nie można zaprojektować urządzenia, które by pozwoliło określić, przez
który otwór elektron przechodzi nie zaburzając równocześnie obrazu interferencyjnego".
Jeżeli urządzenie pozwala na określenie otworu, przez który przeszedł elektron, nie może
być na tyle czułe, aby nie zaburzyć w zasadniczy sposób obrazu interferencyjnego. Nikt
nie wymyślił jeszcze sposobu obejścia zasady nieoznaczoności. Musimy więc przyjąć,
że opisuje ona podstawową cechę przyrody.
Używana obecnie do opisu atomów, a faktycznie do opisu całej materii, mechanika
kwantowa zależy w zasadniczy sposób od poprawności zasady nieoznaczoności.
Ponieważ jednak mechanika kwantowa ma tak wielkie sukcesy, utwierdza to naszą wiarę
w słuszność tej zasady. Jeśli jednak kiedykolwiek zasada nieoznaczoności zostanie
„obalona", mechanika kwantowa zacznie dawać sprzeczne wyniki i trzeba będzie zaniechać
jej używania jako teprii obowiązującej.
„No, dobrze" - powiecie — a co z twierdzeniem A? Czy to w końcu prawda czy nie.
37-6. OBSERWACJA ELEKTRONÓW
185
\8z(wygładzone)
że elektron przechodzi albo przez otwór /,
albo przez otwór 2"? Możemy na to jedynie
odpowiedzieć, że na podstawie
doświadczenia przekonaliśmy się, że istnieje pewien
specjalny sposób rozumowania, którym trzeba
się posłużyć, aby nie popaść w sprzeczności.
Aby uniknąć błędnych przewidywań, musimy
powiedzieć, co następuje: Jeżeli patrzymy
na otwory, lub bardziej dokładnie, jeżeli
mamy urządzenie, które pozwala określić czy
elektrony przeszły przez otwór 1, czy przez
otwór 2, mamy prawo powiedzieć, że elektron
przeszedł przez otwór 1, albo przez otwór 2.
Kiedy jednak nie staramy się określić,
którędy przeszedł elektron, gdy nie ma w
doświadczeniu niczego, co by zaburzało
elektrony, wówczas nie wolno nam powiedzieć, że
elektron przeszedł albo przez otwór /, albo przez
otwór 2. Gdybyśmy zakaz ten złamali i na podstawie tego stwierdzenia usiłowali dokonać
jakichś dedukcji, wówczas w naszej analizie popełnilibyśmy błędy. Oto logiczna lina
akrobatyczna, po której musimy kroczyć, jeżeli chcemy skutecznie opisać przyrodę.
37.5. Obraz interferencyjny w
doświadczeniu z pociskami: a) rzeczywisty
(schematycznie), b) obserwowany
Jeżeli ruch całej materii — tak jak to było z elektronami — trzeba opisywać za
pomocą pojęć dotyczących fal, dlaczego nie było to konieczne w pierwszym doświadczeniu
z pociskami? Dlaczego wówczas nie wystąpiła interferencja? Okazuje się, że w przypadku
pocisków długości fal są tak maleńkie, że obraz interferencji staje się bardzo subtelny.
Do tego stopnia, że za pomocą żadnego detektora o skończonych rozmiarach nie można
rozdzielić poszczególnych maksimów i minimów. To, co widzieliśmy, było tylko swojego
rodzaju średnią, czyli krzywą klasyczną. Na rysunku 37.5 staraliśmy się zaznaczyć w
postaci schematu, co dzieje się w przypadku dużych ciał. Część a rysunku pokazuje
rozkład prawdopodobieństwa, jaki można przewidzieć dla pocisków posługując się
mechaniką kwantową. Gwałtowne zmiany krzywej mają przedstawiać obraz interferencyjny,
jaki otrzymuje się dla fal o bardzo małej długości. Jednakże każdy fizyczny detektor
obejmuje wiele maksimów i minimów krzywej prawdopodobieństwa, pomiary dają więc krzywą
gładką, pokazaną w części b rysunku.
37-7. Podstawowe zasady mechaniki kwantowej
Dokonamy obecnie podsumowania ważniejszych wniosków wypływających z naszych
doświadczeń. Wyniki nasze zapiszemy jednak w takiej postaci, aby były prawdziwe dla
całej klasy takich doświadczeń. Dokonanie podsumowania będzie prostsze, jeżeli zde-
186
37 EFEKTY KWANTOWE
finiujemy najpierw tzw. doświadczenie idealne, jako doświadczenie, w którym nie mamy
niekontrolowanych wpływów zewnętrznych, to znaczy nie zachodzi nic takiego, czego
nie moglibyśmy uwzględnić. Będziemy wystarczająco dokładni, jeżeli powiemy, że
„doświadczenie idealne — to takie doświadczenie, w którym wszelkie możliwe warunki
początkowe i końcowe są całkowicie określone". To, co będziemy nazywać „zdarzeniem",
jest ogólnie biorąc, po prostu pewnym szczególnym układem warunków początkowych
i końcowych (np. „elektron opuszcza działo, dociera do detektora i nic więcej się nie
dzieje"). Przejdźmy obecnie do naszego podsumowania.
Podsumowanie
1. Prawdopodobieństwo pewnego zdarzenia w doświadczeniu idealnym dane jest
przez kwadrat modułu liczby zespolonej ę, która nosi nazwę amplitudy
prawdopodobieństwa.
P=prawdopodobieństwo, \
ę=amplituda prawdopodobieństwa, J (37.6)
p=W\2. i
2. Gdy jakieś zdarzenie może zajść na kilka możliwych sposobów, amplituda
prawdopodobieństwa dla tego zdarzenia jest sumą amplitud prawdopodobieństwa dla każdego
ze sposobów z osobna. Występuje interferencja.
ę = ^ + ^\2 (37.7)
p=ki + d-
3. Jeśli w doświadczeniu można określić, która z możliwości zachodzi,
prawdopodobieństwo zdarzenia jest sumą prawdopodobieństw dla każdej z tych możliwości.
Interferencja znika.
P=Pl+P2. (37.8)
Można się jednak w dalszym ciągu pytać: „Dlaczego wszystko się odbywa w taki
właśnie sposób? Jaki mechanizm kryje się za tymi prawami?" Nikt jeszcze nie odkrył
żadnego mechanizmu. Nikt nie potrafi „wyjaśnić" więcej, niż my tu „wyjaśniliśmy".
Nikt nie da wam głębszej analizy sytuacji. Nic nie wiemy o jakimś bardziej podstawowym
mechanizmie, z którego działania można by nasze rezultaty wydedukować.
Chcielibyśmy jeszcze podkreślić bardzo ważną różnicę między mechaniką klasyczną
a kwantową. Mówiliśmy o prawdopodobieństwie pojawienia się elektronu w określonych
warunkach. Daliśmy więc do zrozumienia, że w naszym urządzeniu doświadczalnym
(a również i w najlepszym z możliwych) nie można dokładnie przewidzieć, co się stanie.
Możemy tylko przewidzieć szanse, jakie istnieją! Jeśli to prawda, oznaczałoby to, że fizyka
zrezygnowała z możliwości dokładnych przewidywań, co zajdzie w określonych
warunkach. I taK właśnie jest! Fizyka rzeczywiście zrezygnowała. Nie wiemy, w jaki sposób
przewidywać, co zajdzie w określonych warunkach i obecnie wierzymy, że takie przewidywania
są w ogóle niemożliwe, a jedyna rzecz, jaką można przewidzieć, to prawdopodobieństwo
poszczególnych zdarzeń. Trzeba sobie zdać sprawę, że jest to ograniczenie w stosunku
37-7. PODSTAWOWE ZASADY MECHANIKI KWANTOWEJ
187
do naszego dawnego ideału rozumienia przyrody. Być może, jest to krok wstecz, lecz
nikt nie znalazł, jak dotąd, sposobu jego usunięcia.
Ustosunkujemy się obecnie do propozycji, którą czasami się robi, starając się uniknąć
opisu, który podaliśmy przed chwilą. Mówi się, że „być może elektrony mają jakiś
mechanizm wewnętrzny, którego jeszcze nie znamy. Być może, dlatego właśnie nie możemy
przewidzieć, co się stanie. Gdybyśmy mogli przyjrzeć się elektronowi dokładniej,
potrafilibyśmy powiedzieć, w jakim miejscu w końcu się znajdzie. O ile nam wiadomo, to
również jest niemożliwe. W dalszym ciągu mielibyśmy kłopoty. Przypuśćmy, że
założyliśmy istnienie wewnątrz elektronu jakiegoś mechanizmu, który wyznacza miejsce, w jakim
się elektron znajdzie. Maszyneria ta musi również określić otwór, przez który elektron
przejdzie. Nie wolno nam jednak zapominać, że to, co się dzieje we wnętrzu elektronu,
powinno być niezależne od tego, co my robimy, a w szczególności nie powinno zależeć
od tego, czy zasłaniamy, czy odsłaniamy jeden z otworów. Jeśli więc elektron przed
wyruszeniem zdecydował się a) przez który otwór przejdzie i b) gdzie wyląduje, powinniśmy
otrzymać prawdopodobieństwo P, dla tych elektronów, które wybrały otwór /, a
prawdopodobieństwo P2 dla tych, które wybrały otwór 2, a wiec Pi + P2 dla tych, które
przybywają przechodząc przez którykolwiek z otworów. Wydaje się, że nie można tego
uniknąć. Sprawdziliśmy jednak doświadczalnie, że tak się nie dzieje. I nikt, jak dotąd, nie
znalazł wyjścia z tej sytuacji. Musimy się więc obecnie ograniczyć do obliczania
prawdopodobieństw. Mówimy „obecnie", jednak bardzo silnie podejrzewamy, że taka sytuacja
pozostanie już na zawsze, że nie ma z niej wyjścia i że przyroda zachowuje się właśnie
tak, a nie inaczej.
37-8. Zasada nieoznaczoności
A oto oryginalne sformułowanie zasady nieoznaczoności dokonane przez Heisen-
berga: Jeżeli dokonujemy pomiarów jakiegoś ciała i możemy wyznaczyć składową x
jego pędu z dokładnością Ap, nie możimy równocześnie określić jego współrzędnej x
z dokładnością większą niż Ax=h\Ap. Iloczyn nieoznaczoności położenia i pędu musi
być w każdej chwili większy niż stała Plancka. Jest to szczególny przypadek zasady
nieoznaczoności sformułowanej poprzednio bardziej ogólnie. Bardziej ogólne
sformułowanie głosiło, że nie można zaprojektować urządzenia, nie niszczącego obrazu
interferencyjnego i pozwalającego na stwierdzenie, która z dwóch możliwości wystąpiła.
Pokażmy na szczególnym przypadku, że jeżeli nie chcemy popaść w kłopoty, relacja
podana przez Heisenberga musi być słuszna. Wyobraźmy sobie modyfikację
doświadczenia pokazanego na rys. 37.3, polegającą na tym, że ściana z obu otworami jest płytą
umieszczoną na rolkach, w ten sposób, że może się poruszać swobodnie w górę i w dół
(w kierunku x), jak to pokazano na rys. 37.6. Obserwując dokładnie ruch płyty, możemy
próbować powiedzieć, przez który z otworów przeszedł elektron. Wyobraźmy sobie, co
się stanie, jeśli umieścimy detektor w punkcie x = 0. Oczekujemy, że elektron, który
przechodzi przez otwór / i ma osiągnąć detektor, musi zostać odbity w dól. Ponieważ
składowa pionowa pędu elektronu uległa zmianie, płyta musi doznać odrzutu i przesunąć
S'C z równym pędem w przeciwnym kierunku. Płyta dozna pchnięcia ku górze. Jeżeli
188
37. EFEKTY KWANTOWE
elektron przeszedł przez dolny otwór, płyta dozna pchnięcia ku dołowi. Jest jasne, że
dla każdego położenia detektora pęd, jaki uzyska płyta, będzie inny dla przejścia przez
otwór 1, a inny dla przejścia przez otwór 2. Nie zaburzając więc h- ogóle elektronów,
obserwując po prostu płytę, możemy powiedzieć, jaką drogę wybrał elektron.
Aby to wszystko przeprowadzić, musimy znać pęd przesłony przed przejściem przez
nią elektronu, tak aby mierząc pęd po jego przejściu, można było obliczyć, o ile pęd płyty
się zmienił. Pamiętajmy jednak, że zgodnie z zasadą nieoznaczoności nie możemy
równocześnie znać położenia płyty z dowolną dokładnością. Jeśli jednak nie wiemy dokładnie,
gdzie płyta się znajduje, nie możemy również powiedzieć, gdzie są oba otwory. Przy
przejściu każdego elektronu będą one w różnych miejscach. Oznacza to, że środek obrazu
interferencyjnego będzie miał dla każdego elektronu inne położenie. Maksima i minima będą
więc wygładzone. W następnym rozdziale pokażemy ilościowo, że gdy pęd płyty
wyznaczymy na tyle dokładnie, aby z pomiaru odrzutu móc określić, który otwór został
wybrany, wówczas nieoznaczoność współrzędnej x płyty będzie, zgodnie z zasadą
nieoznaczoności, wystarczająca, aby obraz interferencyjny rejestrowany przez detektor przesunąć
w górę i w dół na odległość równą odstępowi między maksimum a najbliższym minimum.
Takie przypadkowe przesunięcie wystarcza do wygładzenia obrazu na tyle, aby żadna
interferencja nie była obserwowana.
Zasada nieoznaczoności „ratuje" mechanikę kwantową. Heisenberg pierwszy
zrozumiał, że gdyby można było równocześnie zmierzyć położenie i pęd z większą dokładnością,
mechanika kwantowa runęłaby. Postawił więc hipotezę, że musi to być niemożliwe. Wielu
ludzi starało się wówczas znaleźć sposób, by temu zaprzeczyć, nikomu jednak nie udało
się podać metody zmierzenia położenia i pędu jakiegokolwiek ciała — przesłony,
elektronu, kuli bilardowej, czegokolwiek — z większą dokładnością. Mechanika kwantowa
prowadzi dalej swój niebezpieczny, lecz akuratny żywot.
37.6. Doświadczenie, w klórym mierzy się odrzut przesłony
przestana pochłaniacz
38
porównanie dwóch punktów widzenia:
falowego i korpuskularnego
38-1. Falowe amplitudy prawdopodobieństwa
W rozdziale tym dokonamy porównania dwóch punktów widzenia: falowego i
korpuskularnego. Wiemy już z poprzedniego rozdziału, że zarówno jeden, jak i drugi nie są
właściwe. Zwykle staraliśmy się przedstawiać omawiane zagadnienia zupełnie dokładnie,
a przynajmniej na tyle precyzyjnie, aby w trakcie dalszej nauki nie trzeba ich było
zmieniać — zostaną być może rozszerzone, lecz w żadnym wypadku zmienione! Gdy jednak
staramy się mówić o obrazie falowym lub o obrazie cząstkowym, musimy sobie zdać
sprawę, że oba są przybliżone i oba ulegną zmianie. To, czego nauczymy się z obecnego
rozdziału, nie będzie więc w pewnym sensie ścisłe; będziemy operować półintuicyjnymi
argumentami, które dopiero później uściślimy, pewne jednak sprawy, gdy
zinterpretujemy je poprawnie w mechanice kwantowej, zmienią się tylko nieznacznie. Oczywiście,
postępujemy tak tylko dlatego, że nie zamierzamy się obecnie zajmować mechaniką
kwantową, a mimo to chcielibyśmy uzyskać pewne pojęcie o tym, jakich efektów możemy
oczekiwać. Poza tym całe nasze doświadczenie dotyczy fal lub cząstek, wydaje się wiec użyteczne
wykorzystać te pojęcia do zrozumienia pewnych zjawisk, nim opanujemy w pełni
matematykę amplitud kwantowomechanicznych. Będziemy się starali wskazywać na słabe punkty
w naszym rozumowaniu, jednak w większości wypadków wszystko jest właściwie niemal
ścisłe, chodzi tylko o odpowiednią interpretację.
Jak wiemy, nowy sposób opisu świata w mechanice kwantowej polega na podaniu
amplitudy dla każdego zdarzenia, które może wystąpić. Jeżeli zdarzenie to polega na
Pfzykład na przybyciu jednej cząstki, możemy podać amplitudę określającą możliwość
znalezienia tej cząstki w różnych miejscach, w różnych chwilach czasu.
Prawdopodobieństwo natrafienia na taką cząstkę jest wówczas proporcjonalne do kwadratu modułu tej
190
38. PORÓWNANIE DWÓCH PUNKTÓW WIDZFNIa
amplitudy. W ogólności amplituda znalezienia
cząstki w różnych miejscach, w różnych chwilach
czasu zmienia się z czasem i z położeniem
W pev-nym szczególnym przypadku
amplituda ta może się zmieniać sinusoidalnie jak
38.1. Paczka falowa o długości Jjc e,(t0'~kr) (nie zapominajmy, że amplitudy te - to
liczby zespolone, a nie rzeczywiste), ma zatem
określoną częstość w i wektor falowy k. Jak się
okazuje, odpowiada to klasycznemu przypadkowi granicznemu, w którym
oczekiwalibyśmy, że mamy cząstkę o znanej energii E powiązanej z częstością zależnością
E = hw (38.1)
i o znanym pędzie p, powiązanym z wektorem falowym związkiem
p=fck. (38.2)
Oznacza to, że pojęcie cząstki jest ograniczone. Pojęcie cząstki — jej położenia, pędu
itd. — tak często przez nas używane, jest pod pewnymi względami nie zadowalające.
Jeśli na przykład amplituda znalezienia cząstki w różnych miejscach dana jest przez funkcję
e' ""-k'r), której kwadrat modułu jest stały, oznacza to, że prawdopodobieństwo znalezienia
cząstki jest takie samo dla wszystkich punktów. Nie wiemy więc, gdzie się ona rzeczywiście
znajduje — może być w dowolnym miejscu: nieoznaczoność jej położenia jest ogromna.
Z drugiej strony, jeżeli położenie cząstki jest mniej lub bardziej znane i możemy je
przewidzieć dość dobrze, prawdopodobieństwo znalezienia jej w różnych miejscach musi
się ograniczać do obszaru o pewnej średnicy Ax. Poza nim prawdopodobieństwo równa się
zeru. Ponieważ prawdopodobieństwo to równa się kwadratowi modułu pewnej amplitudy,
sama amplituda musi również być równa zeru. Mamy więc pewien ciąg fal, którego
całkowita długość jest równa Ax (rys. 38.1), a długość fali (odległość między węzłami w tym ciągu)
tego ciągu jest tym, co odpowiada pędowi cząstki.
Natrafiamy tu na pewną osobliwość dotyczącą fal; jest to coś bardzo prostego, nie
mającego zasadniczo nic wspólnego z mechaniką kwantową. Wie o tym każdy, kto uczył się
o falach, nawet jeśli nie miał nigdy do czynienia z mechaniką kwantową. Mianowicie,
nie można zdefiniować jednej długości fali dla krótkiego ciągu fal. Ciąg taki nie ma określonej
długości fali: występuje nieoznaczoność wektora falowego, która jest związana ze skończoną
długością ciągu, mam> więc również i nieoznaczoność pędu.
38-2. Pomiar położenia i pędu
Rozpatrzmy dwa przykłady tej koncepcji i zobaczmy, jakie są przyczyny tego, że mamy
nieoznaczoność położenia i (lub) pędu. Widzieliśmy już poprzednio, że gdyby takiej
nieoznaczoności nie było - gdyby można było zmierzyć położenie i pęd czegokolwiek
równocześnie — natrafilibyśmy na paradoks; na szczęście nie mamy takiego paradoksu, a to,
że taka sama nieoznaczoność wynika w sposób naturalny z obrazu falowego, wskazuje,
że wszystko jest wzajemnie zgodne.
V\M/v^
38-2 POMIAR POŁOŻENIA I PĘDU
191
Oto pierwszy z przykładów, ukazujących związek, jaki zachodzi między położeniem
a pędem w łatwej do zrozumienia sytuacji. Przypuśćmy, że mamy pojedynczą szczelinę,
a cząstki mające określoną energię przybywają z bardzo daleka — zasadniczo więc wszystkie
biegną poziomo (rys. 38.2). Skoncentrujemy się na poprzecznych składowych pędu.
Wszystkie te cząstki mają pewien, określony w sensie klasycznym pęd poziomy, powiedzmy />0.
W sensie klasycznym więc pęd poprzeczny py przed przejściem cząstek przez otwór jest
również określony. Cząstka nie porusza się ani w górę, ani w dół, gdyż przebywa z bardzo
oddalonego źródła — jej pęd poprzeczny jest więc oczywiście równy zeru. Przypuśćmy
jednak, że przechodzi ona przez otwór o szerokości B. Wówczas po przejściu przez ten
otwór znamy jej położenie w kierunku pionowym — składową y — ze znaczną
dokładnością, mianowicie ±B. A więc nieokreśloność położenia, Ay, jest rzędu B. Chciałoby się
również powiedzieć — ponieważ wiemy, że pęd jest całkowicie poziomy — że Apy równa się
zeru; byłoby to jednak błędne. Wiedzieliśmy, że poprzednio pęd był poziomy, nie wiemy
jednak, czy i obecnie jest to prawda. Przed przejściem cząstek przez otwór nie znaliśmy ich
położeń poprzecznych. Obecnie, gdy przepuszczając cząstkę przez otwór znaleźliśmy je,
straciliśmy informację o pędzie poprzecznym! Dlaczego? Zgodnie z teorią falową po
przejściu fal przez szczelinę następuje, tak jak w przypadku światła, dyfrakcja. Mamy więc pewne
prawdopodobieństwo tego, że cząstki po przejściu przez szczelinę nie biegną zupełnie
prosto. Wskutek efektu dyfrakcyjnego obraz zostaje rozszerzony, a kąt określający to
rozszerzenie, który możemy zdefiniować jako kąt pierwszego minimum, jest miarą
nieokreśloności końcowego kąta cząstki.
W jaki jednak sposób następuje to rozszerzenie? Bezsprzecznie oznacza ono, że istnieje
pewna szansa, aby cząstka poruszała się w górę lub w dół, czyli miała tak właśnie
skierowaną składową pędu. Mówimy szansa i cząstka, ponieważ obraz dyfrakcyjny, o którym mowa,
możemy wykrywać za pomocą licznika cząstek i gdy licznik ten rejestruje cząstkę,
powiedzmy w punkcie C na rys. 38.2, jest to zawsze cala cząstka, tak że w sensie klasycznym cząstka
ma pęd poprzeczny, inaczej bowiem nie przeszłaby od szczeliny do punktu C.
Aby uzyskać przybliżone pojęcie o
rozmyciu pędu, przyjmijmy, że pęd poprzeczny py
ma rozmycie równe pa A6, gdzie p0 jest pędem
poziomym. Jak duże jest natomiast A6
w otrzymanym obrazie dyfrakcyjnym? Wiemy,
że pierwsze minimum występuje przy kącie
-W, przy którym fale z jednego końca
szczeliny muszą przebyć o jedną długość fali
więcej niż fale z drugiego końca.
Przekonaliśmy się o tym poprzednio. Zatem J0 równa się
A B, a Apy w tym doświadczeniu równa się
PoA/B. Zwróćmy uwagę, że jeśli zmniejszymy B
i dokonamy dokładniejszego pomiaru
położenia cząstki, obraz dyfrakcyjny stanie się
szerszy. Pamiętamy, że gdy przysłoniliśmy
szczelinę w doświadczeniu z mikrofalami.
38.2. Dyfrakcja cząstek przechodzących przez
szczelinę
. t*
AB
192
38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA
natężenie mierzone w oddalonych miejscach wzrosło. Im więc szczelina będzie węższa,
tym szerszy stanie się obraz i tym większa możliwość, że stwierdzimy, iż cząstka ma pęd
poprzeczny. Nieokreśloność pędu poprzecznego jest więc odwrotnie proporcjonalna do
nieokreśloności y. Widzimy mianowicie, że iloczyn równa się p0A. Lecz A jest długością fali,
a Po - pędem, a zgodnie z mechaniką kwantową iloczyn długości fali i pędu równa się
stałej Plancka h. Stwierdzamy więc, że iloczyn nieoznaczoności pędu poprzecznego i
współrzędnej poprzecznej jest rzędu h:
AyApyxh. (38.3)
Nie można przygotować układu, w którym znalibyśmy położenie pionowe cząstki i umieli
przewidzieć, jak będzie się ona poruszać w kierunku pionowym, z większą pewnością niż
dana przez wzór (38.3). A więc nieoznaczoność pędu poprzecznego musi przekraczać
h/Ay, gdzie Ay jest nieoznaczonością, z jaką znamy położenie.
Czasami ludzie mówią, że mechanika kwantowa jest zupełnie błędna. Gdy cząstka
przybywała z lewej strony, jej pęd w kierunku pionowym równał się zeru. Obecnie natomiast,
gdy przeszła przez szczelinę, jej położenie jest znane. Wydaje się więc, że zarówno
położenie, jak i pęd znane są z dowolną dokładnością. To prawda, że możemy zarejestrować
cząstkę i wyznaczyć jej położenie oraz stwierdzić, jaki pęd musiała mieć poprzednio, aby
wylądować właśnie w tym miejscu. To prawda, ale nie tę sytuację ilustruje związek (38.3).
Wzór (38.3) dotyczy możliwości przewidywania określonej sytuacji, a nie uwag o przeszłości.
Nie ma żadnego pożytku ze stwierdzenia: „Znałem pęd cząstki, nim przeszła ona przez
szczelinę, a obecnie znam jej położenie", gdyż obecnie informacje o pędzie zostały
stracone. Fakt, że cząstka przeszła przez szczelinę, nie pozwala już dłużej przewidzieć, jaki jest
jej pęd w kierunku pionowym. Mówimy o teorii, która ma zdolność dokonywania
przewidywań, a nie o pomiarach dokonanych po fakcie. Trzeba więc mówić o tym, co możemy
przewidzieć.
Podejdźmy obecnie do omawianego zagadnienia w nieco inny sposób. Rozpatrzmy nieco
bardziej ilościowo inny przykład tego samego zjawiska. W poprzednim przykładzie
mierzyliśmy pęd przy pomocy metody klasycznej. Rozważaliśmy mianowicie kierunek,
prędkość, kąty itd. Ponieważ jednak pęd jest związany z wektorem falowym, istnieje w
przyrodzie jeszcze inny sposób zmierzenia pędu cząstki — fotonu lub jakiejś innej — który nie
ma swojego klasycznego odpowiednika, gdyż korzysta ze
związku (38.2). Sposób ten polega na zmierzeniu długości
38.3. Wyznaczanie pędu za fal. Spróbujmy zmierzyć pęd w ten właśnie sposób,
pomocą siatki dyfrakcyjnej Przypuśćmy, że mamy siatkę dyfrakcyjną o bardzo wielu
liniach (rys. 38.3), na którą pada wiązka cząstek. Problem
~~ ten rozważaliśmy dość często: jeśli cząstki mają określony
pęd, otrzymujemy, wskutek interferencji, bardzo silne
wzmocnienie w pewnych kierunkach. Mówiliśmy również o tym,
_ z jaką dokładnością można wyznaczyć ten pęd, to znaczy jaka
jest zdolność rozdzielcza takiej siatki. Zamiast wyprowadzać
to od nowa, powołamy się na rozdz. 30, w którym
stwierdziliśmy, że względna nieokreśloność długości fali, mierzo-
38-2. POMIAR POŁOŻENIA 1 PĘDU
193
nej za pomocą danej siatki, równa się l/Nm, gdzie N jest liczbą linii siatki, a m określa
rząd obrazu dyfrakcyjnego. Tak więc
/4A/A=l/Nw. (38.4)
Wzór ten można również zapisać jako
zlA/A2 = l/NroA=l/L, (38.5)
gdzie L jest odległością pokazaną na rys. 38.3. Odległość ta równa jest różnicy między drogą,
jaką przebywa cząstka, fala czy coś jeszcze innego, co się odbija od dolnego końca siatki,
a drogą, jaką musi przebyć, gdy jest odbite od górnego końca. A więc fale, które tworzą
obraz dyfrakcyjny, są falami przybywającymi z różnych punktów siatki. Pierwsze, które
przybywają, przychodzą z jej dolnego końca i pochodzą z czoła ciągu fal, pozostałe
natomiast pochodzą z dalszych części ciągu i przybywają z innych części siatki, aż wreszcie
przybędzie ostatnia, związana z punktem ciągu falowego, leżącym w odległości L za jego
czołem. Aby więc otrzymać w naszym widmie ostrą, odpowiadającą określonemu pędowi
linię, z dokładnością daną przez związek (38.4), musimy mieć ciąg fal o długości równej
przynajmniej L. Gdy ciąg ten jest zbyt krótki, nie wykorzystujemy całej siatki. Jeżeli tylko
ciąg będzie zbyt krótki, fale tworzące widmo zostaną odbite od krótkiego odcinka siatki
i nie będzie ona działać należycie — stwierdzimy duże rozmycie kątowe. Aby stało się ono
węższe, musimy użyć całej siatki, tak żeby przynajmniej przez chwilę ciąg fal rozpraszał się
równocześnie na wszystkich jej częściach. Aby więc nieoznaczoność długości fali nie
przekraczała podanej przez wzór (38.5), ciąg fal musi mieć długość L. Ponieważ jednak
zU/A2=zJ(l/A) = zJk/2jt, (38.6)
więc
zJ/c = 2ti/L, (38.7)
gdzie L jest długością ciągu fal.
Oznacza to, że gdy mamy ciąg fal o długości mniejszej od L, nieoznaczoność wektora
falowego musi przewyższać 2n/L. A więc nieoznaczoność wektora falowego mnożona przez
długość ciągu fal, którą chwilowo oznaczymy Ax, przewyższa 2tc. Wprowadziliśmy
określenie Ax, ponieważ długość ciągu odpowiada nieoznaczoności położenia cząstki. Gdy ciąg fal
ma skończoną długość, wówczas tylko w obszarze jego występowania można z dokładnością
Ax znaleźć cząstkę. Ta własność fal, na której mocy długość pewnego ciągu mnożona przez
nieoznaczoność związanego z nim wektora falowego równa się co najmniej 2n, jest dobrze
znana każdemu, kto się kiedykolwiek o nich uczył. Nie ma ona nic wspólnego z mechaniką
kwantową. Chodzi po prostu o to, że gdy mamy skończony ciąg fal, nie umiemy przeliczyć
wystarczająco dokładnie liczby fal, jakie on zawiera. Spróbujmy znaleźć przyczynę tego
w jeszcze inny sposób.
Przypuśćmy, że mamy skończony ciąg o długości L. Ze względu na to, że musi się on
zmniejszać przy końcach, tak jak to pokazano na rys. 38.1, liczba fal, jaką mamy na
długości L, określona jest z dokładnością w rodzaju ±1. Lecz liczba fal na odcinku o
długości L równa się kLjln. Dokładna wartość k nie jest więc określona i ponownie
otrzymujemy związek (38.7), po prostu jako własność fal. Jest to słuszne zarówno wtedy, gdy fale
194
38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA
biegną w przestrzeni, a k równa się liczbie radianów na centymetr, L zaś jest długością
ciągu, jak i wtedy, gdy przebieg odbywa się w czasie, a to jest liczbą drgań na sekundę,
T zaś „długością" czasu, w jakim obserwujemy ten ciąg. Jeśli więc mamy ciąg fal trwający
tylko przez pewien skończony czas T, nieoznaczoność częstości dana jest wzorem
Am = 2njT. (38.8)
Staraliśmy się podkreślić, że te własności są własnościami fal w ogólności i są dobrze znane,
np. w teorii dźwięku.
Możliwość ich wykorzystania do naszych celów bierze się stąd, że w mechanice
kwantowej interpretujemy wektor falowy jako miarę pędu cząstki (p=hk); związek (38.7) mówi
nam więc,że ApKhjAx. Mamy więc ograniczenie klasycznego pojęcia pędu (oczywiście, musi
być ono w pewien sposób ograniczone, jeżeli mamy reprezentować cząstki przez fale!).
Dobrze, że znaleźliśmy prawo, które daje nam pewne wyobrażenie o zakresie pojęć
klasycznych.
38-3. Dyfrakcja na kryształach
Rozpatrzmy z kolei odbicie fal materialnych od kryształu. Kryształ — to coś grubego,
złożonego z ogromnej liczby jednakowych atomów (pewne komplikacje uwzględnimy
później) tworzących zgrabną siatkę. Chodzi o to, jak ustawić tę siatkę, aby otrzymać
silne maksimum w określonym kierunku dla określonej wiązki, np. światła (promieni
Róntgena), elektronów, neutronów czy czegokolwiek. Jeżeli mamy otrzymać silne odbicie,
rozproszenie na wszystkich atomach musi być zgodne w fazie. Gdyby równe sobie liczby fal
były zgodne i niezgodne w fazie, redukowałyby się nawzajem. Aby wszystko przebiegało
pomyślnie, należy, jak to już wyjaśniliśmy poprzednio, znaleźć obszary stałej fazy; są nimi
płaszczyzny ustawione pod takim samym kątem względem kierunku początkowego i
końcowego (rys. 38.4).
Gdy rozpatrzymy dwie płaszczyzny równoległe, jak to pokazano na rys. 38.4, fale
odbite od nich będą zgodne w fazie, pod warunkiem, że różnica odległości przebytych
przez front fali równa się całkowitej liczbie długości fal. Jak widzimy z rysunku, różnica ta
równa się Id sin 6, gdzie d jest odległością między dwiema płaszczyznami. Warunek na
koherentne odbicie wygląda więc następująco:
2dńr>6=nX (n = l ,2, ...). (38.9)
Jeśli na przykład kryształ będzie taki, że atomy będą leżały akurat na płaszczyznach
spełniających warunek (38.9) z n=\, nastąpi silne odbicie, jeżeli natomiast w krysztale
wystąpią również inne atomy o tej samej gęstości co poprzednie i umieszczone w połowie
drogi między nimi, wówczas płaszczyzny pośrednie, które one tworzą, będą rozpraszać
równie silnie i odbite fale będą interferować z poprzednimi powodując brak jakiegokolwiek
efektu. Wielkość d we wzorze (38.9) musi więc dotyczyć płaszczyzn przylegających do
siebie; nie wolno brać płaszczyzn przedzielonych pięcioma innymi i stosować do nich
naszego wzoru!
38-3. DYFRAKCJA NA KRYSZTAŁACH
195
Jednakże prawdziwe kryształy nie są
zbudowane z jednego gatunku
powtarzających się atomów. Są natomiast podobne
— jeżeli wprowadzimy dwuwymiarową
analogię — do tapet, które zwykle mają
pewien powtarzający się rysunek. W
przypadku atomów przez „rysunek"
rozumiemy pewne ich ustawienie — wapń, węgiel
i trzy atomy tlenu dla węglanu wapnia
— które może składać się ze
stosunkowo dużej liczby atomów. W każdym bądź
razie konfiguracja ta powtarza się w całej
siatce. Tę zasadniczą konfigurację
nazywamy komórką podstawową.
Na podstawie tej powtarzającej się
konfiguracji określamy to, co nazywamy
typem sieci krystalicznej; typ sieci można
natychmiast wyznaczyć patrząc na obraz,
jaki otrzymujemy w wyniku odbicia, i
określając jego symetrię. Innymi słowy,
miejsca, w których notujemy odbicie, określają
typ sieci. Aby jednak stwierdzić, z czego
ona jest zbudowana, musimy wziąć pod
uwagę natężenie rozproszenia w różnych
kierunkach. W którym kierunku odbywa
się rozproszenie, zależy od typu sieci, jak
silnie natomiast się ono odbywa, zależy
od tego, co się mieści w komórce
podstawowej. W ten właśnie sposób poznaje się
strukturę kryształów.
Dwie fotografie obrazu dyfrakcyjnego,
otrzymanego za pomocą promieni Rónt-
gena (fot. 38.5 i 38.6), przedstawiają
odpowiednio rozpraszanie ■ na soli
kamiennej i mioglobinie.
Ciekawa rzecz występuje, gdy odstępy
między najbliższymi płaszczyznami są
mniejsze niż A/2. W tym przypadku
równanie (38.9) nie ma rozwiązania na n. Jeśli
więc A jest większe niż podwojona odległość
między sąsiadującymi płaszczyznami, nie
ma obrazu dyfrakcyjnego i światło — lub
cokolwiek to jest - przechodzi przez sub-
38.4. Rozpraszanie fal na płaszczyznach
krystalicznych
38.5
38.6
196
38. PORÓWNANIE DWÓCH PUNKTÓW WrDZENIA
neutrony o małym 'K
//
reaktor -*■
grafit
-♦■ neutrony
-»■ o dużym A.
neutrony o małym \
38.7. Dyfuzja neutronów reaktorowych przez blok grafitu
38.8. Natężenie neutronów po przejściu przez blok
grafitu jako funkcja długości fal
stancję nie odbijając się ani nie
ulegając osłabieniu. A zatem
światło, którego długość fali A
jest o wiele większa od tych
odległości, przechodzi bez
przeszkód i nie ma żadnego obrazu
dyfrakcyjnego spowodowanego
odbiciem od płaszczyzn
kryształu.
Fakt ten ma również
interesujące konsekwencje w
przypadku produkowanych w reaktorze
neutronów (są one z pewnością
cząstkami, można się o to
założyć!). Jeśli neutrony te
przepuścimy przez długi blok grafitowy,
będą one dyfundować i torować
sobie drogę naprzód (rys. 38.7).
Dyfundują, ponieważ zostają
odbite od atomów grafitu,
jednakże dokładnie, według teorii
falowej, zostają odbite przez
atomy wskutek dyfrakcji na
płaszczyznach krystalicznych. Okazuje się, że jeśli weźmiemy bardzo długi kawałek grafitu,
wszystkie neutrony, które dotrą do drugiego końca, będą miały dużą długość fali! Jeżeli
wykreślimy natężenie jako funkcję długości fali, efekt niezerowy otrzymamy dopiero dla fal
powyżej pewnego minimum (rys. 38.8). Innymi słowy, możemy w ten sposób otrzymać
bardzo powolne neutrony. Tylko najwolniejsze neutrony przechodzą, nie ulegają dyfrakcji ani
rozproszeniu na płaszczyznach krystalicznych grafitu, lecz biegną prosto przed siebie,
tak jak światło przez szkło. Istnieje wiele innych sposobów pokazania, że fale neutronowe
występują w rzeczywistości i że tak samo jest dla fal związanych z innymi cząstkami.
A-mln
38-4. Rozmiary atomu
Rozpatrzymy teraz inne zastosowanie zasady nieoznaczoności [równanie (38.3)]. Nie
należy jednak tego, co będziemy robili, brać zbyt poważnie; sama idea jest słuszna, analiza
jednak nie jest zbyt dokładna. Chodzi o wyznaczenie rozmiarów atomów oraz o to, że z
punktu widzenia fizyki klasycznej elektrony promieniowałyby światło i po jakimś czasie
lądowałyby na jądrze. Nie może to jednak być słuszne w mechanice kwantowej, gdyż wówczas
wiedzielibyśmy, gdzie każdy elektron się znajduje oraz jak szybko się porusza.
Przypuśćmy, że mamy atom wodoru i mierzymy położenie elektronu. Możliwość
dokładnego przewidzenia, gdzie elektron będzie się znajdować, powinna być niemożliwa,
38-4. ROZMIARY ATOMU
197
gdyż rozmycie pędu byłoby wówczas nieskończone. Za każdym razem, gdy patrzymy na
elektron, znajduje się on w pewnym miejscu, jednakże jego amplituda nie znika i w innych
punktach. Istnieje więc prawdopodobieństwo znalezienia elektronu w różnych miejscach.
Miejsca te nie mogą przypadać jedynie na jądro. Założymy, że istnieje rozmycie położenia
rzędu a, tzn. że odległość elektronu od jądra wynosi przeważnie około a. Wyznaczymy a,
minimalizując całkowitą energię atomu.
Ze względu na zasadę nieoznaczoności rozmycie pędu równa się w przybliżeniu h\a.
Jeśli więc będziemy się starali wyznaczyć w pewien sposób pęd elektronu, np. rozpraszając
na nim promienie Róntgena i mierząc powstający efekt Dopplera, nie powinniśmy
otrzymać za każdym razem zera - elektron nie stoi nieruchomo — pędy, które mierzymy,
muszą być rzędu p za h/a. Energia kinetyczna równa się wówczas w przybliżeniu \mv2=p2\2m =
= h2/2ma2. (W pewnym sensie jest to swojego rodzaju analiza wymiarów, pozwalająca
stwierdzić, w jaki sposób energia kinetyczna zależy od stałej Plancka, od masy m i od
rozmiarów atomu. Nie musimy wierzyć naszej odpowiedzi, jeśli chodzi o czynniki w rodzaju 2, n itd.
Nie zdefiniowaliśmy nawet zbyt dokładnie a.) Energia potencjalna natomiast równa się
minus e2, dzielone przez odległość od środka, powiedzmy —e2\a, gdzie jak pamiętamy e2
jest podniesionym do kwadratu ładunkiem elektronu podzielonym przez 4n£0- Widzimy,
że gdy a staje się mniejsze, energia potencjalna również ulega zmniejszeniu, lecz im mniejsze
staje się a, tym większy, ze względu na zasadę nieoznaczoności, musi być pęd, a tym samym
i energia kinetyczna. Całkowita energia równa się
E=h2l2ma2-e2la. (38.10)
Nie wiemy, czemu się równa a, wiemy jednak, że atom będzie się starać osiągnąć pewien
kompromis, tak aby energia była najmniejsza, jak to jest możliwe. Aby zminimalizować E,
różniczkujemy wyrażenie (38.10) względem a, przyrównujemy pochodną do zera i
otrzymane równanie rozwiązujemy względem a. Pochodna E równa się
dElda=-h2/ma3 + e2la2, (38.11)
a przyjęcie dEjda=0 daje na a wartość
ao = /»2/"»?2=0,528A=0,528-10"I0m. (38.12)
Odległość ta nosi nazwę promienia Bohra. Dowiedzieliśmy się w ten sposób, że wymiary
atomowe są rzędu angstremów, co jak się okazuje, jest prawdą. To wspaniale, gdyż jak
dotychczas, nie mieliśmy żadnej podstawy pozwalającej oszacować rozmiary atomów!
Z punktu widzenia fizyki klasycznej istnienie atomów jest zupełnie niemożliwe, gdyż
elektron opuściłby się po spirali na jądro.
Jeśli wartość a0, daną wyrażeniem (38.12), wstawimy do wzoru (38.10), stwierdzimy,
ze energia równa się
E0= -e2l2a0= -me*/2h2= -13,6eV. (38.13)
Co oznacza ujemna energia? Oznacza, że gdy elektron przebywa w atomie, ma mniej
energii niż wtedy, gdy jest swobodny, a więc elektron jest w atomie związany. Oznacza, że
dla wyrzucenia elektronu na zewnątrz potrzebna jest energia; aby zjonizować atom wodoru
198
38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA
potrzebna jest energia rzędu 13,6 eV. Nie ma powodu, dla którego nie moglibyśmy
przypuszczać, że energia ta jest 2 albo 3 razy większa lub równa się połowie, czy też (l/n)
tej wielkości, gdyż argumenty, jakich używaliśmy, nie były zbyt porządne. Chociaż trochę
„oszukiwaliśmy", użyliśmy jednak wszystkich stałych w ten sposób, że wyszła dobra
liczba! Tę liczbę, 13,6 eV, nazywa się jednym Rydbergiem energii. Jest to energia jonizacji
atomów wodoru.
Rozumiemy więc już, dlaczego chodząc po podłodze nie spadamy na dół. Gdy
przechadzamy się, nasze buty składające się z olbrzymiej liczby atomów napierają na podłogę,
która również składa się z dużej liczby atomów. Aby ścisnąć bardziej atomy, trzeba
zamknąć elektrony w mniejszym obszarze, a wówczas ich pędy, na podstawie zasady
nieoznaczoności, będą musiały być średnio większe, a to oznacza wyższą energię; odporność
atomów na ściskanie jest więc efektem kwantowym, a nie klasycznym. Z punktu widzenia fizyki
klasycznej oczekiwalibyśmy, że gdy będziemy coraz bardziej przybliżać do siebie elektrony
i protony, energia będzie się w dalszym ciągu zmniejszać, a najlepszym ustawieniem
ujemnych i dodatnich ładunków będzie umieszczenie jednych na drugich. Było to rozumowanie
dobrze znane fizyce klasycznej i stanowiło dla niej wielką zagadkę, ponieważ istniały
atomy. Oczywiście, ówcześni naukowcy musieli znaleźć jakieś wyjście z tych kłopotów
— nieważne jakie ono było, w każdym bądź razie obecnie mamy już właściwe wyjaśnienie!
(Być może.)
Jak się również okazuje, chociaż nie potrafimy tego chwilowo zrozumieć, gdy mamy dużo
elektronów, starają się one unikać nawzajem. Gdy jeden elektron zajmuje pewien obszar,
drugi nie może się już w nim znajdować. Dokładniej mówiąc, mamy jeszcze dwie
możliwości dla spinów, tak że jeden elektron może się znajdować na drugim, jeżeli tylko ich spiny
skierowane są przeciwnie. Lecz więcej elektronów w tym miejscu umieścić już nie można.
Inne trzeba lokować gdzie indziej i to jest prawdziwa przyczyna wytrzymałości substancji.
Gdybyśmy mogli umieścić wszystkie elektrony w tym samym miejscu, substancje uległyby
jeszcze większemu zgęszczeniu, niż dzieje się to normalnie. To właśnie fakt, że elektronów
nie można umieszczać jeden na drugim, powoduje trwałość stołów czy krzeseł.
Widzimy więc, że aby wyjaśnić własności materii, będziemy musieli posłużyć się
mechaniką kwantową, a nie zadowalać się jedynie mechaniką klasyczną.
38-5. Poziomy energetyczne
Mówiliśmy dotychczas o atomie w jego najniższym stanie energetycznym. Okazuje się
jednak, że elektron może się poruszać i w bardziej energiczny sposób, mamy więc również
i inne możliwe ruchy atomu. Zgodnie z mechaniką kwantową, atom w warunkach
stacjonarnych może mieć tylko pewne ściśle określone wartości energii. Widzimy to z rys. 38.9,
na którym odkładamy energię pionowo i dla każdej dozwolonej wartości energii rysujemy
linię poziomą. Gdy elektron jest swobodny, tzn. wtedy gdy energia jest dodatnia, każda
wartość energii jest dopuszczalna; elektron może się poruszać z dowolną szybkością-
Energie elektronu związanego nie są natomiast dowolne Atom ma do wyboru tylko jedną
z układu pewnych dopuszczalnych wartości, takich jak te 7 rys. 38.9.
38-S. POZIOMY ENERGETYCZNE
199
Oznaczmy te dozwolone wartości energii £0, E,, £2, £,. Atom znajdujący się
początkowo w jednym z tych „stanów wzbudzonych", £,, £2 itd., nie pozostaje w nim na zawsze.
Prędzej czy później spada do stanu niższego, wypromieniowujac energię w postaci światła.
Częstość emitowanego światła określona jest przez zasadę zachowania energii wraz z
warunkiem mechaniki kwantowej mówiącym, że częstość światła jest związana z jego energią
zależnością (38.1). Tak więc częstość światła emitowanego przy przejściu z poziomu Ej
na poziom E, równa się
w31=(£J-E1)/ft. (38.14)
Jest to więc pewna charakterystyczna częstość atomu, która określa położenie pewnej linii
widmowej w emitowanym przez ten atom promieniowaniu. Inne możliwe przejście — to
przejście z poziomu £3 na poziom E0. Będzie ono miało inną częstość:
w30=(E3-E0)jh. (38.15)
Jeszcze inna możliwość występuje wtedy, gdy atom wzbudzony do stanu £,, spada do stanu
podstawowego emitując foton o częstości
w10 = (£,-£„)/*. (38.16)
Podaliśmy aż trzy przejścia, gdyż chcielibyśmy wskazać na pewien interesujący związek.
Z zależności (38.14), (38.15) i (38.16) wynika, że
W3o = W3,+tó10 (38.17)
Całkiem ogólnie, jeżeli znaleźliśmy dwie linie widmowe, oczekujemy, że dla częstości
równej sumie (lub różnicy) poprzednich częstości znajdziemy jeszcze jedną linię oraz że
położenia wszystkich tych linii można zrozumieć wprowadzając pewien ciąg poziomów,
taki że każda linia odpowiada różnicy energii jakiejś pary poziomów. Ta wspaniała zgodność
częstości widmowych została zauważona przed odkryciem mechaniki kwantowej i nazywa się
ją zasadą kombinacji Ritza. Z punktu widzenia mechaniki klasycznej jest to jeszcze jedna
zagadka. Nie zatrzymujmy się już dłużej nad tym, że fizyka klasyczna zawodzi kompletnie
w dziedzinie atomowej; wydaje się, że pokazaliśmy to już dość dobrze.
Mówiliśmy już o tym, że w mechanice kwantowej pojawiło się pojęcie amplitud, które
zachowują się jak fale z pewnymi częstościami i wektorami falowymi. Zobaczmy czy
operując jedynie amplitudami można zrozumieć
pojawienie się dyskretnych poziomów energetycznych
atomu. Na podstawie tego, co powiedzieliśmy do tej
pory, trudno zrozumieć, jak to jest możliwe.
Przypomnijmy jednak sobie dobrze znany fakt, że fale
zamknięte w ograniczonej przestrzeni mają określone
częstości. Gdy na przykład fale dźwiękowe są
zamknięte w piszczałce organowej lub w czymś
podobnym, drgania mogą się odbywać na różne sposoby;
każdemu z nich odpowiada jednak ściśle określona
częstość. Obiekt, w którym fale zostały zamknięte
38.9. Diagram poziomów
energetycznych atomu ukazujący różne
możliwe przejścia
i
LU
u
£ (J' .', >/>.
F?
1
<-2
f.
T . r„
200
38 PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA
ma więc pewne częstości rezonansowe. A zatem, możliwość występowania tylko przy
pewnych określonych częstościach jest własnością fal zamkniętych w ograniczonej
przestrzeni (zagadnieniem tym, włącznie z podaniem odpowiednich wzorów, zajmiemy się
później). Ponieważ jednak między częstością amplitudy a energią istnieje określony
związek, nie powinno więc nas zbytnio dziwić, że dla elektronów związanych w atomach
otrzymujemy określone energie.
38-6. Konsekwencje filozoficzne
Rozpatrzmy krótko niektóre filozoficzne wnioski wypływające z mechaniki kwantowej.
Jak zwykle, mamy dwie strony tego zagadnienia: pierwsza — to wnioski filozoficzne płynące
dla fizyki, druga - to ekstrapolacja problemów filozoficznych do innych dziedzin. Gdy
związane z nauką koncepcje filozoficzne są przenoszone do innej dziedziny, zostają
przeważnie całkowicie zniekształcone. Ograniczymy się więc jak tylko można do samej fizyki.
Najbardziej interesującą sprawą jest bez wątpienia koncepcja zasady nieoznaczoności;
dokonanie obserwacji zmienia samo zjawisko. O tym, że dokonywanie obserwacji ma wpływ
na zjawisko, wiedziano zawsze. Istotne jest jednak, że efektu tego nie można pominąć,
zminimalizować lub zmniejszyć w określony sposób zmieniając odpowiednio urządzenie.
Gdy badamy jakieś zjawisko, nie możemy uniknąć zaburzenia go w pewien określony,
minimalny sposób i zaburzenie to jest niezbędne do utrzymania nie sprzeczności całego
obrazu. Również w fizyce przedkwantowej obserwator był czasami potrzebny, lecz raczej
w banalnych sytuacjach. Wysuwano na przykład następujący problem: w lesie wali się
drzewo, a w pobliżu nie ma nikogo, kto by mógł to usłyszeć. Czy wywoła ono jakiś dźwięk?
Prawdziwe drzewo padające w prawdziwym lesie zawsze wywołuje dźwięk, oczywiście
nawet i wtedy, gdy nikogo tam nie było. Nawet jeśli nie było nikogo, kto by mógł to usłyszeć,
pozostały jakieś ślady. Dźwięk spowoduje wstrząs liści i jeśli będziemy wystarczająco
dokładni, stwierdzimy, że na którymś tam liściu powstało jakieś maleńkie zadrapanie, którego
nie można wytłumaczyć, jeżeli się nie założy, że ilść doznał wibracji. W pewnym więc sensie
musimy przyznać, że dźwięk wystąpił. Można się natomiast pytać, czy wystąpiło wrażenie
dźwięku. Odpowiadamy na to negatywnie, gdyż wrażenia są prawdopodobnie związane
ze świadomością. A o tym czy mrówki mają świadomość i czy były mrówki w tym lesie
oraz czy drzewo ma świadomość — nie wiemy. Zostawmy ten problem w takiej właśnie
postaci.
Od chwili powstania mechaniki kwantowej kładzie się również nacisk na to, że nie
powinniśmy mówić o wielkościach, których nie umiemy zmierzyć (również teoria
względności mówiła o tym). Tak długo, jak długo jakaś wielkość nie może zostać zdefiniowana przez
pomiar, nie ma dla niej miejsca w teorii. A ponieważ dokładna wartość pędu zlokalizowanej
cząstki nie może zostać zdefiniowana przez pomiar, nie powinna więc występować w teorii-
Koncepcja głosząca, że to właśnie było błędem fizyki klasycznej, jest jednak niesłuszna
i świadczy o niedokładnej analizie sytuacji. To, że nie możemy dokładnie zmierzyć
położenia i pędu, nie oznacza a priori, że nie możemy o nich mówić. Oznacza jedynie, że nie
musimy o nich mówić. W naukach ścisłych mamy następującą sytuację: Wielkości, których
38-6. KONSEKWENCJE FILOZOFICZNE
201
nie możemy zmierzyć, i koncepcje lub pojęcia, których nie możemy powiązać bezpośrednio
z doświadczeniem, mogą być lub nie być użyteczne. Nie jest jednak konieczne, aby
występowały w teorii. Innymi słowy, przypuśćmy, że porównujemy klasyczny opis świata z
opisem kwantowym i przypuśćmy dalej, że doświadczalnie prawdą jest, że położenie i pęd
możemy mierzyć jedynie niedokładnie. Chodzi teraz o to, czy pojęcia dokładnego położenia
cząstki i dokładnego pędu cząstki są ważne czy nie. Teoria klasyczna przyjmuje te pojęcia,
teoria kwantowa — nie. Ale nie oznacza to jeszcze, że fizyka klasyczna jest błędna. Gdy
odkryto mechanikę kwantową, fizycy „klasyczni" — a byli nimi wtedy wszyscy z wyjątkiem
Heisenberga, Schrodingera i Borna — mówili: „Spójrzcie sami, z waszej teorii nie ma
żadnego pożytku, gdyż nie możecie odpowiedzieć na pytanie w rodzaju: jakie jest dokładne
położenie cząstki? przez który otwór ona przechodzi? Itp.". Odpowiedź Heisenberga brzmiała:
„Nie muszę odpowiadać na takie pytania, ponieważ nie umiecie postawić ich
doświadczalnie". Chodzi właśnie o to, że nie musimy. Rozpatrzmy dwie teorie: a i b. Teoria a zawiera
koncepcję, której nie można sprawdzić bezpośrednio, którą jednak posługujemy się w czasie
analizy zjawiska, druga teoria, b, nie zawiera natomiast tej koncepcji. Gdy obie teorie będą
się różnić w swych przewidywaniach, nie możemy twierdzić, że teoria b jest fałszywa,
gdyż nie wyjaśnia koncepcji zawartej w a, koncepcja ta jest bowiem jedną z tych rzeczy,
których nie można sprawdzić bezpośrednio. Dobrze zawsze wiedzieć, których koncepcji
nie można sprawdzić bezpośrednio, nie ma jednak potrzeby usuwania ich wszystkich.
Nie jest prawdą, że możemy posuwać wiedzę naprzód używając tylko wielkości tych,
które są bezpośrednio mierzone w doświadczeniu.
W samej mechanice kwantowej posługujemy się pojęciami amplitudy funkcji falowej
potencjału oraz wielu innymi konstrukcjami, których nie można bezpośrednio zmierzyć.
Podstawą nauki jest jej zdolność do dokonywania przewidywań. Przewidzieć — to znaczy
powiedzieć, co zajdzie w doświadczeniu, które jeszcze nigdy nie zostało wykonane. W jaki
sposób można to zrobić? Trzeba założyć, że niezależnie od doświadczenia wiemy, co się
tam dzieje. Musimy ekstrapolować doświadczenia do obszaru, w którym nie zostały jeszcze
wykonane. Musimy rozszerzyć stosowalność naszych koncepcji na dziedziny, w których
nie zostały jeszcze sprawdzone. Jeśli nie zrobimy tego, nie będziemy mogli przewidywać.
Było więc zupełnie zrozumiałe, że fizycy klasyczni z całym spokojem zakładali, że
położenie, które z całą pewnością oznaczało coś dla piłki futbolowej, oznacza coś również i dla
elektronu. Nie była to głupota. Było to całkiem sensowne postępowanie. Dzisiaj mówimy,
że teoria względności jest prawdziwa dla wszystkich energii, lecz pewnego pięknego dnia
zjawi się ktoś i stwierdzi, jacy to głupi byliśmy tak sądząc. Tak długo, jak długo „nie
nadstawimy karku", nie będziemy wiedzieli, w kórym miejscu popełniliśmy głupstwo.
Chodzi więc o to, aby nadstawić karku. I jedynym sposobem na przekonanie się, że nie
mamy racji, jest dokonanie pewnych przewidywań. Tworzenie konstrukcji myślowych jest
absolutnie niezbędne.
Poczyniliśmy już poprzednio kilka uwag o indeterminizmie mechaniki kwantowej.
Powiedzieliśmy, że w danej sytuacji fizycznej, najstaranniej nawet przygotowanej, nie
Jesteśmy w stanie przewidzieć, co się zdarzy. Gdy mamy atom, który znajduje się w stanie
obudzonym i w związku z tym wyemituje po pewnym czasie foton, nie potrafimy
powiedzieć, kiedy to nastąpi. Mamy jedynie pewną amplitudę określającą możliwość wyemi-
202
38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA
towania w danym momencie i możemy jedynie określić prawdopodobieństwo emisji;
nie możemy przewidzieć dokładnie przyszłości. Stało się to źródłem najrozmaitszych
nonsensów i pytań dotyczących wolności woli i nieoznaczoności świata.
Oczywiście, musimy podkreślić, że w fizyce klasycznej również mamy w pewnym sensie
indeterminizm. Zwykle uważa się, że indeterminizm, niemożność przewidzenia przyszłości,
jest ważną cechą mechaniki kwantowej. Twierdzi się, że cecha ta ma wyjaśnić zachowanie
się naszego umysłu, nasze uczucie, wolną wolę itd. Gdyby jednak świat był „klasyczny"
- gdyby prawa mechaniki były prawami fizyki klasycznej — nie jest wcale oczywiste,
że nasz umysł nie zachowywałby się mniej lub bardziej tak samo jak obecnie. Z punktu
widzenia mechaniki klasycznej prawdą jest, że gdybyśmy znali położenie i prędkość każdej
cząstki na świecie czy też w naczyniu z gazem, moglibyśmy przewidzieć, co się stanie.
W związku z tym świat klasyczny jest światem deterministycznym. Przypuśćmy jednak, że
dysponujemy tylko skończoną dokładnością i nie wiemy dokładnie, gdzie znajduje się jeden
z atomów. Powiedzmy.że określiliśmy jego położenie z dokładnością do jednej miliardowej.
Gdy atom ten zderzy się następnie z innym atomem, wówczas, ze względu na błąd, z jakim
znaliśmy jego położenie, po zderzeniu stwierdzamy, że znamy je z jeszcze większym
błędem. Dokładność, z jaką znamy położenie, maleje oczywiście jeszcze bardziej po następnym
zderzeniu. Jeśli więc zaczniemy nawet od maleńkiego błędu, szybko będzie on wzrastać,
dając bardzo dużą nieoznaczoność. Aby dać jakiś przykład: gdy woda przelatuje poprzez
zaporę, rozpryskuje się. Jeżeli stoimy opodal — coraz to jakaś kropla ląduje na naszym
nosie. Wydaje się to zupełnie przypadkowe, niemniej jednak zachowanie to można
dokładnie przewidzieć przy pomocy praw fizyki klasycznej. Dokładne położenie wszystkich
kropel wody zależy od ich zachowania się przed przejściem przez zaporę. W jaki sposób?
Najmniejsze nieregularności ruchu wody zostają wzmocnione przy jej spadaniu,
otrzymujemy więc zupełną przypadkowość. Z całą pewnością nie możemy przewidzieć położenia
poszczególnych kropel, nie znając ruchu wody z zupełną dokładnością.
Mówiąc ściślej, przy pewnej dokładności, z jaką znamy warunki początkowe, jak duża
by ona była, możemy zawsze podać taką chwilę, dla której nie możemy już robić żadnych
przewidywań. Ważne jest lo, że chwila ta nie jest zbyt odległa. Gdy mamy dokładność
równą jednej miliardowej, wspomniany czas nie równa się milionom lat. W rzeczywistości
zależy on od błędu w sposób logarytmiczny i jak się okazuje, po bardzo małym okresie
czasu tracimy wszelkie informacje. Jeżeli dokładność będzie równa jednej wielo-wielo-
miliardowej — bez znaczenia, ile miliardów weźmiemy, bylebyśmy tylko w pewnym miejscu
stanęli — wówczas stwierdzimy, że po czasie mniejszym od potrzebnego do otrzymania
tej dokładności nie potrafimy już przewidzieć, co się stanie! Nie należy więc mówić, że z
widocznej swobody i indeterminizmu umysłu ludzkiego powinniśmy byli wywnioskować,
że klasyczna „deterministyczna" fizyka nie może mieć żadnych szans na zrozumienie
go, i witać mechanikę kwantową jako uwolnienie z „całkowicie mechanistycznego" świata-
Już bowiem w mechanice klasycznej mieliśm> indeterminizm z praktycznego punktu
widzenia.
39
kinetyczna teoria gazów
39-1. Własności materii
W rozdziale tym rozpoczynamy omawianie nowego tematu, któremu chcemy teraz
poświęcić nieco czasu. Stanowi on pierwszą część analizy własności materii z punktu
widzenia fizyki. Punktem wyjścia tej analizy jest uznanie, że materia jest zbudowana z wielkiej
liczby atomów lub jakichś elementarnych części, które oddziałują elektrycznie i podlegają
prawom mechaniki. Opierając się na tym poglądzie postaramy się zrozumieć, dlaczego
różne zespoły atomów zachowują się właśnie w ten, a nie w inny sposób.
Trzeba stanowczo podkreślić, że omawiany temat jest naprawdę trudny. Dlatego
będziemy go traktować inaczej niż poprzednie. W przypadku mechaniki i nauki o świetle
mogliśmy rozpocząć od precyzyjnego ustalenia pewnych praw, na przykład praw Newtona lub
wzoru dla pola wytworzonego przez przyspieszony ładunek. Prawa te od razu pozwalały
zrozumieć całe bogactwo zjawisk i stanowiły podstawę naszego rozumienia mechaniki
i optyki. I chociaż następnie mogliśmy rozszerzyć naszą wiedzę, to jednak nie mogliśmy
poznać innej fizyki, a tylko uzyskać doskonalsze metody matematycznego badania zjawisk.
Takie postępowanie nie będzie skuteczne przy badaniu własności materii. Potrafimy
badać materię tylko najbardziej uproszczonymi metodami. Rozpoczęcie od odpowiednich
Podstawowych praw, które są po prostu prawami mechaniki i elektryczności byłoby zbyt
skomplikowane. Prawa te są zbyt odległe od zjawisk, którymi chcemy się zająć. Zbyt wiele
etapów dzieli znajomość praw Newtona od poznania własności materii, przy tym
poszczególne etapy są dość skomplikowane. Przejdziemy tylko parę spośród nich. Ale chociaż
w'ele naszych rozważań będzie zupełnie ścisłych, ich ostateczny wynik okaże się mało
dokładny. Zdobędziemy tylko przybliżoną znajomość własności materii.
Jednym z powodów ograniczenia się do takiej niedoskonałej analizy jest to, że
poznanie własności materii wymaga głębokiej znajomości rachunku DrawdoDodobienstwa:
204
39 KINETYCZNA TEORIA GAZÓW
nie chcemy bowiem wiedzieć, dokąd każdy atom rzeczywiście zmierza, aJe raczej, ile ich
średnio porusza się w jakimś kierunku oraz jakie jest prawdopodobieństwo wystąpienia
różnych zjawisk. W stosunku do tych wymagań nasze przygotowanie matematyczne jest
niewystarczające i nie chcemy go zbytnio poszerzać.
Drugim powodem, ważniejszym z punktu widzenia fizyki jest to, że atomy zachowują
się niezgodnie z prawami mechaniki klasycznej, lecz zgodnie z prawami mechaniki
kwantowej, i poprawne zrozumienie naszego tematu nie jest możliwe bez znajomości mechaniki
kwantowej. Tutaj, inaczej niż w przypadku zachowania się kul bilardowych lub
samochodów, różnica między prawami mechaniki klasycznej i mechaniki kwantowej jest bardzo
istotna i doniosła — zatem wiele z tego, co wydedukujemy przy pomocy fizyki klasycznej,
będzie z gruntu nieprawdziwe. Wskutek tego pewne zjawiska poznamy tylko częściowo.
Jednak zawsze przypadki błędnych wyników będziemy sygnalizowali i w ten sposób
poznamy granice możliwości mechaniki klasycznej. W poprzednich rozdziałach zajmowaliśmy się
mechaniką kwantową właśnie po to, żeby wskazać na różne dziedziny, w których mechanika
klasyczna w mniejszym lub większym stopniu zawodzi.
Dlaczego jednak teraz zajmujemy się tym tematem? Dlaczego nie poczekamy rok lub
pół, kiedy poznamy lepiej rachunek prawdopodobieństwa oraz mechanikę kwantową
— i będziemy mogli poznać własności materii gruntowniej? Otóż temat nasz jest trudny i
najlepszym sposobem zrozumienia go jest postępowanie stopniowe! Najpierw musimy się
zorientować, w mniejszym lub większym stopniu, co powinno nastąpić w różnych
okolicznościach, i dopiero wtedy, po lepszym poznaniu praw, będziemy mogli lepiej te prawa
sformułować.
Każdy, kto chce badać właściwości materii, może rozpocząć od wypisania
podstawowych równań i próbować je rozwiązać. Niektórzy rzeczywiście tak postępują, próby te
jednak skazane są na niepowodzenie. Sukcesy osiągają ci, którzy za punkt wyjścia obierają
fizykę, którzy z grubsza wiedzą, dokąd zmierzają i którzy rozpoczynają od uzasadnionych
przybliżeń, wiedząc, co ma większe, a co mniejsze znaczenie w kolejnych skomplikowanych
sytuacjach. Napotkamy problemy tak skomplikowane, że przyda się nawet elementarna,
chociaż niedokładna i niekompletna wiedza o nich i dlatego w ciągu całego kursu fizyki
będziemy powracali do naszego tematu wielokrotnie, za każdym razem z coraz większą
dokładnością.
Innym powodem, dla którego rozpoczynamy nasz temat właśnie w tym momencie
jest okoliczność, że poznaliśmy już wiele z jego elementów, np. w chemii, a nawet
stykaliśmy się z nimi w szkole średniej. Interesujące będzie zapoznanie się z fizycznymi
podstawami tych zjawisk.
Podamy tu jeden z takich interesujących przykładów. Wiemy wszyscy, że w równych
objętościach gazów o tej samej temperaturze i przy tym samym ciśnieniu znajdują się
jednakowe liczby cząsteczek. Prawo stosunków wielokrotnych mówiące, że objętości gazów
reagujących muszą Rozostawać w stosunku liczb całkowitych, doprowadziło Avogadre
do stwierdzenia, że w równych objętościach gazów znajdują się jednakowe liczby atomów-
Ale dlaczego tak jest? Czy możemy to wydedukować z praw Newtona? Tą sprawą zajmiemy
się obecnie. W następnych rozdziałach omówimy jeszcze inne zjawiska, dotyczące ciśnienia,
39-1. WŁASNOŚCI MATERII
205
Przekonamy się także o możliwości traktowania naszego tematu bez odwoływania się
do atomowej struktury substancji oraz o występowaniu wielu wewnętrznych zależności
między własnościami substancji. Tak na przykład przy sprężaniu substancja się ogrzewa,
a przy ogrzewaniu zwiększa objętość. Zależność między tymi dwoma faktami można
wykryć bez znajomości całego mechanizmu, na którym się ona opiera. Zajmuje się tym
termodynamika. Gruntowną wiedzę o termodynamice uzyskuje się oczywiście drogą
poznania tego mechanizmu. Tym właśnie będziemy się zajmować: przyjmiemy za punkt
wyjścia atomową strukturę substancji i na tej drodze postaramy się zrozumieć różne
własności materii i prawa termodynamiki.
Rozpocznijmy zatem omawianie własności gazów biorąc za punkt wyjścia prawa
mechaniki newtonowskiej.
39-2. Ciśnienie gazn
Wiemy wszyscy, że gaz wywiera ciśnienie i powinniśmy wyraźnie sobie uświadomić,
skąd się ono bierze. Jeżeliby nasze uszy były kilkakrotnie czulsze, słyszelibyśmy nieustanny,
gwałtowny hałas. Ewolucja nie rozwinęła ich do tego stopnia, ponieważ byłoby to
nieużyteczne — słyszelibyśmy ciągły zgiełk. Błona bębenkowa styka się z powietrzem, które
składa się z wielkiej liczby cząsteczek, będących w ciągłym ruchu i uderzających o nią.
Uderzając, cząsteczki wywołują nieregularne bębnienie, którego nie słyszymy, ponieważ
atomy są zbyt małe, a ucho nie dość czułe, aby je usłyszeć. W wyniku tego nieustannego
bombardowania błonka powinna się przesunąć, ale od jej drugiej strony występuje
oczywiście taki sam nacisk, tak że wypadkowa siła nacisku równa się zeru. Jeżeli usunęlibyśmy
powietrze z jednej strony błonki lub zmienilibyśmy stosunek ilości powietrza z obu stron,
błona przesunęłaby się w jedną lub drugą stronę, ponieważ liczba uderzeń z jednej strony
byłaby większa niż z drugiej. Czasami doznajemy tego nieprzyjemnego uczucia, jadąc
zbyt szybko windą lub lecąc samolotem, szczególnie gdy jesteśmy przeziębieni (przy
przeziębieniu stan zapalny powoduje zamknięcie rurki doprowadzającej powietrze z gardła
do wewnętrznej strony błony bębenkowej, tak że ciśnienia z obu jej stron nie mogą się
szybko wyrównać).
Próbując ilościowo zanalizować sytuację, wyobrażamy sobie, że w zbiorniku
zamkniętym ruchomym tłokiem znajduje się gaz. Chcielibyśmy znaleźć działającą na tłok siłę,
wywieraną przez atomy znajdujące się w zbiorniku.
Objętość zbiornika równa się V. Atomy poruszają się w nim
z różnymi prędkościami i uderzają w tłok. Załóżmy, że z
drugiej strony tłoka jest próżnia. Co się stanie, gdy zostawimy
tłok bez podparcia? Za każdym uderzeniem będzie zyskiwał
on bardzo mały pęd i stopniowo wysunie się ze zbiornika.
Aby więc temu zapobiec, musimy go trzymać siłą F. Pow-
&taje pytanie: jak duża ma być ta siła? Jednym ze sposobów
JeJ wyrażenia jest posługiwanie się wielkością siły
przypadającej na jednostkę powierzchni: jeżeli A jest powierzchnią
39.1. Atomy gazu w
zbiorniku zamkniętym tłokiem
poruszającym się bez tarcia
206
39. KINETYCZNA TEORIA GAZÓW
tłoka, siła działająca na tłok jest proporcjonalna do tej powierzchni. Z kolei ciśnienie
określamy jako siłę, którą musimy trzymać tłok, podzieloną przez powierzchnię tłoka:
P = F/A. (39.1)
Aby się upewnić, czy zrozumieliśmy o co chodzi, obliczmy różniczkę pracy dW (którą
musimy i tak kiedyś obliczyć) koniecznej do sprężenia gazu przez przesunięcie tłoka o — dx.
Powinna ona się równać iloczynowi siły i odległości, o jaką przesunęliśmy tłok, co zgodnie
z wzorem (39.1) jest równe ciśnieniu razy powierzchnia, razy odległość. A to równa się,
ze znakiem minus, iloczynowi ciśnienia i zmiany objętości:
dW=F(-dx)=-PAdx=-PdV. (39.2)
(Mnożąc powierzchnię A przez odległość dx otrzymamy zmianę objętości.) Postawiliśmy
znak minus, ponieważ przy sprężaniu gazu objętość maleje. Po zastanowieniu się
spostrzeżemy, że jeżeli objętość gazu maleje, to musiała być nad nim wykonana jakaś praca.
Jaka siła potrzebna jest do zrównoważenia uderzeń cząsteczek? Tłok przy każdym
uderzeniu otrzymuje jakiś pęd. Pewna ilość pędu przekazana tłokowi w ciągu sekundy
powoduje jego ruch. Aby mu zapobiec, musimy przekazać tłokowi w ciągu sekundy taki
sam pęd kosztem naszej siły. Oczywiście, siła równa się pędowi, który musimy dostarczyć
tłokowi w ciągu sekundy. Możemy to też sformułować inaczej: jeżeli pozwolimy tłokowi
się wysuwać, jego szybkość będzie wzrastała na skutek uderzeń cząsteczek — każde
uderzenie zwiększy szybkość tłoka. Przyrost prędkości tłoka, jego przyspieszenie, jest
proporcjonalne do przyłożonej siły. Zatem siła, o której mówiliśmy jako o iloczynie ciśnienia
i powierzchni, równa się pędowi przekazanemu tłokowi w ciągu jednej sekundy przez
zderzające się z nim cząsteczki.
Łatwo możemy obliczyć pęd przekazany w ciągu sekundy. Zrobimy to w dwóch
etapach: najpierw obliczymy pęd przekazany przez atom zderzający się z tłokiem, a następnie
pomnożymy to przez liczbę uderzeń atomów o tłok w ciągu sekundy. Siła będzie iloczynem
tych dwóch czynników. Zobaczmy teraz, jakie są te czynniki. Przede wszystkim
przyjmiemy, że tłok jest idealnym „reflektorem" dla atomów. W przeciwnym razie cała teoria
byłaby fałszywa, tłok zacząłby się ogrzewać i wszystko przebiegałoby inaczej, chociaż
ostatecznie po ustaleniu się stanu równowagi zderzenia i tak byłyby idealnie sprężyste.
Średnio biorąc, każda cząsteczka dobiegająca do tłoka opuszcza go z taką samą energią.
Zatem wyobrażamy sobie, że gaz jest w stanie stacjonarnym i nie występuje przekazywanie
energii tłokowi, ponieważ jest on nieruchomy. W tych warunkach cząsteczka uderzająca
o tłok z pewną szybkością odskakuje odeń z taką samą szybkością, przy czym masa
cząsteczek się nie zmienia.
Jeżeli v jest prędkością atomu, a vx — składową x-ową v, wtedy mvx jest joową
składową pędu w kierunku tłoka; mamy także równą jej składową pędu w kierunku
przeciwnym. Dlatego całkowity pęd przekazany tłokowi przez cząstkę w jednym akcie
zderzenia równa się 2mvx, ponieważ odbija się ona „idealnie".
Z kolei chcemy znać liczbę uderzeń atomów w ciągu jednej sekundy lub w pewnym
odstępie czasu dt; potem podzielimy ją przez dt. Ile atomów uderza? Przyjmijmy, że S
... — j.... —,;h.,;<» cio m nhi^trićri V czyli « = A7 K atomów w jednostkowej objętości. W celu
39-2. CIŚNIENIE GAZU
207
obliczenia, ile atomów uderza w tłok, zanotujmy, przyjąwszy określony odstęp czasu /,
że jeżeli cząstka ma jakąś prędkość w kierunku tłoka, to się z nim zderzy w ciągu tego czasu /,
jeżeli będzie dostatecznie blisko. Jeżeli będzie ona zbyt daleko, to w czasie / zdąży
przebyć zaledwie część drogi dzielącej ją od tłoka, ale do niego nie dotrze. Dlatego nie ulega
wątpliwości, że tylko cząsteczki odległe od tłoka o vxt uderzą weń w ciągu czasu /. Zatem
liczba zderzeń z tłokiem w ciągu czasu / równa się liczbie atomów zawartych w
prostopadłościanie o wysokości vxt. Ponieważ powierzchnia tłoka wynosi A, objętość obszaru,
który wypełniają atomy uderzające o tłok, równa się vxtA. Zatem liczba atomów, które
uderzą o tłok, jest równa iloczynowi tej objętości i liczby atomów zawartych w
jednostkowej objętości, nvxtA. Oczywiście, nie chodzi nam o liczbę zderzeń w ciągu czasu /, ale w ciągu
1 s, dzieląc zatem przez / otrzymamy nvxA. (Możemy przyjąć bardzo krótki czas /; jeżeli
chcemy postąpić w bardziej wyszukany sposób, oznaczmy go przez dt i zróżniczkujmy —
wynik będzie taki sam.)
Stwierdziliśmy więc, że siła równa się
F = nvxA-2mvx (39.3)
Jak widzimy, siła jest proporcjonalna do powierzchni, jeśli ją zmieniamy przy ustalonej
gęstości cząstek! Ciśnienie jest zatem równe
P = 2nmvl. (39.4)
Zwróćmy uwagę na następujące trudności: po pierwsze — nie wszystkie cząsteczki
mają tę samą szybkość, po drugie — nie poruszają się w tym samym kierunku. A więc
dla każdej cząsteczki vi będzie inne! Musimy zatem wziąć średnią wszystkich vi, ponieważ
każda z nich wnosi swój odrębny wkład. To, o co nam chodzi, równa się vx do kwadratu,
uśrednione na wszystkie cząsteczki:
P = nm<t>x2>. (39.5)
Czy zapomnieliśmy tu o czynniku 2? Nie, ponieważ tylko połowa wszystkich atomów
zmierza do tłoka. Druga połowa porusza się w przeciwnym kierunku, zatem jeśli obliczymy
<t'*>, uwzględnimy zarówno ujemne vx do kwadratu, jak i dodatnie. A więc biorąc <!>*>
bez zwracania uwagi na znak, otrzymamy dwukrotnie więcej, niż chcemy. Średnia vx
dodatnich vx równa się średniej v\ wszystkich vx, podzielonej przez 2.
Skoro atomy poruszają się we wszystkich kierunkach, to kierunek x niczym się nie
wyróżnia. Atomy mogą się poruszać w kierunku z góry na dół, w przód i do tyłu, w
kierunku tłoka lub przeciwnie. Dlatego możemy powiedzieć, że <i\> — średni ruch atomów
w jednym kierunku i średnie ruchy w dwu pozostałych kierunkach są takie same:
<^> = <^2> = <^>- (39-6)
Wystarczy tylko prosty chwyt matematyczny, by spostrzec, że każdy z nich równa się
jednej trzeciej ich sumy, która oczywiście jest równa kwadratowi szybkości:
<vl>=Kv2x+v2y+v2z> = <v2»3. (39.7)
Wyższość tego wyrażenia polega na tym, że nie musimy się już martwić o jakiś określony
208
39. KINETYCZNA TEORIA GAZÓW
kierunek i możemy teraz nasz wzór na ciśnienie zapisać jako
P=fn<roi;2/2>. (39.8)
Ostatni czynnik napisaliśmy w postaci <mt>2/2>, ponieważ określa on energię kinetyczną
ruchu środka masy cząsteczki. Stwierdziliśmy więc, że
/>F = N(ś)<mt>2/2>. (39.9)
Mając to równanie, możemy obliczyć ciśnienie, jeżeli znamy szybkości.
Jako bardzo prosty przykład weźmy hel albo jakiś inny gaz, np. argon, którego
cząsteczki są pojedynczymi atomami bez żadnych ruchów wewnątrzcząsteczkowych. Mogą
to być też pary rtęci lub potasu w dostatecznie wysokiej temperaturze. Jeśli cząsteczka
jest złożona, to mogą w niej wystąpić jakieś ruchy wewnętrzne, np. drgania lub coś
podobnego. Przyjmiemy tu, że możemy je pominąć. Jest to dość istotna sprawa i będziemy
musieli do niej powrócić, ale przekonamy się, że nasze założenie jest słuszne. Zakładamy
więc, że możemy nie uwzględniać ruchów wewnętrznych cząstek, a tym samym, że energia
kinetyczna ruchu środka masy cząsteczki stanowi, w rozważanym przypadku, całkowitą
energię w ogóle. Dla gazu jednoatomowego energia kinetyczna jest więc jego energią
całkowitą. Od tego miejsca całkowitą energię będziemy oznaczali literą U (czasami bywa
ona nazywana całkowitą energią wewnętrzną; nie wiadomo dlaczego, skoro w odniesieniu
do gazu nie ma energii zewnętrznej). Przez całkowitą energię rozumiemy energię wszystkich
cząsteczek gazu lub dowolnego innego obiektu.
Przyjmiemy, że dla gazu jednoatomowego całkowita energia U równa się iloczynowi
liczby atomów i średniej energii kinetycznej każdego atomu, ponieważ odrzuciliśmy
możliwość wzbudzenia ruchów wewnątrz atomu. W tej sytuacji otrzymamy zatem
PV = $U (39.10)
Przy okazji możemy znaleźć odpowiedź na następujące pytanie: Jeżeli gaz w zbiorniku
będziemy zwolna sprężali, to jakie ciśnienie będzie potrzebne do zmniejszenia jego
objętości? Możemy na to łatwo odpowiedzieć, gdyż ciśnienie jest równe $ energii podzielonej
przez V. Przy sprężaniu gazu wykonujemy nad nim pracę zwiększając energię U.
Otrzymamy więc pewnego rodzaju równanie różniczkowe. Przyjmując za punkt wyjścia stan
o pewnej energii i objętości, możemy obliczyć ciśnienie. Kiedy z kolei sprężamy gaz,
energia U wzrasta, a objętość V maleje, a więc ciśnienie się zwiększa.
Musimy zatem rozwiązać równanie różniczkowe i za chwilę to zrobimy. Przedtem
musimy jednak zwrócić uwagę na założenie, że przy sprężaniu gazu cała wykonana praca
jest zużyta na powiększenie energii atomów wewnątrz zbiornika. Możemy mieć
wątpliwości, czy tak musi być. Co się z tą pracą może jeszcze stać? Okazuje się, że może być
użyta do czegoś innego. Zachodzi mianowicie to, co nazywamy „przeciekaniem ciepła'
przez ścianki zbiornika: gorące (tzn. szybko poruszające się) atomy, które bombardują
ścianki, ogrzewają je i energia ucieka ze zbiornika. W tym przykładzie przyjmiemy, iż to
nie występuje.
Aczkolwiek ciągle robimy bardzo szczegółowe założenia dotyczące naszego gazu,
to jednak dla uzyskania swego rodzaju bardziej ogólnej sytuacji zastąpimy zależność
39-1. CIŚNIENIE GAZU
209
P V= | U wzorem
PV=(y-\)U. (39.11)
Tradycyjnie piszemy (y — l) razy U. Później bowiem zajmiemy się paroma innymi
przypadkami, w których \ przed U należy zastąpić innymi liczbami. A.by więc mieć
możliwość bardziej ogólnego potraktowania tej sprawy, piszemy (y — I), zgodnie z historycznie
przyjętym sposobem oznaczenia tej wielkości od prawie stu lat. Zatem dla gazu jedno-
atomowego, np. helu, y równa się |, ponieważ | —1 równa się |.
Pamiętamy, że przy sprężeniu gazu wykonana jest praca —PdV. Sprężanie, przy
którym nie ma .dopływu ani wypływu energii cieplnej, nazywamy sprężaniem adiabatycznym,
od greckiego a (nie)+ dia (przez) + bainein (iść). (Słowa „adiabatyczny" używa się w fizyce
w różnych okolicznościach i czasami trudno dostrzec, co je łączy.) Zatem przy
adiabatycznym sprężaniu cała wykonana praca użyta jest do zmiany energii wewnętrznej. Istotne
jest, że nie ma żadnych innych strat energii i dlatego mamy P dV= —dU. Ale ponieważ
U= PV/(y— I), możemy napisać
dU = (PdV+VdP)l(y-l). (39.12)
Mamy więc PdV= —(PdV+ VdP)/(y—l),czy\i grupując wyrazy podobne,yPdV= —VdP
a inaczej —
(y dV/V)+(dP/P) = 0. (39.13)
Tak się szczęśliwie składa, że przyjmując stałe y, co zachodzi w wypadku gazu jedno-
atomowego, możemy to równanie scałkować i otrzymujemy y In V+ln P=laC, gdzie
In C jest stałą całkowania. Podnosząc e do potęgi In C otrzymamy prawo:
PVy = C (pewna stała). (39.14)
Inaczej mówiąc, przy adiabatycznym sprężaniu gazu jednoatomowego, gdy jego
temperatura rośnie z powodu braku strat energii, iloczyn ciśnienia i objętości do potęgi § jest stały.
Chociaż otrzymaliśmy ten wniosek na drodze teoretycznej, wiadomo z doświadczenia, że
gazy tak się właśnie zachowują.
39-3. Ściśliwość promieniowania
Możemy podać inny przykład z kinetycznej teorii gazów, który jest szczególnie ważny
w astronomii. Mamy wielką liczbę fotonów w zbiorniku, w którym panuje bardzo wysoka
temperatura. (Zbiornikiem takim może być tylko gaz w bardzo gorącej gwieździe. Słońce
jest nie dość gorące do tego celu. W gwieździe występuje oczywiście ogromna liczba
atomów, ale przy bardzo wysokiej temperaturze możemy je pominąć i twierdzić, że jedynymi
obiektami w zbiorniku są fotony.) Foton ma pewien pęd p. (Zawsze, gdy zajmujemy
się kinetyczną teorią gazu jesteśmy w kłopocie: p oznacza bowiem ciśnienie, ale oznacza
też pęd; v jest prędkością, ale może być też objętością; T może oznaczać temperaturę,
energię kinetyczną, czas lub moment siły — trzeba być kutym na cztery nogi, żeby się
w tym nie zgubić!) p oznacza obecnie wektor pędu. Postępując tak jak poprzednio, stwier-
210
39 KIN1 TYCZNA Tl OR1A GAZÓW
dzamy. że właśnie składowa jr-owa p powoduje „uderzenie", a podwojona składowa
x-owa p jest pędem przekazanym w takim jednym „uderzeniu" Zatem 2px zastępuje
2mvx, ale przy obliczaniu liczby zderzeń vx pozostaje nadal i\. Po wykonaniu wszystkich
obliczeń przekonamy się, że ciśnienie różni się teraz od ciśnienia określonego wzorem
(39.4) i wynosi
P = 2npxv„. (39 15)
Po uśrednieniu otrzymamy: średnia z ciśnienia równa się n razy średnia z pxvx (ten sam
czynnik 2). W końcu po uwzględnieniu kierunków odpowiadających dwom pozostałym
współrzędnym otrzymamy
PK = /V<pv>/3. (39.16)
Wzór ten zgadza się ze wzorem (39.9), ponieważ pęd cząsteczki równa się m\; jest tylko
bardziej ogólny A więc ciśnienie razy objętość równa się iloczynowi całkowitej liczby
atomów i średniej wartości j(p*)-
Ile wynosi p-ł dla fotonów? Pęd i prędkość mają ten sam kierunek, a prędkość równa
się szybkości światła, zatem /w jest dla każdego fotonu iloczynem pędu i szybkości światła.
Dla każdego fotonu iloczyn pędu i szybkości światła równa się jego energii: E=pc. Zatem
pv są energiami poszczególnych fotonów i powinniśmy wziąć średnią energię pomnożona
przez liczbę fotonów. Otrzymamy zatem \ energii wewnętrznej gazu:
PV=U/3 (gaz fotonowy). (39 17)
Zatem dla fotonów y=^, ponieważ (y— 1) ze wzoru (39.11) dla fotonów wynosi |.
Odkryliśmy, że promieniowanie zamknięte w zbiorniku podlega następującemu prawu:
PV*I3 = C (39.18)
Poznaliśmy w ten sposób ściśliwość promieniowania! Jest to bardzo istotne w badaniu
roli ciśnienia promieniowania w gwiazdach. Potrafiliśmy je obliczyć i przewidzieć, jak się
zmienia, gdy sprężamy promieniowanie. Jakież wspaniałe rzeczy są już w naszej mocy!
39-4. Temperatura i energia kinetyczna
Do tej pory nie zajmowaliśmy się temperaturą; unikaliśmy tego celowo. Wiemy, że
przy sprężaniu gazu energia jego cząsteczek wzrasta. Mówimy wtedy, że gaz się ogrzewa;
chcielibyśmy zrozumieć, co to ma wspólnego z temperaturą. Jak powinniśmy postąpić,
aby przeprowadzić eksperyment nie adiabatycznie, ale w warunkach, które nazywamy
temperaturą stałąl Wiemy, że jeżeli zetkniemy z sobą dwa zbiorniki z gazem i
pozostawimy je dostatecznie długo w takim stanie (nawet jeśli początkowo oba były w warunkach,
które nazywamy różnymi temperaturami), to ich temperatury będą w końcu jednakowe.
Co to znaczy? Otóż znaczy to, że oba zbiorniki znajdują się w warunkach, które by
osiągnęły stykając się z sobą dostatecznie długo. To właśnie mamy na myśli mówiąc o
jednakowej temperaturze przedmiotów - stan końcowy przedmiotów, które stykając się ze
sobą przez dostatecznie długi czas, oddziaływały na siebie.
Zastanówmy się co zajdzie, jeżeli w dwóch zbiornikach oddzielonych ruchomym tło-
39-4. TEMPERATURA I f NERGIA KINETYCZNA
211
•
• •
V
I
o o
O o
o
o
kiem.jak na rys. 39.2, znajdują się dwa gazy (dla
uproszczenia weźmy dwa jednoatomowe gazy, np. hel i neon).
W zbiorniku / atomy mają masy m,, prędkość v, i
gęstość n,. W zbiorniku 2 masy atomów są równe m2, ich
prędkość r2, a gęstość równa się n2- Jakie są warunki (') u)
równowagi?
Oczywiście, uderzenia w tłok od strony lewej prze- '9.2. Atomy dwóch różnych je-
suną go w prawo, co spowoduje sprężenie gazu po dnoatomowych gazów oddzielone
. . , ■ ■ ^ ■ * Ti i i_ ruchomym tłokiem
prawej stronie i wzrost ciśnienia z tej strony. Iłok
będzie się zatem poruszał z lewej strony na prawą,
następnie powracał, aż po kilku takich ruchach zatrzyma się w miejscu, w którym ciśnienia
na obie jego strony będą takie same. Możemy zatem tak dobrać warunki, by ciśnienia
były równe, to znaczy, by energie wewnętrzne przypadające na jednakowe objętości były
jednakowe, albo by iloczyny liczb n i średnich energii kinetycznych po obu stronach
tłoka były takie same. Chcemy teraz udowodnić, że gęstości po obu stronach tłoka są
jednakowe. Dotąd udowodniliśmy tylko, że
n, (m, v]/2> = n1 <m2 ^/2>,
na podstawie wzoru (39.8), gdyż są równe ciśnienia. Musimy jednak uprzytomnić sobie,
że nie jest to jedyny warunek, jaki na dłuższą metę ma być spełniony, w miarę bowiem
ustalania się prawdziwej, zupełnej równowagi odpowiadającej równym temperaturom
musi się coś jeszcze powoli zmieniać.
Aby zrozumieć o co chodzi, przyjmijmy, że ciśnienie z lewej strony otrzymaliśmy dzięki
bardzo dużej gęstości, ale przy niewielkiej prędkości. Mając duże n i małe v możemy
otrzymać takie samo ciśnienie jak przy małym n i dużym v. Atomy poruszające się powoli
mogą być bardzo gęsto stłoczone albo też może być ich mniej, lecz silniej uderzających.
Czy taki stan utrzyma się nieskończenie? Z początku tak się może nam wydawać, ale po
namyśle spostrzeżemy, że pominęliśmy pewien ważny moment. Chodzi o to, że na tłok
nie jest wywierane stałe ciśnienie — tłok drga tak jak błonka bębenkowa, ponieważ
uderzenia nie są zupełnie jednakowe. Nie ma tu jednostajnego, ciągłego nacisku, ale raczej
bębnienie, a więc zmienny nacisk, pod którego wpływem tłok drga. Przyjmijmy, że atomy z
prawej strony nie uderzają mocno, a z lewej są nieliczne, rzadko rozmieszczone, ale bardzo
energiczne. Tłok, otrzymując co pewien czas silne uderzenie z lewej strony, będzie nadawał
większą szybkość powolnym atomom po prawej stronie. (Atom zderzając się z tłokiem traci lub
zyskuje energię, zależnie od kierunku, w którym porusza się tłok w chwili zderzenia.)
W wyniku zderzeń tłok ustawicznie drgając przekazuje energię atomom drugiego gazu,
co zwiększa ich szybkość aż do momentu, gdy mogą one już zrównoważyć uderzenia tłoka.
Układ osiągnie stan równowagi polegający na tym, że tłok będzie poruszać się z taką
średnią kwadratową prędkością, przy której ilość energii pobieranej od gazu będzie równa
ilości energii przekazanej atomom gazu. W ten sposób tłok zyskuje pewną średnią prędkość
' właśnie ją chcemy wyznaczyć. Pozwoli nam to lepiej rozwiązać nasze zadanie, gdyż
Prędkości gazów będą się zmieniać zbliżając się do siebie aż do chwili, gdy gazy zaczną
wzajemnie przekazywać sobie za pośrednictwem tłoka równe ilości energii.
212
39. KINETYCZNA TEORIA GAZÓW
Dość trudno jest zanalizować szczegóły ruchu tłoka w podanych okolicznościach;
łatwo je zrozumieć, ale nieco trudniej przeprowadzić ich analizę. Zanim do niej
przystąpimy, zajmijmy się innym zagadnieniem. Mamy zbiornik, w którym znajdują się gazy
złożone z cząsteczek różnego rodzaju o masach mt i mz, o szybkościach vt i v2 itd. Tutaj
oddziaływanie jest bardziej bezpośrednie. Jeżeli nawet wszystkie cząsteczki drugiego
gazu są nieruchome, to ten stan nie potrwa długo, ponieważ uderzają o nie cząsteczki
gazu pierwszego zwiększając ich szybkość. Jeżeli zaś poruszają się szybciej niż cząsteczki
pierwszego gazu, to też niedługo, gdyż w końcu przekażą im swoją energię z powrotem.
Chcemy teraz znaleźć wzór, który by określał względne szybkości cząsteczek dwóch takich
gazów w jednym zbiorniku.
To jest też trudne zadanie, ale rozwiążemy je w następujący sposób. Z początku
zastanowimy się nad pewnym zadaniem pomocniczym (jest to jedno z zadań, których końcowy
wynik niezależnie od wyprowadzenia łatwo zapamiętać, a samo wyprowadzenie jest
bardzo pomysłowe). Przyjmijmy, że dwie zderzające się cząsteczki o różnych masach
obserwujemy, dla uproszczenia, w układzie ich środka mas (ŚM). Jak wiemy na
podstawie praw zderzeń, cząsteczki po zderzeniu, dzięki zasadom zachowania energii i pędu,
poruszają się tak, że zachowują swoje pierwotne szybkości, a zmieniają ich kierunki.
Zatem dowolne zderzenie wygląda tak jak na rys. 39.3. Przyjmijmy na chwilę, że
obserwujemy wszystkie zderzenia, w których ŚM spoczywa. Załóżmy, że początkowo wszystkie
cząsteczki poruszają się poziomo. Oczywiście, po pierwszym zderzeniu niektóre z nich
poruszają się pod pewnym kątem. Inaczej mówiąc, jeżeli wszystkie cząsteczki poruszały
się poziomo, to po pierwszym zderzeniu przynajmniej niektóre z nich będą poruszały się
pionowo. W następnych zderzeniach cząsteczki zderzając się pod pewnym kątem odskoczą
pod innym. Jeżeli zatem na początku ich ruch był całkowicie uporządkowany, to wskutek
zderzeń rozbiegną się we wszystkich kierunkach. Kolejne zderzenia doprowadzą do tego,
że wszystkie kierunki będą równouprawnione. Jaki będzie ostateczny rozkład kierunków?
Odpowiadamy: prawdopodobieństwo znalezienia dowolnej pary cząsteczek poruszających
się w dowolnym kierunku jest takie samo. Potem już żadne dalsze zderzenia nie mogą
zmienić rozkładu.
Wiemy już, że cząsteczki mogą z równym prawdopodobieństwem poruszać się we
wszystkich kierunkach, ale jak to wyrazić? Prawdopodobieństwo poruszania się cząsteczek
w jakimś określonym kierunku jest oczywiście równe zeru,
-„ 3 _. ed k ponieważ wyrażenie „określony kierunek" jest zbyt dokła-
wych cząsteczek oglądane dne » dlatego musimy wybrać „coś innego". Chodzi o to, że
w układzie ich środka mas przez każdy wycinek powierzchni kuli, której środkiem jest
punkt zderzenia, będzie przelatywało tyle samo cząsteczek,
jeśli porównywane wycinki mają te same wymiary. Zatem
w wyniku zderzeń powstanie taki rozkład prędkości, że
jednakowe elementy powierzchni kuli będą miały takie
same szanse trafienia przez cząsteczki.
Przy okazji zauważmy interesujący fakt, że przy
wybranym początkowym kierunku i kierunku tworzącym z mm
kąt 6 odpowiadający mu różniczkowy element powierzchni
39-4- TEMPERATURA 1 ENERGIA KINETYCZNA
213
kuli o jednostkowym promieniu wynosi sin 6 dO pomnożone przez 2n, a więc tyle samo, ile
wynosi różniczka 2jtcos 6. To znaczy, że prawdopodobieństwa dowolnej wartości cosinusa
kąta 8 między dwoma dowolnymi kierunkami, leżącej w przedziale od — 1 do +1, są takie
same.
Z kolei musimy się zająć konkretnym przypadkiem zderzenia, nie w układzie ŚM, lecz
wtedy, gdy spotykają się dwa dowolne atomy z prędkościami v, i v2 ■ Co się wtedy zdarzy?
Możemy zanalizować to zderzenie w następujący sposób: najpierw twierdzimy, że istnieje
pewien układ ŚM. Prędkość tego układu równa się „średniej" prędkości z wagami
proporcjonalnymi do mas cząsteczek v$M = (m,vl+m2*2)/(m,+m2). Jeżeli obserwujemy to
zderzenie w układzie ŚM, wtedy wygląda ono tak jak na rys. 39.3, przy pewnej względnej
prędkości cząsteczek w, która wynosi *, — v2. Zatem stwierdzamy, że po pierwsze — cały
układ ŚM się porusza i po drugie — w układzie tym cząsteczki poruszają się ze względną
prędkością w, zderzają się i odskakują w innym kierunku. W czasie gdy to wszystko
zachodzi, układ ŚM nadal się porusza bez żadnych zmian.
Jaki będzie w takim razie rozkład prędkości? Z naszych poprzednich rozważań
wnioskujemy, że w równowadze wszystkie kierunki w są rozłożone z równym prawdopodobieństwem
względem kierunku ruchu układu ŚM.*' Nie będzie zatem żadnej korelacji między
kierunkiem ruchu układu ŚM i kierunkiem prędkości względnej w. Oczywiście, jeśliby taka
korelacja zachodziła, to zderzenia powinny ją znieść i przywrócić pełną symetrię. Dlatego średnia
wartość cosinusa kąta między w i vŚM jest równa zeru, tzn.
Ale w*sM może być wyrażone przy pomocy v, oraz v2:
(ł,-v2)(w, v,+m2ł2)
WVŚN
ml+m1
{mlv\-m2v\) + (m2-ml)(vli1)
ml+m1
(39.20)
Najpierw zajmijmy się iloczynem v,v2 i zapytajmy: ile wynosi jego średnia wartość?
lub, co na jedno wychodzi: czemu równa jest średnia wartość składowej prędkości jednej
cząsteczki w kierunku ruchu drugiej? Oczywiście, każdy kierunek ruchu danej cząsteczki jest
jednakowo prawdopodobny. Średnia wartość prędkości ł2 w dowolnym kierunku jest więc
równa zeru. Stąd średnia wartość *2 w kierunku v, jest z pewnością równa zeru. Zatem
wartość średnia *, v2 równa się zeru! Dochodzimy więc do wniosku, że średnia wartość
'n.,o, musi być równa średniej wartości m2v\. A zatem średnie energie kinetyczne obu
rodzajów cząsteczek muszą być sobie równe:
\miv\ = \miv\. (39.21)
*' To rozumowanie, pochodzące od Maxwella, zawiera pewne subtelności. Chociaż ostateczny
^niosek jest poprawny, to jednak nie wynika on bezpośrednio z naszych poprzednich rozważań o
symetrii, ponieważ przejście do układu odniesienia poruszającego się w gazie może w>wolac zmianę
rozkładu prędkości. Nie znaleźliśmy Drosteco dowodu h'un lwierH/rma
214
39. KINETYCZNA TEORIA GAZÓW
Jeżeli mamy dwa rodzaje atomów w gazie, to można
udowodnić — i przyjmujemy, iż to udowodniliśmy
— że średnia energia kinetyczna jednego rodzaju
atomów jest taka sama, jak średnia energia kinetyczna
. atomów drugiego rodzaju, jeżeli atomy te wchodzą
39.4. Dwa gazy w zbiorniku od- .... ą
dzielone półprzepuszczalną prze- w skład Sazu znajdującego się w równowadze w je-
grodą dnym zbiorniku. To znaczy, że cięższe atomy
poruszają się wolniej niż lżejsze.
Obecnie przejdziemy do następnego etapu i
powiemy, że dwa różne gazy oddzielone od siebie w zbiorniku będą, po dojściu do stanu
równowagi, miały również takie same średnie energie kinetyczne, nawet jeśli nie będą
znajdowały się w tym samym zbiorniku. Można to udowodnić na różne sposoby. Oto
jeden z nich: Bierzemy zbiornik z nieruchomą przegrodą, w której znajduje się otworek
tak mały, że tylko cząsteczki jednego rodzaju mogą przez niego przejść (rys. 39.4),
a cząsteczki drugiego rodzaju już się w nim nie zmieszczą. Załóżmy, że cały układ osiągnął
stan równowagi. Wtedy, jak wiemy z poprzedniego rozumowania, w tej części, gdzie
występuje mieszanina gazów, oba gazy będą miały jednakowe średnie energie kinetyczne.
Ponieważ część cząsteczek pierwszego rodzaju będzie przechodziła przez otwór bez straty
energii kinetycznej, średnia energia kinetyczna w czystym gazie będzie taka sama, jak
w mieszaninie. Nie jest to szczególnie przekonujący dowód, ponieważ nie ma chyba
takich otworków, które by mogły rozdzielić dwa rodzaje cząsteczek.
Powróćmy do zagadnienia tłoka w zbiorniku z gazem. Możemy twierdzić, że energia
kinetyczna tego tłoka musi być także równa i/w2^2 • W rzeczywistości byłaby to tylko energia
jego ruchu poziomego; zapominając więc o jego ruchu pionowym, powiemy, że powinna
ona być równa \m2v\x. Podobnie ze stanu równowagi z drugiej strony tłoka możemy
wywnioskować, że jego energia kinetyczna równa jest ^Witf,^. Wprawdzie tłok nie jest ze
wszystkich stron otoczony gazem i styka się tylko z jednym rodzajem z każdej strony, ale
nadal, choć jest to nieco trudniejsze, możemy korzystać z faktu, że średnia energia
kinetyczna tłoka w wyniku zderzeń cząsteczek z tłokiem równa się średniej energii cząsteczek
gazu.
Jeżeli i ten dowód nam nie wystarcza, to możemy podać dość sztuczny przykład
ustalenia równowagi za pomocą przedmiotu, który może być bombardowany cząsteczkami
ze wszystkich stron. Weźmy w tym celu krótki pręt zakończony z obu stron kulkami.
Pręt ten wetkniemy w tłok tak, aby mógł poruszać się w nim we wszystkie strony bez
tarcia. Każda kulka, podobnie jak cząsteczka, może być uderzana ze wszystkich stron.
Cały ten przedmiot ma masę m. Tak jak poprzednio, mamy cząsteczki z masami m, oraz
m2. W wyniku zderzeń, jak to udowodniliśmy poprzednio, średnia energia kinetyczna ciała
o masie m musi być z jednej strony tłoka równa \mv\. Podobnie z drugiej strony mamy
średnią energię kinetyczną równą \mi\. A zatem obie strony muszą mieć taką samą energię
kinetyczną, jeżeli są w stanie równowagi cieplnej. A więc chociaż udowodniliśmy to
tylko dla mieszaniny gazów, to nie nastręcza większych trudności rozszerzenie naszego
twierdzenia dla dwóch różnych gazów oddzielonych od siebie w tej samej
temperaturze.
• . I o. . 0
. • °.o
' • "o
• • !• O • •
J9-4. TEMPERATURA 1 ENERGIA KINETYCZNA
215
Zatem dla dwóch gazów o tej samej temperaturze średnie energie kinetyczne ruclui
środków mas cząsteczek są takie same.
Średnia energia kinetyczna cząsteczek jest własnością tylko „temperatury". Dlatego,
że jest własnością „temperatury", a nie gazu, możemy użyć jej do definicji temperatury.
Średnia energia kinetyczna cząsteczek jest w ten sposób pewną funkcją temperatury.
Ale kto nam podpowie, jakiej skali użyć do jej mierzenia? Możemy z góry zdefiniować
skalę temperatury tak, aby średnia energia kinetyczna była wprost proporcjonalna do
temperatury. Najlepiej byłoby nazwać samą średnią energię „temperaturą". To byłaby
najprostsza z możliwych funkcji. Niestety, skala temperatury została wybrana inaczej,
dlatego zamiast energię nazwać po prostu „temperaturą", używamy stałej proporcjonalnej
wiążącej średnią energię cząsteczki i stopień temperatury bezwzględnej, zwany stopniem
Kelvina. Stała ta wynosi fc=l,38- 10~2i dżula na każdy stopień Kelvina*'. Zatem jeżeli
T jest temperaturą bezwzględną, to zgodnie z naszą definicją średnia energia kinetyczna
cząsteczek równa się \kT (\ wzięto dla wygody, aby nie pisać ich w dalszych wzorach).
Przypominamy, że energia kinetyczna związana ze składową ruchu w określonym
kierunku wynosi tylko \kT. Dopiero wystąpienie trzech niezależnych kierunków prowadzi
do ±kT.
39-5. Prawo gazu doskonałego
Obecnie możemy oczywiście wstawić naszą definicję temperatury do równania (39.9)
i stąd znaleźć prawo dla ciśnienia gazu jako funkcji temperatury: iloczyn ciśnienia i objętości
równa się iloczynowi liczby atomów w tej objętości (N), uniwersalnej stałej (k) i
temperatury (7-):
PV = NkT. (39.22)
Co więcej, w określonej temperaturze i w odpowiadającym jej ciśnieniu i objętości liczba
atomów jest określona; jest ona także stałą uniwersalną! Zatem równe objętości różnych
gazów w tej samej temperaturze i przy tym samym ciśnieniu zawierają takie same liczby
cząsteczek i to wynika z praw Newtona. Jest to naprawdę zdumiewający wniosek!
W praktyce mając do czynienia z cząsteczkami musielibyśmy posługiwać się bardzo
wielkimi liczbami. Dlatego dla ułatwienia chemicy wybrali pewną liczbę, też bardzo
wielką, i dali jej specjalną nazwę. Nazwali ją molem. Mol jest po prostu wygodną liczbą.
Dlaczego chemicy nie wybrali 1024 obiektów, chociaż tak byłoby jeszcze wygodniej —
pozostanie pytaniem dla historyków Tak się złożyło, że chemicy wybrali jako standardową
liczbę ^0 = 6,02-10" obiektów i nazwali ją jednym molem tych obiektów. Zamiast
podawać liczbę cząsteczek, posługują się pojęciem mola.**' Mając liczbę N0 możemy napisać
*» 0" w skali Celsjusza odpowiada 273,16CK, więc 7"=273,l6 + temperalura w skali Celsjusza.
**' Chemicy nazywają gramocząsieczkami masy moli cząsteczek wyrażone w gramach. Mol jesi
»ak zdefiniowany, że masa jednego mola atomów izotopu węgla 12 Oj. mających 6 protonów i 6
neutronów w jądrze) wynosi dokładnie 12 g
216
39. KINETYCZNA TEORIA GAZÓW
iloczyn liczby moli, liczby atomów w jednym molu oraz wielkości kT i jeśli chcemy, to
możemy także dać nowe oznaczenie iloczynowi k i liczby atomów w jednym molu, tzn.
molowej wartości k, a mianowicie symbol R. Molowa wartość stałej k wynosi 8,317 J:
/?=7V0fc=8,317 J/(mol-°K). Znaleźliśmy więc prawo gazu zapisane jako iloczyn liczby moli
(również nazywanej N) i RT lub jako iloczyn liczby atomów i kT:
PV = NRT (39.23)
Wzory (39.22) i (39.23) przedstawiają dokładnie to samo, tylko użyto różnych skal do
wyznaczania liczb. We wzorze (39.22) jako jednostki używamy jedynki, a chemicy [wzór (39.23)]
liczby 6-10".
Omówimy teraz jeszcze jedną kwestię dotyczącą stosowania prawa gazów do innych
obiektów niż cząsteczki jednoatomowe. Do tej pory mieliśmy do czynienia tylko z ruchem
atomów gazu jednoatomowego w układzie ŚM. Co się zdarzy, gdy wystąpią siły?
Najpierw zastanówmy się nad przypadkiem, w którym tłok jest utrzymywany przez poziomą
sprężynę, działającą na niego pewną siłą. Wzajemne przekazywanie sobie ruchu skokowego
przez atomy i tłok nie zależy oczywiście od miejsca, w którym tłok się w danym momencie
znajduje. Warunki równowagi są takie same. Niezależnie od tego, gdzie tłok się
znajduje, musi on mieć taką szybkość ruchu, aby przekazać odpowiednią ilość energii
cząsteczkom. Zatem obecność sprężyny niczego nie zmienia. Szybkość, z jaką ma się poruszać tłok,
jest średnio biorąc, taka sama. A więc nasze twierdzenie, że średnia energia kinetyczna
przypadająca na składową ruchu w jednym kierunku wynosi \kT, jest prawdziwe niezależnie
od tego, czy siły wystąpią, czy też nie.
Weźmy na przykład pod uwagę dwuatomową cząsteczkę złożoną z atomów o masach
mA\mB. Udowodniliśmy już, że ruch w ŚM atomu A i atomu B odbywa się tak, że (\mAv\) =
= (\mBvBy = \kT. Jak to możliwe, skoro atomy te są związane? Otóż, mimo że są związane,
podczas ich wirowania oraz obrotów w cząsteczce jedyną rzeczą, którą trzeba brać pod
uwagę przy zderzeniach, jest prędkość ich ruchu. Tylko ten czynnik determinuje szybkość
wymiany energii w zderzeniach. W tym szczególnym wypadku siła nie jest czynnikiem
istotnym. Dlatego ta sama zasada jest słuszna nawet przy występowaniu sił.
Udowodnijmy w końcu, że prawo gazu pozostanie w mocy, gdy nie uwzględnimy ruchu
wewnętrznego. Właściwie do tej pory nie mówiliśmy o ruchu wewnętrznym, zajmowaliśmy
się tylko gazem jednoatomowym. Teraz udowodnimy, że cały obiekt traktowany jako
pojedyncze ciało o masie M ma taką prędkość środka masy, że
±MviM = \kT. (39.24)
Innymi słowy, możemy brać pod uwagę równie dobrze cały obiekt, jak i poszczególne
jego części. Znajdźmy uzasadnienie, dlaczego tak się dzieje. Masa dwuatomowej
cząsteczki równa się U = mA + mB, a prędkość jej środka mas wynosi VśM=(mAvA + mBvB)IM
Chcemy znać <UsV\ Podnosząc vsvl do kwadratu, mamy
2 _mAc\ + 2mAmB\A\B + m\v2B
Mnożymy obie strony tej równości przez +/V/, bierzemy średnią i otrzymujemy:
39-5. PRAWO GAZU DOSKONAŁEGO
217
,, ., 2 v mA WT+2mAmB<vA -vB> + mB\kT 2mAmB <Ti4- vB>
<iW^śM>= - =$kT+
M m
(skorzystaliśmy z faktu że (mA + mB)jM = 1 ]. Czemu równa się <t/,tb>? (Powinno się
równać zeru!) Aby na lo odpowiedzieć, skorzystamy z naszego założenia, że prędkość
względna v/=\A—\B nie wyróżnia żadnego kierunku, to znaczy, że średnia wartość jej
składowej w dowolnym kierunku jest równa zeru. Zatem przyjmujemy, że
Ale czemu się równa w vŚM? Otóż
(^-VeXm^v^ + mBTg) mAvA + (mB-mA)(vA- vB)-mBvl
w»śm =
M M
Ponieważ (mAvAy = imBvBy, po wzięciu średnich pierwszy i ostatni wyraz znoszą się i
otrzymujemy
(mB-mA){yAyBy=Q.
Jeżeli więc mA^mB, to <v/tvB> = 0, a zatem ruch całej cząsteczki traktowanej jako
cząsteczka pojedyncza o masie W jest taki, że jego średnia energia kinetyczna wynosi 32kT.
Przy okazji udowodniliśmy także, że średnia energia kinetyczna ruchu wewnętrznego
dwuatomowej cząsteczki, bez uwzględnienia energii kinetycznej środka mas, równa się
•|A7"! Całkowita bowiem energia kinetyczna obu części cząsteczki wynosi łmAvA + ĄmBi'B,
co po uśrednieniu daje *kT+^kT, a zatem 3A7" Energia kinetyczna ruchu środka mas
wynosi ĄkT. zatem średnia energia kinetyczna ruchu obrotowego i drgającego dwóch
atomów wewnątrz cząsteczki, będąc różnicą energii całkowitej i energii środka mas, równa
się^T.
Twierdzenie o średniej energii ruchu środka masy jest bardzo ogólne. W dowolnym
obiekcie traktowanym jako całość, niezależnie od występowania lub niewystępowania sił,
średnią energia kinetyczna każdego istniejącego w nim niezależnego kierunku ruchu wynosi
\kT. Te „niezależne kierunki ruchu" są czasami nazywane stopniami swobody układu.
Liczba stopni swobody cząsteczki zbudowanej z r atomów równa się 3r, ponieważ dla
każdego atomu potrzeba trzech współrzędnych do określenia jego położenia. Całkowita
energia kinetyczna cząsteczki może być wyrażona albo jako suma energii kinetycznych
wszystkich atomów, albo jako suma energii kinetycznej ruchu ŚM i energii kinetycznej ruchu
wewnętrznego. Tę ostatnią można czasami wyrazić jako sumę energii obrotowej cząsteczki
1 energii drgań, ale jest to tylko przybliżenie. Nasze twierdzenie zastosowane do r-atomowej
cząsteczki głosi, że będzie ona miała średnio ~rkT J energii kinetycznej, z czego f kT jest
energią kinetyczną ruchu środka masy całej cząsteczki, a pozostałe \(r— \)kT przypada
na wewnętrzną energię drgań i obrotów cząsteczki.
40
zasady mechaniki statystycznej
40-1. Wzór biometryczny
Omówiliśmy już pewne własności dużej liczby zderzających się atomów. Przedmiot
tych rozważań nosi nazwę teorii kinetycznej i opisuje materię z punktu widzenia zderzeń
między atomami. Uważamy, że większość własności materii powinna dać się w zasadzie
wyjaśnić za pomocą badania ruchów jej części.
Ograniczymy się na razie do warunków równowagi cieplnej, która zachodzi tylko
dla pewnej klasy zjawisk przyrody. Prawa mechaniki, które stosuje się właśnie do
równowagi cieplnej, nazwano mechaniką statystyczną i w tym rozdziale chcemy zapoznać się
z pewnymi głównymi jej twierdzeniami.
Znamy już jedno z twierdzeń mechaniki statystycznej, mianowicie, że średnia wartość
energii kinetycznej dowolnego ruchu wynosi \kT dla każdego niezależnego ruchu, tj.
dla każdego stopnia swobody, jeżeli temperatura bezwzględna równa się T. Na tej
podstawie wiemy już coś o średnich kwadratowych szybkościach atomów. Chcemy teraz
dowiedzieć się czegoś więcej o położeniach atomów, wykryć, ile z nich znajdzie się w różnych
miejscach w stanie równowagi cieplnej i zapoznać się bardziej szczegółowo z rozkładem
prędkości. Chociaż znamy średnią kwadratową prędkość, to nie potrafilibyśmy
odpowiedzieć na pytanie: ile cząsteczek ma szybkość trzykrotnie większą od pierwiastka
kwadratowego średniej kwadratowej prędkości lub ile z nich porusza się z szybkością równą
jednej czwartej tej samej wielkości? albo też na pytanie: czy wszystkie cząsteczki mają
dokładnie tę samą szybkość?
Mamy zatem dwa pytania, na które spróbujemy odpowiedzieć: Jak rozmieszczone
są cząsteczki w przestrzeni, gdy działają na nie siły? Jaki jest rozkład ich prędkości?
Okazuje się, że pytania te są zupełnie niezależne oraz że rozkład prędkości jest zawsze
laki sam. Na prawdziwość ostatniego stwierdzenia wskazywało już to, że średnia energia
40-1 WZÓR BAROMFTRYC7NY
219
kinetyczna jest taka sama i wynosi \kT na stopień swobody, niezależnie od sił działających
na cząsteczki. Rozkład prędkości cząsteczek nie zależy od sil, ponieważ nie zależą od nich
częstości zderzeń.
Jako pierwszy przykład weźmy rozkład cząsteczek w atmosferze takiej jak ziemska,
ale pozbawionej wiatrów oraz innych zakłóceń. Przypuśćmy, że mamy kolumnę gazu
sięgającą wielkich wysokości i będącą w równowadze cieplnej, nie taką więc jak nasza
atmosfera, która jest coraz zimniejsza, im wyżej się wznosimy. Możemy zauważyć, że
jeżeli temperatura zmienia się z wysokością, to moglibyśmy zademonstrować brak
równowagi cieplnej umieszczając pionowo pręt i dołączając do niego u dołu kolumny gazu
kuleczki (rys. 40.1), które otrzymywałyby tam energię SkT od cząsteczek i potrząsałyby
za pośrednictwem pręta kulkami umieszczonymi na górze, które z kolei przekazywałyby
wstrząsy górnym cząsteczkom atmosfery. W końcu oczywiście temperatura byłaby
jednakowa, niezależnie od wysokości w polu grawitacyjnym.
Jeżeli temperatura jest taka sama na każdej wysokości, to powstaje pytanie: jakie prawo
powoduje, że atmosfera staje się coraz rzadsza, gdy się wznosimy wyżej? Skoro N jest
całkowitą liczbą cząsteczek w objętości V gazu przy ciśnieniu P, wiemy, że PV=NkT,
czyli P = nkT, gdzie /i=/V/Kjest liczbą cząsteczek w jednostkowej objętości. Innymi słowy,
znając liczbę cząsteczek w jednostkowej objętości wiemy, jakie jest ciśnienie, i odwrotnie.
Wielkości te są wzajemnie proporcjonalne, ponieważ w tym przykładzie temperatura jest
stała. Ciśnienie natomiast nie jest stałe, musi rosnąć wraz ze spadkiem wysokości, ponieważ
musi utrzymywać cały gaz znajdujący się powyżej. Dzięki tej wskazówce możemy określić,
jak zmienia się ciśnienie wraz z wysokością. Jeżeli na wysokości h wybierzemy jednostkową
powierzchnię, wtedy siła pionowa działająca z dołu na tę powierzchnię jest ciśnieniem
P. Taka sama siła pionowa działałaby na jednostkową powierzchnię z góry na wysokości
h+dh, gdyby nie było sił ciążenia. Ale tak nie
jest. Siła z dołu musi być większa od siły z góry
o tyle, ile wynosi ciężar gazu zawartego między
h, a h + dh. Siła ciążenia działająca na każdą
cząsteczkę wynosi mg, gdzie g jest
przyspieszeniem ziemskim. W jednostkowym przekroju
znajduje się n dli cząsteczek Stąd otrzymujemy
równanie różniczkowe Ph+Jh-Ph = dP= -mgn dh.
Ponieważ P = nkT. przy czym T jest stałe,
możemy więc wyeliminować P lub n
Powiedzmy, że eliminujemy P i otrzymujemy
równanie:
40.1. Ciśnienie gazu na wysokości h musi
być większe od ciśnienia na wysokości
h-rdh, aby zrównoważyć ciężar gazu
/awarlego między wysokością da h + dh
dn
dh
kT
mechanizm
wyrównujący
temperaturę
które mówi nam, jak maleje gęstość ze wzro-
s<em wysokości.
Otrzymaliśmy równanie dla gęstości cząste-
n, która zmienia się z wysokością tak.
<-?ek
220
40 ZASADY MECHANIKI STATYSTYC7NEJ
że jej pochodna jest proporcjonalna do niej
samej. Funkcją, której pochodna jest
proporcjonalna do funkcji różniczkowanej, jest funkcja
wykładnicza i dlatego rozwiązaniem tego
równania jest
„=„0e-m'*/ir (40.1)
Tutaj stała całkowania n0 jest oczywiście
gęstością na wysokości // = 0 (która może być
wybrana w dowolnym miejscu). Gęstość maleje
wykładniczo z wysokością.
Zauważmy, że dla różnych rodzajów
cząsteczek z różnymi masami malenie gęstości będzie
opisywane przez różne wykładniki potęgowe.
Gęstość cząsteczek cięższych będzie malała
szybciej ze wzrostem wysokości niż lżejszych.
Dlatego powinniśmy oczekiwać, że przy
wznoszeniu się w atmosferze złożonej z tlenu i azotu
stosunek azotu do tlenu wzrasta, ponieważ tlen
jest cięższy od azotu. Ale w naszej atmosferze
tak się nie dzieje, przynajmniej na umiarkowanych wysokościach, na skutek istnienia
wielu ruchów mieszających gazy. Nasza atmosfera nie jest izotermiczna. Mimo to
występuje w niej tendencja do dominowania na bardzo dużych wysokościach składników
lżejszych, takich jak wodór, ponieważ bardzo lekkie składniki występują jeszcze tam,
gdzie inne funkcje wykładnicze praktycznie równają się zeru (rys. 40.2).
40-2. Prawo Boltzmanna
Zauważmy interesujący fakt, że licznik w wykładniku równania (40.1) określa energię
potencjalną atomu. Prawo to możemy zatem sformułować także w następujący sposób:
gęstość w dowolnym punkcie jest proporcjonalna do
—(energia potencjalna każdego atomu'kT)
Może to być tylko przypadek — to znaczy powyższe prawo może być słuszne tylko
w omawianym przez nas wypadku jednorodnego pola grawitacyjnego. Możemy jednak
udowodnić, że jest to ogólniejsze twierdzenie. Załóżmy, że na cząsteczki gazu działa
jakaś inna siła, nie grawitacyjna. Tak na przykład cząsteczki mogą być naładowane
elektrycznie i może na nie działać pole elektryczne innego ładunku, który je przyciąga. Może
też na skutek wzajemnego przyciągania atomów albo przyciągania przez ścianki, albo
przez ciała stałe czy przez coś innego występować siła, która zmienia się w zależności od
położenia i która działa na wszystkie cząsteczki. Załóżmy dalej dla uproszczenia, że wszyst'
kie cząsteczki są takie same i że siła działa na każdą oddzielnie, tak że całkowita siła.
działająca na pewną ilość gazu, równa się po prostu iloczynowi liczby cząsteczek i s"-v
wysokość, km
40.2. Znormalizowane gęstości tlenu i
wodoru w ziemskim polu grawitacyjnym w
stałej temperaturze jako funkcje
wysokości
40-2. PRAWO BOLTZMANNA
221
działającej na jedną cząsteczkę. Dla uniknięcia zbędnych komplikacji wybierzmy układ
współrzędnych z osią x w kierunku siły F.
Jeżeli ustalimy w gazie dwie równoległe płaszczyzny odległe o dx, to siła działająca
na każdy atom pomnożona przez n atomów w cm3 (uogólnienie poprzedniego nmg),
pomnożona przez dx, musi być tak jak poprzednio zrównoważona przez zmianę ciśnienia:
fn dx = dP=kTdn. Można też zapisać to prawo w postaci, która będzie bardziej
przydatna dla naszych późniejszych rozważań:
d
F = kT—(Inn). (40.2)
dx
Na razie widzimy, że —Fdx jest pracą, którą musimy wykonać przenosząc cząsteczkę
z x <\o x + dx i jeżeli F pochodzi od potencjału, to znaczy jeżeli wykonana praca może
być w ogóle przedstawiona jako energia potencjalna, to —Fdx byłoby także zmianą
energii potencjalnej (£p). Różniczka energii potencjalnej wzięta ze znakiem minus równa
się wykonanej pracy Fdx i okazuje się, że d{\nń)= —d(Ep)/kT lub po scałkowaniu
w =(stała) exp(-E,JkT). (40.3)
Okazuje się więc, że spostrzeżenie poczynione w szczególnym przypadku jest ogólnie
słuszne. [A co się dzieje wtedy, gdy siła F nie jest potencjalna? Wówczas równanie (40.2)
nie ma w ogóle rozwiązania. Energia może być wytwarzana lub tracona przez atomy
poruszające się cyklicznie po drogach, na których wykonana praca nie jest równa zeru
i stan równowagi nie może być osiągnięty. Równowaga cieplna nie może istnieć, jeżeli
siły zewnętrzne działające na atomy nie są zachowawcze.] Równanie (40.3) znane jako
prawo Bollzmanna jest jedną z zasad mechaniki statystycznej. Zgodnie z tą zasadą
prawdopodobieństwo tego, że cząsteczki będą tworzyły dany układ przestrzenny, zmienia się
wykładniczo wraz z energią potencjalną tego układu podzieloną przez kT i wziętą ze
znakiem minus.
Prawo to może służyć do określania rozkładu cząsteczek. Zakładając na
przykład, że mamy w cieczy dodatni jon, przyciągający sąsiadujące z nim jony ujemne,
zapytajmy: ile tych jonów będzie znajdowało się w różnych odległościach od jonu
dodatniego? Jeżeli energia potencjalna jest znaną funkcją odległości, to liczby jonów w różnych
odległościach są określone przez prawo Boltzmanna. Podobnie jest w wielu innych
zastosowaniach tego prawa.
40-3. Parowanie cieczy
Omówimy teraz pewien doniosły problem, którym zajmuje się wyższa mechanika
statystyczna. Weźmy pod uwagę zbiór cząsteczek przyciągających się wzajemnie i
załóżmy, że siła między dwoma dowolnymi cząsteczkami, np. i-tą oraz y-tą, zależy tylko
°d ich odległości rki i może być przedstawiona jako pochodna potencjału V{rij)- Rysunek
40-3 pokazuje kształt, jaki może mieć taki potencjał. Dla r> r0 energia maleje, gdy
cząsteczki zbliżają się do siebie dzięki swemu wzajemnemu przyciąganiu. Gdy cząsteczki
222
40 ZASADY MECHANIKI STATYSTYCZNEJ
V(r)
zbliżają się w dalszym ciągu, ich energia bardzo
szybko rośnie na skutek odpychania. W taki oto,
w ogólnych zarysach, charakterystyczny sposób
zachowują się cząsteczki.
Załóżmy teraz, że mamy cały zbiornik
takich cząsteczek i chcemy wiedzieć, jak są,
średnio biorąc, rozmieszczone? Odpowiadamy:
exp( — Ep/kT). Całkowita energia potencjalna
w tym wypadku byłaby sumą po wszystkich
parach cząsteczek, przy założeniu, że mamy do
czynienia tylko z siłami dwuciałowymi (w bardziej
skomplikowanych przypadkach mogą
występować siły trójciałowe, ale np. w elektrostatyce
energia potencjalna składa się tylko z energii pochodzących dosiłdwuciałowych). W
takim razie prawdopodobieństwo znalezienia cząsteczek w dowolnie wybranej kombinacji
rKi byłoby proporcjonalne do
exp[-XF(rl7)/A:7-]
40.3. Potencjał dwóch cząsteczek zależny
tylko od ich odległości
Jeżeli temperatura jest bardzo wysoka, tak że kTp\V(r0)\, wykładnik jest niemal
wszędzie stosunkowo mały i prawdopodobieństwo znalezienia cząsteczki jest prawie
niezależne od położenia. Weźmy pod uwagę tylko dwie cząsteczki; wtedy
prawdopodobieństwo znalezienia ich w różnych wzajemnych odległościach r byłoby równe exp(-£,,/£ 7").
Oczywiście, tam gdzie potencjał jest najbardziej ujemny, prawdopodobieństwo jest
największe, a tam, gdzie potencjał dąży do nieskończoności, prawdopodobieństwo jest
prawie równe zeru, co zachodzi przy bardzo małych odległościach; tzn. że takie atomy
w gazie nie mogą się zetknąć, ponieważ odpychają się bardzo silnie. Istnieje natomiast
znacznie większa szansa znalezienia ich w jednostkowej objętości w otoczeniu punktu r0
niż w otoczeniu każdego innego punktu. O ile większa, to zależy od temperatury. Jeżeli
temperatura jest bardzo duża w porównaniu z różnicą energii między r = r0 i r= oo, funkcja
wykładnicza jest zawsze bliska jedności. W tym przypadku średnia energia kinetyczna
(około kT) znacznie przewyższa energię potencjalną i siły nie mają wielkiego wpływu.
Gdy natomiast temperatura maleje, prawdopodobieństwo znalezienia cząsteczek w
najkorzystniejszej odległości r0 stopniowo wzrasta w stosunku do prawdopodobieństwa
znalezienia ich gdziekolwiek indziej, i rzeczywiście, skoro energia kT jest znacznie
mniejsza od |^(/"0)|, mamy względnie duży dodatni wykładnik wokół tego miejsca. Inaczej
mówiąc, jest o wiele bardziej prawdopodobne, że w danej objętości cząsteczki znajdą się
w odległości odpowiadającej minimum energii niż daleko od siebie. Gdy temperatura
maleje, atomy zbliżają się, zlepiają się w grudki, tworzą ciecze i ciała stałe oraz cząsteczki,
natomiast po podgrzaniu substancje wyparowują.
Wymagania, które należy spełnić w celu dokładnego określenia, jak odbywa się
parowanie, co się dokładnie dzieje w określonych warunkach, są następujące. Najpierw
musimy znaleźć poprawne prawo sił międzycząsteczkowych V(r). Musimy to prawo
wziąć z jakiejś innej dziedziny, np. z mechaniki kwantowej, lub też z doświadczenia. Skoro
40-3- PAROWANIE CIECZY
223
znamy już prawo opisujące siły międzycząsteczkowe, możemy zbadać, jak zachowuje się
miliard cząsteczek, zajmując się tylko funkcją exp(—£ V^jkT). Wbrew oczekiwaniom,
•i
mimo że jest to tak prosta funkcja i tak łatwa do zrozumienia idea, przy znanym
potencjale, postępowanie to jest niesłychanie skomplikowane; trudność sprawia olbrzymia liczba
zmiennych.
Mimo tych trudności problem jest bardzo interesujący, wręcz ekscytujący! Często
nazywa się go przykładem „problemu wielu ciał", który jest rzeczywiście bardzo
zajmujący. W jednym wzorze musi być na przykład zawarte wszystko, co dotyczy
zestalania gazu lub różnych kształtów kryształów ciał stałych. Istnieją wprawdzie próby objęcia
tych wszystkich danych jednym wzorem, jednak trudności matematyczne są bardzo duże
i to nie w samym zapisaniu prawa, ale w postępowaniu z tak olbrzymią liczbą
zmiennych.
Tyle o rozkładzie cząsteczek w przestrzeni. Na tym kończy się praktycznie biorąc
klasyczna mechanika statystyczna, ponieważ skoro znamy siły, to możemy w zasadzie
znaleźć rozkład cząsteczek w przestrzeni, a rozkład prędkości możemy ustalić raz na
zawsze i to dla wszystkich poszczególnych przypadków. Większe trudności nastręcza
otrzymywanie z naszego formalnego rozwiązania szczegółowych informacji i to jest
właśnie głównym przedmiotem badań klasycznej mechaniki statystycznej.
40-4. Rozkład prędkości cząsteczkowych
Obecnie przystępujemy do omawiania rozkładu prędkości, ponieważ czasem warto
wiedzieć, ile cząsteczek porusza się z różnymi szybkościami. W tym celu możemy
skorzystać z wiadomości, które zdobyliśmy zajmując się gazem w atmosferze. Przedmiotem
naszych badań był tylko gaz doskonały, co założyliśmy, kiedy zapisując energię
potencjalną pominęliśmy energię wzajemnego przyciągania atomów. Jedyną energią potencjalną,
jaką uwzględniliśmy w naszym pierwszym przykładzie,
była energia grawitacyjna. Uwzględnienie także sił
działających między atomami wywołałoby oczywiście
dalsze komplikacje. Zakładamy więc. że nie ma sił
między atomami i na razie pomijamy także zderzenia, co
później postaramy się uzasadnić. Wiemy już, że na
wysokości h jest mniej cząsteczek niż na wysokości 0 (rys.
40.4). Zgodnie ze wzorem (40.1) liczba ich maleje
wykładniczo z wysokością. Ale dlaczego ma ich być
mniej na większych wysokościach? Może wszystkie
cząsteczki poruszające się do góry na wysokości 0 w
końcu osiągną wysokość /;? Oczywiście nie! Niektóre
bowiem z nich poruszają się zbjt wolno, by wzbić się
na wysokość h. Wiedząc o tym, możemy obliczyć, ile
Cz4steczek musi poruszać się z różnymi szybkościami,
Ponieważ z wyrażenia (40.1) wiemy, ile z nich porusza
40.4. Tylko dostatecznie szybkie
cząsteczki spośród wszystkich
zmierzających w górę na
wysokości /i=0 osiągną wysokość h
h=h
/>=0
224
40. ZASADY MECHANIKI STATYSTYCZNEJ
się z szybkością zbyt małą, żeby wspiąć się na daną wysokość h. Z powodu tych
właśnie cząsteczek gęstość na wysokości h jest mniejsza niż na wysokości 0.
Postarajmy się sprecyzować nasz problem: obliczmy, ile cząsteczek przebiega z dołu
przez płaszczyznę h = 0 (oznaczając tę wysokość przez 0, nie twierdzimy, że na tej
wysokości jest podstawa naszego słupa gazu; jest to tylko wygodne oznaczenie, gaz bowiem
znajduje się także tam, gdzie h ma wartość ujemną). Cząsteczki gazu poruszają się we
wszystkich kierunkach, ale niektóre z nich przebiegają przez naszą płaszczyznę i w każdej
chwili pewna ich liczba na sekundę przebija płaszczyznę z dołu do góry z różnymi
prędkościami. Następnie zauważmy, że jeżeli prędkość, która jest niezbędna, aby cząsteczka
osiągnęła wysokość h (odpowiada jej energia kinetyczna mu2/2 = mgh), oznaczymy literą
u, to liczba cząsteczek na sekundę, które przebiegają przez dolną płaszczyznę na
wysokości 0 w kierunku pionowym ze składową prędkości większą niż u, jest dokładnie
taka sama jak liczba cząsteczek przebiegających w tym samym kierunku przez górną
płaszczyznę na wysokości h z dowolną, skierowaną do góry prędkością. Te spośród
cząsteczek, których pionowa prędkość nie przewyższa u, nie mogą przedostać się przez górną
płaszczyznę. A więc widzimy, że
liczba cząsteczek przebiegających przez płaszczyznę h = 0 z prędkością vt>u =
= liczbie cząsteczek przebiegających przez płaszczyznę h~h z prędkością v, ~>0.
Jednak liczba cząsteczek, które przebiegają przez płaszczyznę h z dowolną prędkością
większą niż 0, jest mniejsza niż liczba tych, które przebiegają przez dolną płaszczyznę
z dowolną prędkością większą od 0, ponieważ na niższym poziomie jest więcej atomów.
O to nam właśnie chodziło. Wiemy już, że rozkład prędkości jest taki sam, gdy
temperatura w całej atmosferze jest stała. Zatem skoro rozkład prędkości jest taki sam i skoro
liczba cząsteczek rośnie w miarę przesuwania się ku dołowi, to liczba n>0(h) cząsteczek
przebiegających na wysokości h z dodatnią prędkością i liczba n>0(0) cząsteczek
przebiegających na wysokości 0 z dodatnią prędkością pozostają w stosunku równym
stosunkowi gęstości na tych dwu wysokościach, który wynosi e~'n»*'*r. Ale n>0(h) — n3,JP)
i dlatego otrzymujemy
n > iW) -mghlkT __ -mu'/2kT
«>o(0)
ponieważ \mu2 — mgh, czyli liczba cząsteczek przypadających na jednostkową
powierzchnię i przebiegających w ciągu sekundy przez płaszczyznę h = 0 z z-ową składową
prędkości większą niż u wynosi e~m" l2kT, pomnożone przez całkowitą liczbę cząsteczek
przebiegających przez tę płaszczyznę z prędkością większą od 0.
Oczywiście, powyższe twierdzenie jest prawdziwe nie tylko w odniesieniu do dowolnie
wybranej wysokości 0, ale także do każdej innej wysokości, a więc wszystkie rozkłady
prędkości są takie same. (Ostateczny wynik nie zawiera wysokości h, która wystąpiła tylk°
w pośrednich rozważaniach.) Jest to ogólne twierdzenie o rozkładzie prędkości. Mo**"
ono te ieżeli w ścianie rury z gazem wydrążymy otwór tak mały, że zderzenia będą bard?0
4(M. ROZKŁAD PRĘDKOŚCI CZĄSTECZKOWYCH
225
nieliczne i będą zachodziły w odległościach znacznie większych niż wynosi średnica otworu,
cząsteczki wybiegające z rury będą miały wprawdzie różne prędkości, ale liczba tych,
które wybiegają z prędkościami większymi od u, będzie się równać e~MU'i2kT.
Wracamy obecnie do pominięcia zderzeń. Dlaczego nie zmieniają one wyniku?
Moglibyśmy zastosować ten sam dowód, biorąc jednak nie skończoną wysokość h, ale
wysokość nieskończenie małą, tak małą, że nie byłoby miejsca dla zdarzeń między
poziomami 0 i h. Nie musimy jednak tego robić: dowód opiera się na analizie występujących
energii, na zasadzie zachowania energii, a w zachodzących zderzeniach następuje
wymiana energii między cząsteczkami. Właściwie jednak nie obchodzi nas, czy obserwujemy
ciągle tę samą cząsteczkę, jeżeli tylko cząsteczki wymieniają energię między sobą. W końcu
okazuje się, że nawet gdy problem analizujemy bardziej starannie (a taki skrupulatny
dowód oczywiście znacznie trudniej przeprowadzić), to i tak otrzymujemy identyczny
wynik.
Interesujące jest, że rozkład prędkości, który znaleźliśmy, jest właśnie taki:
-energia kinetyczna/kT
»>U~C
(40.4)
Ten sposób opisu rozkładu prędkości — przez podanie liczby cząsteczek, które
przebiegają przez daną powierzchnię z pewną minimalną składową z-ową — nie jest
najwygodniejszy. Znacznie częściej chcemy wiedzieć na przykład, ile cząstek porusza się w gazie
z z-ową składową prędkości zawartą między dwoma danymi wartościami, a to nie jest
od razu widoczne ze wzoru (40.4). Wolelibyśmy sformułować nasz wynik w wygodniejszy
sposób, chociaż jego obecna postać jest już wystarczająco ogólna. Zauważmy, że nie
można powiedzieć, iż jakai cząsteczka ma pewną ściśle określoną prędkość; żadna z nich
nie ma prędkości równej ściśle 1,7962899173 m/s. Aby więc sensownie sformułować
problem, możemy tylko zapytać, ile cząsteczek znajduje się w pewnym przedziale
prędkości. Możemy określić, ile mamy cząsteczek o prędkościach między 1,796 a 1,797 itd.
Matematycznie sformułujemy to tak: niech f(u)du oznacza tę część wszystkich cząsteczek,
których prędkości są zawarte między u i u + du, lub, co na to samo wychodzi (gdy du
jest nieskończenie małe), których prędkości równają się u z dokładnością do du. Rysunek
40.5 przedstawia jedną z możliwych
postaci funkcji f(u), a zakreskowany
wycinek o szerokości du i średniej wysokości
/(«) przedstawia tę część cząsteczek
f{u)du. Inaczej mówiąc, stosunek zakres-
kowanej powierzchni do całej powierzchni
°bjętej krzywą równa się względnej liczbie
^steczek o prędkości u wyznaczonej
z dokładnością du. Jeżeli określimy funkcję
f(u) tak, że część cząsteczek mających
Prędkości w tym przedziale jest dana po
Prostu przez zakreskowaną powierzchnię
"~ cała powierzchnia równa się
względnej liczbie wszystkich cząsteczek, tzn.
40.3. Funkcja rozkładu prędkości.
Zakreskowaną powierzchnia /(u) du przedstawia grupę
cząsteczek mających prędkości u w przedziale du
226
40. ZASADY MECHANIKI STATYSTYCZNEJ
jedności:
OD
$f(u)du = l. (40.5)
— OD
Aby teraz otrzymać szukany rozkład, wystarczy porównać go z twierdzeniem, które
udowodniliśmy poprzednio. Najpierw zapytamy: jak można wyrazić przy pomocy funkcji
f(u) liczbę cząsteczek przebiegających przez powierzchnię w ciągu sekundy z prędkością
większą niż //? W pierwszej chwili możemy pomyśleć, że równa się ona po prostu całce
OC
\f(u)du, ale tak nie jest, ponieważ chcemy znać liczbę cząsteczek, które przebiegają
u
przez powierzchnię w ciągu sekundy. Chodzi o to, że szybsze cząsteczki przebiegają częściej
niż wolniejsze i aby obliczyć, ile ich przebiega, trzeba mnożyć przez prędkość (mówiliśmy
o tym w poprzednim rozdziale, gdy zajmowaliśmy się liczbą zderzeń). W danym czasie
/ całkowitą liczbę cząsteczek przebiegających przez powierzchnię stanowią te, które są
w stanie dotrzeć do powierzchni, to znaczy te, które przybywają z odległości ut, zatem
liczba cząsteczek przybywających nie równa się po prostu liczbie wszystkich istniejących
cząsteczek, lecz liczbie cząsteczek zawartych w jednostkowej objętości, pomnożonej przez
odległość przebytą w drodze do powierzchni, przez którą mają się przedostać. Odległość
ta jest proporcjonalna do u. Zatem musimy obliczyć całkę z u razy f(u)du, całkę z górną
granicą nieskończoną, a dolną u. Całka ta musi być równa temu, co obliczyliśmy
przedtem, mianowicie e~n"'1ilkT ze stałą proporcjonalności, którą znajdziemy później:
00
j"u/(«)</« = stała-e~m,/2/"\ (40.6)
u
Różniczkując całkę względem u otrzymamy funkcję podcałkową (ze znakiem minus,
ponieważ u jest dolną granicą). Różniczkując prawą stronę otrzymamy u razy ta sama
funkcja wykładnicza (i jakaś stała). Oba u skracają się i otrzymujemy
f(u)du = Ce-mu2'2kTdu (40.7)
Pozostawiamy du z obu stron dla przypomnienia, że określają one rozkład, który mówi,
jaka część ogólnej liczby cząsteczek ma prędkość między u a u+du.
Stała C musi być tak dobrana, aby całka równała się jedności, zgodnie z zależnością
(40.5). Możemy udowodnić, że*'
*> Aby obliczyć wartość całki, oznaczamy
— OD
Wtedy
/2= J e^dx J e^dy^ J J ^^dxdy,
— <c — «, - » — *
co jest podwójną całką po całej płaszczyźnie xy. Można ją także zapisać we współrzędnych
biegunowych:
OD »
l2=f e"'-2nrdr=n je"dt=n.
o o
40-4. ROZKŁAD PRĘDKOŚCI CZĄSTECZKOWYCH
227
— CD
Korzystając z tego. łatwo znajdziemy, że C=\ mj2nkT.
Ponieważ prędkość i pęd są wzajemnie proporcjonalne, możemy powiedzieć, że
rozkład pędów jest także proporcjonalny do exp(-EJkT) na jednostkę przedziału pędu.
Okazuje się, że powyższe twierdzenie jest słuszne także w teorii względności, jeżeli
zapiszemy je przy pomocy pędów, natomiast nie jest słuszne przy zapisie z prędkościami,
zatem lepiej badać je w postaci wyrażonej przy pomocy pędów:
J(p)dp=Cexp(-EJkT)dp. (40.8)
Obliczyliśmy więc, że prawdopodobieństwa różnych stanów energetycznych, zarówno
dla energii kinetycznej, jak i potencjalnej są dane przez c~a,eTB'iikT_ Łatwo więc można
zapamiętać to piękne twierdzenie.
Do tej pory wyznaczyliśmy oczywiście tylko rozkład „pionowy" prędkości. Możemy
zapytać: jakie jest prawdopodobieństwo, że cząsteczka porusza się w innym kierunku?
Oczywiście, oba te rozkłady będą związane ze sobą i pełny rozkład można otrzymać na
podstawie posiadanych przez nas wiadomości, ponieważ zależy on tylko od kwadratu
prędkości, a nie od jej składowej z-owej. Pełny rozkład musi być czymś, co nie zależy od
kierunku, i musi być określany tylko przez jedną funkcję - prawdopodobieństwo różnych
wielkości prędkości. Skoro mamy rozkład składowej z-owej, możemy z niego otrzymać
rozkłady innych składowych prędkości. W rezultacie okazuje się, że
prawdopodobieństwo jest nadal proporcjonalne do exp( — EklkT), ale teraz energia kinetyczna zawiera
trzy części: mv2xj2, mry/2 i mv2/2, zsumowane w wykładniku. Wynik ten można też
zapisać jako iloczyn
J(vx, vy. vz)dvx dvydvx ~ exp(— mvx/2kT) exp(— mvlj2kT) exp(— mv2j2kT)dv,, dvydvz.
(40.9)
Widzimy, że wzór ten jest prawdziwy, ponieważ po pierwsze — zawiera tylko funkcję
v2, tak jak należy, a po drugie — prawdopodobieństwa różnych wartości vz otrzymane
po scałkowaniu po wszystkich vx i vy są ściśle takie, jak we wzorze (40.7). Oba te wnioski
wynikają z jednej tylko funkcji (40.9)!
40-5. Ciepła właściwe gazów
Z kolei postaramy się w jakiś sposób sprawdzić naszą teorię i przekonać się o
osiągnięciach klasycznej teorii gazów. Zauważyliśmy już wcześniej, że jeżeli U jest energią
wewnętrzną N cząsteczek, to niekiedy dla pewnych gazów spełnione jest równanie PV=
= NkT=(y — \)U. Wiemy, że w wypadku gazu jednoatomowego prawa strona równa
się J energii kinetycznej ruchu środka masy atomów. Energia kinetyczna takiego gazu
równa się energii wewnętrznej i dlatego y-l=$. Gdy jednak weźmiemy bardziej
skomplikowaną cząsteczkę, która może wirować oraz drgać i założymy (co według mechaniki
klasycznej okazuje się słuszne), że energie ruchów wewnętrznych są także proporcjonalne
228
40. ZASADY MECHANIKI STATYSTYCZNEJ
do kT, to wówczas w danej temperaturze cząsteczka oprócz kinetycznej energii kT ma
także energię wewnętrzną związaną z drganiami i obrotami. Całkowita zatem energia U
składa się wtedy nie tylko z wewnętrznej energii kinetycznej, ale także z energii ruchu
obrotowego i otrzymamy inną wartość y. Praktycznie najlepiej wyznaczyć y mierząc ciepło
właściwe, które równa się zmianie energii przy zmianie temperatury. Do tej metody
jeszcze powrócimy. Dla naszych obecnych celów możemy przyjąć, że y zostało znalezione
eksperymentalnie za pomocą krzywej PVr w przypadku sprężania adiabatycznego.
Obliczmy y dla kilku przypadków. Dla gazów jednoatomowych U stanowi całkowitą
energię, równą energii kinetycznej, i wiemy już, że y powinno się równać |. Przyjmujemy,
że cząsteczki gazów dwuatomowych, np. tlenu, jodku wodoru lub wodoru, można
przedstawić jako dwa atomy związane siłą, podobną do tej, jaką ilustruje rys. 40.3. Możemy
także przyjąć, co okaże się słuszne, że w temperaturach aktualnych w wypadku gazów
dwuatomowych pary atomów bardzo silnie dążą do zachowania między atomami
odległości r0 odpowiadającej minimum potencjału. Gdyby tak nie było, gdyby
prawdopodobieństwo nie zamieniało się na tyle szybko, aby zapewnić znacznej większości cząsteczek
miejsce blisko minimum potencjału, gazowy tlen byłby mieszaniną 02 i niemałej liczby
pojedynczych atomów tlenu. W rzeczywistości wiadomo, że pojedyncze atomy są bardzo
nieliczne, co oznacza, jak stwierdziliśmy, że wartość minimum energii potencjalnej jest
znacznie większa niż kT. Ponieważ cząsteczki bardzo silnie gromadzą się wokół r0,
jedyna część krzywej, która jest potrzebna, znajduje się blisko minimum i możemy ją w
przybliżeniu traktować jako parabolę. Paraboliczny potencjał wiąże się z oscylatorem
harmonicznym i rzeczywiście, możemy z doskonałym przybliżeniem przedstawić cząsteczkę
tlenu jako dwa atomy połączone sprężyną.
Zapytajmy następnie: jaka jest całkowita energia tej cząsteczki w temperaturze H
Wiemy, że energia kinetyczna każdego z dwu atomów powinna być równa \kT a zatem
energia obu równa się \kT+\kT. Możemy to też wyrazić inaczej: te same \ plus -można
traktować jako kinetyczną energię środka masy (\), kinetyczną energię obrotów (*) i
kinetyczną energię drgań Q). Wiemy, że kinetyczna energia drgań równa się ^, ponieważ
te drgania są jednowymiarowe, a na każdy stopień swobody przypada %kT. Biorąc pod
uwagę obroty, widzimy, że cząsteczka może obracać się wokół jednej z dwu osi, zatem
występują dwa niezależne ruchy. Przyjmujemy, że atomy są pewnego rodzaju punktami,
a więc nie mogą wirować wokół osi, która je łączy. Warto o tym pamiętać, bo gdy
natkniemy się na jakieś sprzeczności, to tu może leżeć ich przyczyna. Występuje tu jeszcze jedna
rzecz, energia potencjalna drgań; ile ona wynosi? W oscylatorze harmonicznym średnia
energia potencjalna i średnia energia kinetyczna są równe, a więc energia potencjalna
drgań wynosi także \kT. Zatem całkowita energia równa się U=\kT\ub kT równa się
§£/ na atom. A to oznacza, że y=|, a nie *, czyli y= 1,286.
Możemy porównać te liczby z odpowiednimi wartościami z tab. 40.1. Sprawdzając
najpierw wartości dla helu, gazu jednoatomowego, widzimy, że y jest bardzo bliskie 3.
a błąd pochodzi prawdopodobnie z eksperymentu, chociaż w tak niskiej temperaturze
mogą występować jakieś siły między atomami. Wartości dla kryptonu i argonu, także
gazów jednoatomowych, zgadzają się również z naszymi wynikami w granicach błędu
wynikłego z doświadczenia.
40-5. CIEPŁA WŁAŚCIWE GAZÓW
229
Tabela 40.1. Wartości stosunku ciepel właściwych y dla różnych gazów
Gaz
He
Kr
Ar
H,
o,
7Y°0
180
19
15
100
100
r
1,660
1,68
1,668
1,404
1,399
Gaz
HJ
Br,
Ji
NHj
C,H6
T(°C)
100
300
185
15
15
V
1,40
1,32
1,30
1,310
1.22
Przechodząc do gazów dwuatomowych widzimy, że wodór ma zgodnie z tą tabelą
wartość 1,404, która nie zgadza się z naszym wynikiem wynoszącym 1,286. Tlen ma
wartość y= 1,399, bardzo bliską poprzedniej wartości z tej tabeli, ale znów odległą od
wartości teoretycznej. Dla jodku wodoru y ma także wartość 1,40. Już mogłoby się
wydawać, że poprawna wartość dla gazów dwuatomowych wynosi 1,40, ale tak nie jest,
szukając bowiem dalej znajdziemy dla bromu wartość 1,32 i dla jodu wartość 1,30.
Ponieważ 1,30 jest liczbą stosunkowo bliską 1,286, możemy powiedzieć, że wyniki dla jodu
raczej zgadzają się z naszymi wynikami, natomiast dla tlenu już nie. Jesteśmy w kłopocie:
dla jednych cząsteczek otrzymujemy zgodność, dla innych nie. Trzeba pewnej dozy sprytu,
aby z tego wybrnąć.
Zajmijmy się jeszcze bardziej skomplikowaną cząsteczką, zawierającą dużo składników,
np. etanem, CZH6. Ma on osiem różnych atomów, które drgają i obracają się w różnych
kombinacjach. Dlatego całkowita energia wewnętrzna etanu musi równać się dużej
wielokrotności kT, przynajmniej 12 A: T'dla samej energii kinetycznej, a y — 1 powinno być
bardzo bliskie zera, czyli y powinno się prawie dokładnie równać jedności. W
rzeczywistości jest ono mniejsze od 1,40, ale 1,22
jest niewiele mniejsze, a jest większe od
ly'j, liczby uzyskanej na podstawie samej
energii kinetycznej. I to właśnie jest
niezrozumiałe!
Nasze trudności dodatkowo
powiększa to, że dwuatomowej cząsteczki nie
można uczynić absolutnie sztywną. Nawet
jeżeli więzy nieskończenie usztywnimy, to
cząsteczka nadal będzie drgała, chociaż
bardzo słabo. Energia drgań wewnętrznych
w dalszym ciągu będzie się równać kT,
ponieważ nie zależy ona od mocy
sprzężenia. Jeśli jednak spróbujemy wyobrazić
sobie sztywność, hamującą całkowicie
drgania, a więc eliminującą jedną
zmienią, to otrzymamy dla gazów dwuatomo-
40.6. Uzyskane doświadczalnie wartości y dla
wodoru i tlenu jako funkcje temperatury. Teoria
klasyczna przewiduje niezależnie od
temperatury wartość y= 1,286
fi
1.6
1,4
1,2
i n
i
-9
—o— H2
—X-- ()2
i ,
500 1000
temperatura, "C
230
40. ZASADY MECHANIKI STATYSTYCZNEJ
wych V=\kT\ y=l,40. To by pasowało do H2 lub 02. Z drugiej strony powstaną
dalsze trudności, ponieważ y zarówno dla wodoru, jak i dla tlenu zmienia się wraz
z temperaturą! Ze zmierzonych wartości przytoczonych na rys. 40.6 widzimy, że dla H2 y
zmienia się od około 1,6 dla -185°C do 1,3 dla 2000°C. W wypadku tlenu zmiana ta
jest mniej radykalna, ale i tu y rośnie zdecydowanie ze spadkiem temperatury.
40-6. Załamanie się fizyki klasycznej
W rezultacie możemy stwierdzić, że mamy pewne trudności. Można by spróbować
posłużyć się innym modelem ilustrującym prawo przyciągania, rezygnując z modelu
sprężyny, ale okazuje się, że inny model zwiększyłby tylko wartość współczynnika y.
Jeżeli uwzględnimy więcej postaci energii, wartość współczynnika y jeszcze bardziej zbliży
się do jedności, na przekór faktom. Wszystkie pomysły zaczerpnięte z klasycznej teorii
tylko pogarszają sytuację. Faktem jest, że w każdym atomie znajdują się elektrony i wiemy
z ich widm, że występują w nim ruchy wewnętrzne; każdy z elektronów powinien mieć
przynajmniej $kT energii kinetycznej i jakąś energię potencjalną; po dodaniu obu
wielkości y stanie się jeszcze mniejsze. To jest absurdalne. To jest nieprawdziwe.
Pierwszą wielką pracę o dynamicznej teorii gazów napisał Maxwell w roku 1859. Na
podstawie koncepcji, które omawialiśmy, zdołał precyzyjnie wyjaśnić wiele znanych
zjawisk i praw, jak prawo Boyle'a, teorię dyfuzji, lepkość gazów oraz wiele innych spraw,
o których będziemy mówić w następnym rozdziale. Podsumowując wszystkie te wielkie
odkrycia, na zakończenie Maxwell stwierdził: „Ostatecznie po ustaleniu koniecznego
związku między ruchami translacyjnymi i obrotami (mówi on o twierdzeniu o \ kT)
wszystkich niesferycznych cząsteczek, udowodniliśmy, że zbiór takich cząsteczek nie mógłby
spełniać znanej zależności między dwoma ciepłami właściwymi". Maxwellowi chodzi
tu o współczynnik y (który jak zobaczymy później, wiąże się z dwoma sposobami
pomiaru ciepła właściwego) i stwierdza to, o czym już wiemy, że nie można znaleźć
poprawnego rozwiązania.
Dziesięć lat potem Maxwell powiedział w wykładzie: „Przedstawiam państwu to, co
uważam za największą z dotychczas napotykanych trudności w teorii cząsteczkowej".
Te słowa były pierwszym stwierdzeniem, że prawa fizyki klasycznej się mylą. Była to
pierwsza wskazówka, że istnieje jakiś zasadniczy błąd, ponieważ ściśle udowodnione
twierdzenie nie zgadzało się z doświadczeniem. Około roku 1890 Jeans znów musiał
wspomnieć o tej zagadce. Panuje przekonanie, iż fizycy ostatnich lat XIX wieku uważali, że
znają wszystkie istotne prawa fizyki i jedyną rzeczą, jaką robili, było szukanie kolejnych
dziesiętnych miejsc po przecinku. Ktoś pewnie kiedyś wygłosił taką opinię powtórzoną
następnie przez innych. Jednak sumienna lektura ówczesnej literatury wskazuje, że wszyscy
fizycy przeżywali jakiś niepokój. Jeans powiedział o tej zagadce, że jest tajemniczym
zjawiskiem, które wygląda jak gdyby wraz z obniżaniem temperatury pewne rodzaje ruchów
„zamarzały".
Jeżeli założylibyśmy, że ruch drgający ustaje w niskiej temperaturze a istnieje w
wyższej, to moglibyśmy przyjąć istnienie gazu zarówno w temperaturze tak niskiej, że drgania
4(1-6 ZAŁAMANIE SIĘ FIZYKI KLASYCZNEJ
231
w niej nie zachodzą — a więc y = 1,40 — jak i w wyższej, w której się pojawiają — a
zatem y maleje. To samo można powiedzieć o ruchach obrotowych. Gdybyśmy mogli
wyeliminować obroty, powiedzmy „zamrozić je" w dostatecznie niskiej temperaturze, to
moglibyśmy zrozumieć, dlaczego y dla wodoru osiąga 1,66 przy spadku temperatury.
Jak należy wyjaśnić to zjawisko? Rzecz jasna, że tego „zamrażania" ruchów nie można
wytłumaczyć opierając się na mechanice klasycznej. Stało się ono zrozumiałe dopiero
wtedy, gdy odkryto mechanikę kwantową.
Możemy przytoczyć tu bez dowodu wnioski dla mechaniki statystycznej wypływające
z teorii kwantowomechanicznej. Przypominamy sobie, że zgodnie z mechaniką kwantową
dowolny układ związany potencjałem, np. układ drgający, ma nieciągły zbiór poziomów
energii, tzn. stanów o różnej energii. Powstaje pytanie: jak należy zmodyfikować
mechanikę statystyczną, aby była zgodna z mechaniką kwantową? Okazuje się, co jest bardzo
interesujące, że chociaż większość problemów nastręcza w kwantowej mechanice większe
trudności niż w klasycznej, to problemy mechaniki statystycznej przedstawiają się w teorii
kwantowej o wiele prościej! Prosty wynik otrzymany zgodnie z zasadami mechaniki
klasycznej, /ł = H0e_energ,a"tT, staje się następującym, bardzo doniosłym twierdzeniem:
Jeżeli energię stanów cząsteczek oznaczymy, na przykład, przez £0, £,.£,,...,£,, ...,
to w stanie równowagi cieplnej prawdopodobieństwo znalezienia cząsteczki w jednym
ze stanów o energii £f będzie proporcjonalne do exp(-EJkT). Powyższe twierdzenie
określa prawdopodobieństwo znalezienia się cząsteczek w różnych stanach. Inaczej
mówiąc, względna szansa, prawdopodobieństwo znalezienia się cząsteczki w stanie £, w
stosunku do prawdopodobieństwa znalezienia się w stanie £0, wynosi
P. exp(-£./fcT)
— = -Jll— -—' , (40.10)
P0 exp(-E0/kT)
co oczywiście można napisać tak:
n,=«0exp[-(£1-E0)/kT], (40. LL)
ponieważ Pl=ni/Noraz P0 = n0/N. A więc prawdopodobieństwo znajdowania się w stanie
o wyższej energii jest mniejsze niż w stanie niskoenergetycznym. Stosunek liczby atomów
w wyższym stanie do liczby atomów w stanie niższym równa się e podniesionemu do
potęgi (różnica energii ze znakiem minus dzielona przez kT), co jest bardzo prostym
twierdzeniem.
Okazuje się następnie, że odległości między poziomami energetycznymi dla
oscylatora harmonicznego są jednakowe. Nazywając najniższą energię £o = 0 (w rzeczywistości
trochę się ona różni od zera, ale przesunięcie wszystkich energii o stałą wartość nie jest
rzeczą istotną), otrzymamy pierwszą energię £,=ftcu, drugą Ez = 2hoi, trzecią 3fto» itd.
Zobaczmy teraz, co się dzieje. Załóżmy, że zajmujemy się drganiami cząsteczki
dwutomowej, którą w przybliżeniu traktujemy jako oscylator harmoniczny. Zapytajmy,
jakie jest względne prawdopodobieństwo znalezienia się cząsteczki w stanie Et zamiast
w stanie £0. Odpowiedź brzmi, że stosunek tego prawdopodobieństwa do
prawdopodobieństwa znajdowania się w stanie £0 wynosi e"'io,"lT. Załóżmy teraz, że kT jest znacznie
Mniejsze niż hej, to znaczy, że panuje niska temperatura. Wówczas prawdopodobieństwo
232
40 ZASADY MECHANIKI STATYSTYCZNEJ
znalezienia się cząsteczki w stanie El jest bardzo małe. Praktycznie wszystkie atomy są
w stanie E0. Jeżeli zmieniamy temperaturę, ale ciągle utrzymujemy ją bardzo niską, to
szansa znalezienia się w stanie E1=ho) pozostaje nieskończenie mała — energia
oscylatora jest nadal bliska zera i nie zmienia się wraz z temperaturą tak długo, jak długo
temperatura jest mniejsza od hco/k. Wszystkie oscylatory znajdują się w najniższym stanie
i ruch ich jest skutecznie „zamrożony" — nie wnosi on żadnego wkładu do ciepła
właściwego. Następnie z tabl. 40.1 dowiadujemy się, że w temperaturze 100CC, które równają
się 373°K, kT jest znacznie mniejsze od energii drgań w cząsteczkach tlenu lub wodoru;
ale już dla cząsteczki jodu sytuacja przedstawia się inaczej. Powodem tej różnicy jest
o wiele większy ciężar atomu jodu w porównaniu z atomem wodoru i chociaż siły w obu
cząsteczkach są porównywalne, cząsteczka jodu jest tak ciężka, że ma częstość drgań
własnych bardzo małą w porównaniu z częstością własną wodoru. W temperaturze
pokojowej przy hta większym od kT dla wodoru, ale mniejszym dla jodu, tylko ten ostatni
ma klasyczną energię drgań. Gdy zwiększamy temperaturę gazu, rozpoczynając od
bardzo niskiej wartości T, w której prawie wszystkie cząsteczki znajdują się w swym
najniższym stanie, prawdopodobieństwa ich znalezienia się w drugim stanie i kolejno w
następnych zaczynają stopniowo osiągać dostrzegalne wartości. Gdy prawdopodobieństwo
jest znaczne już dla wielu stanów, gaz zaczyna zachowywać się zgodnie z prawami fizyki
klasycznej, ponieważ stany kwantowe stają się prawie nierozróżnialne w continuum
energii i układ może mieć prawie każdą energię. Dlatego też gdy temperatura rośnie,
powinniśmy znów otrzymać wyniki zgodne z fizyką klasyczną, co właśnie widać z rys.
40.6. W ten sam sposób można pokazać, że stany energetyczne ruchów obrotowych
cząsteczki też są skwantowane, ale leżą tak blisko siebie, że w zwykłych warunkach kT
jest większe niż ich odległości. Zatem wzbudzonych jest wiele poziomów a obrotowa
energia kinetyczna występuje w układzie na sposób klasyczny. Wodór jest jednym z
gazów, w którym powyższa sytuacja nie występuje w temperaturze pokojowej.
Jest to pierwszy w historii fizyki przypadek, w którym przez porównanie z
doświadczeniem stwierdzono, że rzeczywiście coś jest nie w porządku z fizyką klasyczną; podaliśmy
tu rozwiązanie tej trudności za pomocą mechaniki kwantowej prawie w ten sam sposób,
jak to zrobiono po raz pierwszy. Minęło prawie 30 lub 40 lat zanim odkryto następną
trudność, znów związaną z mechaniką statystyczną, ale tym razem z mechaniką gazu
fotonowego. Ten problem rozwiązał Planck w pierwszych latach naszego stulecia.
41
ruchy Browna
41-1. Ekwipartycja energii
Ruchy Browna zostały odkryte w r. 1827 przez botanika Roberta Browna. Prowadząc
badania mikrobiologiczne zauważył on w płynie oglądanym przez mikroskop nieregularne
ruchy drobinek i doszedł do wniosku, że nie są to ruchy żyjątek, lecz po prostu pyłki
roślinne krążące w wodzie. Robert Brown rozstrzygnął ostatecznie, że ruchy te nie mają
nic wspólnego z życiem, badając stary odłamek kwarcu zawierający wewnątrz odrobinę
uwięzionej wody. Woda ta została uwięziona przed milionami lat, ale również w niej
zaobserwował on to samo zjawisko. Polega ono na nieustannym, nieregularnym ruchu
bardzo małych cząstek.
Później udowodniono, że jest to jeden z przejawów ruchu cząsteczkowego. Możemy
to zrozumieć jakościowo, wyobrażając sobie olbrzymią piłkę na obserwowanym z
wielkiej odległości boisku, wypełnionym ludźmi, którzy odbijają tę piłkę w różnych
kierunkach. Nie możemy odróżnić poszczególnych osób, ponieważ zakładamy, że jesteśmy
zbyt daleko, ale piłkę widzimy i stwierdzamy, że porusza się ona dosyć nieregularnie.
Wiemy także, z twierdzeń omawianych w poprzednich rozdziałach, że średnia energia
kinetyczna małej cząstki zawieszonej w cieczy lub gazie równa się \kTt choćby nawet
ciężar jej był znacznie większy od ciężaru cząsteczek cieczy lub gazu. Jeśli ta cząstka
Jest bardzo ciężka, jej szybkości są stosunkowo niewielkie, ale okazuje się, że nie są one
znów tak małe. W gruncie rzeczy niełatwo nawet wyznaczyć tę szybkość, bo chociaż
średnia energia kinetyczna równa się \kT, co daje szybkość około milimetra na sekundę
dla obiektu o średnicy jednego do dwu mikronów, to bardzo trudno ją zmierzyć nawet
Przez mikroskop, gdyż cząstka nieustannie zmienia kierunek ruchu i nie przesuwa się
* określonym kierunku. O tym, w jakim stopniu zmienia położenie, będziemy mówili
na końcu niniejszego rozdziału. Problem ten rozwiązał po raz pierwszy Einstein na
Początku naszego stulecia.
234
41. RUCHY BROWNA
Nawiasem mówiąc, gdy powiadamy, że średnia energia kinetyczna wspomnianej
cząstki wynosi ~kT, jesteśmy przekonani, że zostało to wyprowadzone z teorii kinetycznej,
a więc na podstawie praw Newtona. Okaże się, że z teorii kinetycznej możemy
wyprowadzić najrozmaitsze wspaniałe wnioski. To doprawdy zadziwiające, że z tak niewielu
przesłanek potrafimy tak dużo wywnioskować. Oczywiście, nie chcemy przez to powiedzieć,
że prawa Newtona to „niewiele" — do tych celów wystarczają one w zupełności — ale
że nasz wkład jest niewielki. Jak więc możemy tak wiele otrzymywać? Otóż ciągle robimy
pewne ważne założenie, a mianowicie, że jeśli dany układ pozostaje w równowadze
cieplnej w pewnej temperaturze, to będzie on również pozostawał w równowadze ze
wszystkim, co ma tę samą temperaturę. Tak na przykład, jeśli chcielibyśmy zobaczyć, jakie
ruchy wykonałaby cząstka zderzając się z wodą, to moglibyśmy wyobrazić sobie gaz,
składający się z innego rodzaju cząsteczek, malutkich idealnych kulek, które (załóżmy)
nie oddziałują z wodą, a tylko uderzają o naszą cząstkę zderzając się z nią w sposób
„twardy". Załóżmy, że cząstka ma wystający kolec, w który mają uderzać wszystkie nasze
kulki. Wiemy wszystko o tym wyimaginowanym gazie złożonym z kulek w temperaturze
T — jest to gaz doskonary. Woda ma budowę złożoną, ale gaz doskonały — prostą. Otóż
nasza cząstka musi pozostawać w równowadze z gazem złożonym z kulek. Wobec tego
średni ruch cząstki musi być taki, jak przy zderzeniach w gazie, gdyby bowiem cząstka
nie poruszała się z odpowiednią prędkością względem cząsteczek wody, ale - powiedzmy
— szybciej, znaczyłoby to, że kulki pobierają od niej energię i stają się cieplejsze od wody.
Na początku jednak mieliśmy taką samą temperaturę i przyjmujemy, że jeśli coś jest
raz w równowadze, pozostaje w niej stale — jedne części nie mogą spontanicznie
ogrzewać się, a inne spontanicznie oziębiać.
Twierdzenie to jest prawdziwe i można je wyprowadzić z praw mechaniki, ale dowód
jest skomplikowany i wymaga znajomości mechaniki teoretycznej. Łatwiej go
przeprowadzić na podstawie mechaniki kwantowej niż mechaniki klasycznej. Pierwszy dokonał
tego Boltzmann, ale my na razie uznamy to twierdzenie po prostu za prawdziwe i powiemy,
że nasza cząstka musi mieć energię \kT, jeśli zderza się z hipotetycznymi kulkami, a
zatem musi mieć także energię \kT, gdy zderza się z cząsteczkami wody o tej samej
temperaturze po usunięciu kulek. Pozostajemy więc przy wielkości \kT. Dowodzenie nasze
przebiega może dziwnie, ale jest bez zarzutu.
Oprócz ruchów cząstek koloidalnych, których dotyczyło odkrycie Browna, znamy
wiele innych zjawisk, obserwowanych zarówno w laboratorium, jak i poza nim, w których
występują ruchy Browna. Jeśli spróbujemy zbudować bardzo czułe urządzenie, na przykład
maleńkie zwierciadełko zawieszone na cienkiej nici kwarcowej przeznaczone do galwano-
metru balistycznego o dużej czułości (rys. 41.1), to zwierciadełko nie pozostanie nieruchome,
lecz nieustannie będzie drgało tak, że gdy je oświetlimy i zaobserwujemy położenia
odbitej plamki, przekonamy się, że nie mamy idealnego przyrządu, ponieważ
zwierciadełko stale drży. Dlaczego? Dlatego, że średnia energia kinetyczna obrotów tego zwiercia-
dełka musi wynosić \kT.
Czemu równa się średnia kwadratu kąta wychylenia zwierciadełka? Przypuśćmy, zC
wyznaczyliśmy okres drgań własnych zwierciadełka popchnąwszy je z jednej strony i zmie"
rzywszy czas, jaki zużywa ono na wykonanie pełnego drgania, oraz że wiemy, jaki jes
41-1. EKWIPARTYCJA ENERGII
235
//W?///'.
»*
■^rxly^r^l .,
>'wy////.
41.1. a. Czuły galwanometr z promieniem świetlnym jako wskazówką. Światło ze źródła L po odbiciu
od małego zwierciadełka pada na skalę. b. Schemat zapisu na skali galwanometru jako funkcja czasu
moment bezwładności, /. Znamy wzór (19.8)*' na energię kinetyczną ruchu obrotowego
T=±Ia>2. To jest energia kinetyczna; odpowiadająca jej energia potencjalna będzie
proporcjonalna do kwadratu kąta V=\aSL. Ale jeśli znamy okres t0 i obliczymy częstość
własną co = 2n/t0, to energia potencjalna równa się V=^Io)l62. Ponieważ wiemy, że
średnia energia kinetyczna wynosi \kT, i ponieważ jest to oscylator harmoniczny, zatem
średnia energia potencjalna również wynosi \kT. Dlatego
czyli
tIv2o<02>=łkT,
<02> = fcT//^.
(41.1)
W ten sposób możemy obliczyć drgania zwierciadełka galwanometru i znaleźć
ograniczenia w stosowaniu naszego przyrządu. Aby mieć mniejsze drgania, musimy oziębiać zwier-
ciadełko. Powstaje pytanie: w którym miejscu je oziębiać? To zależy od tego, skąd
pochodzą „szturchnięcia". Jeśli pochodzą od nitki, to właśnie ją oziębiamy od góry; jeśli
zwierciadelko jest otoczone gazem i doznaje wstrząsów przede wszystkim na skutek
zderzeń, to najlepiej oziębić gaz. Okazuje się, że jeśli wiemy, co tłumi drgania, to jak
się przekonamy, to samo jest zarazem źródłem fluktuacji. Ale do tej sprawy jeszcze
powrócimy.
Dziwna rzecz, że to samo dotyczy obwodów elektrycznych. Przypuśćmy, że
konstruujemy bardzo czuły, dokładny wzmacniacz dla określonej częstości i na wejściu mamy
obwód rezonansowy tak dobrany, aby wzmacniacz był bardzo czuły na tę wybraną
częstość — coś w rodzaju odbiornika radiowego, ale naprawdę bardzo dobrego (rys. 41.2).
Załóżmy, że chcemy osiągnąć granice czułości, wprowadzamy więc na wzmacniacz
napięcie, np. indukcyjne, i przesyłamy je do dalszego wzmacniania. Oczywiście, w każdym
*' Z tomu I, cz. 1. (Przyp. red. wyd. polskiego.)
236
41. RUCHY BROWNA
I
G O
obwodzie tego rodzaju występują pewne straty. Nie
jest to idealny obwód rezonansowy, tylko bardzo
dobry, w którym opór jest bardzo mały
(wmontowaliśmy opornik, więc go widzimy, ale założyliśmy, że
» ia jego opór jest bardzo mały). Zapytajmy: jakie są
fluktuacje napięcia na indukcyjnośći? Odpowiedź:
..„,— ,. ... Wiemy, że \LI2 jest „energią kinetyczną" — ener-
41.2. Obwód rezonansowy o duzcj '* i j » e> i j t
wartości 0. a. Właściwy obwód &$ związaną z cewką indukcyjną w obwodzie rezo-
w temperaturze T. b. Zastępczy nansowym (t. I, cz. 1, rozdz. 25). Dlatego średnia
obwód z idealnym („bezszumo- wartość \LI2 = \kT - co określa nam wartość skute-
wym") oporem i „generatorem czną natęZenia prądu, a zarazem wartość skuteczną
szumów" G . . T . ,. ,, . j ,
napięcia. Jeżeli przyjmiemy dla napięcia na
indukcyjnośći wzór VL=itoLI oraz dla średniej kwadratu
bezwzględnej wartości napięcia na indukcyjnośći wzór <Kf>=L2w2</2>, to
podstawiając \L(I2')=\kT, otrzymamy
(V£>=L<o20kT. (41.2)
Teraz możemy już projektować obwody i przewidywać występujące w nich szumy
związane z fluktuacjami termicznymi, tzw. szumy Johnsona1.
Skąd tym razem pochodzą fluktuacje? Ich źródłem jest znów opornik — elektrony
znajdujące się w oporniku poruszają się we wszystkich kierunkach, ponieważ pozostają
w równowadze cieplnej z resztą opornika, a to właśnie wywołuje fluktuacje ich
gęstości. W ten sposób elektrony wytwarzają słabe pola elektryczne w obwodzie
rezonansowym.
Inżynierowie-elektrycy podają inne wytłumaczenie pochodzenia fluktuacji. Z
fizycznego punktu widzenia opornik jest rzeczywiście źródłem szumów. Możemy jednak
zastąpić rzeczywisty obwód mający solidny, prawdziwy opornik fizyczny, który wytwarza
zakłócenia, przez obwód zastępczy zawierający mały generator odpowiedzialny za szumy
i idealny opornik, który szumów nie wytwarza. Wszystkie zakłócenia pochodzą z tego
zastępczego generatora. A zatem jeżeli znalibyśmy charakterystyki szumów wytwarzanych
przez opornik wyrażone jakimś wzorem, moglibyśmy przewidzieć, jak zachowa się obwód
reagując na szumy. Dlatego musimy znać wzór określający szumy fluktuacyjne. Szumy
wytwarzane w oporniku występują we wszystkich częstościach, ponieważ sam opornik
nie jest układem rezonansowym. Oczywiście, obwód rezonansowy „słyszy" tylko tę ich
część, której częstość jest bliska częstości rezonansowej, podczas gdy opornik wytwarza wiele
różnych częstości. Moc generatora szumów możemy określić w następujący sposób: Średnia
moc, którą mógłby absorbować opornik podłączony bezpośrednio do generatora szumów,
wynosi <ZT2)//?, jeżeli ZTjest napięciem wytwarzanym przez generator. Chcielibyśmy jednak
dowiedzieć się bardziej szczegółowo, jaka moc odpowiada różnym częstościom. Trudno
tu mówić o mocy przypadającej na określoną częstość; istnieje jakiś jej rozkład. Niech
P(co) dco oznacza moc dostarczaną przez generator w przedziale częstości o szerokości
da> temu opornikowi. Wówczas możemy udowodnić (zrobimy to dla innego przypadku-
-"- * * -~.ł«~«„an;«» i#»«t taWip wmol że otrzymamy moc równą
41-1. EKW1PARTYCJA ENERGII
237
P((o)dco = l— jkTda), (41.3)
która jest niezależna od potraktowanego w taki sposób oporu.
41-2. Termodynamiczna równowaga promieniowania
Przechodzimy obecnie do omówienia jeszcze trudniejszego i bardziej interesującego
twierdzenia. Przypuśćmy, że mamy naładowany oscylator, taki, o jakim wspominaliśmy
omawiając światło, na przykład elektron drgający w atomie do góry i na dół. Oscylując
wysyła on światło. Załóżmy, że oscylator ten znajduje się w bardzo rozrzedzonym gazie,
którego atomy od czasu do czasu się z nim zderzają. Wówczas, pozostając w równowadze,
po dostatecznym upływie czasu oscylator będzie pobierał tyle energii, że energia kinetyczna
jego drgań wyniesie \kT, a ponieważ jest to oscylator harmoniczny, więc całkowita energia
jego ruchu będzie równa kT. Jak dotychczas, ten opis nie odpowiada rzeczywistości,
ponieważ oscylator jest naładowany i mając energię kT, drga do góry i na dół wypromie-
niowując światło. Dlatego nie można osiągnąć równowagi dla samej rzeczywistej substancji
nie uwzględniając ładunków, które emitują światło. Skoro jednak światło jest emitowane,
to energii ubywa, oscylator traci swoją energię kT z biegiem czasu i wskutek tego gaz,
którego cząsteczki zderzają się z oscylatorem, stopniowo traci ciepło. Takie właśnie
zjawisko zachodzi, gdy gorący piec stygnie w zimną noc wypromieniowując energię, ponieważ
atomy z drgającymi ładunkami nieustannie promieniują i dzięki temu ich drgania powoli
słabną.
Z drugiej strony, gdy całość zamkniemy w zbiorniku, tak aby światło nie uciekało
do nieskończoności, osiągniemy w końcu stan równowagi cieplnej. Możemy albo
zamknąć gaz w zbiorniku, w którego ścianach znajdują się inne źródła promieniowania
wysyłające światło do wnętrza, albo — co wygodniejsze — przyjąć, że zbiornik ten ma ścianki
lustrzane. Łatwiej sobie wyobrazić tę drugą ewentualność. W każdym razie przyjmujemy,
że całe promieniowanie wysyłane przez oscylator pozostaje w zbiorniku. Oscylator zaczyna
oczywiście promieniować, ale natychmiast odzyskuje swoją energię kinetyczną kT, mimo
wypromieniowania jej, ponieważ jest stale, można to tak powiedzieć, oświetlony swym
własnym światłem odbitym od ścian zbiornika. Zatem po chwili cały zbiornik jest
wypełniony światłem. I chociaż oscylator trochę promieniuje, to światło wraca do niego
przynosząc część wypromieniowanej energii.
Obliczymy teraz, ile światła musi znajdować się w zbiorniku o temperaturze T, aby
oświetlenie oscylatora dawało mu tyle samo energii, ile wypromieniowuje jej w postaci
światła.
Weźmy gaz rozrzedzony, tak aby mieć oscylator doskonały, napotykający tylko opór
Promieniowania. Wtedy uwzględniamy, że o pozostającym w równowadze cieplnej
oscylatorze można powiedzieć dwie rzeczy. Po pierwsze — ma on średnią energię kT
1 możemy obliczyć, ile promieniowania wysyła. Po drugie — wysyłanego promieniowania
Powinno być tyle, ile powstaje go w wyniku rozproszenia światła padającego na oscyla-
238
41 RUCHY BROW,N-\
tor. Ponieważ energia nie ma innego ujścia, więc efektywne promieniowanie oscylatora
jest po prostu światłem rozproszonym, pochodzącym z promieniowania, które jest w
zbiorniku.
Wobec tego najpierw obliczymy, jaką energię wypromieniowuje w ciągu sekundy
oscylator mający pewną jej ilość. (Z rozdziału 32, mówiącego o oporze promieniowania,
zaczerpniemy kilka równań, nie powtarzając ich wyprowadzenia.) Energia wypromienio-
wana, przypadająca na radian i dzielona przez energię oscylatora, została tam oznaczona
przez ]/Q [równanie (32.8)]: \,Q = (dW/dt)oj0lV Posługując się wielkością y, stałą
tłumienia, można także to równanie zapisać następująco: \\Q = y\co{i, gdzie co0 jest częstością
własną oscylatora. Jeżeli y jest bardzo małe, to Q jest bardzo duże, a energia wypromie-
niowana w ciągu sekundy równa się
dW co0W co0Wy
-— = -—= =yW. (41.4)
dl Q co0
Energia wypromieniowana w ciągu sekundy równa się po prostu iloczynowi y i energii
oscylatora. Oscylator z kolei powinien mieć średnią energię równą kT, zatem widzimy,
że y razy AT jest średnią energią wypromieniowana w ciągu sekundy:
'dWjdf) = ykT (41.5)
Musimy teraz tylko dowiedzieć się, czemu równa się y. Łatwo ją znaleźć z równania
(32.12):
«o 2 r0Wo
>>=—=- , (41.6)
Q 3 c
gdzie r0 = e2/mc2 jest klasycznym promieniem elektronu, a l = 2nc/co0.
W wyniku otrzymamy dla średniej ilości promieniowania o częstości bliskiej co0
następujące równanie:
dW 2 r0coZkT
— = —— (41.7)
dl 3 c
Pytamy z kolei: ile światła musi padać na oscylator? Musi padać go dokładnie tyle
samo, ile oscylator pochłania (a następnie rozprasza). Inaczej mówiąc, wyemitowane
światło traktujemy jako rozproszone promieniowanie pochodzące ze światła padającego
na oscylator znajdujący się w zbiorniku. Musimy więc następnie obliczyć, ile światła
rozprasza oscylator, jeżeli pada nań pewna — nieznana — ilość promieniowania. Niech
/(tu) dco oznacza energię niesioną przez światło o częstości co zawartej w przedziale dco
(ponieważ nie ma światła o częstości dokładnie równej co, ale rozkłada się ono na całe
widmo). Tak więc l(co) jest pewnym rozkładem widmowym, który chcemy znaleźć; jest
to kolor paleniska o temperaturze T, który widzimy, gdy otworzymy drzwiczki pieca
i spojrzymy do środka. Zastanówmy się teraz, jaka ilość światła zostaje absorbowana.
Obliczyliśmy już ilość pochłoniętego promieniowania pochodzącego z danego padającego
strumienia światła wprowadzając pojęcie przekroju czynnego. Mieliśmy wtedy taką sytuację,
jakby zostało pochłonięte całe światło padające na pewne pole przekroju poprzecznego,
nazwanego przez nas przekrojem czynnym. A zatem całkowita ilość światła, które jest
41-2. TERMODYNAMICZNA RÓWNOWAGA PROMIENIOWANIA
239
teraz reemitowane (rozproszone) równa się natężeniu padającego światła /(to) dw
pomnożonemu przez przekrój czynny a.
Wyprowadzony przez nas wzór na przekrój czynny [równanie (32.19)] nie uwzględnia
tłumienia. Nietrudno jeszcze raz otrzymać ten wzór uwzględniając wyraz opisujący opór,
który przedtem opuściliśmy. Jeżeli to zrobimy i obliczymy tak samo przekrój czynny,
otrzymamy
8nr2 ( w4 \
3 \(cj -<o0) + y w J
Widzimy, że a, jako funkcja częstości różni się w sposób istotny od zera tylko dla
wartości w bardzo bliskich częstości drgań własnych w0. (Pamiętajmy, że Q dla promieniującego
oscylatora jest rzędu 108.) Oscylator rozprasza bardzo silnie, gdy w równa się co0, a bardzo
słabo dla innych wartości co. Wobec tego możemy zastąpić wielkość w wielkością w0
oraz wyrażenie (y2-wj wyrażeniem 2w0(co-co0) i otrzymamy
-,2 2
2nr0w0
°,= -r , , .,■ (41.9)
3[(co-co0)2 + y2/4]
Powyższej zależności o, od w odpowiada krzywa, która ma silne maksimum dla co = oj0
i różni się w sposób istotny od zera jedynie dla argumentów co w otoczeniu to0.
(Właściwie nie musieliśmy się tu posłużyć dopiero co opisanym przybliżeniem, ale ułatwi to
znacznie obliczenie całki, która za chwilę się pojawi, gdy uda się nam uprościć jej
wyrażenie podcałkowe.) Pomnóżmy teraz natężenie w danym przedziale częstości przez przekrój
czynny rozproszenia, by otrzymać energię rozpraszaną w przedziale dw. Całkowita energia
rozproszona będzie się wtedy równała całce po wszystkich w z tej wielkości. Zatem
cc oo
dWs f f 2nrlwll(co)dw
= I(w)<js(w)dto = r 7 i -■• (4,l0)
dt J J 3[(co-fl>0)2+y2/4]
o o
Podstawiamy teraz dWJdt=3ykT. Skąd tu trójka? Zajmując się przekrojem czynnym
w rozdz. 32 przyjmowaliśmy odpowiednią polaryzację, aby światło mogło oddziaływać
na oscylator. Jeżeli użyjemy oscylatora, który będzie mógł drgać tylko w jednym kierunku
i światło będzie spolaryzowane nieodpowiednio, nie otrzymamy rozproszenia. Dlatego
musimy uśrednić przekrój czynny dla takiego oscylatora na wszystkie kierunki
rozchodzenia się i polaryzacji światła, albo - co jest łatwiejsze — wyobrazić sobie oscylator, który
oddziaływałby z polem niezależnie od jego kierunku. Oscylator, który mógłby drgać
równie dobrze w każdym z trzech kierunków, miałby energię 3kT, ponieważ miałby trzy
stopnie swobody. Dlatego właśnie powinniśmy przyjąć 3ykT.
Teraz musimy obliczyć całkę. Załóżmy, że nieznany rozkład widmowy światła /(w)
jest gładką krzywą wolnozmienną w wąskim przedziale częstości, w którym a, ma ostre
maksimum (rys. 41.3). Wówczas istotne znaczenie mają takie to, które od to0 różnią się
tylko o bardzo małą wielkość y. Wobec tego chociaż I(to) może być nieznaną,
skomplikowaną funkcją, istotny wpływ na całkę mają tylko jej wartości dla argumentów to bliskich
<o = oj0. Możemy więc zastąpić ją przez prostą przebiegającą na stałej wysokości — przez
240
41. RUCHY BROWNA
Wo-7 Mo+7
41.3. Czynniki występujące pod całką
(41.10). Pik przedstawia krzywą rezonansową
l/[(«u—co0)2 + y2l4]. Z bardzo dobrym
przybliżeniem czynnik I (co) można zastąpić
czynnikiem /(a>o)
41.4. Rozkłady natężenia promieniowania
ciała doskonale czarnego dla dwóch różnych
temperatur otrzymane z fizyki klasycznej
(krzywe ciągłe). Krzywe przerywane
przedstawiają właściwe rozkłady.
/ — obszar fal radiowych, 2 — obszar
promieniowania podczerwonego, 3 — obszar
promieniowania widzialnego, 4 — obszar
promieniowania nadfioletowego, 5 — obszar
promieniowania rentgenowskiego
„stałą". Inaczej mówiąc, wynosimy funkcję
I(io) przed znak całki i oznaczamy ją I(co0).
Po wyniesieniu pozostałych stałych przed
całkę otrzymamy
$nrla)20I(co0)
or.
I
dco
(co-a)oy+yAl4
= 3ykT.
(41.11)
Całkę należy wziąć w granicach od 0 do oo,
ale punkt 0 jest tak odległy od to0, że krzywa
jest w jego otoczeniu (i dla ujemnych wartości
argumentu co) bardzo bliska osi odciętych.
Możemy więc dolną granicę w całce zastąpić
przez minus oo, co nie zmienia sytuacji,
a ułatwia wykonanie całkowania. Całka jest
typu arcus tangens, tzn. J dx/(x2+a2). Po
sprawdzeniu w tablicach całek przekonamy
się, że równa się ona n/a, co w naszym
przypadku odpowiada 2n/y. Dlatego po pewnych
przekształceniach otrzymamy
9y2kT
/Oo) =
4ji
2rWQ
(41.12)
Następnie podstawiamy tu wzór (41.6) na y
(nie musimy tu pisać co0, ponieważ wzór jest
prawdziwy dla dowolnego to0 i możemy je po
prostu oznaczać jako w) i otrzymujemy
następujący wzór na I (co):
I(co)=-
co kT
(41.13)
Określa on rozkład promieniowania gorącego
paleniska. Nazywa się je promieniowaniem
ciała doskonałe czarnego, czarnego, ponieważ
otwór w drzwiczkach, przez który patrzymy,
jest czarny, gdy temperatura wynosi zero.
Wzór (41.13) określa rozkład energii
promieniowania w zamkniętym zbiorniku w
temperaturze T, zgodnie z teorią klasyczną. Najpierw zwróćmy uwagę na doniosłą cechę tego
wyrażenia. Ładunek oscylatora, jego masa i pozostałe własności uprościły się, ponieważ
skoro raz osiągnęliśmy równowagę przy określonym oscylatorze, to musimy mieć
równowagę przy każdym innym oscylatorze o innej masie, bo w przeciwnym wypadku
mielibyśmy trudności. Jest to więc ważny sprawdzian twierdzenia, że równowaga nie zależy
41-2. TERMODYNAMICZNA RÓWNOWAGA PROMIENIOWANIA
241
od tego, z czym zachodzi, a tylko od temperatury. Wykreślmy teraz krzywą I(c>) (rys. 41.4).
Określi nam ona, ile jest światła przy różnych częstościach.
Widzimy, że natężenie promieniowania w naszym zbiorniku, przypadające na
jednostkowy przedział częstości, zmienia się jak kwadrat częstości, a to oznacza, że jeśli weźmiemy
zbiornik o dowolnej temperaturze i zapytamy się, jaką część promieniowania stanowi
promieniowanie rentgenowskie, to otrzymamy odpowiedź, że bardzo dużą!
Oczywiście, wiemy, że to nieprawda. Gdy otworzymy piec i spojrzymy do środka,
to nasze oczy nie zostaną w ogóle porażone promieniami Róntgena. To jest zupełnie
niemożliwe. Co więcej, całkowita energia w zbiorniku, całkowite natężenie sumowane po
wszystkich częstościach równałoby się powierzchni zawartej pod tą nieskończoną krzywą.
Widzimy więc, że coś tu jest z gruntu zasadniczo i całkowicie fałszywe.
Zatem teoria klasyczna zupełnie nie była w stanie należycie opisać rozkładu
promieniowania ciała doskonale czarnego, podobnie jak nie mogła należycie opisać ciepła
właściwego gazów. Fizycy zajmowali się tym wyprowadzeniem z różnych punktów widzenia,
ale bez rezultatu. Jest ono wnioskiem wypływającym z fizyki klasycznej. Równanie (41.13),
nazywane prawem Rayłeigha, jest wnioskiem wypływającym z fizyki klasycznej, bez
wątpienia absurdalnym.
41-3. Ekwipartycja i oscylator kwantowy
Omówiona powyżej trudność — to jeszcze jedna strona problemu ciągłości w fizyce
klasycznej, która rozpoczęła się z trudnościami dotyczącymi ciepła właściwego gazów,
a obecnie skupiła się na promieniowaniu ciała doskonale czarnego. Kiedy teoretycy
zajmowali się tą sprawą, dokonywano także wielu pomiarów prawdziwej.krzywej. Okazało
się, że poprawna krzywa wygląda tak, jak krzywa przerywana z rys. 41.4. A więc to znaczy,
że promieniowania rentgenowskiego w ogóle tam nie ma. Jeżeli obniżymy temperaturę,
cała krzywa obniża się proporcjonalnie do T zgodnie z teorią klasyczną, ale oprócz tego
krzywa doświadczalna szybciej znika dla niższej temperatury. Widzimy więc, że nisko-
częstościowy kraniec krzywej teoretycznej odpowiada doświadczeniu, a wysokoczęstoś-
ciowy — nie. Dlaczego? Gdy James Jeans badał ciepło właściwe gazów, zauważył, że
ruchy wewnątrzcząsteczkowe o wysokich częstościach są „zamrożone", gdy temperatura
zbytnio się obniży, to znaczy, że jeśli temperatura jest zbyt niska, a częstości drgań zbyt
duże, oscylatory nie mają średniej energii równej kT Przypomnijmy, jak przebiegało
nasze wyprowadzenie wzoru (41.13). Opiera się ono w całości na energii jednego oscylatora
pozostającego w równowadze cieplnej. Wyrażenie kT, które występowało we wzorze
(41.5), i to, które było we wzorze (41.13), jest tą samą średnią energią oscylatora o częstości
w w temperaturze T. Z punktu widzenia fizyki klasycznej energia ta jest równa kT, ale
z doświadczenia wiemy, że tak nie jest! Nie jest tak, gdy temperatura jest zbyt niska lub
częstość oscylatora zbyt wysoka. Zatem powód, dla którego krzywe są nieprawdziwe,
Jest taki sam jak w przypadku załamania się teorii ciepła właściwego gazów. Łatwiej
badać krzywe promieniowania ciała doskonale czarnego niż ciepła właściwe gazów, z
którymi jest więcej kłopotów. A więc skupimy uwagę na poprawnym określeniu takiej krzywej.
242
41. RUCHY BROWNA
W„ , , ponieważ określi ona ściśle średnią energię oscyla-
—2S—EĄ=4t>*> P4-Ae*p(-4t>w/kT) \ . ■ i r i - 1 P\ a.
torą harmonicznego jako funkcję temperatury dla
Ł_E3=3r)w P3=Aextf-3t>u/kT) każdej częstości.
———E2=2fi<x> P2=Aexp(-2t)cjkT) Krzywą tą zajmował się Planck. Najpierw po-
N* E - f)ui P\=Aem(-t)w/kT) ^a' rozwiązanie eksperymentalne, dopasowując ob-
/V0 serwowane krzywe do funkcji, która najlepiej zga-
0 dzała się z doświadczeniem. Otrzymał w ten sposób
„ . . eksperymentalny wzór na średnią energię oscylato-
41.5. Poziomy energetyczne oscyla- J
torą harmonicznego znajdują się w « harmonicznego jako funkcję częstości drgań.
równych odległościach E„=nKto Inaczej mówiąc, otrzymał właściwe wyrażenie
zamiast k T, a następnie drogą różnych kombinacji
znalazł jego proste wyprowadzenie, które wymagało
bardzo osobliwego założenia. Planck zakładał mianowicie, że oscylator harmoniczny
może na raz pochłonąć tylko energię równą hu>. Wyobrażanie sobie, że może on mieć dowolną
energię, okazało się fałszywe. Oczywiście, był to początek końca mechaniki klasycznej.
Wyprowadzimy teraz pierwszy poprawnie określony wzór mechaniki kwantowej.
Załóżmy, że dozwolone poziomy energetyczne oscylatora harmonicznego są od siebie
jednakowo oddalone o hiu0, tak że oscylator może mieć tylko jedną z tych energii (rys.
41.5). Argumentacja Plancka była bardziej skomplikowana, ponieważ działo się to u
zarania mechaniki kwantowej, i musiał wiele rzeczy udowadniać. Ale my przyjmiemy za fakt
(co Planck udowodnił w tym przypadku), że prawdopodobieństwo zajęcia poziomu o energii
E równa się P(E) = otc~ElkT Przy takim założeniu otrzymamy wynik prawidłowy.
Przypuśćmy teraz, że mamy dużo oscylatorów, z których każdy drga z częstością c>0.
Niektóre z nich są w najniższym stanie kwantowym, inne w następnym co do wielkości
i tak dalej. Chcemy znać średnią energię tych oscylatorów. W tym celu obliczymy ich
całkowitą energię i podzielimy ją przez liczbę oscylatorów. Otrzymamy wówczas średnią
energię oscylatora pozostającego w równowadze cieplnej z promieniowaniem ciała
doskonale czarnego, która zastąpi wyraz kT w równaniu (41.13). Niech A0 oznacza liczbę
oscylatorów w stanie podstawowym (w stanie o najniższej energii), A', — liczbę
oscylatorów w stanie E,, A', — liczbę oscylatorów w stanie E2 itd. Zgodnie z hipotezą (której
nie dowodziliśmy), iż w mechanice kwantowej prawo, które zastępuje
prawdopodobieństwo exp( ~EpjkT) lub exp( — Ek>kT) z mechaniki klasycznej, mówi, że
prawdopodobieństwo maleje jak e~ M kT (gdzie AE oznacza przyrost energii), musimy przyjąć liczbę A,
oscylatorów w pierwszym stanie jako równą A0 razy e~y'lokT. Podobnie A2 — liczba
oscylatorów w drugim stanie — równa się N2 = N0e'2'"'kT. Dla uproszczenia obliczeń oznaczamy
e-vir = x wtedy mamy po prostu A, = A0.v, !\2 = N0x2, ,A'„=A0xn.
Obliczymy najpierw całkowitą energię wszystkich oscylatorów. Oscylator znajdujący
się w stanie podstawowym nie ma wcale energii. Jeżeli znajduje się w pierwszym stanie
energetycznym, ma energię hto0. Takich oscylatorów jest A,. Mają one więc razem energię
A,fau lub hu>iyox. W drugim stanie energetycznym energia równa się 2ha>, a więc
A\ oscylatorów ma energię ■N2-2hoj = 2hoN0x2 Dodając wszystkie energie otrzymamy
ECii = Noh<u(0 + x + 2x2 + 3x3 + . .).
Następnie zastanówmy się, ile je>t wszystkich oscylatorów razem. Oczywiście, jest
41-3. EKWrPARTYCJA 1 OSCYLATOR KWANTOWY
243
ich N0 w stanie podstawowym, A', - w pierwszym itd.; po dodaniu otrzymamy: WCB| =
= A'0(l+x + x2 ...)■ Dlatego średnia energia równa się
<£>^::*°*"(0+x+2*/h3*,+-). (4i.i4)
N«i /V0(l+x + x2 + ...)
Niechaj Czytelnik zabawi się obliczeniem powyższych sum. Gdy obliczymy sumy i
podstawimy do nich wartość x, wówczas jeżeli nie zrobiliśmy błędu, powinniśmy otrzymać
/£> = _ (41.15)
s ' eV/*T_ ^ • V
Był to pierwszy z dotychczas znanych i badanych wzorów mechaniki kwantowej. Stanowił
on wspaniałe zakończenie okresu zagadek. Maxwell wiedział, że coś jest nie w porządku,
ale pozostawał problem: co jest dobrel Otrzymaliśmy jakościową odpowiedź na pytanie:
jakie wyrażenie naprawdę powinno zająć miejsce k77 Powinno ono oczywiście przechodzić
w kT, gdy co-*0 lub gdy 7"->oo. Sprawdźmy, czy potrafimy to udowodnić - zastanówmy
się, jak to zrobić.
Tak właśnie wygląda słynny czynnik „obcinający" duże częstości, którego szukał
Jeans, i jeżeli skorzystamy z niego zamiast z czynnika kTwc wzorze (41.13), to otrzymamy
na rozkład światła w czarnym zbiorniku wzór
ho)3d<o
^cV^-1)
Ponieważ w mianowniku mamy e podniesione do bardzo dużej potęgi, więc dla dużych a>,
mimo występowania w3 w liczniku, krzywa obniża się i nie „wybucha" — nie znajdujemy
ani promieniowania ultrafioletowego, ani promieniowania rentgenowskiego, tam gdzie
się ich nie spodziewamy!
Ktoś mógłby ubolewać, że w naszym dowodzie użyliśmy teorii kwantowej do
wyprowadzenia poziomów energetycznych oscylatora, a klasycznej - do otrzymania przekroju
czynnego as. Jednak kwantowa teoria oddziaływania światła z oscylatorem harmonicznym
daje dokładnie taki sam wynik jak teoria klasyczna. Jesteśmy ponadto usprawiedliwieni,
że tak długo zajmowaliśmy się współczynnikiem załamania światła i rozproszeniem światła,
traktując atomy jak małe oscylatory. Postępowaliśmy tak, ponieważ wzory kwantowe są
w istocie takie same.
Wróćmy teraz do szumów Johnsona w oporniku. Wspominaliśmy już, że teoria mocy
tych szumów jest w istocie taka sama jak teoria rozkładu promieniowania ciała doskonale
czarnego Mówiliśmy nawet, że jeżeli opór obwodu stanowi tylko antena (antena działa
jak opór, ponieważ promieniuje energię) stawiająca opór promieniowaniu i brak jest
zwykłego oporu, to łatwo możemy wyliczyć moc. Byłaby to właśnie moc, którą
przekaże antenie otaczające światło i powinniśmy otrzymać taki sam rozkład, co najwyżej
różniący się jednym lub dwoma czynnikami. Możemy przyjąć, że opornik jest
generatorem o nieznanym widmie mocy P(a>). Widmo to ustalamy na podstawie faktu, że ten sam
generator dołączony do obwodu rezonansowego dla dowolnej częstości, iak na rvs. 41.2b.
244
41. RUCHY BROWNA
wytwarza na indukcyjności napięcie określone równaniem (41.2). W ten sposób
dochodzimy do tej samej całki jak we wzorze (41.10) i przy pomocy tej samej metody otrzymamy
równanie (41.3). Dla niskich temperatur trzeba oczywiście zastąpić czynnik kT we wzorze
(41.3) wyrażeniem (41.15). Te dwie teorie (promieniowania ciała doskonale czarnego
i szumów Johnsona) są także ściśle związane fizycznie, gdyż możemy oczywiście włączyć
do obwodu rezonansowego antenę i opór R będzie wtedy czystym oporem promieniowania.
Ponieważ zależność (41.2) nie uwzględnia fizycznych własności źródła oporu, generator G
będzie więc taki sam i dla rzeczywistego oporu i dla oporu promieniowania. A co
wytworzy moc P(co), jeżeli oporem R będzie idealna antena pozostająca w równowadze z
otoczeniem w temperaturze T! Generatorem tym będzie promieniowanie I(io) otaczające antenę
w temperaturze T, które oddziałuje na nią jako „odebrane sygnały". Dlatego możemy od
razu otrzymać zależność między funkcjami P(to) i I(to), przechodząc następnie od wyrażenia
(41.13) do (41.3).
Wszystko o czym mówiliśmy, a więc i teoria szumów Johnsona i rozkład Plancka,
a także poprawna teoria ruchów Browna, do której przejdziemy za chwilę — to osiągnięcia
pierwszego dziesięciolecia XX w. Obecnie, pamiętając o tych osiągnięciach i o całej
historii problemu, wróćmy do ruchów Browna.
41-4. Błądzenie przypadkowe
Zastanówmy się, jak zmieni się położenie drgającej cząstki po upływie czasu o wiele
dłuższego od czasu między kolejnymi „uderzeniami". Zajmijmy się małą cząstką
podlegającą ruchom Browna, która skacze na wszystkie strony, bombardowana zewsząd
nieregularnie drgającymi cząsteczkami wody. Pytanie: Jak daleko od położenia wyjściowego
znajdzie się cząstka po upływie określonego czasu? Problem ten rozwiązali Einstein i Smo-
luchowski. Jeżeli wyobrazimy sobie, że podzieliliśmy ten czas na małe odstępy, na
przykład długości Y^p s, wtedy w pierwszym odstępie cząstka przesuwa się w pewnym
kierunku, w następnym trochę dalej, w następnym jeszcze dalej w innym kierunku itd.
W porównaniu z czasem upływającym między kolejnymi uderzeniami r^ s trwa bardzo
długo. Czytelnik może łatwo sprawdzić, że liczba uderzeń doznanych przez cząsteczkę
wody w ciągu 1 s wynosi 1014, zatem w
ciągu y^0 s wynosi I012 uderzeń, a więc bardzo
dużo! Dlatego po upływie -' s cząstka już
41.6. Błądzenie przypadkowe składające się . . . ,. i„„^7»i
,, . . . r. . - , , . . . . nie pamięta, co zdarzyło się przedtem. Inaczej
z 36 kroków o długości L. Jak daleko znaj- r x ' r
duje się punkt S3t od JV Odpowiedź: średnio mówiąc, wszystkie zderzenia są przypadkowe,
o około 6L tak że następny „krok" nie jest związany
z poprzednim. Jest to zagadnienie
analogiczne do słynnego problemu pijanego marynarza-
Marynarz wychodzi z baru i robi kilka
kroków, ale każdy krok jest skierowany pod
innym kątem, na chybił trafił (rys. 416). Pyta"
my: gdzie znajdzie się marynarz po uptyvvie
41-4 BŁĄDZENIE PRZYPADKOWE
245
dłuższego czasu? Oczywiście, nie wiadomo! Nie można na to odpowiedzieć. Co najwyżej
wiemy tylko mniej więcej, że znalazł się w jakimś miejscu przypadkowo. No, to w takim
razie zapytajmy: gdzie się znajduje średnio biorąc? Jak daleko, średnio biorąc, oddalił się
od baru? Już odpowiedzieliśmy na to pytanie, gdy zajmowaliśmy się interferencją światła
z wielu różnych źródeł o różnych fazach. Rozwiązanie polegało na dodawaniu wielu
wektorów skierowanych pod różnymi kątami (rozdz. 32). Stwierdziliśmy wówczas, że
średni kwadrat odległości od jednego do drugiego końca szeregu przypadkowych kroków,
który odpowiada natężeniu światła, równa się sumie natężeń oddzielnych źródeł. W ten
sam sposób możemy natychmiast udowodnić, że jeśli R^ oznacza wektor odległości od
punktu wyjściowego po wykonaniu jV kroków, to średni kwadrat tej odległości jest
proporcjonalny do liczby kroków A'; tzn. Rf, = NL2, gdzie L oznacza długość każdego kroku.
Ponieważ w tym wypadku liczba kroków jest proporcjonalna do czasu, średni kwadrat
odległości jest także proporcjonalny do czasu:
<R2>=at. (41.17)
Nie chcemy przez to powiedzieć, że średnia odległość jest proporcjonalna do czasu, gdyż
znaczyłoby to. że cząstka porusza się ze ściśle określoną stałą prędkością. Marynarz
wprawdzie posuwa się dostrzegalnie naprzód, ale tylko tak, że średni kwadrat przebytej odległości
jest proporcjonalny do czasu. To jest właśnie cecha charakterystyczna błądzenia
przypadkowego.
Możemy łatwo udowodnić, że każdy kolejny krok zwiększa kwadrat odległości średnio
o L1. Pisząc R^ = RV_|+L otrzymamy dla R*:
Rn'Rn~R/i = Rn- i +2Rw_| -L + L
i po uśrednieniu po wielu błądzeniach mamy </?jJ> = </?w_i> + L2, ponieważ <R,¥-iL>=0.
Następnie drogą indukcji otrzymujemy
<R2N> = NL2 (41.18)
Z kolei chcemy wyznaczyć współczynnik a w równaniu (41.17). W tym celu musimy
wziąć pod uwagę pewne dodatkowe okoliczności. Zamierzamy się więc zastanowić, co się
będzie działo z taką cząstką, gdy przyłożymy do niej pewną siłę (ruch naszej cząstki nie ma
teraz nic wspólnego z ruchem Browna — zagadnienie to jest chwilowo tylko dygresją).
Jak zatem cząstka będzie się zachowywała? Przede wszystkim da znać o sobie jej
bezwładność. Niech m oznacza współczynnik bezwładności, efektywną masę obiektu (niekoniecznie
równą rzeczywistej masie cząstki, ponieważ jeżeli popchniemy cząstkę, woda też będzie się
Poruszała. Wobec tego, jeżeli mówimy o ruchu w jednym tylko kierunku,
przyłożona siła będzie przede wszystkim zrównoważona przez wyraz m(d2xjdt2). Następnie
Przyjmiemy, że obok stałej siły działającej na obiekt wystąpi opór cieczy proporcjonalny do
Jego prędkości. Unoszona przez cząstkę ciecz jest nie tylko bezwładna, lecz istnieje w niej
°Pór przepływu spowodowany lepkością i złożoną budową płynu. Dla wystąpienia fluktuacji
absolutnie niezbędne jest istnienie pewnych nieodwracalnych strat, takich jakie powoduje
na przykład opór. Nie można otrzymać wyrazu kT, posługując się modelem nie
uwzględniającym takich strat. Źródło fluktuacji jest ściśle związane z tymi stratami. Będziemy wkrótce
246
41. RUCHY BROWNA
omawiać mechanizm tego oporu — zajmiemy się sitami, które są proporcjonalne do
prędkości, i znajdziemy ich źródło. Na razie jednak załóżmy tylko, że taki opór istnieje.
Wówczas wzór na ruch pod wpływem siły zewnętrznej zapisany w zwykły sposób będzie miał
postać następującą:
d2x dx
miitI+ti7t=F""' (41,9)
Wielkość n można wyznaczyć z doświadczenia. Tak na przykład możemy obserwować
spadanie kropli pod wpływem siły grawitacji. Wtedy wiemy, że siła równa się mg i wartość fi
równa się mg podzielonemu przez końcową szybkość spadania kropli. Możemy też
obserwować szybkość osadzania się kropli w wirówce lub naładowaną kroplę umieścić w polu
elektrycznym. Ostatecznie więc fi jest wielkością mierzalną, a nie wprowadzoną sztucznie.
Znamy ją dla wielu typów cząstek koloidalnych i innych.
Powróćmy teraz do ruchów Browna i skorzystajmy ze wzoru (41.19), już nie dla
dowolnej siły zewnętrznej, lecz dla sił nieregularnych występujących w ruchach Browna.
Następnie spróbujemy określić średni kwadrat odległości, na jaką obiekt się przemieści.
Zamiast obliczać odległości w trzech wymiarach, weźmiemy tylko jeden wymiar i traktując
to jako ćwiczenie znajdziemy średnią wartość x1. (Średnia wartość x2 jest oczywiście taka
sama jak średnia wartość y2 oraz z2, a zatem średni kwadrat odległości jest trzy razy
większy od tego, co mamy teraz obliczyć.) Składowa x-owa siły nieregularnej jest tak samo
nieregularna jak każda z pozostałych składowych. Jaka jest szybkość zmian x21 Równa
się ona d(x2)/dt = 2x(dx/dt) a więc chcemy znać średnią wartość iloczynu prędkości i
położenia. Mamy udowodnić, że jest to wielkość stała i dlatego średni kwadrat promienia będzie
rósł proporcjonalnie do czasu; chcemy też znać szybkość tego przyrostu. Jeśli pomnożymy
równanie (41.19) przez x, otrzymamy mx(d2x/dt2)+fvc(dx/dt) = xFx. Chcemy znać
uśrednioną po czasie wartość x(dx/dt), weźmy więc średnią z całego równania i zbadajmy
wszystkie trzy wyrazy. Co otrzymamy z iloczynu x i siły? Jeżeli cząstka przemieściła się
o x, to ponieważ nieregularna siła jest całkowicie przypadkowa i niezależna od punktu
wyjściowego cząstki, następne uderzenie może mieć zupełnie dowolny zwrot względem x.
Jeżeli x jest na przykład dodatnie, to nie ma powodu, aby i średnia siła miała zwrot
dodatni. Może mieć równie dobrze zwrot dodatni, jak i przeciwny. Siły nieregularne nie
popychają więc cząstki w określonym kierunku. Dlatego średnia wartość iloczynu x i F
równa się zeru. Wyraz mx(d2x/dt2) możemy natomiast zapisać w takiej oto, trochę
dziwnej postaci:
d2x d\x{dxjdt)\ (dx\2
mx t =m — m ( — I
^*F dt \dtj
i jego średnią możemy zastąpić przez średnie czasowe obu otrzymanych wyrazów.
Zastanówmy się, ile powinno wynosić x pomnożone przez prędkość. Średnia wartość iloczynu X
i prędkości nie zmienia się w czasie, bo skoro cząstka zajmie jakieś położenie, to zapomiDa
o swym poprzednim położeniu i dlatego wyrażenie to nie zależy od czasu. A więc średnia
wartość pierwszego składnika równa się zeru. Pozostało nam tylko mv2; i tu możemy
skorzystać z naszych wiadomości, że średnia wartość mv2/2 wynosi \kT. Stwierdziliśmy
41-4. BŁĄDZENIE PRZYPADKOWE
247
więc, że z tego, iż
(mx^r) + /J(x-) = <xFx>.
wynika, że
-<™2>+^—<x2>=0.
2 dl
czyli
c/<x2> fcT
-^ = 2 — (41.20)
Wskutek tego nasz obiekt po upływie czasu i przemieści się na odległość, której średni
kwadrat
(R2> = 6kT—. (41.21)
W ten sposób nareszcie możemy określić jak daleko cząstki się przesuwają! Najpierw musimy
stwierdzić, jak cząstki reagują na siłę stacjonarną, jak szybko przesuwają się pod wpływem
znanej siły (znaleźć n) i dopiero wtedy możemy odpowiedzieć na pytanie, jak daleko
przesuną się przy błądzeniu przypadkowym. To równanie było ze względów
historycznych bardzo ważne, ponieważ przy jego pomocy po raz pierwszy określono stałą k. Można
przecież zmierzyć fi, wyznaczyć czas, odległość, na jaką przesuną się cząstki, i obliczyć
wartość średnią. Określenie k miało wielkie znaczenie, ponieważ z prawa gazu doskonałego
dla jednego mola, PV=RT, znamy R, które można wyznaczyć i które równa się liczbie
atomów w jednym molu pomnożonej przez k. Z początku mol definiowano jako określoną
ilość gramów tlenu, mianowicie 16 (teraz używamy węgla), liczba zatem atomów w jednym
molu nie była początkowo znana. Był to interesujący i ważny problem: Jak duże są atomy?
Ile ich jest w jednym molu? Najwcześniejszą więc metodą określania liczby atomów było
zbadanie, jak porusza się malutka cząstka pyłu, kiedy obserwujemy ją cierpliwie przez
pewien czas pod mikroskopem. Właśnie w ten sposób została określona stała Boltzmanna k
i liczba Avogadry A', ponieważ R było zmierzone wcześniej.
42
zastosowania teorii kinetycznej
42-1. Parowanie
W rozdziale niniejszym omówimy dalsze zastosowania teorii kinetycznej. Poprzednio
położyliśmy nacisk na jedno z twierdzeń tej teorii, mówiące, że średnia energia kinetyczna
przypadająca na dowolny stopień swobody cząsteczki lub innego obiektu równa się \kT
Centralnym punktem naszego obecnego tematu będzie z kolei fakt, że prawdopodobieństwo
znalezienia cząsteczki w różnych miejscach, obliczone dla jednostkowej objętości, zmienia się
jak e-energia P°,encJalna/*7'. Podamy wiele zastosowań tego twierdzenia.
Zjawiska, które zamierzamy omówić, są dość skomplikowane: parowanie cieczy,
emisja elektronów z powierzchni metalu, czy też reakcja chemiczna, w której bierze udział
duża liczba atomów. W tych przypadkach nie można, korzystając tylko z teorii kinetycznej,
wyciągnąć prostych i poprawnych wniosków, ponieważ zjawiska te są zbyt skomplikowane.
Dlatego też treść niniejszego rozdziału nie jest zbyt ścisła poza przypadkami, na które
specjalnie zwrócimy uwagę. Chodzi tu o to, że na podstawie teorii kinetycznej możemy
tylko w przybliżeniu zrozumieć przebieg zjawisk. Stosując twierdzenia termodynamiki
lub wyniki pomiarów pewnych wielkości krytycznych, moglibyśmy przebieg tych zjawisk
przedstawić dokładniej.
Jednak warto wiedzieć, choćby tylko z grubsza, dlaczego coś przebiega tak a nie
inaczej — po to, aby w przypadku nieznanych warunków lub takich, których jeszcze nie
badaliśmy, móc powiedzieć, co się powinno w zasadzie zdarzyć. Nasze dalsze rozważania
będą bardzo niedokładne, lecz w istocie rzeczy prawdziwe — prawdziwe co do samei
idei; tylko sytuacja jest, powiedzmy, trochę uproszczona, jeżeli chodzi o pewne
specyficzne szczegóły.
Naszym pierwszym przykładem będzie parowanie cieczy. Weźmy duży zbiornik
częściowo wypełniony cieczą pozostającą w równowadze oraz parą w pewnej temperaturze
42-1. PAROWANIE
249
Przyjmiemy, że cząsteczki pary są w dużych odległościach wzajemnych, natomiast w cieczy
cząsteczki są bardzo ciasno upakowane. Chcemy określić, ile cząsteczek znajduje się w fazie
lotnej w porównaniu z cząsteczkami zawartymi w cieczy. Jaka jest gęstość pary w danej
temperaturze i w jaki sposób zależy ona od temperatury?
Powiedzmy, że « oznacza liczbę cząsteczek w jednostce objętości pary. Liczba ta zmienia
się oczywiście wraz z temperaturą. Przy ogrzewaniu parowanie jest szybsze. Weźmy też
wielkość \IVa, która równa się liczbie atomów w jednostce objętości cieczy.
Przyjmujemy, że każda cząsteczka cieczy zajmuje pewną objętość, a zatem większa liczba
cząsteczek zajmuje większą objętość. Jeżeli więc Va jest objętością zajmowaną przez jedną
cząsteczkę, to liczba cząsteczek w jednostkowej objętości cieczy równa się jednostkowej
objętości podzielonej przez objętość każdej cząsteczki Następnie przyjmiemy, że między
cząsteczkami występuje siła przyciągania, która utrzymuje je wewnątrz cieczy, gdyż w
przeciwnym razie nie moglibyśmy zrozumieć zjawiska skraplania pary. Zakładamy więc
istnienie tej siły oraz energii wiązania cząsteczek w cieczy, którą tracą przechodząc do pary.
Chcemy tym samym przyjąć, że do wyparowania jednej cząsteczki potrzebna jest praca
W. Istnieje pewna różnica, W. między energią cząsteczki w cieczy i jej energią w parze,
ponieważ musimy cząsteczkę wydobyć spomiędzy innych cząsteczek, które ją przyciągają.
Następnie skorzystamy z ogólnej zasady, że stosunek liczb atomów w jednostce
objętości w dwóch różnych miejscach równa się n2ln,=exp[—(E2—El)/kT], czyli n (liczba
cząsteczek w jednostce objętości pary) podzielone przez 1 'VB (liczbę cząsteczek w jednostce
objętości cieczy) równa się
nVe = c~w,'kT, (42.1)
gdyż wynika to z ogólnej reguły. Podobną sytuację spotkaliśmy w atmosferze będącej
w równowadze w polu grawitacyjnym, kiedy to gaz u dołu był gęstszy niż u góry na skutek
konieczności wykonania pracy mgh potrzebnej do przeniesienia cząsteczek na wysokość
h. Gęstość w cieczy jest większa niż w parze, gdyż chcąc wydobyć cząsteczkę z cieczy
musimy pokonać „wzgórze" energii o wysokości W. Stosunek tych gęstości równa się e~wlkT.
O to właśnie nam chodziło - o to tylko, że gęstość pary zmienia się jak e do minus
pewnej energii podzielonej przez kT. Czynniki stojące przed e nie są dla nas ważne,
ponieważ w większości przypadków gęstość pary jest znacznie mniejsza niż gęstość cieczy.
W przypadkach, kiedy jesteśmy daleko od punktu krytycznego, w którym obie gęstości
są prawie równe, gęstość pary jest dlatego znacznie mniejsza od gęstości cieczy, tzn. liczba n
jest znacznie mniejsza od \jVa, że energia W jest znacznie większa od kT. Zatem wzory
takie jak (42.1) są interesujące tylko wtedy, gdy W jest znacznie większe od kT. W
przypadkach tych bowiem e jest podniesione do bardzo dużej ujemnej potęgi i jeżeli choć trochę
zmienimy T, ten olbrzymi wykładnik też się zmieni, a ta zmiana wykładnika niesłychanie
Przewyższa swym wpływem każdą zmianę, która mogłaby wystąpić w czynnikach stoją-
cych przed e. Czy mogłyby w ogóle występować zmiany w takich czynnikach jak Va1
Naturalnie, chociażby dlatego, że nasza analiza była przybliżona. Przede wszystkim nie
•stnieje właściwie określona objętość dla każdej cząsteczki; ze zmianą temperatury objętość
Ki nie pozostaje stała — ciecz rozszerza się. Występują jeszcze inne drobne podobne
Osobliwości i dlatego rzeczywista sytuacja jest bardziej skomplikowana. Wszędzie znajduje-
250
42. ZASTOSOWANIA TEORII KINETYCZNEJ
my współczynniki wołnozmienne z temperaturą. Moglibyśmy na przykład twierdzić, ie
samo W także zmienia się wraz z temperaturą, ponieważ w wyższej temperaturze przy
zmienionej objętości cząsteczkowej zmienia się uśrednione przyciąganie itd. Dlatego
moglibyśmy myśleć, że wzór nasz jest bez wartości, skoro wszystko w nim jest w
nieokreślony sposób uzależnione od temperatury. Jednakże jeżeli uprzytomnimy sobie, że wykładnik
W\kT jest na ogół bardzo duży, zobaczymy, że największe zmiany krzywej gęstości pary
jako funkcji temperatury pochodzą właśnie od niego. Stwierdzimy także, że traktując
W jako stałą \\\Va jako prawie stałą otrzymamy dobre przybliżenie dla niedużych
przedziałów krzywej. Inaczej mówiąc, istotne zmiany są opisywane przez funkcję e~wlkT.
Okazuje się, że istnieje bardzo wiele zjawisk w przyrodzie, które przebiegają przy
energii pobieranej z zewnątrz. Ich istotna zależność od temperatury jest postaci e do
potęgi minus energia podzielona przez kT. Własność ta jest pożyteczna tylko wtedy, gdy
występuje duża energia w porównaniu z kT, tzn. wtedy, gdy zmiana spowodowana przez
zmianę temperatury za pośrednictwem wyrazu kT jest w sposób istotny większa od zmiany
spowodowanej w stałej lub w innych współczynnikach.
Z kolei zajmiemy się innym sposobem otrzymania podobnego opisu parowania,
traktując go tym razem bardziej szczegółowo. Do otrzymania wzoru (42.1) skorzystaliśmy po
prostu z reguły słusznej w stanie równowagi, ale nic nie przeszkadza, aby w celu lepszego
zrozumienia zająć się dokładniej zachodzącym tu procesem. Przebieg parowania możemy
również opisać następująco: cząsteczki pary nieustannie bombardują powierzchnię cieczy;
przy zderzeniach z nią mogą albo odskoczyć, albo ugrzęznąć. Nie wiemy, jaki stosunek
określa te możliwości może 50 do 50 a może 10 do 90. Powiedzmy, że wszystkie cząsteczki
grzęzną — później zbadamy to jeszcze raz przy założeniu, że tak nie jest. Wówczas w każdej
chwili pewna liczba atomów biorących udział w procesie skraplania przejdzie przez
powierzchnię cieczy. Liczba cząsteczek biorących udział w procesie skraplania, a ściślej
— liczba tych, które wejdą do cieczy przez jednostkę powierzchni, jest równa liczbie n
cząsteczek w jednostkowej objętości razy prędkość i>. Prędkość cząsteczek jest uzależniona
od temperatury, wiemy bowiem, że \mv2 równa się średnio biorąe \kT. Prędkość v jest
więc pewnego rodzaju prędkością średnią. Powinniśmy oczywiście wykonać jeszcze
całkowanie po kątach i uśrednić, ale wynik z grubsza biorąc jest proporcjonalny do pierwiastka
ze średniej kwadratowej prędkości z dokładnością do współczynnika. W ten sposób
N3 = nv (42.2)
jest liczbą cząsteczek, które dobiegają do jednostki powierzchni cieczy i biorą udział
w procesie skraplania.
Ale atomy cieczy także się poruszają i od czasu do czasu niektóre z nich wydostają si?
na zewnątrz. Chcemy obliczyć, jak często się to zdarza. Kierować będziemy się tym, ze
w stanie równowagi liczba cząsteczek, które wydostają się w ciągu 1 s jest równa liczbie
cząsteczek, które w tym samym czasie powracają do cieczy.
Ile cząsteczek wydostaje się z cieczy? Aby wyskoczyć, cząsteczka musi przypadków0
uzyskać nadwyżkę energii w porównaniu z energiami swych sąsiadek — dużą nadwyzKv
energii, ponieważ jest silnie przyciągana przez inne cząsteczki cieczy Zwykle cząsteczK
nie opuszcza cieczy, gdyż jest z nią silnie związana, ale niekiedy na skutek zderzeń przyPa
42-1. PAROWANIE
251
kowo zyskuje dodatkową energię. Jednak prawdopodobieństwo uzyskania tej dodatkowej
energii W, niezbędnej do opuszczania cieczy przez cząsteczkę, jest znikome w przypadkach,
gdy WpkT. Właśnie wyraz e_H7*T jest proporcjonalny do prawdopodobieństwa, że atom
uzyska nadwyżkę energii większą od W. Jest to ogólna zasada teorii kinetycznej: szanse
uzyskania przez cząsteczkę nadwyżki energii W ponad średnią są określone przez e
podniesione do potęgi minus nadmiar energii podzielony przez kT. Załóżmy, że niektóre cząsteczki
uzyskały tę energię. Musimy teraz ocenić, ile cząsteczek opuszcza powierzchnię w ciągu
1 s. Oczywiście, cząsteczka, która ma już tę niezbędną energię, nie musi od razu wyparować,
ponieważ może ona tkwić zbyt głęboko albo, jeżeli nawet jest blisko powierzchni, poruszać
się w niewłaściwym kierunku. Liczbę cząsteczek, które opuszczą jednostkową powierzchnię
cieczy w ciągu I s, możemy w przybliżeniu określić w następujący sposób. Jest to liczba
atomów tkwiących blisko powierzchni, obliczona dla jednostkowej powierzchni,
podzielona przez czas potrzebny do ucieczki z cieczy i pomnożona przez prawdopodobieństwo
e-fK/*r zdolności do ucieczki, a więc posiadania dostatecznej energii.
Załóżmy, że każda cząsteczka przy powierzchni cieczy zajmuje pewien obszar tej
powierzchni równy polu jej przekroju poprzecznego A. Wtedy liczba cząsteczek na
jednostkową powierzchnię cieczy równa się 1 I A. Zastanówmy się teraz: ile czasu potrzebuje
cząsteczka do wydostania się z cieczy? Jeżeli cząsteczki mają pewną średnią szybkość v
i muszą pokonać na przykład odległość równą średnicy cząsteczki D, to znaczy grubość
pierwszej warstwy cieczy, wtedy czas użyty na przebycie tej odległości jest czasem ucieczki,
oczywiście dla cząsteczek mających dostateczną energię. Ten czas równa się D/v. W takim
razie liczba parujących cząsteczek będzie równa w przybliżeniu
N„=(llA)(vlD)e~WlkT ■ (42.3)
Z kolei powierzchnia zajmowana przez każdy atom pomnożona przez grubość warstwy
równa się w przybliżeniu objętości Va zajmowanej przez jeden atom. Ponieważ w
równowadze musimy mieć Np = Ns, więc
nv=(vlVe)e~wlkT. (42.4)
Możemy uprościć prędkości v po obu stronach, ponieważ są one równe; mimo że jedna
z nich jest prędkością cząsteczki pary, a druga prędkością cząsteczki wyparowującej,
są one równe, gdyż ich średnia energia kinetyczna (przypadająca na jeden kierunek) równa
się JAT. Można by się z tym nie zgodzić: „Nie! Nie! Wyparowują cząsteczki wyjątkowo
szybkie, które uzyskały nadwyżkę energii". Niezupełnie, ponieważ w chwili rozpoczęcia
ucieczki z cieczy straciły one ten nadmiar energii na korzyść energii potencjalnej. Zatem
gdy osiągnęły powierzchnię, zwolniły i mają prędkość vi Mamy tu podobną sytuację jak
w rozkładzie prędkości cząsteczek w atmosferze — na dole cząsteczki mają pewien rozkład
eQergii. W wyższych warstwach rozkład energii jest taki sam, ponieważ powolne cząsteczki
n,e mogą się tam dostać, a szybkie zmniejszyły swą prędkość. Tak wiec cząsteczki na po-
W|erzchni, biorące udział w parowaniu, mają taki sam rozkład energii, jaki mają cząsteczki
Wewnątrz cieczy. Jest to rzecz godna uwagi. W każdym razie nie ma sensu zbyt ściśle
yskutować nasz wzór ze względu na inne popełnione nieścisłości, jak na przykład większ©
Prawdopodobieństwo odbicia cząsteczki niż przejścia do cieczy, itd. Otrzymaliśmy zatem
. ii kii M;\ iviv
oiini* rbko parowania i skiaplania i widzimy, że gęstość pai
tak jak poprzedni tym że teraz zrozumieliśmy to dokładni
tylk podstawie d'^sjc dowolnego wzoru.
'iłyh' 'umienie pozwala nam zbadać niektóre zjawiska. Załóżmy na przykł
in> [ LaKd s tokoNUd, z jaka powstaje ta więc niamj bardzo wyda>
mp paruje powoli) Zapytajmy jak szybko następuje parowanie, jeżeli utrzymu
tuhpei iturecieczv 77 Zało/my ponadto, że zmierzylismyjużdoświadczalnie gęste
ary adze, tak że wiemy, ile w danej temperaturze znajduje się cząsteczek
dn ^stki 'ih|eto pary będącej w równowadze z cieczą. Chcielibyśmy teraz wiedzu
k c/ będzie parowała Mimo że nasza analiza w części dotyczącej parowar
yła «lk przybliżona, liczbę cząsteczek docierających do cieczy określiliśmy niezłe
atkiem nieznanego współczynnika odbicia. A więc możemy skorzystać z faki
• w n 'wadze liczba cząsteczek opuszczających ciecz i powracających do niej jest
dnakc To prawda, że parę usuwamy i cząsteczki tylko parują, ale gdybyśmy zostawih
arę w sp >k ju, to osiągnęłaby ona gęstość, przy której liczba cząsteczek wracając
yłaby sama jak liczba cząsteczek parujących Dlatego od razu spostrzegamy,
liczba cz"ste>_zek parujących z powierzchni cieczy w ciągu sekundy równa się iloczynowi
eznaneco współczynnika odbicia R i liczby cząsteczek, które w ciągu sekundy wracałyby
na powierzchnię cieczy, gdyby była nad nią para Ta równość zachodzi, ponieważ właśnie
aka liczba cząsteczek równoważyłaby parowanie w stanie równowagi:
Np = nvR=(vR'Va)t~wlkT (42 51
iczywiacie, łatwo obliczyć liczbę cząsteczek, które uderzają w ciecz od strony pary, ponie-
- aż nie musimy tyle wiedzieć o siłach, co w przypadku, gdy interesuje nas ucieczka cząsli-
■ ki przez powierzchnię cieczy, pierwszy sposób jest znacznie łatwiejszy
42-2. Termoemisja
'ni m\ pc inn pr/vkł id powszechnie znanego zjawiska podobnego do par >*a
nie warto osobno nim się zajmować Jest to w istoci- ;n
W mpic znajduic >ię ziodło elektronów, ogrzane włókii
idłaui elektroda przyciągająca elektrony Każdy elekt""1*1
lmu natvehrma prz\ciącan\ przez elektrody T'
In mp kt< ra nn« >dpompo\Min lektrony C
trzsmac k lłka ilframu oraz jak ich
(42.51 ponieważ okazui
lub ltomy nutalu W przybić
i el >trzebn
ilu VV1 iwie z
przekra^z
42-2 TLRMObMlSJA
253
(np. bateryjkę kieszonkową), które powstaje w wyniku reakcji chemicznej, wynosi
około I V.
Jak obliczyć, ile elektronów wylatuje w ciągu 1 s? Byłoby trudno prześledzić wszystko,
co wywiera wpływ na wylatujące elektrony; lepiej postąpić inaczej. Przede wszystkim
wyobraźmy sobie, że nie odciągamy elektronów, które tworzą jak gdyby gaz otaczający metal
i mogą do niego powracać. Wtedy otrzymamy w równowadze pewną gęstość elektronów,
określoną przez ten sam wzór (42.1), gdzie Va oznacza objętość przypadającą w
przybliżeniu na jeden elektron w metalu, a W równa się qtip, gdzie ip jest tzw. potencjałem wyjścia,
tzn. potencjałem potrzebnym do wyciągnięcia elektronu nad powierzchnię. Wzór ten
określi nam, ile elektronów powinno otaczać metal i bombardować go, aby zrównoważyć
wylatujące elektrony. W ten sposób możemy łatwo obliczyć, ile elektronów wybiega,
jeżeli stale wszystkie je usuwamy, ponieważ liczba elektronów wybiegających jest dokładnie
równa liczbie elektronów uderzających o metal przy podanej poprzednio gęstości „pary"
elektronowej. Na nasze pytanie możemy więc odpowiedzieć, że prąd elektryczny płynący
do metalu na jednostkę powierzchni równa się iloczynowi ładunku każdego elektronu
oraz liczby elektronów, które docierają do jednostkowej powierzchni metalu w ciągu 1 s.
A to równa się liczbie elektronów w jednostce objętości pomnożonej przez prędkość, czyli,
co pisaliśmy już wiele razy:
l = qenv = (qevlVa)exp(-qe(pjkT). (42.6)
I eV odpowiada wyrażeniu kT obliczonemu dla temperatury 11600°. Włókno lampy
radiowej ma temperaturę powiedzmy 1100°, a zatem czynnik wykładniczy równa się e-10.
Gdy zmienimy temperaturę, czynnik wykładniczy znacznie się zmieni. A zatem istotnym
wyrazem we wzorze (42.6) jest znów czynnik exp(-qetplkT). Właściwie czynnik stojący
przed funkcją wykładniczą jest zupełnie błędny okazuje się, że to mechanika kwantowa,
a nie teoria klasyczna pozwala poprawnie opisać zachowanie się elektronów w metalu,
lecz zmienia to niewiele nasz współczynnik. Właściwie nikt nie był w stanie obliczyć go
dobrze, chociaż wielokrotnie stosowano do tych obliczeń zaawansowaną mechanikę
kwantową. Główny problem stanowi to, czy W zmienia się choćby powoli wraz z
temperaturą. Jeżeli tak to nie można odróżnić powolnej zmiany W wraz z temperaturą od zmiany
współczynnika stojącego przed e, to znaczy, że jeżeli na przykład W zmienia się liniowo
wraz z temperaturą, tak że W=W0 + ikT, wówczas mielibyśmy
e\p( W kD = exp[-(W()+xkT)/kT] = exp(-a)exp(-W0lkT).
A zatem liniowj /miana W wraz z temperaturą jest równoważna zmienionej „stałej"
Jest to rzeczywiście bardzo trudne zagadnienie i próby otrzymania dokładnej wartości
tego współczynnika -.4 zwykle bezowocne.
42-3. Jonizacja termiczna
Przechodzi im teraz do innego przykładu ilustrującego tę samą ideę; ciągle tę samą.
' ym razem iest u- jonizacja Załóżmy, że w gazie znajduje się bardzo dużo atomów nie zjoni-
Zovvanych ' u ra~ w ;; można ie zjoniznwać Chcielibyśmy wiedzieć, ile jonów
254
42. ZASTOSOWANIA TEORII KINETYCZNEJ
istnieje w danych warunkach przy danej gęstości atomów i w danej temperaturze. Znów
weźmiemy zbiornik zawierający N atomów mających swoje elektrony. (Jeżeli atom straci
elektron, nazwiemy go jonem.) Załóżmy, że w danym momencie w jednostce objętości
znajduje się na atomów nienaładowanych, ni — jonów i nt — elektronów. Chcemy znać
zależność między tymi trzema liczbami.
Przede wszystkim mamy dwa warunki, dwie zależności spełniane przez te liczby. Gdy
na przykład zmieniamy warunki, powiedzmy temperaturę, to na + nj powinno się nie
zmieniać, ponieważ suma ta równa się liczbie Njąder atomowych znajdujących się w
zbiorniku. Gdy gęstość jąder jest ustalona i zmieniamy na przykład temperaturę, wówczas na
skutek jonizacji niektóre atomy staną się jonami, ale całkowita liczba jonów plus liczba
atomów nie powinna się zmienić; tzn. nj+na = N. Jest jeszcze inny warunek, mianowicie
taki, że jeżeli gaz jest nienaładowany (i jeżeli pomijamy podwójną oraz potrójną jonizację),
to przez cały czas gęstość jonów równa się gęstości elektronów, czyli nt=ne. Są to warunki
dodatkowe, które wyrażają po prostu zasadę zachowania ładunku i liczby atomów.
Te zależności są prawdziwe i w końcu z nich skorzystamy, gdy zajmiemy się
rozwiązaniem rzeczywistego problemu. Chcemy jednak znaleźć jeszcze inną zależność między tymi
wielkościami. Zrobimy to jak następuje. Znów skorzystamy z faktu, że potrzebna jest
pewna energia do oddzielenia elektronu od atomu. Energię tę nazwiemy energią jonizacji
i oznaczymy ją przez W, aby wszystkie wzory wyglądały tak samo. A więc W jest energią
potrzebną do wyciągnięcia elektronu z atomu i wytworzenia jonu. Następnie znów powiemy.
że liczba swobodnych elektronów w jednostce objętości „pary" równa się gęstości
elektronów związanych w atomach razy e do minus różnica energii elektronu swobodnego i
związanego, podzielona przez kT. To jest znowu podstawowe równanie. Jak je zapisać?
Oczywiście, gęstość swobodnych elektronów równa się n„ ponieważ taka właśnie jest definicja ne.
Ale co poczniemy z liczbą elektronów związanych w atomach przypadających na
jednostkową objętość? Pełna liczba miejsc, w których możemy umieścić elektrony, równa się
na pozór na + nj. Załóżmy, że każdy ze związanych elektronów zajmuje pewną objętość
Va. Zatem całkowita objętość dostępna dla elektronów, które byłyby związane, równa
się ina + nt)Va. Moglibyśmy więc zażądać, by nasz wzór miał postać:
n n" e~wikT
' (nc + nj)Va
Jednak wzór ten jest nieprawdziwy, gdyż nie uwzględniliśmy bardzo istotnego faktu:
gdy jeden elektron jest już w atomie, żaden inny nie może skorzystać z tej objętości! Inaczej
mówiąc, objętości wszystkich możliwych miejsc w rzeczywistości nie są dostępne dla
elektronu, który zastanawia się, czy zostać w parze, czy też przejść do atomu, ponieważ
istnieje tu dodatkowa właściwość, że gdy elektron zbliża się do miejsca już zajętego przez
inny elektron, to zostaje odepchnięty. Z tego właśnie powodu powinniśmy obliczyć tę
część objętości, która jest dostępna dla elektronu. To znaczy, że miejsc już zajętych
przez elektrony powinniśmy nie liczyć w całkowitej dostępnej objętości. Liczy się tylko
objętość związaną z jonami, gdzie istnieją puste miejsca, które mogą być zajęte przez
elektrony. Wobec tego dochodzimy do wniosku, że lepszy sposób zapisania naszego wzoru jest
następujący:
42-3 JONIZACJA TERMICZNA
255
n_,«,= 1 e.wlkr
Wzór ten nazywamy równaniem jonizacji Sahy. Przekonamy się teraz, czy rozpatrując
kinetykę zachodzących zjawisk możemy jakościowo zrozumieć, dlaczego jest on prawdziwy.
Przede wszystkim od czasu do czasu elektrony spotykają się z jonami i tworzą razem
atomy. Jednocześnie co pewien czas atomy zderzają się i rozpadają na elektrony i jony.
Te dwa zjawiska muszą zachodzić z taką samą szybkością. Jak często elektrony spotykają
się z jonami? Na pewno tym częściej, im większa jest gęstość elektronów oraz im większa
jest gęstość jonów. To znaczy, że szybkość rekombinacji musi być proporcjonalna do
iloczynu liczby elektronów i liczby jonów. Jednocześnie szybkość jonizacji spowodowanej
zderzeniami atomów musi zależeć liniowo od liczby atomów, które mają być zjonizowane.
Oba zjawiska będą w równowadze, jeżeli będzie istniała odpowiednia zależność między
iloczynem ntns i liczbą atomów nn. Tę zależność podaje nasz wzór, w którym W7jest energią
jonizacji. Dostarcza on nam wprawdzie więcej informacji, ale moglibyśmy od razu
przewidzieć, że zależność, o którą nam chodzi, powinna zawierać gęstości elektronów, jonów
i atomów w postaci ilorazu «,«,/«„, aby dać wielkość stałą, niezależną od poszczególnych
liczb w, a zależną od temperatury, atomowych przekrojów czynnych oraz od innych
stałych współczynników.
Ponieważ w równaniu występują liczby odnoszące się do jednostkowej objętości, możemy
również stwierdzić, że gdybyśmy przeprowadzili dwa doświadczenia z tą samą liczbą N
atomów i jonów, tzn. z tą samą liczbą jąder atomowych, ale z dwoma zbiornikami o różnych
objętościach, to powinniśmy otrzymać w większym zbiorniku liczby n mniejsze. Ponieważ
jednak stosunek ntns\na pozostaje ten sam, całkowita liczba elektronów i jonów musi być
większa w większym zbiorniku. Aby się o tym przekonać, załóżmy, że w zbiorniku o
objętości V zawartych jest N jąder, których pewna część, dana ułamkiem /", jest zjonizowana.
Wtedy ne=fN/V=nj oraz «„ = (! —f)N/v. Nasz wzór zapiszemy zatem następująco:
f2 N e """"
- = (42.8)
\-fV V.
Inaczej mówiąc, im bardziej będziemy zmniejszać gęstości atomów lub zwiększać objętość
zbiornika, tym otrzymamy większy ułamek /^elektronów i jonów. Ta jonizacja wynikająca
' „ekspansji" przy zmniejszaniu się gęstości uzasadnia nasze przekonanie, że przy bardzo
małych gęstościach, jakie panują w zimnej przestrzeni międzygwiezdnej, mogą istnieć
jony, choćby nam to było trudno zrozumieć ze względu na wielkość występującej tam
energii. Chociaż do jonizacji niezbędna jest bardzo duża wielokrotność kT, to jednak jony
tam istnieją.
Dlaczego jony mogą istnieć w takiej bezdennej pustce oraz dlaczego ich liczba maleje
ze wzrostem gęstości? Aby na to odpowiedzieć, przypatrzmy się atomowi. Od czasu do
czasu promieniowanie, inny atom, jon lub cokolwiek, co pozostaje w równowadze
cieplnej z atomem, zderza się z nim. Bardzo rzadko, ze względu na olbrzymią nadwyżkę
energii, jakiej to wymaga, jakiś elektron wyskakuje i pozostawia jon. Skoro dzieje się to
w olbrzymiej pustej przestrzeni, elektron wędruje nieraz latami i niczego nie napotyka
256
42. ZASTOSOWANIA TEORII KINETYCZNEJ
Ale w końcu, po bardzo długim czasie, wraca jednak do jonu i łączy się z nim w atom.
Widzimy więc, że elektrony są bardzo rzadko wybijane z atomów. Jeżeli jednak przestrzeń
jest bardzo duża, elektron, który uciekł z atomu, tak długo szuka jonu, żeby się z nim
połączyć, że prawdopodobieństwo rekombinacji jest znikomo małe. Zatem, mimo że
wymaga to dużej nadwyżki energii, znajduje się tam dostrzegalna liczba elektronów.
42-4. Kinetyka reakcji chemicznych
Z takim samym zagadnieniem, jakie określiliśmy mianem „jonizacji", spotykamy się
w reakcjach chemicznych. Jeżeli na przykład obiekty A i B tworzą związek AB, to po chwili
namysłu możemy stwierdzić, że AB jest odpowiednikiem atomu, B — elektronu, a A — jonu.
Po tym podstawieniu otrzymamy równanie równowagi dokładnie w tej samej postaci:
"^=ce-^r (42.9)
"ab
Ten wzór nie jest oczywiście ścisły, ponieważ „stała" c zależy od tego, jaka objętość jest
dozwolona dla zajścia reakcji A z B, itd., jednak na podstawie rozważań
termodynamicznych można stwierdzić, co oznacza wielkość W w wykładniku. Okazuje się, że wielkość W
jest ściśle związana z energią potrzebną do zajścia reakcji.
Spróbujmy potraktować ten wzór jako wynik zderzeń. Będziemy postępowali podobnie,
jak w przypadku wzoru na parowanie, przy którego otrzymaniu ocenialiśmy, ile
elektronów ubywa, a ile wraca w jednostce czasu. Załóżmy, że obiekty A i B zderzając się od czasu
do czasu tworzą związek AB. AB byłaby więc złożoną cząsteczką, która wykonując ruchy
nieregularne zderza się z innymi cząsteczkami, dzięki czemu, od czasu do czasu, uzyskuje
energię dostateczną do rozpadnięcia się znów na obiekty A i B.
W rzeczywistości okazuje się, że jeżeli podczas reakcji chemicznej atomy zetkną się
mając zbyt małą energię, choćby nawet ta energia pochodziła z reakcji A + B-*AB, to
z samego faktu zetknięcia atomów jeszcze nie wynika, że reakcja musi się rozpocząć.
Zwykle zderzenie musi być bardzo mocne, aby reakcja mogła zajść; „miękkie" zderzenie
między obiektami A i B może być niewystarczające, nawet gdyby wydzieliła się w nim energia.
Przyjmijmy więc, że w reakcjach chemicznych do utworzenia związku AB z A i B nie
wystarcza zwykle samo tylko zderzenie — musi nastąpić zderzenie z wystarczającą energią-
Tę energię nazywa się energią aktywacji; jest to energia niezbędna do wywołania reakcji.
Oznaczmy energię aktywacji, tzn. nadwyżkę energii niezbędną do zajścia reakcji chemicznej
przez A*. Wówczas wzór na szybkość R„ z jaką obiekty A i B tworzą związek AB, zawierałby
iloczyn liczby atomów A, liczby atomów B i prędkości, z jaką pojedynczy atom uderza
w pewne pole powierzchni przekroju poprzecznego, które nazywamy przekrojem czynnym
aAB, oraz współczynnika e~A'lkT, który oznacza prawdopodobieństwo posiadania przez
atomy dostatecznej energii:
R, = nAnBvaABe-A'>kT. (42.10
Z kolei musimy obliczyć szybkość Rr, z jaką odbywa się rozpad związku AB. Istnieje
42-4- KINETYKA REAKCJI CHEMICZNYCH
257
pewne prawdopodobieństwo rozpadnięcia
się AB. Do rozpadu związek AB musi mieć
nie tylko energię W, niezbędną do tego,
aby podział w ogóle nastąpił. Skoro bowiem
trudno było zlepić obiekt A i B, musi istnieć
coś w rodzaju wzgórza, na które obiekty
A i B muszą się wspiąć, aby móc się rozłączyć.
Muszą mieć nie tylko tyle energii, ile trzeba x
na sam rozpad, ale także pewną jej nadwyżkę. ^ , ^.^ energetyczne w reakcjj
Mamy tu do czynienia z czymś podobnym a + b~*ab
do pokonywania grzbietu górskiego, aby
dostać się do głębokiej doliny. Składniki A i B
dążąc do połączenia się muszą się wspiąć na wzgórze i podobnie muszą wydostać się z doliny
i znów wdrapać się na to wzgórze, aby się rozłączyć (rys. 42.1). Dlatego szybkość, z jaką
związek AB rozpada się na składniki A i B, będzie proporcjonalna do liczby nAB
istniejących cząsteczek AB, pomnożonej przez e~(w+A*)ikT:
Rr = c'n,Be-(,r + /l,)/kr (42.11)
Wielkość c' składa się z objętości atomów i z częstości zderzeń, którą możemy obliczyć
jak przy parowaniu, mnoiąc powierzchnię, grubość warstwy i czas - ale nie będziemy tego
robili. Interesuje nas tutaj tylko to, że stosunek równych szybkości rozpadu i rekombinacji
równa się 1. Stąd zaś wnioskujemy, jak poprzednio, że nAnB\nAB = cc~Vfm", gdzie c zawiera
przekroje czynne prędkości i inne współczynniki niezależne od n.
Znamienne jest, że szybkość reakcji zależy także od wielkości e~cons"'lT, chociaż stała
jest inna od tej, która rządzi gęstościami; energia aktywacji A* różni się zasadniczo od
energii W. Energia W rządzi stosunkiem między ilościami A, Bi AB, które występują w
równowadze. Jeżeli jednak chcemy wiedzieć, jak szybko ze składników A i B tworzy się związek
AB, to nie mamy do czynienia z równowagą i dlatego inna energia, a mianowicie energia
aktywacji, decyduje o szybkości reakcji występując w wykładniku potęgi.
Ponadto wielkość A* nie jest stałą uniwersalną, taką jak W. Załóżmy, że na powierzchni
ściany zbiornika lub w jakimś innym miejscu obiekty A i B zderzają się tak, że mogą łatwiej
tworzyć związek. Znaczyłoby to, że znaleźliśmy „tunel" we wzgórzu albo nawet niższe
wzgórze. Z zasady zachowania energii wiemy, że po zapoczątkowaniu reakcji A + B^AB
wynik nie zależy od sposobu, w jaki reakcja przebiega. Tak więc różnica energii W
będzie zupełnie niezależna od sposobu, w jaki reakcja zachodzi, ale energia aktywacji A*
będzie bardzo od niego zależała. Dlatego właśnie szybkości reakcji chemicznych tak bardzo
'ależą od warunków zewnętrznych.
Szybkość reakcji możemy zmienić zmieniając powierzchnię ścianek lub
przeprowadzając reakcję w „innej beczce", jeżeli zależy ona od rodzaju powierzchni. Możemy też
wprowadzić trzeci obiekt, który może bardzo istotnie zmienić szybkość reakcji. Niektóre
ciała powodują olbrzymie zmiany szybkości, po prostu zmieniając nieco wielkość A*;
c'ała te nazywamy katalizatorami. Praktycznie biorąc, reakcja może w ogóle nie zajść
w danej temperaturze, ponieważ energia A* w tej temperaturze jest zbyt wielka, ale po
258
42. ZASTOSOWANIA TEORII K1NETYCZNFJ
wprowadzeniu specjalnych substancji - katalizatorów reakcja przebiega bardzo szybko,
ponieważ wartość A* maleje.
Nawiasem mówiąc, przy takiej reakcji (A + B daje AB) występują pewne trudności,
ponieważ gdy chcemy utworzyć z dwóch obiektów jeden, bardziej stabilny, nie możemy
spełnić jednocześnie zasad zachowania energii i pędu. Dlatego potrzebny nam jest
przynajmniej jeszcze jeden obiekt C, a więc prawdziwa reakcja jest znacznie bardziej
skomplikowana. Wzór na szybkość tworzenia powinien więc zawierać iloczyn nAnBnc i wydawałoby
się, że nasz wzór jest fałszywy, ale tak nie jest! Jeżeli zastanowimy się nad szybkością,
z jaką obiekt A B się rozpada, zauważymy, że musi on także zderzyć się z obiektem C,
a zatem mamy też iloczyn nABnc we wzorze na szybkość rozpadu. Liczba nc upraszcza
się zatem we wzorze dla gęstości w stanie równowagi. Prawo równowagi (42.9), które
wypisaliśmy poprzednio, jest absolutnie słuszne, niezależnie do mechanizmu reakcji!
42-5. Prawa promieniowania Einsteina
Przechodzimy teraz do analogicznej interesującej sprawy dotyczącej prawa
promieniowania ciała czarnego. W ostatnim rozdziale rozważaliśmy prawo rozkładu
promieniowania w zbiorniku. Wyprowadziliśmy je, podobnie, jak zrobił to Planck, tzn. rozważając
promieniowanie oscylatora. Oscylator musi mieć pewną energię średnią, a ponieważ drga,
więc powinien promieniować i wysyłać energię do zbiornika, póki nie nagromadzi się
tam jej tyle, że zajdzie równowaga między emisją i absorpcją promieniowania. Na
podstawie tego obliczyliśmy, że natężenie promieniowania o częstości co wyraża się wzorem:
hw3dw
/M^ = -ww-T). (42.12)
Wynik ten otrzymaliśmy przy założeniu, że promieniujący oscylator miał określone,
równoodległe poziomy energetyczne. Nie mówiliśmy, że światło składa się z fotonów lub
z czegoś podobnego. Nie zajmowaliśmy się tym, jak otrzymujemy energię świetlną w postaci
jednostek energii hcu, gdy atom przechodzi z jednego poziomu energii na inny. Zgodnie
z oryginalną ideą Plancka skwantowana była materia, a nie światło: materialne oscylatory
nie mogły wziąć dowolnej energii, ale mogły ją pochłaniać w określonych porcjach.
Nadal jednak istnieje pewna trudność związana z wyprowadzeniem, polegająca na tym,
że było ono częściowo oparte na fizyce klasycznej. Ilość promieniowania emitowanego
przez oscylator obliczyliśmy zgodnie z fizyką klasyczną, a potem przyjrzeliśmy się mu i
stwierdziliśmy: „Nie, ten oscylator ma wiele poziomów energetycznych". 1 tak, w celu
otrzymania prawdziwego wyniku opartego wyłącznie na mechanice kwantowej, rozwijano
ją stopniowo, aż do pełnego jej rozkwitu w roku 1927. W tym czasie jednak Einstein
spróbował zmienić punkt widzenia reprezentowany przez Plancka, że tylko oscylatory
są skwantowane, i zaproponował, aby traktować światło jako rzeczywiste fotony, które
można by uważać w pewnym stopniu za cząstki o energii Ino. Później Bohr wykazał, że każdy
układ atomów ma poziomy energii, które nie muszą być jednak równoodległe, jak w
oscylatorze Plancka. Dlatego zaszła konieczność ponownego wyprowadzenia, a przynajmniej
42-5. PRAWA PROMIENIOWANIA EINSTEINA
259
absorpcja'
,
a-~'
- — -
_____ emtsja
spontaniczna
- — emisja
T T indukowana
'n
42.2. Przejścia między dwoma poziomami
energetycznymi atomu
przedyskutowania prawa promieniowania
z punktu widzenia mechaniki
kwantowej.
Einstein przyjął, że końcowy wzór
Plancka jest prawdziwy, i skorzystał
z niego do otrzymania nowych informacji,
poprzednio nieznanych, o oddziaływaniu
promieniowania z materią. Jego
rozumowanie przebiegało w następujący
sposób. Weźmy dwa z wielu poziomów
energetycznych atomu, powiedzmy poziomy m-ty oraz «-ty (rys. 42.2). Jeżeli światło
o odpowiedniej częstości padnie na atom, to może on pochłonąć foton promieniowania
i przejść ze stanu n do stanu m. Prawdopodobieństwo zajścia tej absorpcji w ciągu sekundy
jest proporcjonalne do natężenia promieniowania padającego na atom i zależy oczywiście od
tych dwóch poziomów. Oznaczmy stałą proporcjonalności przez Bmn, aby uprzytomnić
sobie po prostu, że nie jest ona stałą uniwersalną przyrody, ale zależy od każdej pary
poziomów; jedne poziomy łatwiej wzbudzić, inne trudniej. Jaki więc będzie wzór na szybkość
emisji i przejścia ze stanu m do «? Einstein zaproponował, żeby wziąć tu pod uwagę dwie
rzeczy. Przede wszystkim nawet w nieobecności światła atom w stanie wzbudzonym
powinien mieć pewną możliwość przejścia do stanu niższego przez wysłanie fotonu: to zjawisko
nazwiemy emisją spontaniczną. Nawet fizyka klasyczna przewidywała, że oscylator nie
utrzymuje swego zasobu energii, lecz traci go przez promieniowanie. Odpowiednikiem
zatem spontanicznej emisji w układzie klasycznym jest istnienie prawdopodobieństwa Amn
przejścia atomu wzbudzonego ze stanu m do n, zależącego znowu od poziomów energii.
Prawdopodobieństwo to nie zależy natomiast od tego, czy promieniowanie pada na atom,
czy też nie. Einstein jednakże poszedł dalej i przez porównanie z teorią klasyczną, a także
opierając się na innych argumentach wywnioskował, że emisja zależy od światła, które
otacza atom: gdy mianowicie światło o odpowiedniej częstości padnie na atom, to
prawdopodobieństwo emisji fotonu wzrośnie proporcjonalnie do natężenia światła i stałą
proporcjonalności będzie Bmn. Gdyby udało nam się wykazać, że ten współczynnik równa się
zeru, moglibyśmy pomyśleć, że Einstein się mylił. Zobaczymy jednak za chwilę, że miał
on oczywiście rację.
A więc Einstein założył, że są trzy rodzaje procesów: absorpcja proporcjonalna do
natężenia światła, emisja także proporcjonalna do natężenia światła, nazywana emisją
indukowaną lub czasami emisją wymuszoną, oraz emisja spontaniczna, niezależna od
światła.
Załóżmy teraz, że mamy w równowadze w temperaturze T pewną liczbę A', atomów
w stanie n i inną liczbę Nm atomów w stanie m. Wówczas całkowita liczba atomów, które
Przechodzą ze stanu n do m, równa się liczbie atomów w stanie n, pomnożonej przez
Prawdopodobieństwo, że w ciągu sekundy atom przejdzie ze stanu n do m. Otrzymujemy
Hięc następujący wzór na liczbę atomów przechodzących ze stanu n do m w ciągu sekundy:
R = NnB„mlUo)
(42.13)
260
42. ZASTOSOWANIA TEORII KINETYCZNEJ
Liczbę atomów przechodzących ze stanu m do n wyrażamy w ten sam sposób jako liczbę
Nm atomów w stanie m pomnożoną przez prawdopodobieństwo na sekundę, że każdy z nich
przejdzie do stanu n. Tym razem mamy
Rm-* = NJiAm. + BmmHt0)]. (42.14)
Załóżmy następnie, że w równowadze termodynamicznej liczby atomów przechodzących na
wyższy poziom i spadających na niższy muszą być takie same. Jest to w końcu jedna z
możliwości zapewnienia stałej liczby atomów na każdym poziomie*'. Przyrównujemy te dwa
prawdopodobieństwa w stanie równowagi. Ale przecież mamy jeszcze jedną informację:
wiemy, jak duże są Nm w porównaniu z N„ - ich stosunek równa się exp [-(Em—En)jkT].
Einstein przyjął, że jedynym światłem, które jest w stanie spowodować przejście ze stanu
n do m jest światło o częstości odpowiadającej różnicy energii, a więc E„—En=ha> we
wszystkich naszych wzorach. Zatem
Nm = Nne-^lkT. (42.15)
Przyrównując oba prawdopodobieństwa N„BnmI(co) = Nm[Am„ + Bm„I(co)] i dzieląc
przez N„ otrzymujemy
Bm I (co) ev"r = Anm + Bm l (co) . (42.16)
Z tego równania możemy obliczyć I(co):
I(o>) ™ O*2*7)
Ale Planck już nam powiedział, że słuszny musi być wzór (42.12). Dlatego możemy już
coś wywnioskować. Przede wszystkim Bnm musi być równe B^, ponieważ inaczej nie
otrzymalibyśmy wyrażenia (ew*T — 1). A więc Einstein-odkrył coś, czego nie umiał obliczyć:
że prawdopodobieństwa emisji indukowanej i absorpcji muszą być równe. To bardzo
interesujące. Oprócz tego, aby wzory (42.17) i (42.12) się zgadzały
y<JB,,n musi równać się /ico3/7t2c2. (42.18)
Jeżeli znamy, na przykład, prawdopodobieństwo absorpcji dla danego poziomu, możemy
obliczyć prawdopodobieństwo emisji spontanicznej oraz prawdopodobieństwo emisji
indukowanej lub dowolną ich kombinację.
Tylko tyle Einstein lub ktokolwiek inny mógł otrzymać korzystając z takich założeń.
Do obliczenia bezwzględnej wartości prawdopodobieństwa emisji spontanicznej lub
innego prawdopodobieństwa jakiegoś określonego przejścia atomowego potrzebna była
wiedza o mechanice atomu, nazwana kwantową elektrodynamiką, która została odkryta
11 lat później. Te obliczenia Einstein wykonał w roku 1916.
Emisja indukowana znalazła dziś bardzo interesujące zastosowania. Obecność światła
może wywołać przejścia na niższe poziomy energetyczne. Wówczas w wyniku tych przejść
•' Nie jest to tylko jedna z możliwości gwarantująca stałą liczbę atomów na każdym poziomie
energetycznym, lecz w taki właśnie sposób odbywa się to w przyrodzie. Zasada, że w równowadze
termodynamicznej każdemu procesowi musi odpowiadać proces dokładnie odwrotny, nosi nazwę
zasady równowagi szczegółowej.
42-5. PRAWA PROMIENIOWANIA EINSTEINA
261
dojdzie energia będąca wielokrotnością hw do
istniejącej energii świetlnej pod warunkiem, że
pewne atomy znajdowały się w wyższym stanie.
Obecnie możemy za pomocą nietermicznych
metod otrzymać gaz, w którym liczba atomów
w stanie m jest znacznie większa niż w stanie n.
Oczywiście, nie jest to stan równowagi, nie
odnosi się więc do niego wzór t~tl"'lkT,
mający zastosowanie tylko do stanu równowagi.
Możemy nawet doprowadzić gaz do stanu,
w którym liczba atomów w stanie wyższym jest
bardzo duża, a w niższym praktycznie równa
zeru. Wówczas światło o częstości
odpowiadającej różnicy energii Em — E„ będzie słabo
absorbowane, ponieważ jest niewiele atomów w
nąć. Z drugiej strony istniejące światło będzie indukowało emisję z tego wyższego
stanu! A zatem w przypadku dużej liczby atomów w stanie wzbudzonym otrzymujemy coś
w rodzaju reakcji łańcuchowej, w której światło emitowane przez atomy momentalnie
wywoła jednoczesną emisję z wielu atomów i wszystkie one przejdą razem na niższy
poziom. Tak właśnie działa laser lub w przypadku dalekiej podczerwieni — maser.
Atomy w stanie m można otrzymać na różne sposoby. Może się zdarzyć, że istnieją wyższe
od nich poziomy, na które możemy przenieść atomy, jeżeli oświetlimy je silnym strumieniem
światła o wysokiej częstości. Z tych wyższych poziomów atomy, emitując różne fotony,
przechodzą niżej, aż utkną w stanie m. Jeżeli trwają w stanie m nie emitując fotonów, to
stan taki nazywamy stanem metastabilnym. Następnie na skutek emisji indukowanej
wszystkie atomy spadają niżej. Jest tu jeszcze jedna techniczna trudność. Jeżeli taki układ
atomów umieścimy w zwykłym zbiorniku, to emituje on spontanicznie w różnych
kierunkach, co osłabia emisję indukowaną. Możemy jednak wzmocnić efekt, zwiększyć wydajność,
ustawiając prawie idealne zwierciadła przy każdej ściance zbiornika, tak że wyemitowane
światło może odbijając się indukować wielokrotnie emisję. Chociaż zwierciadła te
odbijają światło prawie w 100%, jednak zawsze trochę światła przepuszczą. W końcu, oczywiście,
na skutek zasady zachowania energii całe światło wydostaje się na zewnątrz w ściśle
określonym kierunku, dając bardzo silne strumienie świetlne, które otrzymujemy obecnie
z laserów.
niebi eski e ( —j—,—■ rn
czerwone światło
wysyłane przez
laser
■ n
42.3. Wzbudzając za pomocą,
powiedzmy, światła niebieskiego wyżsey stan A,
z którego atomy przechodzą po wysłaniu
fotonów do stanu m, możemy otrzymać
tak dużo atomów w tym stanie m, że
laser może zacząć działać
stanie n, które mogłyby je pochło-
43
dyfuzja
43-1. Zderzenia między cząsteczkami
Do tej pory zajmowaliśmy się ruchem cząsteczek gazu, który pozostawał w stanie
równowagi cieplnej. Teraz chcemy zająć się zjawiskami przebiegającymi blisko stanu
równowagi. W warunkach odległych od równowagi zjawiska są bardzo skomplikowane,
ale łatwo można przewidzieć, co się stanie, gdy układ jest bardzo blisko stanu równowagi.
W tym celu musimy jednak powrócić do teorii kinetycznej. Mechanika statystyczna i
termodynamika pozwala nam badać jedynie stany równowagi, dlatego z dala od tych stanów
musimy stosować inne metody i badać, co się dzieje, jeśli można tak się wyrazić, śledząc
losy poszczególnych atomów.
Jako prosty przykład warunków, w których nie ma równowagi, weźmiemy dyfuzję
jonów w gazie. Załóżmy, że w gazie jest względnie małe stężenie jonów — elektrycznie
naładowanych cząsteczek. Jeżeli gaz poddamy działaniu pola elektrycznego, na każdy jon
będzie działać siła różna od sił działających na nienaładowane cząsteczki gazu. Gdyby nie
było innych cząsteczek, każdy jon poruszałby się ze starym przyspieszeniem aż do chwili
zderzenia się ze ścianą zbiornika. Tak jednak nie jest ze względu na obecność innych
cząsteczek. Prędkość jonu wzrasta tylko do momentu zderzenia z inną cząsteczką, w wyniku
czego jon traci swój pęd. Od nowa jednak nabiera prędkości, by znowu stracić w następnym
zderzeniu. Wskutek tego jon porusza się bardzo dziwacznie, jednak jego wypadkowy
ruch utrzymuje się w kierunku siły elektrycznej. Zobaczymy, że jon ma pewne średnie
„przemieszczenie" Średnia szybkość jonu jest proporcjonalna do pola elektrycznego-
im silniejsze pole, tym szybciej jon się porusza. Gdy działa przyłożone pole i pod jeg°
wpływem jon się porusza, nie ma oczywiście równowagi termodynamicznej. Jon usiłuje >1
osiągnąć, czyli stara się osiąść na ściance zbiornika. Szybkość przesuwania się jonu
możemy obliczyć na podstawie teorii kinetycznej.
43-1. ZDERZENIA MIĘDZY CZĄSTECZKAMI
263
Okazuje się, że przy pomocy naszych obecnych matematycznych umiejętności właściwie
nie możemy dokładnie obliczyć, co się będzie działo, a możemy tylko uzyskać przybliżony
wynik, który odzwierciedli wszystkie istotne właściwości zjawiska dyfuzji. Możemy
przewidzieć zależność od ciśnienia, od temperatury itp., ale nie będziemy w stanie otrzymać
poprawnych liczbowych współczynników we wszystkich wyrażeniach. Nie będziemy więc
się martwić w tym wyprowadzeniu, by współczynniki liczbowe miały dokładne wartości.
Można je otrzymać tylko za pomocą znacznie bardziej zaawansowanych metod
matematycznych.
Zanim przejdziemy do rozważania sytuacji, w której nie ma równowagi, musimy
dokładniej poznać gaz w stanie równowagi cieplnej. Będziemy bowiem musieli na przykład
znać średni czas, jaki upływa między kolejnymi zderzeniami cząsteczek.
Każda cząsteczka doznaje kolejnych zderzeń z innymi — oczywiście zupełnie
przypadkowo. Jakaś wybrana cząsteczka dozna w długim okresie czasu T pewnej liczby N
zderzeń. Jeżeli wydłużymy dwukrotnie czas, liczba zderzeń też się dwukrotnie zwiększy.
Liczba zderzeń jest zatem proporcjonalna do czasu T. Spróbujemy zapisać to w
następujący sposób:
N = T/t (43.1)
Stałą proporcjonalności zapisaliśmy jako I/t, gdzie x ma wymiar czasu. Stała r jest
średnim czasem między zderzeniami. Załóżmy na przykład, że w ciągu godziny zachodzi
60 zderzeń, wówczas t równa się 1 min. Powiemy wówczas, że t(1 min) jest średnim
czasem między zderzeniami.
Często chcielibyśmy znać odpowiedź na następujące pytanie: „Jakie jest
prawdopodobieństwo doznania przez cząsteczkę zderzenia w właśnie nadchodzącym krótkim odstępie
czasu dt?" Intuicyjnie możemy odpowiedzieć, że wynosi ono dtjz. Spróbujmy jednak
przeprowadzić bardziej przekonywający dowód. Weźmy bardzo dużą liczbę cząsteczek
N. Ile będzie zderzeń w dowolnym odstępie czasu dt? W stanie równowagi nic średnio
biorąc nie zmienia się w czasie. A więc N cząsteczek dozna w czasie dt tyle samo zderzeń,
co jedna cząsteczka w czasie N dt. Wiemy, że liczba zderzeń w tym czasie równa się N dt/r.
Liczba zderzeń A' cząsteczek w czasie dt równa się więc N dtjr, a prawdopodobieństwo
zderzenia dla dowolnej jednej cząsteczki jest \/N razy mniejsze, czyli równa się (\/N)x
x(Ndtlx) = dtjz, tak jak przewidywaliśmy na początku. Widzimy więc, że ułamek
cząsteczek, które zderzą się w czasie dt równa się dt/r. Jeżeli na przykład t równa się 1 min, to
w ciągu 1 s dozna zderzeń ~ wszystkich cząsteczek. Oznacza to oczywiście, że ta ^ ogólnej
liczby cząsteczek jest dostatecznie blisko tych, z którymi mają nastąpić zderzenia, oraz
ze te zderzenia dokonują się w następnej minucie.
Mówiąc, że r, średni czas między zderzeniami, wynosi 1 min, nie twierdzimy, że
wszystkie zderzenia zajdą w jednominutowych odstępach czasu. Nie oznacza to bowiem, że
każda cząsteczka po odczekaniu 1 min doznaje zderzenia. Odstępy czasu między
kolejnymi zderzeniami są bardzo nieregularne. Oderwiemy się teraz na chwilę od głównego
tematu naszego wykładu i chociaż nie będzie nam to później potrzebne, zastanowimy się
nad odpowiedzią na pytanie: „Jak długie są właściwie odstępy między zderzeniami?"
Wiemy, że dla rozpatrywanego przez nas przykładu średni czas wynosi 1 min, ale chcieli-
264
43. DYFUZJA
byśmy wiedzieć na przykład, jakie jest prawdopodobieństwo, że nie będzie zderzeń w ciągu
dwóch minut.
Podamy tu właściwie odpowiedź na ogólniejsze pytanie: „Jakie jest
prawdopodobieństwo, że cząsteczka przetrwa czas t bez zderzeń?" W dowolnej chwili, nazwijmy ją / = 0.
rozpoczniemy obserwację wybranej cząsteczki. Jakie jest prawdopodobieństwo, że
upłynie czas t, zanim się ona zderzy z inną cząsteczką? Aby obliczyć to prawdopodobieństwo,
zastanówmy się, co się dzieje ze wszystkimi jV0 cząsteczkami w zbiorniku. Jeżeli
odczekaliśmy czas t, niektóre z nich się zderzą. Oznaczmy przez N(t) liczbę cząsteczek, które
nie doznały zderzeń do chwili /. Oczywiście N(t) jest mniejsze od N0. Możemy znaleźć
N(t), ponieważ wiemy, jak zmienia się ono w czasie. Jeżeli bowiem wiemy, że N(t)
cząsteczek przetrwało bez zderzeń do chwili t, to N(t+dt), tzn. liczba cząsteczek, które
przetrwały bez zderzeń do chwili t+dt, jest mniejsza od N(t) o liczbę cząsteczek, które
doznały zderzeń w czasie dt. Liczbę cząsteczek, które zderzyły się w ciągu czasu dt,
zapisaliśmy już przy pomocy średniego czasu x jako dN=N(t)dt/x. Otrzymujemy
równanie:
dt
N(t + dt) = N(t)-N(t)—. (43.2)
T
Wyrażenie z lewej strony, N(t +dt), można zapisać zgodnie z rachunkiem różniczkowym
jako N(t) + (dN/dt)dt. Podstawiając to do równania (43.2) otrzymujemy:
dN(t) N(t)
~ = (43.3)
dt r
Liczba cząsteczek ubywających w odstępie rf/jest proporcjonalna do liczby istniejących
cząsteczek i odwrotnie proporcjonalna do średniego czasu r. Równanie (43.3) łatwo
można scałkować, jeżeli przepiszemy je w postaci
dN(f) dt
(43.4)
N(t) r
Każda strona równania jest tu różniczką zupełną, a więc mamy całkę:
lnW(f)=-//T + stała, (43.5)
lub — co na to samo wychodzi —
JV(/)=conste",/'. (43.6)
Wiemy, że ta stała musi się równać N0 — całkowitej liczbie istniejących cząsteczek,
ponieważ one wszystkie — począwszy od t=0 — czekały na swoje „następne" zderzenie.
Nasz wynik możemy zapisać w postaci
N(t)=N0e-"\ (43.7)
Stąd możemy otrzymać prawdopodobieństwo P(t), że zderzenie nie zajdzie, dzieląc N(t)
przez N0, a wiec
P(0=e_,/I. (43.8)
43-1. ZDERZENIA MIĘDZY CZĄSTECZKAMI
265
Znaczy to, że cząsteczka może bez zderzeń przetrwać czas / z prawdopodobieństwem
e-,/T, gdzie r jest średnim czasem między zderzeniami. Prawdopodobieństwo to w chwili
i=0 równa się jedności (czyli cząsteczka w chwili 7=0 z pewnością się nie zderzy) i ze
wzrostem t maleje. Prawdopodobieństwo, że cząsteczka uniknie zderzenia w czasie r
wynosi e_,=0,37 Prawdopodobieństwo, że czas między zderzeniami będzie dłuższy
od średniego czasu między zderzeniami jest więc mniejsze od £. Nie ma w tym żadnej
sprzeczności, ponieważ jest dość cząsteczek, które nie zderzają się przez znacznie dłuższy
okres czasu niż średni czas między zderzeniami, średni więc czas mimo wszystko będzie
się równał r.
Początkowo zdefiniowaliśmy r jako średni czas między zderzeniami. Z równania
(43.7) wnioskujemy, że średni czas liczony od dowolnej chwili początkowej do następnego
zderzenia także wynosi r. Ten nieco zaskakujący wniosek możemy uzasadnić w sposób
następujący. Liczba cząsteczek, które doznają następnego zderzenia w odstępie czasu
dt po czasie /, który upłynął od dowolnie obranego momentu początkowego, równa się
N(t) dt/r. Oczywiście, ich „czas do chwili następnego zderzenia" równa się właśnie r.
„Średni czas do następnego zderzenia" obliczamy w zwykły sposób:
cc
1 f N(t)
średni czas do następnego zderzenia = — I t dt.
NoJ *
o
Korzystając z wartości N{t) otrzymanej ze wzoru (43.7) i wykonując całkowanie
znajdujemy, że rzeczywiście r jest średnim czasem, który upłynął od dowolnie wybranego
momentu do następnego zderzenia.
43-2. Średnia droga swobodna
Opisując zderzenia między cząsteczkami możemy zamiast mówić o czasie między
zderzeniami, mówić o drodze, jaką cząsteczka w tym czasie przebędzie. Stąd, że średni czas
między zderzeniami równa się r oraz że cząsteczki poruszają się ze średnią prędkością
v, możemy się spodziewać, że średnia odległość między zderzeniami, którą oznaczymy
symbolem /, równa się po prostu iloczynowi r oraz v. Tę odległość między zderzeniami
nazywamy zwykle średnią drogą swobodną:
średnia droga swobodna Z = tt;. (43.9)
W niniejszym rozdziale nie będziemy się zastanawiali, o jaki sposób brania średniej
chodzi nam w każdym wybranym przypadku. Różne możliwe średnie: średnia
arytmetyczna, pierwiastek ze średniego kwadratu itd., są sobie prawie równe i różnią się tylko
współczynnikami niewiele odbiegającymi od jedności. Ponieważ do otrzymania
poprawnych współczynników liczbowych tak czy owak potrzebna jest bardzo szczegółowa
analiza, więc nie będziemy się martwić, o jaką średnią w każdym przypadku chodzi. Chcemy
także ostrzec czytelnika, że symbole używane przez nas dla niektórych wielkości
fizycznych (np. / dla średniej drogi swobodnej) nie odpowiadają ogólnie przyjętej konwencji,
przede wszystkim dlatego, iż brak czegoś takiego.
266
43. DYFUZJA
Widzieliśmy, że prawdopodobieństwo zderzenia się cząstki w krótkim odstępie czasu
dl wynosi dr/r; z podobnych powodów prawdopodobieństwo, że zderzy się ona po
przejściu drogi dx, jest równe dxjl. W podobny sposób jak poprzednio czytelnik może wykazać,
że prawdopodobieństwo przebycia przez cząsteczkę przed następnym zderzeniem
przynajmniej drogi x równa się e_x".
Średnia odległość, którą cząsteczka przebywa, zanim się zderzy z inną - średnia
droga swobodna / — zależy od liczby cząsteczek, które ją otaczają, oraz od ich
„rozmiarów", to znaczy od tego, jak wielką stanowią one tarczę. Efektywne „rozmiary" tarczy
podczas zderzenia zwykle opisujemy za pomocą „przekroju czynnego zderzenia",
pojęcia, którego się używa w fizyce jądrowej lub w opisie zjawisk rozpraszania światła.
Weźmy pod uwagę poruszającą się cząsteczkę, która przebywa odległość dx w gazie
zawierającym n0 centrów rozpraszających (cząsteczek) w jednostce objętości (rys. 43.1).
Jeżeli spojrzymy na jednostkową powierzchnię prostopadłą do drogi naszej cząsteczki,
to znajdziemy w niej n0 dx cząsteczek. Jeżeli każda z nich ma pewną czynną powierzchnię
zderzenia lub jak się zwykle mówi, „przekrój czynny zderzenia" ac, to całkowita
powierzchnia zakryta przez te cząsteczki równa się a^n0dx.
Przez „przekrój czynny zderzenia" rozumiemy pole powierzchni, wewnątrz której
musi znajdować się środek naszej cząsteczki, aby mogła się ona zderzyć z inną wybraną
cząsteczką. Gdyby cząsteczki były malutkimi kulkami (obraz klasyczny), powinniśmy
oczekiwać, że a = n(rlĄ-r1Y, gdzie r, oraz r2 są promieniami dwu zderzających się
obiektów. Prawdopodobieństwo, że nasza cząsteczka dozna zderzenia, równa się stosunkowi
powierzchni utworzonej przez zderzające się cząsteczki do całkowitej powierzchni, którą
przyjęliśmy równą jedności. Zatem prawdopodobieństwo zderzenia przy przejściu
odległości dx równa się po prostu acn0dx.
prawdopodobieństwo zderzenia na drodze dx = a,n^dx. (43.10)
Poprzednio wyraziliśmy prawdopodobieństwo zderzenia na drodze dx przy pomocy
średniej drogi swobodnej /jako dxjl. Porównując to z zależnością (43.1) możemy
powiązać średnią drogę swobodną z przekrojem czynnym zderzenia:
— =<rc«o, (43 11)
który łatwiej zapamiętać po przepisaniu go jako
acn0l=\ (43.12)
Wzór ten można by odczytać mówiąc, że cząsteczka przebywająca odległość / weźmie
udział w średnio biorąc jednym zderzeniu, jeżeli odległości / odpowiada taka warstwa
substancji rozpraszającej, że znajdujące się w niej cząsteczki ułożone obok siebie
dokładnie pokryłyby całkowitą powierzchnię (w naszym przypadku o polu równym jedności)-
W walcu o tworzącej / i o podstawie o jednostkowej powierzchni znajduje się n0l centrów
rozpraszających; jeżeli każde z nich ma powierzchnię o polu ac, to pokryte przez nie
pole całkowitej powierzchni równa się n0lac, co właśnie równa się jedności. Normalnie
oczywiście powierzchnia nie jest w całości pokryta, ponieważ niektóre cząsteczki są częs-
43-2. Średnia drooa swobodna
267
powierzchnia zderzenia
i wynosi dc
1
o
o
o ®
o
Q
©
^ ©
o
powierzchnia
całkowicie zakrywana
równa się O"n0dx
43.1. Przekrój czynny zderzenia
ciowo zasłaniane przez inne. Dlatego właśnie niektóre cząsteczki mogą przebyć drogę
dłuższą niż /, nie biorąc udziału w żadnym zderzeniu. Tylko ujmując rzecz statystycznie
możemy twierdzić, że cząsteczki biorą udział w zderzeniu w czasie, gdy przebywają
odległość /. Mierząc średnią drogę swobodną możemy określić przekrój czynny rozpraszania
ac i porównać wynik z obliczeniami opartymi na dokładnej teorii budowy atomu. Ale
to już jest inny temat! Powróćmy zatem do zagadnienia stanów nie będących w
równowadze.
43-3. Szybkość unoszenia
Chcemy opisać, jak zachowuje się jedna cząsteczka lub kilka cząsteczek, które w jakiś
sposób różnią się od większości cząsteczek gazu. Tę „większość" cząsteczek będziemy
nazywali cząsteczkami „tła", a cząsteczki odróżniające się od tła nazwiemy cząsteczkami
„specjalnymi" lub krócej - cząsteczkami S. Cząsteczki mogą mieć charakter specjalny
z różnych powodów. Mogą być na przykład cięższe od zwykłych cząsteczek. Mogą mieć
inny skład chemiczny. Mogą też mieć ładunek elektryczny, a więc być jonami w
zbiorowisku cząsteczek nienaładowanych. Dzięki innym masom lub ładunkom na cząsteczki
■S mogą działać inne siły niż na cząsteczki „tła". Badając zachowanie się cząsteczek S
możemy zrozumieć istotne własności występujące w podobny sposób w wielu różnych
zjawiskach. Wymienimy parę z nich: dyfuzja gazów, prąd elektryczny w ogniwach,
osadzanie się zawiesin, odwirowywanie itd.
Na początku zajmiemy się zjawiskiem podstawowym: na pewną cząsteczkę S
otoczoną przez cząsteczki „tła" działa pewna specyficzna siła F (która może być np. siłą
grawitacyjną lub elektryczną) oraz, dodatkowo, zwykłe siły pochodzące ze zderzeń z
cząsteczkami tła. Chcielibyśmy określić ogólne własności zachowania się cząsteczki S. W
szczegółach zachowanie to polega na tym, że cząsteczka przedziera się między innymi
cząsteczkami, porusza się tam i z powrotem ciągle się zderzając. Po dokładnej jednak obserwacji
stwierdzimy, że stale przesuwa się ona w kierunku siły F. Mówimy, że na jej zupełnie
powier7elnia
jednostkowa
liczba wszystkich
cząstek wynosi n0dx
268
43. DYFUZJA
bezładny ruch nakłada się ruch unoszenia. Chcielibyśmy znać szybkość tego unoszenia
wywołaną przez siłę F.
Jeżeli w pewnej chwili zaczniemy obserwację cząsteczki S, to najprawdopodobniej
trafimy na moment między dwoma zderzeniami. Oprócz prędkości, jaką miała ona po
ostatnim zderzeniu, cząsteczka zyskuje jakąś składową prędkość w wyniku działania siły F.
Po chwili (średnio po czasie r) cząsteczka się zderzy i rozpocznie nowy odcinek swej drogi.
Będzie miała nową prędkość początkową, ale stale takie samo przyspieszenie pochodzące
od siły F.
Na razie, dla uproszczenia, założymy, że po każdym zderzeniu nasza cząsteczka S
startuje zupełnie „świeża", to znaczy, że nie pamięta przyspieszenia wywołanego w
przeszłości przez siłę F. To założenie jest zupełnie uzasadnione, jeżeli nasza cząsteczka 5
jest znacznie lżejsza od cząsteczek tła, ale ogólnie na pewno nie jest słuszne. Później
omówimy bardziej poprawne założenie.
Tymczasem przyjmiemy, że po każdym zderzeniu cząsteczka 5 ma prędkość, która
z równym prawdopodobieństwem może być dowolnie skierowana. Prędkość, z jaką
cząsteczka startuje, będzie zatem przyjmować zupełnie przypadkowo jakiś dowolny
kierunek i nie da żadnego przyczynku do ruchu w określonym kierunku. Nie będzie więc
nam potrzebna znajomość prędkości po zderzeniu. Oprócz ruchu przypadkowego każda
cząsteczka S będzie miała w dowolnej chwili w kierunku siły F dodatkową prędkość,
którą nabrała od chwili swego ostatniego zderzenia. Jaka jest średnia wartość tej
dodatkowej prędkości? Jest ona równa przyspieszeniu F/m (gdzie m oznacza masę cząsteczki
S) pomnożonemu przez średni czas, który upłynął od ostatniego zderzenia. Ale średni
czas od ostatniego zderzenia równa się średniemu czasowi do następnego zderzenia, który
oznaczyliśmy przez t. Średnia prędkość spowodowana przez siłę F jest oczywiście szukaną
prędkością unoszenia, mamy więc zależność
F
koszenie = (43-,3>
m
Ta podstawowa zależność stanowi istotę naszego zagadnienia. Mogą być pewne
komplikacje przy określeniu, czym jest r, ale podstawowy proces jest określony przy pomocy
równania (43.13).
Zwróćmy uwagę, że prędkość unoszenia jest proporcjonalna do siły. Niestety, brak
ogólnie przyjętej nazwy dla stałej proporcjonalności. Dla sił różnego rodzaju używa się
różnych nazw. Przy zjawiskach elektrycznych siłę zapisujemy jako iloczyn ładunku i
natężenia pola F = cE i stałą proporcjonalności między prędkością i natężeniem pola
elektrycznego E zwykle nazywamy „ruchliwością". Mimo możliwości powstania
nieporozumień, użyjemy określenia ruchliwość dla stosunku prędkości unoszenia do siły dla
dowolnych sił. Napiszemy ogólnie
v ■ =uF (43.14)
■'unoszenie r1' \^-'- *
i nazwiemy n ruchliwością. Z równania (43.13) otrzymamy
\i = x\m. (43.15)
Ruchliwość jest proporcjonalna do średniego czasu między zderzeniami (mniej liozne
43-3- SZYBKOŚĆ UNOSZENIA
269
zderzenia mniej ją osłabiają) i odwrotnie proporcjonalna do masy (większa bezwładność
oznacza mniejszą szybkość uzyskaną między zderzeniami).
Otrzymanie dobrego współczynnika liczbowego w równaniu (43.13), którego podana
tu wartość okazuje się poprawna, wymaga pewnej ostrożności. Nie chcąc wprowadzić
zamieszania, chcielibyśmy jednak podkreślić, że nasze rozważania zawierają pewne
subtelności, które stają się widoczne dopiero po uważnym i szczegółowym zbadaniu. Aby
wykazać, że mimo pozorów są pewne trudności, jeszcze raz wyprowadzimy równanie
(43.13), postępując w sposób wydawałoby się rozsądny, ale z gruntu fałszywy (który
jednak można znaleźć w wielu podręcznikach!).
Moglibyśmy rozumować tak: Średni czas między zderzeniami wynosi r. Po zderzeniu
cząsteczka rozpoczyna ruch z jakąś przypadkową prędkością, ale zyskuje jeszcze
dodatkową prędkość między zderzeniami, która równa się iloczynowi przyspieszenia i czasu.
Ponieważ do następnego zderzenia upływa czas r, cząsteczka ponownie zderza się mając
prędkość (F/m) t. Po pierwszym zderzeniu jej prędkość była równa zeru, czyli jej średnia
prędkość między dwoma zderzeniami jest równa połowie prędkości końcowej i średnia
prędkość unoszenia równa się \Fxlm (błąd!). Ten wynik jest jednak błędny, a wynik
otrzymany z równania (43.13) jest poprawny, chociaż oba dowody wydają się
jednakowo przekonujące. Istnieje bardzo subtelna przyczyna, która sprawia, że drugi dowód
jest fałszywy. O co chodzi? Otóż dowód jest tu tak przeprowadzony, jakby między
wszystkimi zderzeniami upływał średni czas r. W rzeczywistości niektóre czasy są dłuższe, a inne
krótsze od czasu średniego. Krótkie czasy występują częściej, ale wnoszą mniejszy wkład
do prędkości unoszenia, ponieważ mają mniejszą możliwość „porządnego rozruszania
cząstki". Jeśli wziąć pod uwagę rozkład swobodnych czasów między zderzeniami, to
można wykazać że nie powinno być współczynnika \. który uzyskaliśmy w drugim
wyprowadzeniu. &łąd został popełniony podczas próby powiązania za pomocą prostego
argumentu średniej końcowej prędkości z prędkością średnią w ogóle. Ta zależność nie
jest wcale tak prosta, a więc najlepiej ograniczyć się do tego, co jest niezbędne: do samej
tylko prędkości średniej. W pierwszym wyprowadzeniu określiliśmy średnią prędkość
od razu — i poprawnie! Teraz jednak powinniśmy już być przekonani, dlaczego nie
zawsze wolno nam obliczać dokładnych wartości liczbowych dla wszystkich współczynników
za pomocą elementarnych wyprowadzeń.
Wróćmy obecnie do naszego upraszczającego założenia, że przy każdym zderzeniu
cząsteczka zapomina o swym poprzednim ruchu — że po każdym zderzeniu następuje
zupełnie świeży start. Załóżmy, że nasza cząsteczka 5 jest ciężkim obiektem na tle lżejszych
cząsteczek. Wówczas nie będzie już ona traciła całego pędu „do przodu" w każdym
zderzeniu. I trzeba będzie paru zderzeń, zanim jej ruch stanie się znów przypadkowy.
Możemy po prostu przyjąć, że w każdym zderzeniu — średnio w każdym odstępie czasu
r — cząsteczka traci pewną część swego pędu. Nie będziemy wchodzić w szczegóły, a tylko
zauważmy, że wynik jest równoważny zastąpieniu t — średniego czasu między zderzeniem
— przez nowy i dłuższy czas r, który odpowiada średniemu „czasowi zapominania",
tzn. średniemu czasowi potrzebnemu do „zapomnienia" przez cząsteczkę jej pędu do
przodu. Przy takiej interpretacji czynnika t możemy stosować nasz wzór (43.15) do
zjawisk, które nie są tak proste jak te. które rozważaliśmy n.i wstmie
270
43. DYFUZJA
43-4. Przewodnictwo jonowe
Zastosujemy teraz nasze wyniki do szczególnego przypadku. Weźmy gaz w zbiorniku,
w którym znajdują się także jony — naładowane elektrycznie atomy lub cząsteczki.
Przedstawiliśmy to schematycznie na rys. 43.2. Jeżeli dwie przeciwległe ściany zbiornika będą
z metalu, to możemy je połączyć z elektrodami ogniwa i w ten sposób wytworzyć pole
elektryczne w gazie. Pole elektryczne będzie działało na jony z pewną siłą, a więc zaczną
się one przesuwać w kierunku jednej z metalowych ścianek. Wytworzy to pewien prąd
elektryczny i gaz wraz ze swymi jonami będzie zachowywał się jak opornik. Obliczając
strumień jonów za pomocą szybkości unoszenia możemy obliczyć także opór. W
szczególności interesuje nas, w jaki sposób przepływ prądu elektrycznego zależy od
przyłożonej do ścianek różnicy napięć V.
Zajmiemy się przypadkiem, w którym nasz zbiornik jest prostopadłościanem o
wysokości b i o powierzchni pola podstawy A (rys. 43.2). Jeśli różnica potencjałów,
napięcie między ściankami, równa się V, natężenie pola elektrycznego między nimi wynosi
V\b. (Potencjał elektryczny równa się pracy potrzebnej do przeniesienia jednostkowego
ładunku z jednej ścianki do drugiej. Siła działająca na jednostkowy ładunek równa się
E. Jeżeli natężenie pola E jest wszędzie między ściankami stałe, co w naszym przypadku jest
uzasadnionym przybliżeniem, to praca wykonana nad jednostkowym ładunkiem równa się
Eb, a więc V=Eb.) Siła działająca na jon gazu równa się qE, gdzie q jest ładunkiem jonu.
Wówczas szybkość unoszenia jonu równa się n razy ta siła:
V
v . =uF = uq (43.16)
"unoszenie Ji
Prąd elektryczny / równa się przepływowi ładunku w jednostce czasu. Całkowity ładunek
jonów dopływających do jednej ścianki w jednostce czasu równa się prądowi
elektrycznemu płynącemu przez tę ściankę. Jony przesuwające się w kierunku ścianki z prędkością
"unoszenie « znajdujące się w odległości
równej vuros«nie ■ T osiągną ściankę po
upływie czasu T. Jeżeli gęstość jonów
równa się w,, to liczba jonów, które
dobiegną do ścianki w czasie T, równa się
(»j A ■"unc.ni.n- Każdy jon niesie
ładunek q, mamy więc
ładunek zebrany w czasie T=
= q"jAvUBOiMRicT (43.17)
Prąd / równa się ładunkowi
nagromadzonemu w czasie T i podzielonemu przez T,
a więc
I=qnjAvunoacBit. (43.18)
Po podstawieniu runoszerie z wzoru (43.16)
43.2. Prąd elektryczny w gazie zjonizowanym
metal
powierzchnia
A
■* —
o
o
o
o c
gaz
o W
b 1
o
o o °
o o
° E_ o
» o
o
° .0
o A/i jonach
jednostce °
D objętości e
\
izolator
do baterii
o napięciu V
43-4. PRZEWODNICTWO JONOWE
271
mamy
i A
I = fiq1nj—V. (43.19)
b
Okazało się, że natężenie prądu elektrycznego jest proporcjonalne do napięcia, a to jest
właśnie prawo Ohma. Opór R równa się odwrotności stałej proporcjonalności:
i=/Vn,4 (43.20)
Otrzymaliśmy zależność między oporem i właściwościami cząsteczkowymi gazu nJt q i fi,
które z kolei zależą od m i x. Jeżeli znamy «, i q z innych doświadczeń, to pomiar R może
posłużyć do wyznaczenia fi, a za pomocą fi także t.
43-5. Dyfuzja cząsteczkowa
Przechodzimy teraz do innego zagadnienia i do innego sposobu jego badania: zajmiemy
się teorią dyfuzji. Weźmy zbiornik gazu znajdującego się w równowadze cieplnej i
wprowadźmy w jakimś miejscu zbiornika trochę innego gazu. Gaz, który mieliśmy na początku,
nazwiemy gazem „tła", a nowy — gazem „specjalnym". Gaz „specjalny" zacznie
rozchodzić się po całym zbiorniku, ale będzie to robił powoli zć względu na obecność gazu
„tla". Ten powolny proces rozchodzenia się nazywamy dyfuzją. Dyfundują przede
wszystkim cząsteczki gazu specjalnego, potrącane ze wszystkich stron przez cząsteczki „tła".
Po wielkiej liczbie zderzeń cząsteczki specjalne są mniej więcej równomiernie
rozmieszczone w całej objętości zbiornika. Musimy uważać, aby nie pomylić dyfuzji gazu z jego
przenoszeniem (transportem), który może wystąpić w obecności prądów konwekcyjnych.
Mieszanie się dwu gazów zachodzi najczęściej w wyniku złożenia konwekcji i dyfuzji.
Nas interesuje tylko przypadek, w którym nie ma „wiatrów" konwekcyjnych. Gaz
rozchodzi się tylko dzięki ruchom cząsteczek; tylko dzięki dyfuzji. Chcemy obliczyć, jak
szybko odbywa się dyfuzja.
Najpierw zajmiemy się obliczeniem wypadkowego strumienia cząsteczek gazu
specjalnego, spowodowanego ruchem cząsteczek. Strumień wypadkowy otrzymamy tylko wtedy,
gdy istnieje niejednorodny rozkład cząsteczek. W przeciwnym bowiem razie wszystkie
ruchy cząsteczek uśredniają się i nie dadzą żadnego strumienia wypadkowego. Najpierw
zajmijmy się strumieniem w kierunku osi x. Aby go wyznaczyć, wyobraźmy sobie
płaszczyznę umieszczoną prostopadle do osi x i obliczmy, ile cząsteczek „specjalnych"
przepływa przez tę płaszczyznę. W tym celu musimy traktować jako dodatnie te cząsteczki,
które przechodzą płaszczyznę w dodatnim kierunku osi x i odjąć od tego te cząsteczki,
które przechodzą przez nią w kierunku ujemnym osi x. Jak już widzieliśmy wiele razy,
liczba cząsteczek przechodzących przez powierzchnię w czasie AT równa się tej ich liczbie,
która w czasie AT znajduje się w obszarze wvznaczonym przez odległość u AT od
płaszczyzny (zwróćmy uwagę, że tym razem v oznacza prędkość cząsteczek, a nie prędkość
unoszenia).
Uprościmy obliczenia przyjmując, że nasza powierzchnia ma pole jednostkowe. Wtedy
272
4i PYFUZJA
liczba cząsteczek „specjalnych" przelatujących z lewa na prawo (przyjmując, że dodatni
kierunek x jest zwrócony na prawo) równa się n_v AT, gdzie n_ oznacza gęstość
cząsteczek specjalnych z lewej strony (ze współczynnikiem 2 lub podobnym, ale my nie
zwracamy na to uwagi!). Podobnie liczba cząsteczek przelatujących z prawa na lewo równa
się n+v AT, gdzie n+ równa się gęstości cząsteczek „specjalnych" z prawej strony
płaszczyzny. Jeżeli przez J oznaczymy wypadkowy prąd cząsteczkowy, tzn. wypadkowy
strumień cząsteczek przez jednostkową powierzchnię w jednostce czasu, to otrzymamy
n_vAT — n+vAT
J= - , (43.21)
AT '
czyli
J = (n_-n+)v (43.22)
Co powinniśmy podstawić za n. oraz n+? Gdy mówimy „gęstość z lewej strony",
o jakie miejsce dokładnie nam chodzi? Powinniśmy wziąć gęstość w miejscu, od którego
cząsteczki rozpoczynają swój „swobodny lot", ponieważ liczba cząsteczek
rozpoczynających taką podróż zależy od liczby cząsteczek znajdujących się w danym miejscu. A
zatem n- powinno oznaczać gęstość w odległości średniej drogi swobodnej / na lewo od
naszej wyimaginowanej płaszczyzny, a n+ — gęstość w odległości / na prawo.
Wygodnie jest traktować rozkład naszych „specjalnych" cząsteczek w przestrzeni
jako ciągłą funkcję zmiennych x, y oraz z. Nazwiemy ją na: na(x,y,z) oznacza gęstość
numeryczną cząsteczek „specjalnych" w małym elemencie objętości ze środkiem w punkcie
\.x,y> z). Przy pomocy na możemy w następujący sposób wyrazić różnicę (n+ — n_):
dn. dna
(n+-n_)= — Ax=~ -21. (43.23)
dx dx
Podstawiając to do równania (43.22) i pomijając współczynnik 2 otrzymujemy:
dn„
Jx=-lv-^. (43.24)
dx
Obliczyliśmy, że prąd cząsteczek „specjalnych" jest proporcjonalny do pochodnej gęstości
ub — jak się mówi niekiedy — do „gradientu" gęstości.
Oczywiście, przyjęliśmy kilka grubych przybliżeń. Poza opuszczeniem różnych
współczynników, umieściliśmy v tam, gdzie powinno być vx, oraz przyjęliśmy, że n+ oraz n-
odnoszą ^ię do punktów odległych o / prostopadle do naszej powierzchni, chociaż dla
cząsteczek, które nie poruszają się prostopadle do powierzchni, / powinno odpowiadać
ukośnej odległości od powierzchni. Wszystkie te poprawki można wprowadzić. W wyniku
dokładniejszej analizy okazuje się, że prawą stronę równania (43.24) należy pomnożyć
przez J. A więc poprawiony wynik wygląda następująco:
lv dn.,
J,= -. (43 25)
3 dx
Podobne równania można napisać dla prądów w kierunkach osi y oraz z.
Prąd Jx oraz gradient gęstości dnjdx można wyznaczyć na podstawie pomiarów ma-
43-5. DYFUZJA CZĄSTECZKOWA
273
kroskopowych. Ich stosunek zmierzony doświadczalnie nazywamy „współczynnikiem
dyfuzji", D. A więc
dn„
Jx=-D-f. (43.26)
dx
Wykazaliśmy więc, że dla gazów
D = ilv. (43.27)
Dotychczas braliśmy pod uwagę, w tym rozdziale, dwa oddzielne procesy: ruchliwość,
unoszenie cząsteczek spowodowane siłami „zewnętrznymi", oraz dyfuzję,
rozprzestrzenianie się cząsteczek określone tylko przez siły wewnętrzne, przez przypadkowe
zderzenia. Istnieje jednak między nimi związek, ponieważ oba procesy zasadniczo zależą od
ruchów cieplnych i w obu rachunkach występuje średnia droga swobodna /,
Jeżeli w równaniu (43.25) podstawimy /=rr oraz T=pm, to otrzymamy
Jz=-$mv2p (43.28)
dx
Ale czynnik nn1 zależy tylko od temperatury. Przypominamy, że
{mv2 = ikT, (43.29)
a więc
dna
Jx= -pkT -? (43.30)
dx
Widzimy więc, że D, współczynnik dyfuzji, równa się po prostu kT pomnożonemu przez
p. (przez ruchliwość):
D = pkT (43.31)
Okazuje się też, że współczynnik liczbowy we wzorze (43.31) jest ścisły — nie potrzeba
dodawać tu żadnych współczynników dla poprawienia naszych przybliżonych założeń.
Można nawet udowodnić, że wzór (43.31) musi być zawsze słuszny — nawet w
przypadkach złożonych (w takich jak na przykład zawiesiny w cieczy), do których nasze proste
obliczenia w ogóle by się nie stosowały.
Aby udowodnić, że wzór (43.31) musi być zawsze słuszny, wyprowadzimy go inaczej,
korzystając tylko z naszych podstawowych zasad mechaniki statystycznej. Wyobraźmy
sobie, że istnieje gradient gęstości cząsteczek „specjalnych" i że mamy prąd dyfuzji
proporcjonalny do gradientu gęstości zgodnie z równaniem (43.26). Nakładamy teraz pole
sił o kierunku osi x, tak aby na każdą cząsteczkę działała siła F. Zgodnie z definicją
ruchliwości p. otrzymamy następującą prędkość unoszenia:
Wen, = /^ (43-32)
Tak jak zwykle, prąd unoszenia (wypadkowa liczba cząsteczek przechodzących przez
jednostkową powierzchnię w jednostce czasu) równa się
unoszenie « unoszenie * l*+-'--,-,7
czyli
274
43. DYFUZJA
znoszenie = "a^F. (43.34)
Dobieramy następnie taką siłę F, aby spowodowany przez nią prąd unoszenia
zrównoważył dyfuzję, czyli aby nie było przepływu wypadkowego cząsteczek specjalnych. Mamy
więc/J1 + ./unosz<:ni<r = 0 lub
dna
D — =natiF. (43.35)
dx
W warunkach równowagi obliczamy stacjonarny (stały w czasie) gradient gęstości
określony przez
dna napF
~ = ~- (43.36)
ax D
Ale uwaga! Opisujemy warunki równowagi, a więc możemy stosować nasze prawa
równowagi z mechaniki statystycznej. Zgodnie z tymi prawami prawdopodobieństwo
znalezienia cząsteczki o współrzędnej x jest proporcjonalne do e~v,kT, gdzie U jest energią
potencjalną. Po wprowadzeniu gęstości numerycznej na oznacza to, że
na = n0e-v,kT. (43.37)
Różniczkując wyrażenie (43.37) względem x znajdujemy
dna _„,lT 1 dU
-'=-«0e VlkTT~- . (43.38)
dx kT dx
czyli
(/«._ "„ dU
dx kT dx
W naszym przypadku, ponieważ siła F działa w kierunku osi x, energia potencjalna L'
równa się — Fx oraz —dl)ldx = F. Z równania (43.39) otrzymujemy
dna n„F
—'=-£- (43.40)
dx kT
[Jest to dokładnie równanie (40.2), z którego otrzymaliśmy początkowo e~v,kT, a więc
koło się zamknęło.] Porównując równanie (43.40) z (43.36) otrzymujemy dokładnie
równanie (43.31). Udowodniliśmy więc, że równanie (43.31), które określa prąd dyfuzyjny
przy pomocy ruchliwości, ma poprawny współczynnik i jest słuszne w bardzo ogólnych
warunkach. Ruchliwość i dyfuzja są ściśle związane. Tę zależność po raz pierwszy wykr>ł
Einstein.
43-6. Przewodnictwo cieplne
Metody teorii kinetycznej, z których korzystaliśmy wyżej, mogą także służyć do
obliczenia przewodnictwa cieplnego gazu Jeżeli gaz u góry zbiornika jest cieplejszy niż gaz
będący na dole, to ciepło będzie przypływało z góry do dołu. (Gaz cieplejszy musi b>ć
43-6. PRZEWODNICTWO CIEPLNF
275
u góry, bo w przeciwnym razie wystąpiłyby prądy konwekcyjne i nie mielibyśmy do
czynienia tylko z zagadnieniem przewodnictwa ciepła.) Przekazywanie ciepła od gazu
gorętszego do zimniejszego odbywa się drogą dyfuzji „gorących" cząsteczek — cząsteczek
o większej energii — do dołu oraz dyfuzji „zimnych" cząsteczek do góry. Aby obliczyć
strumień energii cieplnej, obliczymy energię przenoszoną przez pewien element
powierzchni na dół za pomocą cząsteczek opadających oraz energię niesioną do góry przez
cząsteczki przebijające tę powierzchnię w kierunku odwrotnym. Różnica ich da nam
wypadkowy strumień energii.
Przewodnictwo cieplne k jest zdefiniowane jako stosunek ilości energii cieplnej
przenoszonej w jednostce czasu przez jednostkową powierzchnię do gradientu temperatury:
1 dQ dT
= -*— (43.41)
A dt dz v '
Ponieważ rachunki są identyczne z tymi, które wykonywaliśmy przy obliczaniu przepływu
prądu elektrycznego w zjonizowanym gazie, więc pozostawiamy czytelnikowi do
udowodnienia, że
knlv
* = - —-, (43.42)
y-i
gdzie (y— \)kT jest średnią energią cząsteczki w temperaturze T.
Jeżeli skorzystamy z naszej zależności nloc=\, przewodnictwo cieplne możemy
zapisać w następującej postaci:
1 kv
k= (43.43)
y-i °c
Otrzymaliśmy wynik raczej zaskakujący. Wiemy, że średnia prędkość cząsteczek gazu
zależy od temperatury, a nie zależy od ich gęstości. Spodziewamy się, że cc zależy tylko
od rozmiarów cząsteczek. Tak więc nasz prosty wynik głosi, że przewodnictwo cieplne
k (a więc i ilość ciepła przepływającego w jakichś określonych warunkach) nie zależy od
gęstości gazu! Zmiana liczby „nosicieli" energii wraz ze zmianą gęstości jest całkowicie
skompensowana przez zmianę odległości, którą „nosiciele" muszą przebyć między
zderzeniami.
Ktoś mógłby zapytać: „Czy przypływ energii przy gęstości gazu dążącej do zera
również jest niezależny od gęstości? A co wtedy, gdy w ogóle nie ma gazu?" Oczywiście nie!
Wzór (43.43) został wyprowadzony, tak jak zresztą wszystkie inne w tym rozdziale, przy
założeniu, że średnia droga swobodna między zderzeniami jest znacznie krótsza od
dowolnego wymiaru zbiornika. Skoro bowiem gęstość gazu jest tak mała, że cząsteczki
mogą swobodnie bez zderzeń przebiegać między ściankami zbiornika, nie będą miały
zastosowania żadne z obliczeń wykonanych w tym rozdziale. W takich przypadkach
musimy z powrotem odwołać się do teorii kinetycznej i rozważyć przebieg zjawisk od
nowa.
44
zasady termodynamiki
44-1. Silniki cieplne, pierwsza zasada
Do tej pory omawialiśmy własności materii z punktu widzenia fizyki atomowej,
próbując z grubsza zrozumieć przebieg zjawisk przy założeniu, że otaczające nas przedmioty
składają się z atomów podlegających pewnym prawom. Istnieje jednak wiele zależności
między własnościami substancji, które można otrzymać nie wchodząc w szczegóły
budowy materii. Termodynamika właśnie zajmuje się określeniem zależności między różnymi
własnościami materii, nie badając jej wewnętrznej budowy. Historycznie rzecz biorąc,
termodynamika rozwinęła się wcześniej nim poznano wewnętrzną budowę materii.
Oto jeden z przykładów: wiemy z teorii kinetycznej, że ciśnienie gazu jest spowodowane
przez uderzenia cząsteczek. Wiemy także, że jeżeh ogrzejemy gaz, to liczba uderzeń się
zwiększy, a więc ciśnienie musi wzrosnąć. I odwrotnie, jeżeli wsuwamy tłok do zbiornika
zawierającego gaz, kierując go przeciw sile uderzeń cząsteczek, to wzrośnie energia
cząsteczek bombardujących tłok, a więc wzrośnie i temperatura. Z jednej zatem strony, jeżeli
zwiększymy temperaturę przy stałej objętości, zwiększymy ciśnienie. Z drugiej zaś
strony jeżeli sprężymy gaz, wzrośnie jego temperatura. Teoria kinetyczna umożliwia
wyprowadzenie ilościowej zależności między tymi dwoma zjawiskami, ale intuicyjnie czujemy
że są one związane w jakiś konieczny sposób, niezależny od szczegółowych warunków
zderzeń.
Weźmy inny przykład. Znana jest interesująca własność gumy: jeżeli rozciągniemy
taśmę gumową, to się ona ogrzeje. Trzymając rozciąganą taśmę w ustach czujemy
wyraźny przyrost ciepła, który jest odwracalny w tym znaczeniu, że jeżeli szybko puścimy
gumkę, to wyraźnie odczujemy jej oziębienie Znaczy to, że gumka ogrzewa się przy
naciąganiu, a oziębia się po zwolnieniu napięcia. Intuicyjnie podejrzewamy, że jeżeli
ogrzejemy gumkę, może w niej powstać napięcie, czyli skoro rozciągana gumka się ogrzewa.
44-1. SILNIKI CIEPLNE, PIERWSZA ZASADA
277
to także ogrzewanie gumki powinno
spowodować jej kurczenie. I rzeczywiście,
jeżeli dotkniemy płomieniem gazowym
gumki utrzymującej jakiś ciężarek, to
zobaczymy, że ona się skurczy raptownie
(rys. 44.1), czyli ogrzana gumka
naprawdę się kurczy i fakt ten jest z pewnością
związany ze zjawiskiem oziębiania się
gumki przy zmniejszaniu jej napięcia.
Wewnętrzne przyczyny, które
wywołują takie efekty w gumce, są dość złożone.
W pewnym stopniu postaramy się je
opisać z punktu widzenia budowy
cząsteczkowej materii, chociaż głównym celem tego
rozdziału jest poznanie tego rodzaju
związków niezależnie od modelu cząsteczkowego. Mimo to możemy wykazać za pomocą modelu
cząsteczkowego, że wspomniane zjawiska są ściśle związane. Jedyną drogą wiodącą do
zrozumienia zachowania się gumy jest stwierdzenie, że zbudowana jest ona z olbrzymiego splotu
długich łańcuchów cząsteczkowych, w rodzaju „cząsteczkowego spaghetti", z dodatkową
komplikacją: między tymi łańcuchami znajdują się poprzeczne łączniki — tak jak spaghetti,
które splatane jest czasem poprzecznymi kawałkami ciasta — w sumie straszna
gmatwanina. Jeżeli rozciągamy ten splot, niektóre łańcuchy dążą do ustawienia się wzdłuż
kierunku rozciągania. Jednocześnie łańcuchy są w ciągłym ruchu termicznym, a więc ciągle
zderzają się ze sobą. W rezultacie rozciągany łańcuch nie pozostanie rozciągnięty, lecz
na skutek zderzeń z innymi łańcuchami i cząsteczkami będzie się znów zwijał. Oto więc
właściwy powód, dla którego gumka wykazuje tendencję do kurczenia się. Gdy gumkę
rozciągamy, łańcuchy ustawiają się w kierunku podłużnym, a termiczne uderzenia
cząsteczek w boki łańcuchów zmierzają do ich zwinięcia i skracają je. Staje się więc widoczne,
że jeżeli łańcuchy są rozciągnięte i temperatura wzrasta, a więc wzrasta i wigor uderzeń
cząsteczek, łańcuchy zaczynają się kurczyć i są w stanie podciągnąć duży ciężarek
podczas ogrzewania. Jeżeli zwolnimy gumkę napiętą przez pewien czas, to każdy łańcuch
wiotczeje i uderzające weń cząsteczki tracą energię trafiając w zwolniony łańcuch. A więc
temperatura się obniża!
Przekonaliśmy się, że dwa zjawiska: kurczenie się podczas ogrzewania i oziębianie
w czasie kurczenia są z punktu widzenia teorii kinetycznej z sobą ściśle związane, ale
znalezienie ich ścisłego związku byłoby ogromnym zadaniem. Musielibyśmy wiedzieć,
ile jest zderzeń w ciągu sekundy, jak wyglądają łańcuchy, a oprócz tego musielibyśmy
wziąć pod uwagę wiele innych czynników. Szczegółowy mechanizm zjawiska jest tak
skomplikowany, że na podstawie kinetycznej teorii nie możemy wywnioskować jak ono
naprawdę przebiega; nadal jednak twierdzimy, że określoną zależność między
zaobserwowanymi zjawiskami można wyprowadzić bez żadnej znajomości ich wewnętrznego
mechanizmu!
Cała termodynamika sprowadza się w istocie do następującego rozumowania: po-
44.1. Ogrzewanie taśmy gumowej
278
«4. ZASADY TERMODYNAMIKI
nieważ gumka jest „silniejsza" w wyższych
temperaturach niż w niższych, to można
podnosić i przesuwać ciężary, a więc wykonywać
pracę kosztem ciepła. Przecież
doświadczalnie stwierdziliśmy, że ogrzewana gumka może
podnosić ciążarek. Badanie sposobu
otrzymania pracy kosztem ciepła zapoczątkowało
naukę termodynamiki. Czy możemy
zbudować silnik, który wykorzystuje
zachowanie się podgrzewanej gumki do wykonania
pracy? Można by sobie wykonać taki
zabawny silnik. Składałby się on z koła rowerowego,
44.2. Silnik cieplny z taśmami gumowymi w którym szprychy zastąpionoby gumkami
(rys. 44.2). Gumki z jednej strony koła po
podgrzaniu ich za pomocą żarówek stałyby
się „silniejsze" od gumek z przeciwnej strony. Środek ciężkości koła przesunąłby się poza
jego oś i koło by się obróciło. W czasie obrotu zimne gumki poruszałyby się w kierunku
źródła ciepła, a gorące — oddalałyby się od żarówek, a więc koło obracałoby się tak
długo, jak długo dostarczanoby ciepła. Sprawność takiego silnika byłaby bardzo mała. 400 W
mocy dostarczone do dwóch żarówek mogłoby najwyżej utrzymać go w ruchu! Warto się
jednak zastanowić, czy można zamieniać ciepło na pracę w bardziej wydajny sposób.
Właściwie całą naukę termodynamiki zapoczątkował wielki inżynier Sadi Carnot
badaniem możliwości zbudowania najlepszego, najbardziej wydajnego silnika. Był to
jeden z nielicznych słynnych przypadków, w którym technika wniosła istotny wkład do
teorii fizycznej. Innym przykładem przychodzącym mi na myśl są niedawne badania nad
teorią informacji prowadzone przez Claude'a Shannona. Przypadkowo te dwie analizy
okazały się ściśle z sobą związane.
Silnik parowy zwykle pracuje w ten sposób, że ciepło pobrane od ognia, na którym
gotujemy wodę, tworzy parę, która rozszerzając się popycha tłok obracający koło. A więc
para przesuwa tłok — i co dalej? Należy jakoś skończyć robotę — można by głupio
dokończyć cykl wypuszczając parę w powietrze, trzeba by wówczas stale uzupełniać zapas
wody. Tańszy i wydajniejszy sposób polega na przesłaniu pary do innego zbiornika,
gdzie się ją skrapla za pomocą zimnej wody i później z powrotem przepompowuje do
kotła, tak aby woda ciągle krążyła. Ciepło jest w ten sposób dostarczane do silnika i
zamieniane na pracę. A może lepiej byłoby użyć alkoholu? Jakie własności powinna mieć
substancja, aby można było zbudować możliwie najlepszy silnik? Takie było pytanie,
które postawił sobie Carnot i jednym z jego ubocznych wyników było odkrycie tej
zależności, którą wyjaśniliśmy wyżej.
Wszystkie osiągnięcia termodynamiki są zawarte w niewielu pozornie prostych
twierdzeniach, nazwanych zasadami termodynamiki. Za czasów Carnota pierwsza zasada
termodynamiki, zasada zachowania energii, nie była znana. Argumenty Carnota były jednak
tak starannie dobrane, że są słuszne, mimo że nie znał tej zasady! Dopiero później Clausius
podał prostsze wyprowadzenie, które było przystępniejsze od bardzo subtelnej
44-1. SILNIKI CIEPLNE, PIERWSZA ZASADA
279
argumentacji Carnota. Okazało się jednak, że Clausius zakładał nie zachowanie
energii, a tylko zachowanie ciepła, zgodnie z teorią cieplika, której fałszywość później
udowodniono. Dlatego często się mówi, że Carnot rozumował błędnie. Jego rozumowanie
było tymczasem zupełnie poprawne, a nieprawdziwa jest tylko powszechnie znana wersja
rozumowania podana przez Clausiusa.
W ten sposób tzw. druga zasada termodynamiki została odkryta przez Carnota przed
pierwszą zasadą! Byłoby interesujące przytoczenie dowodu Carnota, który nie korzysta
z pierwszej zasady, ale nie zrobimy tego, gdyż uczymy się fizyki a nie historii. Będziemy
używali pierwszej zasady od samego początku, mimo że można bardzo dużo osiągnąć
bez niej.
Rozpocznijmy od sformułowania pierwszej zasady, zasady zachowania energii: jeżeli
do układu dostarczymy ciepło i wykonamy nad nim pracę, wówczas jego energia wzrośnie
o włożoną pracę i o dostarczone ciepło. Możemy tę zasadę zapisać w następujący sposób:
Ciepło Q dostarczane do układu plus praca W wykonana nad układem równa się
przyrostowi energii U układu; tę ostatnią nazywamy niekiedy energią wewnętrzną:
zmiana U=Q + W. (44.1)
Zmianę U możemy przedstawić jako sumę małej ilości ciepła AQ i niewielkiej ilości pracy
A W:
AU=AQ + AW. (44.2)
Jest to tak zwana różniczkowa postać tej samej zasady. Znamy ją bardzo dobrze z jednego
z poprzednich rozdziałów.
44-2. Druga zasada
A jaka jest druga zasada termodynamiki? Wiemy, że jeżeli wykonamy pracę przeciwko
tarciu, to praca stracona przez nas równa będzie wytworzonemu ciepłu. Jeżeli wykonujemy
tę pracę w pokoju w temperaturze T i robimy to dostatecznie wolno, to temperatura
w pokoju zmieni się nieznacznie, a więc zamieniamy pracę na ciepło w stałej temperaturze.
Ale czy można postąpić przeciwnie? Czy można z powrotem zamienić ciepło na pracę
w stałej temperaturze? Druga zasada twierdzi, że nie. Byłoby bardzo wygodnie, gdybyśmy
byli w stanie zamienić ciepło na pracę, odwracając po prostu taki proces, jak na przykład
tarcie. Jeżeli stoimy tylko na gruncie zachowania energii, to możemy sądzić, że energia
cieplna, na przykład energia drgań cząsteczek, może stanowić bardzo dobre źródło
użytecznej energii. Ale Carnot założył, że nie można wykorzystać energii cieplnej w stałej
temperaturze. Inaczej mówiąc, jeżeli cały Wszechświat znajdowałby się w tej samej
temperaturze, to nie można by przekształcić żadnej z jego energii cieplnych na pracę. O ile
procesy zamiany pracy na ciepło mogą zachodzić w stałej temperaturze, o tyle nie można
ich odwrócić dla otrzymania pracy z powrotem. Ściśle mówiąc, Carnot twierdził, że ciepło
w stałej temperaturze nie może być pobrane i zamienione na pracę bez dodatkowych zmian
w układzie lub w otoczeniu.
280
44. ZASADY TERMODYNAMIKI
Ostatnie zdanie jest bardzo ważne. Przypuśćmy, że mamy zbiornik sprężonego
powietrza w stałej temperaturze i pozwolimy powietrzu się rozprężyć. Może ono wykonać
pracę; może na przykład uruchomić młoty pneumatyczne. W trakcie rozprężania powietrze
trochę się ochłodzi, ale jeżeli mamy wielkie morze, ocean, o stałej temperaturze — zbiornik
ciepła — to możemy znów je ogrzać. A więc pobraliśmy ciepło z oceanu i wykonaliśmy
pracę przy pomocy sprężonego powietrza. Carnot nie mylił się jednak, ponieważ nie
pozostawiliśmy wszystkiego w poprzednim stanie. Jeżeli ponownie sprężymy powietrze, które
się rozszerzyło, to przekonamy się, że wykonaliśmy dodatkową pracę i na końcu
stwierdzimy, że nie tylko nie otrzymaliśmy pracy z układu w stałej temperaturze T, ale nawet
jakąś pracę włożyliśmy. Musimy zająć się tylko takimi sytuacjami, w których jedynym
rezultatem całego procesu jest pobranie ciepła i zamiana go na pracę, tak jak jedynym
rezultatem procesu wykonywania pracy przeciw tarciu jest pobranie pracy i zamiana jej
na ciepło. Jeżeli wykonujemy proces kołowy, to możemy przeprowadzić układ z powrotem
do punktu wyjściowego, a jedynym rezultatem będzie wykonanie pracy przeciwko tarciu
i wytworzenie ciepła. Czy można odwrócić ten proces? Jeżeli przestawimy przełącznik,
tak aby wszystko przebiegło z powrotem, to czy tarcie wykona pracę przeciwko nam i oziębi
morze? Według Carnota: nie! A więc załóżmy, że jest to niemożliwe.
Gdyby to było możliwe, znaczyłoby to między innymi, że można wziąć ciepło od ciała
zimnego i przekazać je ciału gorącemu bez żadnych strat. Wiemy, że zwykle ciało gorące
może ogrzać zimne; jeżeli zetkniemy je ze sobą i nic poza tym nie zmienimy, nasze
doświadczenie zapewnia nas, że ciało cieplejsze nie może jeszcze bardziej się ogrzać a zimniejsze
ostygnąć! Ale jeżeli można by wykonać pracę pobierając ciepło z oceanu lub z innego
źródła w stałej temperaturze, to można by ją także z powrotem zamienić za pomocą tarcia na
ciepło w innej temperaturze. Tak na przykład inne ramię pracującej maszyny mogłoby
trzeć o coś, co jest już gorące. Wtedy jednak w ostatecznym rachunku ciepło byłoby
pobrane z „zimnego" ciała, oceanu, i przekazane ciału „gorącemu". Czasami więc hipotezę
Carnota, drugą zasadę termodynamiki, formułuje się następująco: ciepło samo nie może
płynąć od ciała zimnego do gorącego. Ale, jak widzieliśmy, te dwa sformułowania są
równoważne: pierwsze, mówiące o tym, że nie można wymyślić procesu, którego jedynym
wynikiem byłaby zamiana ciepła na pracę w stałej temperaturze, i drugie, że ciepło samo nie
może przepływać z zimniejszego miejsca do cieplejszego. Częściej będziemy używali
pierwszego sformułowania.
Dokonana przez Carnota analiza silników cieplnych jest bardzo podobna do rozważań,
które przeprowadziliśmy dla dźwigni w rozdz. 4 tomu I (cz. 1) przy omawianiu zasady
zachowania energii. Właściwie wtedy wzorowaliśmy się na argumentacji Carnota dla silników
cieplnych, a więc obecne rozważania nie wydadzą nam się obce.
Przypuśćmy, że zbudowaliśmy silnik cieplny z „kotłem" o temperaturze T1. Taki
silnik parowy będzie pobierał z kotła pewną ilość ciepła g,, wykonywał pracę W, a
następnie przekazywał trochę ciepła Q2 do skraplacza (chłodnicy) o innej temperaturze 7\
(rys. 44.3). Carnot nie określił, ile ciepła silnik przekazuje, ponieważ nie znał pierwszej
zasady i nie skorzystał z prawa, że Q2 równa się 2,, gdyż w nie nie wierzył. Chociaż wszyscy
sądzili, że zgodnie z teorią cieplika Qi i Q2 powinny być równe, Carnot z tego nie korzystał
i na tym między innymi polegała zręczność jego dowodu. My natomiast korzystając z pierw-
44-2. DRUGA ZASADA
281
szej zasady termodynamiki stwierdzamy, że
ciepło Q2 przekazane chłodnicy równa się
ciepłu pobranemu £?, minus wykonana
praca W:
Qi = Qi-W. (44.3)
Wl
7J -0,*
-%♦
T2
44.3. Silnik cieplny
(Jeżeli mamy pewien proces cykliczny, w
którym woda po skropleniu pary jest
przepompowywana z powrotem do kotła, to powiemy, że zostało zaabsorbowane ciepło Qt i wykonana
została praca W podczas każdego cyklu przy pewnej ilości krążącej cyklicznie wody.)
Spróbujmy następnie zbudować inny silnik i zobaczymy, czy nie można otrzymać
więcej pracy z tej samej ilości dostarczonego ciepła w temperaturze Tt, z chłodnicą o tej
samej temperaturze T2. Pobieramy tę samą ilość ciepła Q, z kotła i spróbujemy otrzymać
więcej pracy niż z silnika parowego używając tym razem innej cieczy, może np. alkoholu.
44-3. Silniki odwracalne
Teraz musimy zbadać warunki pracy naszych silników. Jedno jest jasne: będą
występować straty, jeżeli silniki będą miały urządzenia pracujące z tarciem. Najlepszym
silnikiem byłby silnik bez tarcia. Dlatego też przyjmiemy stan idealny, podobnie jak przy
badaniu zasady zachowania energii, tzn. założymy, że istnieje silnik pracujący bez tarcia.
Musimy także znaleźć cieplny odpowiednik ruchu bez tarcia, „beztarciowe"
przekazywanie ciepła. Jeżeli wywołamy przepływ ciepła stykając obiekt o wysokiej
temperaturze z obiektem zimnym, to nie można zmienić kierunku tego przepływu dokonując
tylko bardzo małej zmiany temperatury któregoś z obiektów. Tymczasem w mechanice
mając maszynę pracującą praktycznie bez tarcia wystarczy podziałać na nią niewielką
siłą w jakimś kierunku, żeby działała ona w tym kierunku, i wystarczy zmienić kierunek
działania siły, by zmienić też kierunek ruchu maszyny. Chce/ny znaleźć odpowiednik
ruchu bez tarcia: przepływ ciepła, którego kierunek możemy zmieniać drogą niewielkich
zmian temperatury. Dla skończonej różnicy temperatur nie jest to do zrealizowania. Ale
jeżeli okaże się, że ciepło płynie zawsze między dwoma ciałami o praktycznie tej samej
temperaturze, a jedynie nieskończenie mała
różnica temperatur określi kierunek jego
przepływu, to przepływ ten nazywamy
przepływem odwracalnym (rys. 44.4). Jeżeli
nieznacznie ogrzejemy ciało z lewej strony, to
ciepło popłynie na prawo, a jeżeli je trochę
oziębimy, ciepło popłynie na lewo. A więc
przekonujemy się, że idealnym silnikiem
jest tak zwany silnik odwracalny, w którym
każdy proces można odwrócić, czyli
dokonując nieskończenie małych zmian można zmie-
44.4. Odwracalny przepływ ciepła
st rumie
282
44. ZASADY TERMODYNAMIKI
44.5. Etapy w cyklu Carnota
UJ
a) iii
i
mi
c)
«0
2^
*-*
A
flz
SI
5
r2
nić bieg silnika na przeciwny. Oznacza to, że
nigdzie w silniku nie może występować
dostrzegalne tarcie i że żadne zbiorniki cieplne, ani
palenisko kotła nie może się stykać z niczym,
co jest znacznie zimniejsze lub cieplejsze.
Zajmijmy się teraz silnikiem idealnym,
w którym wszystkie procesy są odwracalne.
Chcąc wykazać, że taki silnik jest w zasadzie
możliwy, damy przykład cyklu silnika, którego
praktyczna realizacja nas nie obchodzi, ale który
jest w każdym razie odwracalny, tak jak to
rozumiał Carnot. Weźmy gaz zawarty w
cylindrze z tłokiem poruszającym się bez tarcia.
Gaz nie musi być gazem doskonałym. Płyn
roboczy nie musi być nawet gazem, ale żeby się
nie rozpraszać, weźmy gaz doskonały. Oprócz
tego potrzebne są nam dwa duże zbiorniki
ciepła o stałych temperaturach 7\ oraz T2 (rys.
44.5). Przyjmiemy, że Tt jest wyższe od T2.
Najpierw ogrzewamy gaz i jednocześnie
rozprężamy go, utrzymując go w kontakcie ze
zbiornikiem o temperaturze Tt. Gdy zadbamy
o to, by tłok wysuwał się bardzo powoli z
cylindra podczas dopływu ciepła, będziemy pewni,
że temperatura nigdy nie odbiegnie znacznie od
temperatury Tt. Jeżeli wyciągniemy tłok zbyt
prędko, to temperatura szybko spadnie poniżej
wartości Tt i wówczas proces przestanie być
w ogóle procesem odwracalnym. Tylko wtedy
gdy tłok wyciągamy odpowiednio wolno,
temperatura nigdy nie oddali się zbytnio od Tt.
Podobnie przy powolnym wsuwaniu tłoka
temperatura bardzo nieznacznie różniłaby się od T,
i ciepło odpłynęłoby z cylindra. Widzimy więc,
że takie izotermiczne (przy stałej temperaturze)
rozszerzanie dokonywane powoli i dostatecznie
delikatnie jest procesem odwracalnym.
Do zrozumienia tego, co robimy, potrzebny
nam będzie wykres, (rys. 44.6) zależności
ciśnienia gazu od jego objętości. Gdy gaz się
rozszerza, jego ciśnienie maleje. Krzywa
oznaczona (/) pokazuje, jak zmienia się ciśnienie i
objętość, jeżeli utrzymujemy stałą wartość tempera-
♦4-J. SILNIKI ODWRACALNE
283
tury 7\. Dla gazu doskonałego tę krzywą
powinna opisywać zależność pv=NkTt.
Podczas izotermicznego rozprężenia gazu
ciśnienie maleje ze wzrostem objętości aż do
punktu b. Jednocześnie pewna ilość ciepła
Qx musi przepłynąć ze zbiornika do gazu,
ponieważ gdyby gaz rozszerzał się nie będąc
w kontakcie ze zbiornikiem ciepła, to jak
już wiemy, oziębiłby się. Po skończeniu
izotermicznego rozprężania w punkcie b
odsuńmy cylinder od zbiornika ciepła i nadal
rozprężajmy gaz. Tym razem ciepło nie
będzie mogło wpłynąć do cylindra. Ponieważ
rozprężenie ciągle przeprowadzamy powoli,
nie ma powodu, dlaczego nie moglibyśmy go
odwrócić, zakładając jak poprzednio, że
tarcie nie występuje. Gaz rozszerza się nadal
i jego temperatura maleje, ponieważ teraz
ciepło już nie dopływa do cylindra.
Pozwolimy, żeby gaz się rozszerzał
zgodnie z krzywą oznaczoną (2), aż temperatura jego spadnie do T2, w punkcie oznaczonym
c. Takie rozprężenie gazu, bez dopływu ciepła, nazywa się rozprężaniem adiabatycznym.
Wiemy już, że dla gazu doskonałego krzywa (2) ma kształt PVy = const, gdzie y jest stałą
większą od jedności, a więc adiabata jest bardziej nachylona niż izoterma. Cylinder z
gazem ma teraz temperaturę 7\, a więc nie wywołamy zmian nieodwracalnych, gdy
zetkniemy go ze zbiornikiem o temperaturze 7\. Następnie powoli sprężamy gaz zgodnie z
krzywą (i), podczas gdy cylinder styka się ze zbiornikiem ciepła o temperaturze T2 (rys. 44.5,
etap 2). Ponieważ cylinder jest w kontakcie cieplnym ze zbiornikiem o temperaturze T2,
temperatura gazu nie wzrasta, ale ciepło Q2 przepływa z cylindra do tego zbiornika. Po
izotermicznym sprężeniu gazu wzdłuż izotermy (i) do punktu d usuwamy zbiornik
o temperaturze T2 i nadal sprężamy gaz nie dopuszczając do ucieczki ciepła.
Temperatura będzie teraz wzrastała, a ciśnienie będzie się zmieniało zgodnie z krzywą (4). Jeżeli
każdy etap wykonamy właściwie, możemy wrócić do punktu a o temperaturze 7",, z
którego wystartowaliśmy, i cykl powtórzyć.
Widzimy z tego wykresu, że wykonaliśmy z gazem pełny cykl, podczas którego
dostarczyliśmy ciepło Q, w temperaturze 7", i usunęliśmy ciepło Q2 w temperaturze T2. Istotne
znaczenie ma odwracalność cyklu, dzięki której możemy wszystkie etapy wykonać w innej
kolejności. Moglibyśmy postępować odwrotnie: wyruszyć z punktu a z temperaturą Tt,
rozprężyć gaz zgodnie z krzywą (4), dalej rozprężać go w temperaturze T2 pobierając
ciepło Q2 ttd., przechodząc pełny cykl w przeciwnym kierunku. Przebiegając cykl w jednym
kierunku musimy wykonać pracę nad gazem, w przeciwnym — gaz pracuje dla nas.
Okazuje się, że łatwo można obliczyć całkowitą pracę wykonaną, ponieważ praca
podczas rozprężenia gazu równa się iloczynowi ciśnienia i zmiany objętości \PdV. Na
pole
powierzchni =
= praca
użyteczna
objętość
44.6. Cykl Carnota, a) Rozszerzanie izo-
termtczne w temperaturze 7",, absorpcja
ciepła Qt, b) rozszerzanie adiabatyczne;
temperatura spada od T, do T2, c)
sprężanie izotermiczne w temperaturze T2,
wydzielanie ciepła £>i, d) sprężanie
adiabatyczne, temperatura wzrasta od T2 do 7",
284
44. 7ASADY TERMODYNAMIKI
7"i
*
i'
A
ł
1
■+-W
1
02
ł
fi
1 ,
o,-iv'
ł
praca
użyteczna
T2
44.7. Silnik odwracalny 4 pracuje w siecz
kosztem silnika B
naszym wykresie odłożyliśmy objętość \ na
osi poziomej, a ciśnienie P — na osi pionowej.
Jeżeli więc zmienną na osi pionowej nazwiemy
>■, a na poziomej .y, to praca równa się
J y dx — inaczej mówiąc, jest to
powierzchnia zawarta pod krzywą. Czyli powierzchnia
pod każdą z oznaczonych krzywych jest miarą
pracy wykonanej odpowiednio przez gaz
lub nad gazem, w zależności od kierunku
przejścia. Łatwo się przekonać, że praca
wypadkowa równa się powierzchni zakres-
kowanej na wykresie.
Pamiętając o przytoczonym przykładzie
silnika odwracalnego, przyjmiemy, że są
możliwe także i inne takie silniki. Weźmy
odwracalny silnik A, który pobiera ciepło Qv w
temperaturze Tt, wykonuje pracę W i wydziela pewną ilość ciepła w temperaturze T2. Załóżmy
też, że mamy jeszcze jeden silnik B, obojętnie czy już wykonany, czy też jeszcze nie
wynaleziony, „gumkowy", parowy lub jakiś inny odwracalny lub nie. Przy tym jest on tak
zaprojektowany, że pobiera tę samą ilość ciepła Qt w temperaturze 7", i wydziela pewną
ilość ciepła w niższej temperaturze T2 (rys. 44.7). Załóżmy, że silnik ten wykonuje pewną
pracę W. Udowodnimy teraz, że W nie jest większe od W, że żaden więc silnik nie może
wykonać większej pracy od silnika odwracalnego. Dlaczego? Przypuśćmy, że rzeczywiście
W jest większe niż W. Możemy wówczas wziąć ciepło (?, ze zbiornika o temperaturze 7',
i za pomocą silnika B wykonać pracę W, wydzielając jakąś - mniejsza o to jaką - ilość
ciepła do zbiornika o temperaturze 7\. Mamy więc do swej dyspozycji pracę W, która,
jak przyjęliśmy, jest większa od l\ . Możemy skorzystać tylko z jej części równej W. a
pozostałą część W — >f zaoszczędzić na pracę użyteczną. Kosztem pracy W możemy uruchomić
silnik A w odwrotnym kierunku, ponieważ jest on silnikiem odwracalnym. Silnik ten
zaabsorbuje wtedy pewną ilość ciepła ze zbiornika o temperaturze T2 i przekaże z powrotem ciepło
Q, do zbiornika o temperaturze T,. W wyniku tego podwójnego cyklu wszystko powróci
do stanu wyjściowego i ponadto otrzymamy pewną pracę dodatkową, mianowicie W" — W
Pracę tę uzyskaliśmy pobierając energię ze zbiornika o temperaturze TĄ Zadbaliśmy
przy tym. by ciepło Qt zostało /wrócone do zbiornika T,. Zbiornik ten nie musi być duży
i możemy go schować „wewnątrz" naszego złożonego silnika A + B. którego rola sprowadzi
się do pobrania wypadkowego ciepła W W ze zbiornika o temperaturze T2 i
przekształcenie go na pracę. Zgodnie jednak / postulatem Carnota otrzymanie pracy użytecznej ze
zbiornika ciepła v\ stałej temperatur/e bez żadnych zmian dodatkowych jest niemożliwe,
nie można tego po prostu dokonać. Dlatego żaden silnik pobierający określoną ilość ciepra
ze zbiornika o wyższej temperaturze 7", i przekazujący ją do zbiornika o temperaturze T:
nie może wykonać większej prac> niż silnik odwracaln) pracujący w tych samych tempera"
turach T, i T2.
Załóżmy teraz, że silnik B jest także odwracalny. Wówczas oczywiście nie tylko "
44-3. SILNIKI ODWRACALNE
285
nie może być większe od W, ale odwracając dowód można wykazać, że również W nie
może być większe od W. A więc widzimy, że dwa silniki odwracalne muszą wykonywać
taką samą pracę i w ten sposób dochodzimy do wspaniałego wniosku Carnota: jeżeli
silnik jest odwracalny, jego konstrukcja nie odgrywa żadnej roli, ponieważ praca, którą
otrzymamy, gdy silnik pobiera określoną ilość ciepła w temperaturze T, i wydzieli pewną
jego ilość w temperaturze 7\, nie zależy od konstrukcji silnika. Jest to właściwość świata,
a nie określonego silnika.
Jeżeli będziemy w stanie sformułować prawo, które określi, ile otrzymamy pracy, gdy
pobieramy ciepło Qv w temperaturze Tt i wydzielimy pewną jego ilość w temperaturze 7~2,
to wartość tej pracy będzie uniwersalna, niezależna od substancji. Oczywiście, znając
własności wybranej substancji, możemy obliczyć tę ilość pracy i stwierdzić, że wszystkie inne
substancje dostarczą tyle samo pracy w silniku odwracalnym. Jest to właśnie
najistotniejszy wniosek, idea przewodnia, dzięki której możemy znaleźć na przykład zależność między
kurczeniem się ogrzewanej gumki i jej oziębieniem, gdy pozwolimy jej się skurczyć.
Wyobraźmy sobie, że dołączyliśmy tę gumkę do odwracalnego silnika i wykonaliśmy pełny
odwracalny cykl. Wypadkowy wynik, całkowita ilość wykonanej pracy, jest funkcją uniwersalną,
wspaniałą funkcją, która nie zależy od substancji. A więc stwierdzamy, że własności
substancji są w jakiś sposób ograniczone, nie można sporządzić wszystkiego, co by się
chciało, nie można więc wynaleźć substancji, która użyta w silniku dałaby więcej pracy
niż maksymalnie dostępna praca, którą się otrzymuje z silnika odwracalnego. Ta zasada,
to ograniczenie, jest najistotniejszym wnioskiem wynikającym z termodynamiki.
44-4. Sprawność silnika idealnego
Spróbujemy teraz znaleźć prawo, które określa pracę W'jako funkcję ciepła Qt i
temperatury Tt oraz T2. Praca W jest oczywiście proporcjonalna do (2i - Jeśli bowiem weźmiemy
pod uwagę dwa silniki odwracalne, pracujące równolegle, stanowiące jeden podwójny silnik,
stwierdzimy, że zespół ten jest także silnikiem odwracalnym. Jeżeli każdy z silników
absorbuje ciepło Qu to obydwa absorbują ciepło 2Qt i wykonują pracę równą 2WX itd. Zupełnie
więc uzasadniony jest wniosek, że W jest proporcjonalne do Qt.
Kolejnym ważnym krokiem jest sformułowanie tego uniwersalnego prawa. Możemy
zająć się odwracalnym silnikiem zjedna wybraną substancją, której prawa znamy, z gazem
doskonałym. Tak właśnie postąpimy. Można też otrzymać to prawo za pomocą tylko
logicznych argumentów, nie używając żadnej wybranej substancji. Jest to jedno z
najpiękniejszych rozumowań w fizyce i nie mamy zamiaru go czytelnika pozbawiać.
Zainteresowanych czytelników zaznajomimy z nim nieco później. Najpierw jednak powinniśmy
się zająć znacznie mniej abstrakcyjnym i prostszym wyprowadzeniem dla gazu doskonałego.
Potrzebujemy tylko wzorów dla Qx oraz Q2 (zrówna się Q\-Q2), tzn. dla ciepeł
wymienianych między zbiornikami podczas izotermicznego rozprężania lub sprężania
Chodzi nam o to, ile np. ciepła Qt jest pochłaniane ze zbiornika o temperaturze T, podczas
izotermicznego rozprężania oznaczonego (/) na rys. 44.6 od punktu a odpowiadającego
ciśnieniu pa, objętości V i temperaturze Tx do punktu b z ciśnieniem równym pbl objętością
286
44. ZASADY TERMODYNAMIKI
Vb oraz tą samą temperaturą 7\. Każda cząsteczka gazu doskonałego ma energię zależną
tylko od temperatury, a ponieważ temperatura oraz liczba cząsteczek są takie same w
punktach a i b, więc wewnętrzne energie są też takie same. Energia wewnętrzna U zatem się nie
zmienia. Cała praca wykonana przez gaz,
*
W= \pdV,
a
podczas rozprężania równa się energii Qt pobranej ze zbiornika. W czasie tego rozprężania
spełnione jest równanie pV=NkTf, czyli
NfcT,
V
co prowadzi do zależności
a stąd
-J
b b
f dV
pdV= | NfcT,—, (44.4)
J Vi
'a
Qx jest ciepłem pobranym ze zbiornika w temperaturze Tx. Podobnie podczas sprężania
w temperaturze T2 [krzywa (i) na rys. 44.6] ciepło wydzielone do zbiornika T2 równa się
Q2 = NkT2 In—. (44.5)
Ki
Do zakończenia naszej analizy brak nam jeszcze tylko zależności między Vc\ Va oraz Vb\Va.
Otrzymamy ją biorąc pod uwagę, że krzywa (2) ilustruje adiabatyczne rozprężanie od
punktu b do c, podczas którego p Vy jest stałe. Ponieważ p V= Nk T, możemy równanie
adiabaty zapisać jako (/?F)Fy_I= const lub przy pomocy T i V jako TVy~i= const, albo
też
TlVl~1=T1Vl-1 (44.6)
Podobnie, ponieważ krzywa (4) od punktu d do a także przedstawia rozprężanie
adiabatyczne, otrzymujemy
^1K^, = 7-2^7-, (44.6a)
Dzieląc oba równania stronami, znajdujemy, że VJVa musi równać się VJV^ a więc
logarytmy w równaniach (44.4) muszą być równe, czyli
?± =-?2 (44.7)
T, T2
O tę właśnie zależność nam chodziło. Chociaż udowodniliśmy ją w przypadku silnika z ga'
zem doskonałym, wiemy, że musi ona być słuszna dla każdego silnika odwracalnego-
Zobaczymy teraz, jak to uniwersalne prawo może być uzasadnione logicznie, bez ucieka-
44-4. SPRAWNOŚĆ SILNIKA IDEALNEGO
287
|3~[—«-^i2
<?2
kV,
"■32"
-W,
™3
nia się do określonych substancji. Weźmy trzy
silniki i trzy temperatury, powiedzmy Tt,T2,T3.
Niech jeden z silników pochłania ciepło (?, ze
zbiornika o temperaturze Tt, wykonuje pewną
pracę Wl3 i przekazuje ciepło Q3 do zbiornika
o temperaturze T3 (rys. 44.8). Niech zaś drugi
silnik pracuje w odwrotnym kierunku, od T2 do
T3. Wybierzmy tak ten drugi silnik,aby
pochłaniał tę samą ilość ciepła Q3, którą wydzielił
silnik pierwszy, i wydzielał pewną ilość ciepła Q2 ■
Będziemy musieli włożyć do niego pewną pracę
W32 — ujemną, ponieważ pracuje on w kierunku
odwrotnym. Gdy pierwszy silnik wykona cykl,
pochłonie ciepło (?, i wydzieli ciepło Q3 w
temperaturze T3; następnie drugi silnik pochłonie tę
samą ilość ciepła Q3 ze zbiornika o temperaturze T3 i przeniesie ją do zbiornika o
temperaturze T2. Jedynym zatem wynikiem jednoczesnej pracy obu silników jest pochłonięcie
ciepła Q i ze zbiornika o temperaturze 7*, i wydzielenie ciepła Q2 do zbiornika o temperaturze
T2. Oba te silniki są więc równoważne trzeciemu, który pochłania ciepło Qt ze zbiornika
o temperaturze 7",, wykonuje pracę Wl2 i wydziela ciepło Q2 w temperaturze T2,
ponieważ W12=Wl3 — W32, co można łatwo udowodnić na podstawie pierwszej zasady
termodynamiki w następujący sposób:
44.8. Silniki 1 i 2 pracując razem są
równoważne silnikowi 3
n\*-W32={Ql-Qi)-{Q2-Qi)=Qi-Qi = Wl2.
(44.8)
Możemy teraz otrzymać prawo wiążące sprawności tych silników, ponieważ musi
oczywiście istnieć jakaś zależność między sprawnościami silników pracujących między
temperaturami 7, i T3, T2 i T3 oraz 7", i T2.
Można to bardzo przekonująco udowodnić: przed chwilą widzieliśmy, że zawsze
możemy związać ciepło pochłonięte w temperaturze Tt z ciepłem wydzielonym w
temperaturze 7\, znajdując ciepło wydzielone w jakiejś innej temperaturze T3. Dlatego możemy
zbadać wszystkie własności silników wprowadzając standardową temperaturę i badając
wszystko przy jej pomocy. Zgodnie z tym, jeżeli będziemy znać sprawność silnika
pracującego między pewną temperaturą T oraz inną dowolną standardową temperaturą, zawsze
będziemy mogli otrzymać sprawność dla dowolnej innej różnicy temperatur Ponieważ
przyjęliśmy, że posługujemy się silnikami odwracalnymi, możemy więc ustalić ich warunki pracy
od pewnej początkowej temperatury do niższej temperatury standardowej i z powrotem
znów do końcowej temperatury. Temperaturę standardową zdefiniujemy zupełnie dowolnie
jako jeden stopień. Przyjmiemy także specjalne oznaczenie dla ciepła wydzielonego w tej
temperaturze: oznaczymy je symbolem Qs. Inaczej mówiąc, jeżeli silnik odwracalny
pochłania ciepło Q w temperaturze T, to w jednostkowej temperaturze wydzieli ciepło Qs. Jeżeli
zatem jeden silnik, pochłaniający ciepło Qx w temperaturze T,, wydziela ciepło Q, w
temperaturze jednego stopnia i jeżeli inny silnik, pochłaniający ciepło Q2 w temperaturze T2, wydzieli
taką samą ilość ciepła Qs w temperaturze jednego stopnia, to stąd wynika, że silnik, który
288
44. ZASADY TERMODYNAMIKI
pochłania ciepło Qt w temperaturze Tt, wydzieli ciepło Q2, jeśli pracuje między
temperaturami 7\ oraz T2, jak to udowodniliśmy mówiąc o silnikach pracujących między trzema
temperaturami. A więc musimy teraz po prostu obliczyć, ile należy dostarczyć ciepła Q
w temperaturze 7\, aby wydzieliła się pewna ilość ciepła Q, w-temperaturze jednostkowej.
Kiedy to obliczymy, będziemy już wiedzieli wszystko. Ciepło Q jest oczywiście funkcją
temperatury T. Łatwo wykazać, że ciepło musi wzrastać, gdy rośnie temperatura, gdyż
jak wiemy, do wstecznego biegu silnika i wydzielania ciepła w wyższej temperaturze
potrzebna jest praca. Łatwo też zauważyć, że Qt musi być proporcjonalne do Qs. A więc to
wielkie prawo może brzmieć tak: Jeśłi silnik cieplny pobierający w temperaturze T ciepło Q
wydziela w temperaturze jednego stopnia ciepło Qs, to ciepło absorbowane Q musi równać
się iloczynowi Q, i pewnej rosnącej funkcji temperatury:
Q = QJ(T). (44.9)
44-5. Termodynamiczna skala temperatur
Na razie nie chcemy znajdować wzoru wiążącego powyższą rosnącą funkcję
temperatury z naszą znaną rtęciową skalą temperatur. Zamiast tego zdefiniujemy nową skalę
temperatury. Kiedyś „temperaturę" definiowano zupełnie dowolnie, dzieląc ściankę rurki
zawierającą rozszerzający się słupek wody na równe części, które nazwano stopniami. Ale gdy
zmierzono następnie temperaturę termometrem rtęciowym, przekonano się, że odległości
między stopniami nie są już równe. Teraz jednak możemy podać definicję temperatury,
która nie zależy od wybranej substancji. Możemy skorzystać w tym celu z funkcji f(T),
która nie zależy od użytego przez nas urządzenia, ponieważ wydajność silników
odwracalnych nie zależy od ich substancji roboczych. Skoro otrzymana funkcja f(T) jest rosnącą
funkcją temperatury, możemy ją zdefiniować jako samą temperaturę, mierzoną w
jednostkach standardowej temperatury równej jednemu stopniowi:
Q = ST, (44.10)
gdzie
Qs = S-r. (44.11)
To znaczy, że będziemy określali temperaturę obiektu obliczając, ile ciepła pochłonie
silnik odwracalny pracujący między temperaturą tego obiektu i temperaturą jednostkową
(rys. 44.9). Jeżeli, na przykład, siedmiokrotnie więcej ciepła zostało pobrane z kotła niż
przekazane do chłodnicy o temperaturze równej jednemu stopniowi, to temperaturę kotła
określimy jako siedem stopni itd. A więc mierząc, ile ci;pła zostaje pochłonięte w różnych
temperaturach, określamy jednocześnie te temperatury. Zdefiniowana w ten sposób
temperatura nosi nazwę bezwzględnej temperatury termodynamicznej i nie zależy od substancji-
Poczynając od tego miejsca będziemy posługiwali się wyłącznie tą definicją
temperatury*'.
*' Poprzednio zdefiniowaliśmy naszą skalę temperatur inaczej. Stwierdziliśmy mianowicie. *e
średnia energia kinetyczna cząsteczek gazu doskonałego jest proporcjonalna do temperatury, czyi" w
z prawa gazu doskonałego wynika, \żpV jest proporcjonalne do T. Czy ta nowa definicja jest jej ro**
noważna? Tak, ponieważ końcowy wynik (44.7) wyprowadzony z prawa gazu doskonałego jest ta
sam. jak przytoczony tutaj. Zajmiemy się tym jeszcze raz w następnym rozdziale.
44-5. TERMODYNAMICZNA SKALA TEMPERATUR
289
Widzimy więc, że gdy dwa silniki, jeden
pracujący między temperaturą T, i temperaturą
jednego stopnia, a drugi między temperaturą T2
i temperaturą jednego stopnia, wydzielają to
samo ciepło w jednostkowej temperaturze,
wówczas ciepła pochłonięte związane są
zależnością:
Qi Q.^
-- = S = — . (44.12)
T, T2
To zaś oznacza, że dla silnika pochłaniającego
energię Qv w temperaturze T, i wydzielającego
ciepło Q2 w temperaturze T2, Q, tak się ma do
7"i, jak Q2 do T2. Jest to najistotniejszy wynik całej naszej analizy, jej wspaniały finał.
Ta zależność musi być spełniona dla każdego silnika odwracalnego. Zawiera się w niej
wszystko: jest to istota całej termodynamiki.
Jeżeli w tej zależności zawarta jest istota termodynamiki, to dlaczego uważa się ją za tak
trudny przedmiot? Przy rozwiązywaniu zadania dotyczącego jakiejś substancji, której
masa się nie zmienia, stan tej substancji opisujemy podając w danej chwili jej temperaturę
i objętość. Jeżeli znamy temperaturę i objętość substancji oraz wiemy, że ciśnienie jest
pewną funkcją temperatury i objętości, wówczas wiemy, jaka jest energia wewnętrzna.
Ktoś mógłby jednak powiedzieć: „To mi nie odpowiada. Powiedz mi, jaka jest
temperatura i ciśnienie, a ja ci podam objętość. Mogę przecież traktować objętość jako funkcję
temperatury i ciśnienia, a energię wewnętrzną też jako funkcję temperatury i ciśnienia
itd." Termodynamika dlatego właśnie jest trudna, że każdy stosuje ją inaczej. Gdybyśmy
mogli wszyscy razem zssiąść, uzgodnić nasze zmienne i trzymać się ich stale, wówczas
termodynamika byłaby zupełnie łatwym przedmiotem.
Teraz zaczniemy wyciągać wnioski. Tak jak zależność F=ma stanowi istotę mechaniki,
która w całości z niej wynika, tak i zasada, którą przed chwilą sformułowaliśmy, stanowi
podstawę całej termodynamiki. Ale czy można z niej wyciągnąć wnioski?
Właśnie zaczynamy to robić. W celu otrzymania pierwszego wniosku musimy skorzystać
z obu zasad: zasady zachowania energii i tej zasady, która wiąże ciepło Q2 i £?,. Łatwo
wówczas otrzymamy sprawność silnika odwracalnego. Z pierwszej zasady mamy tV=
= Qi — Q2. Zgodnie z naszą nową zasadą
T2
'i
a więc praca równa się
H'=e,(i-^=e,^~^, (44.13)
co określa nam sprawność silnika - ile pracy otrzymamy z danej ilości ciepła. Sprawność
silnika jest wprost proporcjonalna do różnicy temperatur, między którymi silnik pracuje,
—
silnik
odwracalny
■W=Q-S-1°
':w/.w
lv"; 1°K
44.9. Bezwzględna temperatura
termodynamiczna
290
44 ZASADY TERMODYMAMl
podzielonej przez wyższą temperaturę:
tt Tt-T2
sprawność = — =— — (44 l&\
G. T2 K l4)
Sprawność nie może być większa od jedności, a bezwzględna temperatura nie może być
mniejsza od bezwzględnego zera. A więc skoro T2 musi być dodatnia, to sprawność jest
sze mniejsza od jedności. 1 to jest właśnie nasz pierwszy wniosek.
44-6. Entropia
Równania (44.7) lub (44.12) można interpretować w specjalny sposób. W cyklu pracy
silników odwracalnych ciepło (?, w temperaturze T, jest „równoważne" ciepłu Q2 w
temperaturze T2, jeżeli QilTt = Q2/T2, przy czym jedno z tych ciepeł jest pochłaniane, a drugie
wydzielane. Fakt ten wyróżnia w jakiś sposób wielkość QjT. Możemy bowiem powiedzieć:
w procesach odwracalnych ta sama „ilość" wielkości QjT zostaje pochłonięta co wydzielona,
nie ma straty, ani zysku QjT. Iloraz Q/T nazywamy entropią. Mówimy, że „entropia nie
zmienia się w ciągu cyklu odwracalnego". Jeżeli 7"równa się 1°, wówczas entropia równa się
(2/1° lub zgodnie z naszym oznaczeniem £?S/1° = S. W rzeczywistości właśnie S'jest
oznaczeniem zwykle używanym dla entropii, która liczbowo równa się ciepłu wydzielonemu
(oznaczonemu przez nas Qs)do zbiornika o temperaturze 1° (sama entropia nie jest ciepłem,
lecz ciepłem podzielonym przez temperaturę, a więc mierzy się ją w dzidach na stopień).
Ciekawe, że oprócz ciśnienia będącego funkcją temperatury i objętości oraz energii
wewnętrznej, która również jest funkcją temperatury i objętości, znaleźliśmy inną wielkość,
która jest funkcją stanu, a mianowicie entropię substancji. Spróbujmy wyjaśnić, jak ją
obliczamy, oraz co mamy na myśli mówiąc, że jest ona „funkcją stanu". Zajmijmy się
układem w dwóch różnych stanach, podobnych do tych, o których mówiliśmy przy
doświadczeniu z izotermicznym i adiabatycznym rozprężeniem gazu. (Nawiasem mówiąc, nie musimy
mieć tylko dwóch zbiorników w silniku cieplnym, silnik może mieć trzy lub cztery zbiorniki
o różnych temperaturach, w których pochłania ciepło lub je wydziela.) Możemy przechodzić
od jednego stanu do drugiego poruszając się swobodnie po wykresie pV. Inaczej mówiąc,
możemy twierdzić, że gaz jest w pewnym stanie a, a następnie przechodzi w inny stan b
i żądamy przy tym, aby to przejście od stanu a do i było odwracalne. Załóżmy, że wzdłuż
drogi od stanu a do b znajdują się małe zbiorniki ciepła o różnych temperaturach. Ciepło
dQ pobrane od substancji w każdym małym odcinku drogi od a do b jest przekazywane do
odpowiedniego zbiornika o temperaturze odpowiadającej punktowi na tej drodze. Następnie
połączymy wszystkie zbiorniki odwracalnymi silnikami cieplnymi z jednym zbiornikiem
o jednostkowej temperaturze. Gdy zakończymy przeprowadzanie substancji od stanu a do b.
powinniśmy doprowadzić wszystkie zbiorniki do ich stanu początkowego. Ciepło dQ
pobrane od substancji w temperaturze T zostaje przekształcone przez silnik odwracalnyi
a w jednostkowej temperaturze zostanie wydzielona pewna ilość entropii dS:
dS = dQIT.
(44.15)
44-6. ENTROPIA
291
Obliczmy całkowitą ilość wydzielonej
entropii- Różnica entropii, czyli entropia
potrzebna do przejścia ze stanu a do b drogą
wybranego odwracalnego przejścia, równa się
całkowitej entropii, tzn. sumie entropii
pobranych od małych zbiorników cieplnych i
wydzielonych w jednostkowej temperaturze:
-f
dQ
T
(44.16)
ro
5
TO
O
CL
E
ą >a Q
s ©A OY I
r*b
J zbiorniki
doT v Y JL JL X
dw-C\ 0 D U U L
ds-iT T T T
♦ UH
J silniki
'
objętość
44.10. Zmiana entropii podczas przejścia
odwracalnego
Powstaje pytanie: czy powyższa różnica
entropii zależy od wybranej drogi? Istnieje
przecież wiele dróg prowadzących od stanu a do
b. Pamiętajmy, że w cyklu Carnota
pokazanym na rys. 44.6 mogliśmy przejść ze stanu a do c najpierw rozprężając gaz izotermicznie,
a następnie adiabatycznie, lub też moglibyśmy najpierw przejść adiabatę, a następnie
izotermę. Pytamy więc, czy zmiana entropii zachodząca przy przejściu od stanu a do b na
rys. 44.10 jest taka sama na różnych drogach? Musi ona być taka sama, idąc bowiem
najpierw jedną drogą ze stanu a do b i powracając jakąś inną wykonalibyśmy pełny cykl
silnika odwracalnego, w którym, jak wiemy, nie byłoby żadnej straty ciepła na rzecz
zbiornika o jednostkowej temperaturze. W całkowicie odwracalnym cyklu ze zbiornika
o temperaturze jednostkowej nie trzeba też pobierać żadnego ciepła, a więc entropia
potrzebna do przejścia od a do b jest na różnych drogach taka sama. Nie zależy ona zatem
od drogi, a tylko od jej krańcowych punktów. Możemy więc powiedzieć, że istnieje pewna
funkcja, zwana entropią substancji, która zależy tylko od stanu substancji, tzn. tylko od
jej objętości i temperatury.
Można znaleźć funkcję S(V, T), która ma tę właściwość, że gdy liczymy zmianę
entropii przy pomocy ciepła wydzielonego w jednostkowej temperaturze podczas przejścia
Drzez substancję pewnej odwracalnej drogi, to
dQ
T
AS= -?,
(44.17)
gdzie dQ oznacza ciepło pobrane od substancji w temperaturze T. Całkowita zmiana
entropii równa się różnicy między entropią obliczoną w punkcie początkowym i końcowym:
AS = S(Vb,Tb)-S(Va,Ta)
i
-I
dQ
T
(44.18)
Wyrażenie powyższe nie określa całkowicie entropii, lecz podaje tylko różnicę między jej
wartościami dla dwóch różnych stanów. Bezwzględną wartość entropii możemy określić
dopiero po obliczeniu entropii pewnego wybranego stanu.
292
44 ZASADY TERMODYNAMIKI
Długo wierzono, że bezwzględna wartość
entropii nie ma sensu, że można określić
tylko jej różnicę. Wyjście z tej sytuacji
znalazł w końcu Nernst, który zaproponował
twierdzenie, nazwane przez niego
twierdzeniem o cieple; zwane jest ono również trzecią
zasadą termodynamiki. Zasada ta jest bardzo
prosta. Przytoczymy ją tu bez dowodu.
Postulat Nernsta głosi po prostu, że entropia
dowolnego obiektu w temperaturze zera
bezwzględnego równa się zeru. Znamy więc war-
objętość togć- entropii dla jednego stanu, mianowicie
..,,„. ... .. . . dla T=0 wynosi ona 5=0. Dzięki temu mo-
44.11. Zmiana entropii przy przejściu całego J . .
odwracalnego cyklu żerny podać entropię każdego innego stanu.
Aby zilustrować tę ideę, obliczymy entropię
gazu doskonałego. Podczas izotermicznego
rozprężania (będącego procesem odwracalnym) \dQIT=QIT, gdyż temperatura T jest
stała. Dlatego zgodnie z wzorem (44.4) zmiana entropii równa się
S(<v,T)-S(<vfc,T) = Mcln^,
a więc S(V, T) = NK\n Fplus pewna funkcja samej tylko temperatury T. W jaki sposób 5
zależy od Tl Wiemy, że w adiabatycznym odwracalnym rozprężaniu nie ma wymiany ciepła.
Wtedy więc entropia nie zmienia się, mimo że zmieniają się V i T tak, że 7Vr-1=const.
Czy potrafisz stąd Czytelniku wywnioskować, że
S(V,T) = Nk In V+ In T La ,
gdzie a jest pewną stałą, która nie zależy ani od V, ani od T, zwaną stałą chemiczną?
[Stała a zależy od gazu, którego entropię obliczamy i można ją wyznaczyć eksperymentalnie
na podstawie twierdzenia Nersta przez pomiar ciepła wydzielonego podczas oziębiania
i skraplania gazu aż do jego zestalenia (lub w przypadku helu aż do osiągnięcia fazy
ciekłej) w temperaturze 0° K. Następnie trzeba obliczyć \dQ\T. Stałą tę można także otrzymać
na drodze teoretycznej za pomocą mechaniki kwantowej i wyrazić ją poprzez stałą Plancka,
ale w bieżącym kursie nie będziemy się tym zajmowali.]
Zwróćmy jeszcze uwagę na pewne własności entropii. Przede wszystkim pamiętamy, że
przy odwracalnym przechodzeniu od stanu a do b entropia substancji zmienia się o Sb—Sa.
Oprócz tego wiemy, że przy przechodzeniu tej drogi entropia, czyli ciepło wydzielone w
zbiorniku o jednostkowej temperaturze, wzrasta zgodnie ze wzorem dS=dQ/T, gdzie dQ
jest ciepłem, które pobieramy od substancji, gdy jej temperatura wynosi T.
Wiemy też, że wykonując cykl odwracalny nie zmieniamy całkowitej entropii całego
układu, ponieważ ciepłu £>, pochłoniętemu w temperaturze 7, oraz ciepłu Q2 wydzielone-
to
3
ra
S
a
E
0)
AS = Sa-Sb
a *
y^b
/ AS=Sb-Sa
44-6. ENTROPIA
293
mu w temperaturze T2 odpowiadają zmiany entropii równe co do wartości bezwzględnej
o przeciwnych tylko znakach, tak że wypadkowa zmiana entropii równa się zeru. A więc
podczas odwracalnego cyklu entropia całości, włączając zbiorniki ciepła, nie zmienia się.
Ta zasada może się wydawać podobna do zasady zachowania energii, ale jest to
podobieństwo pozorne, stosuje się ona bowiem tylko do procesów odwracalnych. Jeżeli uwzględnimy
procesy nieodwracalne, zasada zachowania entropii przestanie obowiązywać.
Podamy teraz dwa przykłady. Najpierw założymy, że nad pewnym obiektem
wykonujemy pracę w sposób nieodwracalny pokonując tarcie, wytwarzamy wtedy ciepło Q w pewnej
temperaturze T Entropia wzrasta o Q/T. Ciepło Q równa się pracy i dlatego gdy wykonamy
pewną pracę przeciwko tarciu, którego doznaje obiekt o temperaturze T, entropia
Wszechświata wzrasta o WIT.
A oto następny przykład procesu nieodwracalnego. Jeżeli zetkniemy dwa obiekty o
różnych temperaturach, powiedzmy 7, i T2, wystąpi przepływ pewnej ilości ciepła od jednego
z nich do drugiego. Włóżmy na przykład gorący kamień do zimnej wody. O ile zmieni się
entropia gorącego kamienia, gdy pewna ilość ciepła AQ zostanie przekazana od T, do T21
Zmaleje ona o AQ/Tt. A o ile zmieni się entropia wody? Wzrośnie o AQjT2. Ciepło
oczywiście będzie płynęło od wyższej temperatury T, do niższej T2, a więc AQ będzie dodatnie,
gdy 7", będzie większe od T2. A zatem zmiana entropii całego Wszechświata będzie
dodatnia i równa różnicy dwóch ułamków
AQ AQ
AS = ~ * (44.19)
T2 7,
Jest więc prawdziwe następujące twierdzenie: w każdym nieodwracalnym procesie
entropia Wszechświata wzrasta. Tylko podczas procesów odwracalnych entropia
pozostanie stała. Ponieważ w rzeczywistości żaden proces nie będzie całkowicie odwracalny,
zawsze będzie musiał nastąpić minimalny chociażby wzrost entropii; procesy odwracalne
są pewną idealizacją takich procesów, w których wzrost entropii jest minimalny.
Niestety, nie będziemy mogli się zajmować termodynamiką zbyt drobiazgowo. Chcemy
tylko zilustrować jej zasadnicze idee i uzasadnić twierdzenia, z jej przedmiotu nie
będziemy bowiem zbyt wiele korzystać w dalszej części tych wykładów. Termodynamika ma
najwięcej zastosowań w technice i w chemii. A więc ci z Was, którzy będą studiować te
dziedziny, zapoznają się z termodynamiką stosowaną. Ponieważ nie ma sensu, byśmy
tym wykładem dublowali wykłady techniczne, podamy tu jeszcze pewną dyskusję jej
podstaw teoretycznych, nie wnikając zbytnio w szczegóły związane z bardziej specjalnymi
jej zastosowaniami.
Obie zasady termodynamiki często formułuje się w następujący sposób:
Pierwsza zasada termodynamiki: Energia Wszechświata jest zawsze stała.
Druga zasada termodynamiki: Entropia Wszechświata zawsze wzrasta.
Nie jest to bardzo dobre sformułowanie drugiej zasady termodynamiki. Nie mówi
ono na przykład, że w procesach odwracalnych entropia pozostaje stała, i nie precyzuje,
czym właściwie jest entropia. Jest to tylko wygodny sposób zapamiętania tych dwóch
294
44 ZASADY TERMODYNAMIKI
Tabela 44.1. Podsumowanie zasad termodynamiki
Pierwsza zasada:
Ciepło dostarczone do układu + praca wykonana nad układem = przyrost energii wewnętrznej
układu:
dQ + dW=dU.
Druga zasada:
Nie istnieje proces, klórego jedynym rezultatem byłoby pobranie ciepła ze zbiornika i
zamiana go na pracę. Nie ma silnika cieplnego pochłaniającego ciepło Qt w temperaturze 7\ i
wydzielającego ciepło Q2 w temperaturze T2 i dającego przy tym więcej pracy niż silnik odwracalny, dla
którego
IT, — T2\
w=Ql-Q2=Qly T~y
Entropię układu określamy w następujący sposób:
a. Jeżeli ciepło AQ jest dostarczone odwracalnie do układu w temperaturze T, to przyrost
entropii układu wynosi AS=AQIT.
b. W temperaturze 7"=0, 5=0 {trzecia zasada).
Podczas zmian odwracalnych całkowita entropia wszystkich części układu (włączając zbiorniki
ciepła) nie ulega zmianie.
Podczas zmian nieodwracalnych całkowita entropia układu zawsze wzrasta.
zasad, który nie wiele mówi, o co właściwie chodzi. Zasady omawiane w niniejszym
rozdziale zebraliśmy w tab. 44.1. W następnym rozdziale zastosujemy je do wykrycia
zależności między ciepłem wytwarzanym podczas rozciągania gumy i dodatkowym
napięciem, które powstaje przy jej ogrzewaniu.
45
Zastosowania termodynamiki
45-1. Energia wewnętrzna
Termodynamika stosowana jest trudnym i złożonym przedmiotem. Dlatego nie
byłoby celowe zagłębianie się w tę dziedzinę podczas naszego wykładu. Oczywiście, ma
ona wielkie znaczenie dla inżynierów i chemików i zainteresowani mogą się z nią
zapoznać na wykładach chemii fizycznej lub termodynamiki technicznej. Istnieją także bardzo
dobre podręczniki, np. Zemansky'ego Heat and Thermodynamics (Ciepło i
termodynamika)**.
Dziedzina termodynamiki jest dlatego tak skomplikowana, że zawiera wiele różnych
sposobów mówienia o tym samym. Jeżeli chcemy opisać zachowanie się gazu, to
możemy powiedzieć, że ciśnienie zależy od temperatury i objętości albo że objętość zależy od
temperatury i ciśnienia. Mówiąc zaś o energii wewnętrznej U możemy twierdzić, że
zależy ona od temperatury i od objętości — jeżeli wybraliśmy właśnie te zmienne — lecz
możemy także powiedzieć, że zależy od temperatury i od ciśnienia albo od ciśnienia i od
objętości itd. W poprzednim rozdziale zajmowaliśmy się jeszcze jedną funkcją
temperatury i objętości, entropią S. Oczywiście, możemy skonstruować dowolnie wiele innych
funkcji tych zmiennych. Tak na przykład U— TS jest też funkcją temperatury i objętości.
A więc mamy wiele różnych wielkości, które mogą być funkcjami wielu różnych
kombinacji zmiennych
*> W języku polskim ukazały się następujące podręczniki z termodynamiki: K. Gumiński,
Termodynamika, PWN, 1955; K. Gumiński, Termodynamika procesów nieodwracalnych, PWN, 1962; J. We-
rle. Termodynamika fenomenologiczna, PWN, 1957; K. Zalewski, Wykłady z termodynamiki
fenomenologicznej i statystycznej. PWN, 1966. (Przyp. tłum.)
296
45. ZASTOSOWANIA TERMODYNAMIK
W niniejszym rozdziale dla uproszczenia postanawiamy od samego początku uważać
temperaturę i objętość za zmienne niezależne. Chemicy jako takich zmiennych używają
temperatury i ciśnienia, ponieważ łatwiej je mierzyć i kontrolować w doświadczeniach
chemicznych. My jednak konsekwentnie pozostaniemy przy temperaturze i objętości,
poza jednym wyjątkiem, kiedy zajmiemy się przejściem do chemicznego układu
zmiennych.
Po pierwsze, uwzględnimy więc tylko jeden układ zmiennych niezależnych:
temperaturę i objętość. Po drugie, omówimy tylko dwie zależne funkcje: energię wewnętrzną
i ciśnienie. Wszystkie inne funkcje można z nich wyprowadzić, a więc nie musimy się
nimi zajmować. Po tych ograniczeniach termodynamika jest nadal dość skomplikowana,
ale już nie taka straszna.
Na początek trochę matematyki. Jeżeli pewna wielkość jest funkcją dwu zmiennych,
to pojęcie pochodnej tej wielkości wymaga nieco dokładniejszych rozważań niż w
przypadku jednej zmiennej. Co rozumiemy przez pochodną ciśnienia względem temperatury?
Zmiana ciśnienia towarzysząca zmianie temperatury zależy oczywiście częściowo od tego,
co się dzieje z objętością podczas zmiany T. Najpierw musimy określić zmianę V, aby
precyzyjnie zdefiniować pojęcie pochodnej względem T. Możemy na przykład zapytać,
jak zmienia się P ze zmianą T przy stałym V. Jest to po prostu zwyczajna pochodna,
którą zwykle zapisujemy jako dPjdT. Tradycyjnie używamy specjalnego symbolu dP/dT,
który przypomina nam, że P zależy nie tylko od T, ale i od innej zmiennej V, która
pozostaje stała. Będziemy nie tylko używali symbolu d dla zwrócenia uwagi na stałość
innej zmiennej, ale oprócz tego będziemy zapisywali tę zmienną, której wartość jest stała,
przy symbolu pochodnej: (dP/dT)v. Ponieważ mamy do czynienia tylko z dwiema
zmiennymi niezależnymi, więc ten zapis może się wydać przesadny, ale bardzo nam pomoże
w przedzieraniu się przez termodynamiczną dżunglę pochodnych cząstkowych.
Załóżmy, że funkcja f(x,y) zależy od dwóch zmiennych niezależnych: x oraz y. Przez
(df/dx)y rozumiemy po prostu zwyczajną pochodną, obliczoną w zwykły sposób, jeżeli
traktujemy y jako stałą:
(jL\ = iim /(*+^*> >*)-/(*. y)
\dx/y 4x-o Ax
Podobnie określamy
(dl\ = lim /(*> ■>'+^>)-/(*»>)
\dyjx /),-o Ay
Jeżeli na przykład f(x,y)=x2 + xy, to (df/dx)y = 2x+y oraz (df/dy)x=x. To
postępowanie możemy rozciągnąć też na pochcdne wyższych rzędów: d2f/dy2 lub c2f/dy dx. Ostatni
symbol wskazuje, że najpierw różniczkujemy / względem x, traktując y jako stałą, a
następnie wynik różniczkujemy względem y, traktując x jako stałą. Kolejność wykonywania
różniczkowań nie jest istotna: d2f/dx dy=d2f/dy dx.
Będzie nam potrzebna zmiana Aj funkcji f(x, y), gdy x zmieni się na x + Ax, a y zmieni
się na y + Ay. Cały czas przyjmujemy, że Ax oraz Ay są nieskończenie małe:
45-1. ENERGIA WEWNĘTRZNA
297
Af=f(x + Ax, y + Ay)-f(x,y) =
=f(x + Ax,y + Ay)-f(x,y + Ay)+j(x,y + Ay)-f(x,y) =
Ax
W,
Ay
(Ił
(45.1)
Ostatnie równanie jest podstawową zależnością wyrażającą Af przy pomocy Ax i Ay.
Jako przykład korzystania z tej zależności obliczymy zmianę energii wewnętrznej
U(T. V), gdy temperatura zmienia się od T do T+AT, a objętość zmienia się od V do
V+AV. Korzystając z równania (45.1), piszemy
AU = AT[ — )
fdU\
+ AV —-
VvJi
(45.2}
W naszym ostatnim rozdziale znaleźliśmy inne wyrażenie dla zmiany energii wewnętrznej
Al) na skutek dostarczenia do gazu ciepła AQ:
AU=AQ-PAV
(45.3)
Porównując równania (45.2) oraz (45.3) można z początku przypuszczać, że P=(dU/6V)T,
ale to nie jest słuszny wniosek. W celu otrzymania poprawnej zależności załóżmy najpierw,
że dostarczymy ciepło AQ do gazu przy stałej objętości, tak że AV=§. Przy zlK=0
równanie (45.3) mówi nam, że AU = AQ, a z równania (45.2) wiemy, że AU=(dU/dT)vAT
a więc {dUldT)v = AQjAT. Stosunek AQ/AT, ilość ciepła, którą trzeba dostarczyć do
substancji, aby zmienić jej temperaturę
o jeden stopień przy stałej objętości,
nazywamy ciepłem właściwym przy stałej
objętości. Oznaczamy je symbolem Cv.
Udowodniliśmy więc, że
fd-v) -o
(45.4)
Następnie znów dostarczmy do gazu
ciepło AQ, ale tym razem utrzymujemy
stałą temperaturę T, i dopuśćmy zmianę
objętości o A V. Analiza tego przypadku jest
bardziej skomplikowana, ale można
obliczyć A U z twierdzenia Carnota korzystając
* cyklu Carnota, którym zajmowaliśmy
S'C w poprzednim rozdziale.
Wykres zależności ciśnienie-objętość
dla cyklu Carnota widzimy na rys. 45.1.
Jak już wykazaliśmy, całkowita praca
wykonana przez gaz w cyklu odwracalnym
45.1. W>kres zależności ciśnienia od objętości
w cyklu Carnota. Krzywe oznaczone
symbolami T oraz T- AT są izotermami. Dwie
pozostałe strome krzywe są adiabatami. AV oznacza
zmianę objętości wywołaną dostarczaniem do
gazu ciepła AQ w stałej temperaturze T. AP
oznacza zmianę ciśnienia przy stałej objętości
gazu, gdy jego temperatura zmienia się od
T do T- AT
T-AT
objętość
298
45. ZASTOSOWANIA TERMODYNAMIKI
Pi
T
45.2. Powierzchnia zakreskowana =
powierzchni ograniczonej liniami
przerywanymi = powierzchni prostokąta = AP A V
równa się AQ(A T/T), gdzie AQ oznacza ciepło
dostarczone do gazu, który rozszerza się izo.
termicznie w temperaturze T od objętości Vd0
V+AV, a F-zirjest końcową temperaturą
osiąganą przez gaz, który rozszerza się
adiabatycznie na drugim odcinku cyklu.
Udowodnimy, że praca ta równa się polu zakresko-
wanemu na rys. 45.1. W każdych warunkach
praca wykonana przez gaz równa się JZ' dV \
jest dodatnia, gdy gaz się rozszerza, a ujemna
przy sprężaniu gazu. Jeżeli wykreślimy
funkcję P w zależności od V, to zmianę P i y
przedstawia krzywa, która w każdym
punkcie podaje wartość P odpowiadającą
wybranej wartości V. Gdy objętość zmienia się
od jednej wartości do drugiej, praca wykonana przez gaz, a więc całka \P dV równa
się powierzchni leżącej pod krzywą łączącą początkową i końcową wartość V. Gdy
zastosujemy powyższe rozumowanie do cyklu Carnota, zwracając uwagę na znak pracy
wykonanej przez gaz, widzimy, że po przejściu całego cyklu praca gazu równa się
powierzchni zakreskowanej na rys. 45.1.
Teraz chcemy obliczyć tę powierzchnię geometrycznie. Cykl, który wykreśliliśmy na
rys. 45.1 różni się od stosowanego w poprzednim rozdziale tym, że obecnie uważamy
AT oraz AQ za nieskończenie małe. Obecnie cykl przebiega między adiabatami i
izotermami położonymi bardzo blisko siebie, a więc figura ograniczona grubymi liniami
na rys. 45.1 będzie zbliżała się do równoległoboku, w miarę jak przyrosty AT oraz AQ
będą dążyły do zera. Powierzchnia tego równoległoboku równa się AVAP, gdzie AV
jest zmianą objętości przy dostarczaniu energii AQ do gazu w stałej temperaturze, a AP
jest zmianą ciśnienia, wywołaną zmianą temperatury o AT przy stałej objętości. Można
łatwo udowodnić, że powierzchnia zakreskowana na rys. 45.1 równa się iloczynowi AP 4ł
stwierdzając, że równa się ona powierzchni ograniczonej przez linie przerywane na
rys. 45.2. Ta zaś z kolei różni się od prostokąta o bokach AP\ AV tylko o pola równych
trójkątów dodanych i odjętych na rys. 45.2.
Podsumujmy wyniki naszych dotychczasowych rozważań:
praca wykonana przez gaz = powierzchnia zakreskowana = A\ AP
czyli
~-<t)
AT
x (ciepło potrzebne do zmiany \ o A \ ),
Walc r '
= Jl x (/miana P, gdy T zmienia się o JT).
stale Vi
czyli
x (ciepło potrzebne do /mianv \ o AV )T=T(dPldT)v
1\
(45.?)
i-[. ENERGIA WEWNĘTRZNA
299
Równanie (45.5) wyraża istotną treść twierdzenia Carnota. Z równania tego oraz z
pierwszej zasady termodynamiki zapisanej w postaci równania (45.3) można wyprowadzić
całą termodynamikę. W istocie rzeczy równanie (45.5) wyraża drugą zasadę
termodynamiki, chociaż początkowo było ono wyprowadzone przez Carnota w nieco innej postaci,
ponieważ nie korzystał on z naszej definicji temperatury.
Teraz już możemy obliczyć (dU/dV)T. O ile zmienia się energia wewnętrzna U, jeżeli
zmienimy objętość o AV1 Po pierwsze, U zmienia się na skutek dopływu ciepła, a po
drugie, na skutek wykonanej pracy. Ciepło dostarczone równa się
zgodnie z równaniem (45.5), a praca wykonana nad substancją wynosi — PAV. Zmiana
energii wewnętrznej o AU składa się zatem z dwóch części:
(dP\
ll/=T(— )
AV-PAV. (45.6)
Dzieląc obie strony tego równania przez A V znajdujemy pochodną U względem V przy
stałym T:
(a
■» -T$\-,
W naszej termodynamice, w której T oraz V są jedynymi zmiennymi niezależnymi, a P
i U jedynymi funkcjami, równania (45.3) i (45.7) są podstawowymi równaniami, z
których można wyprowadzić wszystkie wnioski.
45-2. Zastosowania
Omówimy teraz znaczenie równania (45.7) i zobaczymy, dlaczego odpowiada ono
na pytania postawione przez nas w poprzednim rozdziale. Rozważaliśmy tam
następujmy problem: w teorii kinetycznej jest oczywiste, że wzrost temperatury prowadzi do
^zrostu ciśnienia na skutek wzmocnienia uderzeń atomów o tłok. Gdy pozwolimy, żeby
"ok się wysuwał, to dla tych samych powodów fizycznych gaz oddaje ciepło i w celu
trzymania stałej temperatury musimy je dostarczać z zewnątrz. Gaz oziębia się podczas
°zPrężania, a ciśnienie wzrasta podczas ogrzewania gazu. Musi istnieć pewien związek
■ędzy tymi dwoma zjawiskami. Jest on zawarty w równaniu (45.7). Jeżeli objętość po-
s,aJe stała, a zwiększamy temperaturę, przyrost ciśnienia na jednostkę temperatury
równy (dP dT)t Wiąże się z tym następujący wniosek: jeżeli zwiększymy objętość,
się oziębi, chyba że dla utrzymania stałej temperatury dostarczymy pewn«{ ilość ciepła
Wn:ł właśnie (dUjdV)T. Równanie (45.7) wyraża podstawowy związek między tymi
ma zjawiskami. To właśnie obiecaliśmy otrzymać z zasad termodynamiki. Nie
■W wewnętrznej struktury gazu i wiedząc tylko, że nie możemy zrealizować per-
300
45 ZASTOSOWANIA TERMODYNAMIKI
petuum mobile drugiego rodzaju*', jesteśmy w stanie otrzymać związek między ilością
ciepła potrzebną do utrzymania stałej temperatury rozszerzającego się gazu i zmianą
ciśnienia gazu ogrzewanego!
Skoro mamy już poszukiwany wynik dotyczący gazu, wróćmy do naszej gumki. Gdy
rozciągamy gumkę, jej temperatura wzrasta, a przy podgrzewaniu gumka się kurczy.
Jakie równanie da taką samą zależność dla gumki, jak (45.3) dla gazu? W wypadku gumki
sytuacja będzie wyglądała następująco: gdy dostarczymy jej ciepło AQ, jej energia
wewnętrzna zmieni się o A U i ponadto zostanie wykonana pewna praca. Jedyna różnica polega
na tym, że praca wykonana przez gumkę równa się -FAL, a nie PAV, gdzie F oznacza
siłę działającą na gumkę a L jest jej długością. Siła F jest pewną funkcją temperatury
i długości gumki. Zastępując wyrażenie PAVv/ równaniu (45.3) przez —FAL
otrzymujemy
AU = AQ + F AL. (45.8)
Zestawiając równania (45.3) i (45.8) widzimy, że równanie dla gumki otrzymaliśmy
jedynie przez zastąpienie jednych symboli innymi. Ponadto jeżeli zastąpimy V przez L
oraz P przez —F, to wszystko co powiedzieliśmy o cyklu Carnota stosuje się też do gumki.
Możemy na przykład natychmiast wywnioskować, że ciepło A Q potrzebne do zmiany
długości o AL jest dane równaniem analogicznym do równania (45.5): AQ= ~T(dF/dT)LAL.
Równanie to mówi nam, o ile wzrośnie podczas ogrzewania napięcie gumki,
jeśli długość jej się nie zmienia. W tym celu trzeba obliczyć, ile potrzeba ciepła do
utrzymania stałej temperatury, gdy gumkę trochę rozciągniemy. Widzimy więc, że to samo
równanie stosuje się i do gazu i do gumki. Rzeczywiście, pisząc równanie AU=AQ +
+ A AB, gdzie A oraz B przedstawiają różne wielkości, siłę i długość, ciśnienie i objętość,
itd., można stosować wyniki otrzymane dla gazu podstawiając A i B w miejsce P i V.
Zajmijmy się na przykład różnicą potencjałów, „napięciem" E w ogniwie oraz ładunkiem
AZ, który przepływa przez to ogniwo. Wiemy, że praca wykonana przez odwracalne
ogniwo elektryczne, np. przez akumulator, równa się E AZ. (Ponieważ nie uwzględniliśmy
wyrażenia P AV we wzorze na pracę, założyliśmy tym samym, że cały czas utrzymujemy
stałą objętość ogniwa.) Zobaczmy, co może nam powiedzieć termodynamika o pracy
takiego ogniwa. Podstawiając E w miejsce P oraz Z w miejsce V w równaniu (45.6)
otrzymamy
AU fdE\
=-tI)-E. (45.9)
AZ \dTjz
Równanie (45.9) mówi, że zmienia się energia wewnętrzna U, gdy przez ogniwo przepływa
ładunek AZ. Dlaczego AU\AZ nie równa się po prostu E — napięciu baterii? Otóż
dlatego, że podczas przepływu prądu rzeczywiste ogniwo się ogrzewa. Energia wewnętrzna
ogniwa zmienia się z dwóch powodów. Po pierwsze — wykonuje ono pewną pracę w ob-
*' To znaczy skonstruować urządzenie, które dostarczałoby pracę kosztem pobierania ciepła ze
zbiornika o stałej temperaturze bez dodatkowych zmian w układzie lub w otoczeniu. (Przyp. red.
wydarło rts^lclri^ort \
45-2. ZASTOSOWANIA
301
wodzie zewnętrznym, a po drugie — ogniwo się ogrzewa. Należy zwrócić uwagę, że tę
drugą przyczynę można znów wyrazić przez zmianę napięcia baterii na skutek zmiany
temperatury. Nawiasem mówiąc, gdy ładunki elektryczne przepływają przez ogniwo,
zachodzą tam reakcje chemiczne i równanie (45.9) wskazuje wygodny sposób pomiaru
energii potrzebnej do zajścia reakcji chemicznej. W tym celu należy tylko zbudować
ogniwo działające na podstawie odpowiedniej reakcji chemicznej, zmierzyć napięcie
początkowe, a następnie wyznaczyć, jak się ono zmienia w zależności od temperatury, gdy nie
pobieramy prądu z baterii!
Przyjęliśmy, że objętość ogniwa się nie zmienia, ponieważ opuściliśmy wyrażenie
P A V pisząc, że praca wykonana przez ogniwo równa się E AZ. Okazuje się, że
technicznie bardzo trudno utrzymać stałą objętość. Znacznie łatwiej utrzymać ogniwo w stałym
ciśnieniu atmosferycznym. Dlatego chemicy nie lubią równań, które wypisaliśmy
powyżej. Wolą równania opisujące działanie ogniwa w stałym ciśnieniu. Na początku
rozdziału zdecydowaliśmy, że naszymi zmiennymi niezależnymi będą V oraz T. Chemicy
tymczasem wolą P i T, sprawdzimy więc, jak nasze wyniki można zapisać w ich układzie
zmiennych. Bądźmy ostrożni, łatwo bowiem możemy się teraz pomylić, ponieważ
przechodzimy ze zmiennych T i V na T i P.
Zacznijmy od równania (45.3), tzn. od AU=AQ—P AV. Iloczyn P AV można
zastąpić przez E AZ lub A AB. Jeżeli potrafilibyśmy jakoś zastąpić ostatni wyraz, P AV,
wyrazem VAP, wówczas moglibyśmy zastąpić Kprzez Pi chemicy byliby szczęśliwi. Otóż ktoś
sprytny spostrzegł, że różniczka iloczynu PV wynosi d(PV) = PdV+VdP, dodał to do
równania (45.3) i otrzymał:
A(PV) = PAV+V AP
AU= AQ -PAV
A(U + PV)= AQ +V AP.
Aby nasz wynik był podobny do równania (45.3), zdefiniujemy U+PVjako nową wielkość;
nazwiemy ją entalpią (H) i napiszemy AH=AQ+VAP.
Teraz możemy nasze wyniki przełożyć na język chemików za pomocą następujących
reguł: U-*H, P-* — V, V-*P. Tak na przykład, podstawowa zależność, którą chemicy
zastąpiliby równanie (45.7), ma postać:
(^)r--r(E+"-
Wyjaśniliśmy więc już, jak przejść do zmiennych T i P, którymi posługują się chemicy.
Teraz wrócimy do naszych dawnych zmiennych: w dalszym ciągu rozdziału zmiennymi
niezależnymi będą więc T oraz V.
Zastosujemy nasze wyniki do kilku zjawisk fizycznych. Najpierw rozważmy gaz
doskonały. Z teorii kinetycznej wiemy, że energia wewnętrzna gazu doskonałego zależy tylko od
ruchu cząsteczek oraz od ich liczby. Energia wewnętrzna zależy więc od T, a nie od V.
Jeżeli zmieniamy V, utrzymując stałe T, to t/się nie zmienia Dlatego (dlf/dV)T=0 i
równanie (45.7) mówi nam, że dla gazu doskonałego
302
45 ZASTOSOWANIA TERMODYNAMIKI
-P=0. (45.10)
V
Równanie (45.10) jest równaniem różniczkowym, z którego możemy dowiedzieć się czegoś
o funkcji P Możemy potraktować pochodne cząstkowe w następujący sposób. Ponieważ
pochodną cząstkową obliczamy przy stałym V, zastąpimy ją więc przez zwykłą pochodną
i dopiszemy, aby nie zapomnieć „V stałe". Wówczas równanie (45.10) przyjmie postać:
AP
T - -P=0, V stałe. (45.1J)
AT '
co po scałkowaniu daje:
In />=ln T+const, V stałe,
P=const T, V stałe. ( ' )
Wiemy, że ciśnienie gazu doskonałego równa się
RT
P=y (45.13)
co zgadza się z zależnością (45.12), ponieważ V i R są tu stałe. Dlaczego zawracamy sobie
głowę tymi obliczeniami, skoro już dawno znamy ich wyniki? Ponieważ używamy dwu
niezależnych definicji temperatury*. W pierwszym wypadku założyliśmy, że energia
kinetyczna cząsteczek jest proporcjonalna do temperatury, co definiowało jedną skalę temperatur,
którą nazywamy skalą gazu doskonałego. Właśnie w tej skali wyrażone jest T w równaniu
(45.13). Temperaturę mierzoną w skali gazowej nazywamy także temperaturą kinetyczną.
W drugim wypadku określiliśmy temperaturę inaczej, zupełnie niezależnie od jakiejkolwiek
substancji. Opierając się na drugiej zasadzie termodynamiki określiliśmy coś, co można
nazwać „termodynamiczną temperaturą bezwzględną" T, która występuje w równaniu (45.12).
Udowodniliśmy w ten sposób, że ciśnienie gazu doskonałego (zdefiniowanego tak, że jego
energia wewnętrzna nie zależy od objętości) jest proporcjonalne do „termodynamicznej
temperatury bezwzględnej". Wiemy także, że ciśnienie jest proporcjonalne do temperatury
mierzonej w skali gazowej. Możemy stąd wywnioskować, że temperatura kinetyczna jest
proporcjonalna do „bezwzględnej temperatury termodynamicznej". To oczywiście znaczy,
że gdybyśmy byli roztropni, moglibyśmy obie skale uzgodnić. Przynajmniej w tym przypadk u
wybrano je tak, by się zgadzały, by stała proporcjonalności równała się jedności. Na ogół
ludzie utrudniają sobie życie, ale tym razem wybrali obie skale równe!
45-3. Równanie Claosiusa-Clapeyrona
Wyniki, które otrzymaliśmy, można także zastosować przy opisie parowania cieczy.
Weźmy zbiornik z cieczą, którą możemy sprężać za pomocą tłoka i zastanówmy się, jak się
zmienia ciśnienie wraz z objętością, jeżeli utrzymamy stałą temperaturę. Inaczej mówiąc,
'G
45-3. RÓWNANIE CLAUS1USA-CLAPEYRONA
303
ciecz
i para
V
T-AT
pata
objętość
45.3. Izotermy pary sprężanej w zbiorniku.
Z lewej strony — substancja w fazie ciekłej, na
prawo — para tej substancji, w środku —
w zbiorniku oba stany występują jednocześnie
chcemy na wykresie P-V poprowadzić
izotermę. Substancja zawarta w cylindrze
nie jest jak poprzednio gazem doskonałym.
Może ona teraz występować w fazie ciekłej
lub lotnej albo w obu fazach jednocześnie.
Jeżeli wywrzemy dostateczne ciśnienie,
substancja będzie się skraplała. Jeżeli
jeszcze bardziej ją ściśniemy, objętość będzie
się zmieniać bardzo nieznacznie i nasza
izoterma będzie gwałtownie rosnąć przy
dalszym zmniejszaniu objętości, co widać
w lewej części rys. 45.3.
Jeżeli będziemy zwiększać objętość
wysuwając tłok ze zbiornika, to ciśnienie
początkowo będzie maleć aż do chwili, kiedy
ciecz zacznie wrzeć i będzie tworzyła się
para. Teraz dalsze wysuwanie tłoka spowoduje tylko wyparowanie większej ilości cieczy.
Część zbiornika będzie więc wypełniała ciecz, a część para, czyli obie te fazy będą w
równowadze — z jednakową szybkością będzie się odbywać parowanie cieczy i kondensacja pary.
Jeżeli zrobimy więcej miejsca dla pary, to musi wytworzyć się jej więcej, aby utrzymać
stałe ciśnienie, a więc wyparuje trochę więcej cieczy, ale ciśnienie pozostanie takie samo.
Na poziomej części krzywej z rys. 45.3 ciśnienie nie zmienia się i jego wartość nosi nazwę
ciśnienia pary nasyconej w temperaturze T. Gdy w dalszym ciągu będziemy zwiększać
objętość, osiągniemy moment, w którym
zabraknie cieczy do tworzenia pary. Od tej
chwili dalsze zwiększanie objętości
spowoduje spadek ciśnienia, jak w wypadku
zwykłego gazu, co widać w prawej części
wykresu P-V. Niższa krzywa na rys. 45.3
jest izotermą wykreśloną dla nieco niższej
temperatury T—AT. Ciśnienie cieczy jest
wówczas nieco niższe, gdyż ciecz się
rozszerza przy podwyższeniu temperatury
(dla większości substancji, ale nie dla
wody blisko punktu zamarzania), i,
oczywiście, ciśnienie pary jest niższe w niższej
temperaturze.
Wykonajmy teraz cykl wzdłuż dwu
izoterm łącząc je (np. za pomocą adia-
bat) na końcach ich poziomych części,
•ak jak na rys. 45.4. Mały skok krzywej
w dolnym prawym rogu rysunku nie jest
istotny i dlatego pominiemy go. Posłużymy
45.4. Wykres zależności ciśnienia od objętości
pary zawartej w zbiorniku dla cyklu Carnota.
Po lewej stronie — substancja w stanie ciekłym.
Ciepło L potrzebne do wyparowania cieczy jest
dostarczone w temperaturze T. Para rozszerza
się adiabatycznie, gdy temperatura T przechodzi
w temperaturę T—AT
AP
_I_
T
T-AT
V9
objętość
304
45. ZASTOSOWANIA TERMODYNAMIKI
się rozumowaniem Carnota, które nam określi, jak ciepło dostarczone substancji podczas
przejścia ze stanu ciekłego do lotnego wiąże się z pracą wykonaną przez substancję
podczas wykonywania cyklu. Niech L będzie ciepłem potrzebnym do wyparowania
substancji zawartej w zbiorniku. Z rozważań poprzedzających równanie (45.5) wiemy, że
L(AT\T) = pracy wykonanej przez substancję. Jak poprzednio, praca ta równa się polu
objętemu krzywą, które w przybliżeniu równa się AP(Vg — Vc), gdzie AP jest różnicą ciśnienia
pary nasyconej przy dwóch temperaturach Ti T—AT, Vg jest objętością gazu, a Vc —
objętością cieczy. Obie te objętości są mierzone przy ciśnieniu równym ciśnieniu pary
nasyconej. Przyrównując te dwa wyrażenia na pole, otrzymujemy L(ATIT)=AP(Vg — Vc)
lub
L -"- (45,4)
T(Vg-Vc) dT
Równanie (45.14) podaje zależność między zmianą ciśnienia pary nasyconej wraz z
temperaturą i ilością ciepła potrzebną do wyparowania cieczy. Zależność tę wyprowadził Carnot,
lecz nazywa się ją równaniem Clausiusa-Clapeyrona.
Porównajmy teraz równanie (45.14) z wynikami otrzymanymi na podstawie teorii
kinetycznej. Zwykle Vf jest znacznie większe od Vc. Dlatego Vg — Vr-vVt = RT/P dla
jednego mola. Jeżeli oprócz tego założymy, że L jest stałe, niezależne od temperatury — co nie
jest zbyt dobrym przybliżeniem — wtedy dP/dT=L/(RT2/P). Równanie to ma następujące
rozwiązanie:
P=const-e~LJRT. (45.15)
Porównajmy ten wynik z zależnością ciśnienia od temperatury, którą otrzymaliśmy
wcześniej na podstawie teorii kinetycznej. Teoria kinetyczna wskazywała, z grubsza biorąc,
że liczba cząsteczek pary znajdujących się nad cieczą równa się
n=^-exp\_-(Ug-Uc)IRT], (45.16)
'A
gdzie Ug — Uc jest różnicą energii wewnętrznej jednego mola w gazie i w cieczy, czyli jest
energią potrzebną do wyparowania jednego mola cieczy. Termodynamiczne równanie
(45.15) i równanie kinetycznej teorii gazów (45.16) są bardzo podobne, ponieważ ciśnienie
wynosi nkT; nie są jednak identyczne. Równania te byłyby identyczne, gdybyśmy przyjęli
że L — Ut = const, zamiast L=const. Skoro założymy, że L — Ug = const, niezależnie od
temperatury, wówczas postępowanie prowadzące do równania (45.15) doprowadzi nas
do równania (45.16).
To porównanie wskazuje na zalety i braki termodynamiki w zestawieniu z teorią
kinetyczną. Przede wszystkim równanie (45.14) otrzymane z termodynamiki jest ścisłe, podczas
gdy równanie (45.16) jest przybliżone i jest słuszne tylko przy założeniu, że U jest prawie
stałe i że nasz model jest prawdziwy. Ponadto nie musimy wcale widzieć, w jaki naprawdę
sposób gaz przechodzi w ciecz; niezależnie od wszystkiego równanie (45.14) jest poprawne,
podczas gdy (45.16) jest tylko przybliżeniem. Co więcej, chociaż nasze rozważania stosują
się do gazu skraplającego się w ciecz, to podane tu rozumowanie jest słuszne dla dowolnej
45-3. RÓWNANIE CLAUSIUSA-CLAPEVRONA
305
z,miany stanu. Tak na przykład, przejście ciała stałego w ciecz jest określone przez taką samą
krzywą jak na rys. 45.3 oraz 45.4. Wprowadzając utajone ciepło topnienia, A//mol,
otrzymujemy wzór analogiczny do równania (45.14), tzn.(dPtop/dT)y = Ml[T(VciKŁ- Kcialo state).
Gdybyśmy nawet nie znali kinetycznej teorii procesu topnienia, otrzymalibyśmy poprawne
równanie. Ze znajomością teorii kinetycznej jest jednak związana inna zaleta. Równanie
(45.14) jest tylko zależnością różniczkową i nie znamy sposobu otrzymania stałych
całkowania. W teorii kinetycznej możemy natomiast otrzymać także i te stałe, pod warunkiem,
że posłużymy się dobrym modelem, który w sposób zupełny opisze całe zjawisko. Istnieją
wiec wady i zalety obu opisów. Gdy wiedza nasza jest niepełna, a opisywane zjawisko
złożone, to zależności termodynamiczne są rzeczywiście najskuteczniejsze. Gdy natomiast
sytuacja jest prosta i można dokonać jej analizy od strony teoretycznej, wówczas lepiej za
pomocą tej analizy wydobyć możliwie najwięcej informacji.
Rozpatrzmy jeszcze jeden przykład: promieniowanie ciała czarnego. Zajmowaliśmy
się zbiornikiem zawierającym Samo promieniowanie. Mówiliśmy o równowadze między
oscylatorem i promieniowaniem. Przekonaliśmy się także, że fotony uderzając o ściany
zbiornika wywierają na nie ciśnienie P i obliczyliśmy, że PV= U/3, gdzie U oznacza
całkowitą energię wszystkich fotonów, a V — objętość zbiornika. Jeżeli wstawimy U=3PV do
podstawowego równania (45.7), otrzymamy.
Ponieważ objętość naszego zbiornika jest stała, możemy zastąpić wyrażenie (dP/8T)y
wyrażeniem dPjdT i otrzymujemy zwykłe równanie różniczkowe, które możemy scałkować:
In /*=41n r+const, czyli />=stała-T'4. Ciśnienie promieniowania zmienia się jak
temperatura podniesiona do czwartej potęgi, a gęstość energii promieniowania U/ V= P/3 także
zmienia się jak T*. Zwykle się pisze U/ V=(4c[c) T*, gdzie c jest szybkością światła a a jest
stałe. Wartości a nie można otrzymać na podstawie samej tylko termodynamiki. Jest to
właśnie dobry przykład jej możliwości i ograniczeń. Pokazanie, że U/V zmienia się jak
7** jest dużym osiągnięciem, ale aby wiedzieć, czemu równa się U/V w dowolnej
temperaturze, musimy poznać takie szczegóły, jakich dostarczyć może tylko pełna teoria. Dla
promieniowania ciała czarnego znamy taką teorię i dlatego możemy wyprowadzić
wyrażenie dla stałej a; uczynimy to w następujący sposób.
Niech I(co) dat oznacza rozkład natężenia promieniowania, to znaczy strumień energii
promieniowania o częstości zawartej między co a co + dco, przepływający przez 1 m2 w ciągu
1 s. Rozkład gęstości energii = energia/objętość = I(co) dto/c. Stąd
U
— = całkowita gęstość energii =
CO
= f(gcslość energii w przedziale między u> a cj + dlO =
u)= 0
o
306
«. ZASTOSOWANIA TERMODYNAMIKI
Z naszych poprzednich rozważań wiemy, że
ha>3
Podstawiając to wyrażenie dla I(w) do naszego równania na UjV otrzymujemy
00
u _ i r
e*"*r- 1
Jeżeli w naszej całce dokonamy zmiany zmiennej x = hwjkT, to
~F~fcV?J e'-1'
Całka ta równa się po prostu pewnej liczbie, którą moglibyśmy w przybliżeniu otrzymać
wykreślając krzywą i wyznaczając pole ograniczonej przez nią powierzchni. Równa się ono
w przybliżeniu 6,5. Znajdujący się wśród nas matematycy mogą udowodnić, że całka ta
równa się dokładnie ji*/I5 *\ Porównując to wyrażenie z U/V=(4c/c)T*, znajdujemy o:
*V . ,_ _p W
a= r-r = 5,67-10
60fiV * m2 deg*"
Wyobraźmy sobie, że w zbiorniku jest mały otwór i zapytajmy: ile energii wypłynie
w ciągu sekundy przez otwór o jednostkowej powierzchni? Aby przejść od gęstości energii
do strumienia energii, mnożymy gęstość energii U/V przez c. Mnożymy ją także przez J,
co jest iloczynem następujących dwóch czynników: pierwszy czynnik \ jest spowodowany
tym, że bierze się pod uwagę tylko energię wypływającą, drugi czynnik \ bierze się stąd,
że energii osiągającej otwór pod innym kątem niż 90° jest trudniej wydostać się na zewnątrz;
uwzględnimy to mnożąc strumień przez cosinus tego kąta. Średnia zaś wartość cosinusa
równa się \. Teraz jest już jasne, dlaczego piszemy U/V=(4c/c)T*: dlatego, abyśmy mogli
stwierdzić, że strumień energii wypływający przez mały otwór równa się oT* na jednostkę
powierzchni.
*' Ponieważ (e*—l)~l =c~*+e'2* +..., więc całka równa się
00 00
-« 3
C
«-l Ó
AleJe~"dx=l/« i różniczkując trzykrotnie względem n otrzymujemy/ x3e~"dx=6/n*, także całka
o o
równa się 6(1+-^+^+...). Uzyskamy wystarczająco dobre przybliżenie biorąc tylko kilka piw
wszych wyrazów. W rozdziale 50 podamy sposób udowodnienia, że suma odwrotności czwartych
potęg liczb całkowitych równa się rzeczywiście n*/90.
46
Mechanizm zapadkowy
46-1. Jak pracuje zębatka
W rozdziale niniejszym zajmiemy się bardzo prostym mechanizmem, który sprawia,
że oś obraca się tylko w jedną stronę. Możliwość zbudowania takiego urządzenia wymaga
dokładnego i ostrożnego badania, z którego wynikają bardzo interesujące wnioski.
Zamiar omawiania tego urządzenia wynikł z chęci podania elementarnego, opartego
na teorii kinetycznej wyjaśnienia faktu, że istnieje maksymalna praca, którą może wykonać
silnik cieplny. Oczywiście, znamy już istotę twierdzenia Carnota, ale byłoby przyjemnie
znaleźć wyjaśnienie, które jest elementarne w tym sensie, że umożliwiałoby zrozumienie
fizycznych powodów tego, co się dzieje. Wprawdzie istnieją skomplikowane matematyczne
metody oparte na prawach Newtona, z których wynika, że można otrzymać tylko
ograniczoną ilość pracy, gdy ciepło przepływa z jednego miejsca do drugiego, jednak bardzo
trudno przedstawić je w elementarnym sformułowaniu. Krótko mówiąc, nie rozumiemy ich,
chociaż doskonale radzimy sobie z matematyką.
W dowodzie Carnota to, że przy przejściu od jednej temperatury do drugiej można
otrzymać tylko pewną określoną ilość pracy, wynika z innego niż prawa Newtona
aksjomatu. Aksjomat ten mówi, że jeżeli wszystkie części jakiegoś układu mają taką samą
temperaturę, to nie można zamienić ciepła na pracę w wyniku procesu cyklicznego. Najpierw
spróbujmy się przekonać na jednym przynajmniej przykładzie elementarnym, dlaczego
to prostsze twierdzenie jest słuszne.
Spróbujmy wynaleźć urządzenie, które naruszałoby drugą zasadę termodynamiki.
Urządzenie to powinno przekształcać ciepło wzięte ze zbiornika na pracę przy jednakowej
temperaturze wszystkich elementów układu. Weźmy zbiornik z gazem o pewnej
temperaturze, wewnątrz którego znajduje się oś z przymocowanym do niej wiatraczkiem (jak
na rys. 46.1, gdzie na razie Tt = T2 = T). Na skutek uderzeń cząsteczek wiatraczek drga.
308
46 MECHANIZM ZAPADKOWY
Na drugim końcu osi umieszczamy kółko
zębate, czyli zębatkę z zapadką, które dzięki
zapadce może obracać się tylko w jednym
kierunku. Kółko się obróci, gdy oś drgnie w
jednym kierunku,, natomiast pozostanie
nieruchome, gdy uderzenia cząsteczek gazu o
wiatraczek będą usiłowały obrócić oś w stronę
przeciwną. W wyniku tego kółko będzie się powoli
obracało i moglibyśmy nawet przywiązać pchłę
46.1. Mechanizm zapadkowy do nitki Porzuconej przez bęben umieszczony
na osi i podnieść ją do góry! Zastanówmy się
teraz, czy jest to możliwe? Zgodnie z hipotezą
Carnota, oczywiście nie. Ale na pierwszy rzut oka, prima facie, może to się wydawać
całkiem możliwe. Musimy więc lepiej się temu zjawisku przyjrzeć. I rzeczywiście, kiedy
dokładniej obejrzymy kółko zębate i zapadkę zauważymy liczne komplikacje.
Przede wszystkim nasze idealne urządzenie jest tak proste, jak tylko możliwe, ale mimo
to jest w nim zapadka, a więc musi być i dociskająca ją sprężynka. Sprężynka jest niezbędna,
aby po przeskoczeniu jednego zęba, zapadka mogła znów przyciskać kółko.
Bardzo istotna jest jeszcze inna cecha naszego urządzenia, której zresztą nie można
dostrzec z rysunku. Załóżmy, że całe urządzenie jest zbudowane z idealnie sprężystych
części. Skoro tylko kółko podniesie zapadkę na wysokość zęba, to sprężynka dociskając ją
do kółka spowoduje jej ześlizgnięcie się z zęba — zapadka odskoczy i zacznie drgać. Może
się wtedy zdarzyć, że przy przeciwnym ruchu łopatek kółko będzie mogło się z powrotem
obrócić, gdyż ząb będzie mógł przesunąć się pod zapadką w momencie, kiedy będzie
podniesiona! Dlatego istotną przyczyną nieodwracalności ruchu naszego kółka jest mechanizm
tłumiący drgania zapadki. Kiedy już występuje takie tłumienie, energia drgań zapadki
przechodzi oczywiście do kółka w postaci ciepła. Obracając się kółko zacznie się więc
ogrzewać. Aby wszystko uprościć, możemy kółko otoczyć gazem, który by część ciepła
pochłonął. W każdym razie gaz będzie się ogrzewać wraz z kółkiem. Czy będzie tak stale?
Nie! Zapadka i kółko, w tej samej temperaturze T, wykonują także ruchy Browna. Te ruchy
powodują, że od czasu do czasu zapadka przypadkowo sama podnosi się nad ząb właśnie
w chwili, gdy ruchy Browna działające na łopatki próbują obrócić oś do tyłu. I gdy całe
urządzenie się ogrzewa, zdarza się to coraz częściej.
Taki jest właśnie powód, dla którego nasze urządzenie nie znajduje się w ciągłym ruchu.
Gdy cząsteczki uderzają o łopatki, zapadka niekiedy podnosi się nad ząb. Ale czasami,
gdy kółko próbuje się obrócić w przeciwną stronę, zapadka jest podniesiona dzięki ruchom
Browna i może ono obrócić się z powrotem. Tak więc wypadkowy wynik równa się zeru.
Nietrudno udowodnić, że w przypadku równych temperatur po obu stronach urządzenia
średni ruch kółka nie istnieje. Oczywiście, kółko ciągle skacze w obie strony, ale nie robi
tego, o co nam chodzi,- to znaczy nie obraca się stale w tym samym kierunku.
Zobaczmy, dlaczego tak się dzieje. Do podniesienia zapadki nad ząb niezbędna jest
pewna praca wykonana przeciwko sprężynce. Oznaczmy tę pracę e i niech 6 oznacza kąt
między zębami. Prawdopodobieństwo, że układ zgromadzi dostateczną energię e do podnie-
46-1. JAK PRACUJE ZĘBATKA
309
sienią zapadki nad ząb równa się e_"kr. Ale prawdopodobieństwo tego, że zapadka
znajduje się przypadkowo w górze, także wynosi e"£'*T Dlatego liczba przypadków, w których
zapadka jest uniesiona i kółko może swobodnie się poruszać do tyłu równa się liczbie
przypadków, w których mamy energię dostateczną do obrócenia kółka do przodu, gdy
przyciska je zapadka. W ten sposób osiągamy „równowagę" i kółko nie może się obracać.
46-2. Zębatka w roli silnika
Pójdźmy trochę dalej. Zajmijmy się przykładem, w którym temperatura łopatek wynosi
7",, a temperatura kółka, a zatem i zapadki, T2, przy czym temperatura T2 jest niższa od T,.
Ponieważ kółko jest zimne, a drgania zapadki względnie rzadkie, bardzo trudno jej będzie
osiągnąć energię e, natomiast łopatki, ponieważ temperatura T, jest wysoka, bardzo często
będą miały dostateczną energię e, a więc nasze urządzenie będzie, zgodnie z planem,
działało w jednym kierunku.
Chcielibyśmy wiedzieć, czy może ono podnosić ciężary. Do bębna umieszczonego
na osi przywiązujemy nitkę obciążoną jakimś ciężarem, np. pchłą. Oznaczmy przez L
moment siły wywołanej przez ten ciężar. Jeżeli moment L nie będzie zbyt wielki, nasze
urządzenie podniesie ciężar, gdyż ruchy Browna spowodują, że kółko będzie się poruszało
raczej w jednym kierunku. Chcemy wiedzieć, jaki ciężar może nasze urządzenie podnieść,
jak szybko się porusza, itd.
Najpierw zajmijmy się ruchem zębatki do przodu, co jest jej naturalnym zadaniem.
Ile energii należy pobrać od łopatek, aby zębatka wykonała jeden skok naprzód? Do
podniesienia zapadki potrzebna jest energia e. Ponadto kółko obracając się o kąt 6 pokonuje
moment siły L, musimy więc dostarczyć mu jeszcze energię LB. Dlatego całkowita energia,
jaką musimy pobrać od łopatek równa się e+L6. Prawdopodobieństwo uzyskania takiej
energii jest proporcjonalne do exp [ — (e +L8)/kTl]. Właściwie nie chodzi nam tylko o samo
otrzymanie tej energii, ale powinniśmy także wiedzieć, ile razy nastąpiło to w ciągu sekundy.
Prawdopodobieństwo na sekundę jest proporcjonalne do exp [ — (e4-L8)/k 7", ], a
współczynnik proporcjonalności oznaczymy l/r, zresztą i tak skróci się on na końcu obliczeń. Po
przejściu jednego kroku praca wykonana nad ciężarem wynosi LB. Energia pobrana od
łopatek równa się e+L6. Sprężynka podskoczy z energią e, następnie wykona parę drgań,
opadnie i zamieni swoją energię na ciepło. Cała otrzymana energia zostanie zużyta na
podniesienie ciężarka i wprawienie w ruch zapadki, która przeskakując przekaże ciepło
kółku.
Z kolei zajmijmy się przypadkiem ruchu wstecz. Jak się on odbywa? W celu wykonania
takiego ruchu musimy tylko dostarczyć energii do podniesienia zapadki tak wysoko, aby
kółko mogło się pod nią prześlizgnąć. Ta energia też równa się e. Prawdopodobieństwo na
sekundę podniesienia się zapadki na odpowiednią wysokość równa się teraz (l/r) exp ( — efkT2) ■
Stała proporcjonalności jest nadal taka sama, ale ze względu na inną temperaturę
pojawiło się teraz kT2. W tych warunkach praca zostanie oddana, ponieważ kółko musi
poruszyć się do tyłu. Jeżeli cofnie się o jedno wycięcie, odda pracę LB. Energia wzięta
po stronie zębatki równa się e, a energia oddana do gazu o temperaturze T, po stronie łopa-
310
46. MECHANIZM ZAPADKOWY
tek wynosi LO + e. Nietrudno się przekonać, dlaczego tak się dzieje. Załóżmy, że na skutek
fluktuacji zapadka przypadkowo podniesie się sama. Kiedy następnie opadnie i sprężynka
przyciśnie ją do zęba, wystąpi siła, starająca się obrócić kółko, ponieważ zapadka będzie
się opierać o nachyloną płaszczyznę. Ta siła wykonuje pracę tak samo, jak i siła wywołana
przez ciężarek. Obie składają się na siłę całkowitą, a cała energia, która wyzwala się powoli,
zamienia się na ciepło po stronie łopatek. (Musi oczywiście się wydzielić, ze względu na
zasadę zachowania energii, ale trzeba to uważnie przemyśleć!) Widzimy, że wszystkie te
energie są takie same, różnią się tylko znakiem. A więc zależnie od tego, co jest bardziej
prawdopodobne, ciężarek albo zwolna się podnosi, albo powoli opada. Przy tym oczywiście
ciągle drży, a więc nieznacznie podnosi się i opada, ale nam chodzi o jego średni ruch.
Załóżmy, że dla określonego ciężarka oba prawdopodobieństwa są takie same. Obciążmy
nitkę dodatkowym, nieskończenie małym ciężarkiem. Ciężarek taki powoli opuści się na
dół i nad urządzeniem będzie wykonana praca. Energia zostanie wzięta od kółka i
przekazana łopatkom. Jeżeli natomiast zmniejszymy nieco obciążenie, to brak równowagi
spowoduje coś innego. Ciężarek zostanie podniesiony przy pobraniu ciepła od łopatek i
przekazaniu do zębatki. A więc mamy spełnione warunki odwracalnego cyklu Carnota, jeżeli
ciężarek jest tak dobrany, że szanse obu ruchów są takie same. A to oznacza, że musi
zachodzić (e+LO^Ti =e/T2. Powiedzmy, że urządzenie nasze powoli podnosi ciężarek. To
oznacza, że energia Q, jest pobierana od łopatek, a energia Q2 przekazana zębatce. Przy tym
stosunek tych energii jest równy (e+L0)/e. Jeżeli ciężarek jedzie na dół, to także QilQ2 =
= (e+L0)/e. A więc (tab. 46.I)
QJQ2 = TJT2.
Tabela 46.1. Podsumowanie opisu działania mechanizmu zapadkowego
do przodu: wymagana energia
pobiera od łopatek
wykonuje pracę
przekazuje zapadce
do tylu: wymagana energia
e+LO (od łopatek),
LO+e
L0
B
e (dla zapadki).
pobiera od zapadki e
wyzwala pracę L6
przekazuje łopatkom L8+e
Jeżeli układ jest odwracalny,
rJ-Ff)
to prawdopodobieństwa są równe. Stąd —-—- =
Ti
ciepło do zapadki e
ciepło od łopatek L9+e
Stąd *-TL
Ti
skąd prawdopodobieństwo =
= —exp[-(L0+e)/*7\]
T
skąd prawdopodobieństwo =
= — exp { — elkTt)
X
tak samo poprzednio, ale
z przeciwnym znakiem
46-2. ZĘBATKA W ROLI SILNIKA
311
ponadto stosunek pracy wykonanej przez nasze
urządzenie do energii pobranej od łopatek równa
się stosunkowi LB do LO + e, a więc wynosi
iT,—TI)ITl. Widzimy więc, że nasze urządzenie
pracując odwracalnie dostarcza maksymalną
pracę. Tego właśnie wniosku spodziewaliśmy się na
podstawie twierdzenia Carnota i jest on głównym
celem niniejszego wykładu. Możemy jednak
wykorzystać jeszcze nasze urządzenie do
zrozumienia paru innych zjawisk, niekoniecznie w stanie
równowagi i dlatego wykraczających poza termo- ,,,_.,,., . ,. . ,
° ° J J 46.2. Prędkość kątowa zębatki jako
dynamikę. funkcja momentu siły
Obliczmy, jak szybko poruszałoby się nasze
jednokierunkowe urządzenie, gdyby wszystkie jego
części miały jednakową temperaturę i gdybyśmy zawiesili ciężarek na bębnie. Jeżeli
szarpniemy za nitkę bardzo mocno, to oczywiście popadniemy w tarapaty. Zapadka prze-
śliznie się nad zębami kółka, pęknie sprężynka lub stanie się coś podobnego. Przypuśćmy
jednak, że pociągnęliśmy dość łagodnie i wszystko działa sprawnie. W tych warunkach
powyższe rozważania dotyczące prawdopodobieństwa występowania ruchów w obu
kierunkach pozostają słuszne, jeżeli pamiętamy, że obie temperatury są takie same. W każdym
skoku kółko obraca się o kąt 6, a więc prędkość kątowa równa się kątowi 6 pomnożonemu
przez prawdopodobieństwo wykonania jednego skoku w ciągu sekundy. Do przodu kółko
porusza się z prawdopodobieństwem (l/r)e_('+L8)/lT, a do tyłu — z prawdopodobieństwem
(l/r)e-c/*T, a więc na prędkość kątową otrzymamy następujący wzór:
w=(e/T)[e-u+W)/*7"-e-t/*7"]=WT)e-lM7"(e-Ł9/"'-l). (46.1)
Jeżeli wykreślimy w jako funkcję L, otrzymamy krzywą pokazaną na rys. 46.2. Widzimy,
że znak wartości L ma bardzo istotne znaczenie. Jeżeli L rośnie będąc stale dodatnie, co
zachodzi, gdy staramy się obracać zębatkę do tyłu, to prędkość kątowa w tym kierunku
osiąga wartość stałą. Gdy natomiast L staje się ujemne, w „skacze" do „góry", ponieważ
e podniesione do wysokiej dodatniej potęgi jest bardzo duże!
Wartość prędkości kątowej, którą otrzymujemy przy różnych siłach, jest więc bardzo
niesymetryczna. Ruch w jedną stronę jest bardzo łatwy: przy małej sile otrzymujemy dużą
prędkość kątową. Natomiast w przeciwnym kierunku mimo przyłożenia dużej siły kółko
obraca się z trudnością.
To samo stwierdzamy w prostowniku prądu elektrycznego. Zamiast siły mamy tu pole
elektryczne, a zamiast prędkości kątowej prąd elektryczny. W prostowniku napięcie nie jest
proporcjonalne do oporu i zjawiska przebiegają niesymetrycznie Ta sama analiza, która
przeprowadziliśmy dla prostownika mechanicznego, stosuje się także dla prostownika
prądu. W istocie rzeczy wzór otrzymany powyżej przedstawia typową zależność
przepuszczalności prądowej prostownika od przyłożonego napięcia.
Wyrzućmy teraz wszystkie ciężarki i przyjrzyjmy się samemu urządzeniu. Gdyby 7\
było mniejsze od T,, zębatka poruszałaby się do przodu i każdy z tym się zgodzi. Ale na
312
46. MECHANIZM ZAPADKOWY
pierwszy rzut oka trudno uwierzyć w odwrotną możliwość. Jeżeli T2 jest większe od T,
zębatka obraca się w przeciwną stronę! Gorąca zębatka porusza się sama do tyłu na skutek
drgań zapadki. Jeżeli zapadka jest przez chwilę oparta o jakieś miejsce skośnej płaszczyzny
zęba, to popycha ją w bok. Ale zapadka zawsze napiera na taką płaszczyznę, jeżeli bowiem
przypadkiem uniesie się ponad czubek zęba, a jednocześnie koło przesunie się nieco wstecz,
to zapadka znowu się oprze na następnej skośnej płaszczyźnie. Dlatego gorąca zębatka
z zapadką jest urządzeniem, które może idealnie poruszać się w kierunku odwrotnym
do planowanego!
Niezależnie od naszej umiejętności wypaczania przeznaczenia urządzeń, w wypadku
dwu dokładnie równych temperatur nasze urządzenie nie wykazuje szczególnej skłonności
do poruszania się w którymś kierunku. W momencie gdy je obserwujemy, może poruszać
się w tę lub w inną stronę, ale gdy popatrzymy przez dłuższą chwilę, nie dostrzeżemy
żadnego sumarycznego przesunięcia. Ten brak określonego kierunku jest w istocie podstawową,
najgłębszą zasadą, na której opiera się cała termodynamika.
46-3. Odwracalność w mechanice
Z jakiej to bardziej podstawowej zasady mechaniki wynika, że gdy temperatury są
jednakowe, to nasze urządzenie nie obróci się ostatecznie ani w lewo, ani w prawo?
Widocznie istnieje jakieś podstawowe twierdzenie głoszące, że nie można zbudować urządzenia,
które pozostawione samo poruszałoby się raczej w jedną stronę niż w drugą przez
dostatecznie długi czas. Musimy postarać się sprawdzić, jak to twierdzenie wynika z praw
mechaniki.
W krótkim zarysie prawa mechaniki wyglądają następująco: masa razy przyspieszenie
równa się sile, a silą działająca na każdą cząstkę jest jakąś skomplikowaną funkcją położeń
wszystkich innych cząstek. Są też sytuacje, w których siły zależą od prędkości, tak jak w
magnetyzmie, ale nie będziemy się tym teraz zajmowali. Weźmy prostszy przypadek, w którym,
tak jak w grawitacji, siły zależą tylko od położeń. Załóżmy, że rozwiązaliśmy nasz układ
równań i otrzymaliśmy pewien ruch x(i) dla każdej cząstki. Dla układu dostatecznie
złożonego rozwiązania będą bardzo skomplikowane i z upływem czasu dzieją się tam bardzo
dziwne rzeczy. Jeżeli wymyślimy jakikolwiek rozkład cząstek i poczekamy dostatecznie
długo, to na pewno się go doczekamy! Towarzysząc naszemu rozwiązaniu dostatecznie długo
stwierdzamy, że — jeśli można się tak wyrazić — wypróbowuje ono wszystkie swoje
możliwości. To nie jest bezwzględnie konieczne dla urządzeń najprostszych, ale zdarza się
w układach złożonych z dużej liczby atomów. Nasze rozwiązanie ma jeszcze jedną własność.
Rozwiązując równania ruchu otrzymujemy pewną funkcję czasu, np. / + /2 + /3
Twierdzimy, że drugim rozwiązaniem będzie -t + t1 — /3. Inaczej mówiąc, jeżeli zastąpimy wielkość
/ wielkością —/ w całym rozwiązaniu, znów otrzymamy rozwiązanie tego samego równania.
Wynika to z faktu, że jeśli w wyjściowym równaniu różniczkowym zastąpimy wielkość t
wielkością —/, to nic się nie zmieni, ponieważ występują tylko drugie pochodne względem
t. Znaczy to, że jeżeli zachodzi pewien ruch, to jest możliwy również ruch dokładnie
przeciwny. W stanie zupełnego chaosu, któr> wystąpi po dostatecznie długim czasie, w pewnei
46-3. ODWRACALNOŚĆ W MECHANIC!!
313
chwili ruch odbywa się w jednym kierunku, a później może wystąpić ruch dokładnie do
niego przeciwny. Żaden ruch nie wyróżnia się niczym spośród innych ruchów. A więc
nie można wymyślić urządzenia, które na dalszą metę porusza się chętniej w jednym
kierunku niż w innych, jeżeli urządzenie to jest dostatecznie skomplikowane.
Można podać przykład, w którym to, co powiedzieliśmy przed chwilą, nie jest
prawdziwe. Jeżeli na przykład rozkręcimy koło w pustej przestrzeni, to zawsze będzie się poruszało
tak samo. A więc istnieją pewne warunki, które, jak zasada zachowania momentu pędu,
naruszają powyższe rozważania. Wymaga to jednak tylko staranniejszego potraktowania
naszego dowodu. Może moment pędu jest przekazywany ściankom lub dzieje się coś
podobnego, co zawiesza działanie zasad zachowania. Wtedy, jeżeli urządzenie jest dostatecznie
złożone, nasze rozumowanie jest prawdziwe. Opiera się na fakcie, że prawa mechaniki
są odwracalne.
Ze względów historycznych chcielibyśmy zwrócić uwagę na urządzenie wymyślone przez
Maxwella, twórcę dynamicznej teorii gazów. Rozważył on następującą sytuację: W dwóch
zbiornikach połączonych otworkiem znajduje się gaz o tej samej temperaturze. W otwork u
siedzi diabełek (można go oczywiście zastąpić jakimś mechanizmem!), który może otwierać
lub zamykać znajdujące się tam drzwiczki. Diabełek obserwuje cząsteczki biegnące z lewej
strony w prawą. Gdy zobaczy szybką cząsteczkę, to otwiera drzwiczki, a cząsteczek
powolnych nie wypuszcza. Jeżeli wyobrazimy go sobie jako super-diabełka, który ma też oczy z tyłu
głowy, to może postępować odwrotnie z cząsteczkami biegnącymi z prawej strony.
Diabełek przepuszcza więc powolne cząsteczki na lewo, a szybkie na prawo. Wkrótce zatem
lewy zbiornik się oziębi, a prawy ogrzeje. Czy taki diabełek naruszyłby więc zasady
termodynamiki?
Okazuje się jednak, że gdyby nasz diabełek miał skończone rozmiary, to bardzo szybka
tak się ogrzałby, że po chwili nie widziałby zbyt dobrze. Najprostszym przykładem takiego
diabełka może być klapka utrzymywana przy otworku za pomocą sprężynki. Szybkie
cząsteczki przechodziłyby przez otworek, ponieważ mogłyby uchylić klapkę. Powolne nie
mogłyby tego zrobić i odbijałyby się z powrotem. Ale nie jest to przecież nic innego jak
inna postać naszej zębatki, która w końcu się ogrzewa. Jeżeli założymy, że ciepło właściwe
diabełka nie jest nieskończone, to musi się on ogrzać. Przecież musi mieć jakieś przekładnie
i kółka, a więc nie może stracić dodatkowego ciepła, które otrzymuje wskutek
obserwowania cząsteczek. Wkrótce zacznie się tak trząść od ruchów Browna, że sam nie będzie
wiedział, czy zamyka czy otwiera drzwiczki, a tym bardziej czy cząsteczki wlatują, czy wylatują
- więc przestanie spełniać swoje zadanie.
46-4. Nieodwracalność
Czy wszystkie prawa fizyki są odwracalne? Z pewnością nie! Spróbujmy z jajecznicy
otrzymać z powrotem całe jajka! Puśćmy taśmę filmową do tyłu, a po chwili wszyscy
zaczną się śmiać. Najbardziej naturalną cechą wszystkich zjawisk jest ich oczywista
nieodwracalność.
Skąd bierze się ta nieodwracalność? Nie wynika z praw Newtona. Jeżeli twierdzimy,
314
46. MECHANIZM ZAPADKOWY
że wszystkie zjawiska mogą być w końcu zrozumiałe na podstawie praw fizyki i jeżeli
okazuje się także, że wszystkie równania mają tę dziwną właściwość, iż po podstawieniu
/= —/ otrzymujemy także rozwiązanie, to każde zjawisko jest odwracalne. Jak więc się to
dzieje, że w przyrodzie ciągle spotykamy się z nieodwracalnością? Oczywiście, musi istnieć
jakieś prawo, jakieś trudno dostępne, ale podstawowe równanie, może w elektrodynamice
może w fizyce neutrino, w którym kierunek upływu czasu ma znaczenie.
Zastanówmy się teraz nad tym zagadnieniem. Znamy jedno z takich praw, prawo,
które mówi, że entropia zawsze wzrasta. Jeżeli mamy dwa przedmioty: gorący oraz zimny,
ciepło zawsze przepływa od ciepłego do zimnego. A więc prawo wzrostu entropii jest
jednym z takich praw. Ale my chcemy zrozumieć to prawo z punktu widzenia mechaniki.
Przecież już się nam udało w oparciu o rozumowanie na podstawie mechaniki wyciągnąć
wnioski z twierdzenia, że ciepło nie może samo płynąć w odwrotnym kierunku. Dzięki
temu zrozumieliśmy drugą zasadę termodynamiki. Widocznie możemy otrzymać
nieodwracalność z równań odwracalnych. Ale czy korzystaliśmy tylko z twierdzeń mechaniki?
Zajmijmy się tym dokładniej.
Skoro nasz problem dotyczy entropii, chodzi nam wiec o znalezienie jej opisu
mikroskopowego. Jeżeli mówimy, że mamy pewną energię, zawartą np. w gazie, możemy od razu
otrzymać obraz mikroskopowy i mówimy, że każdy atom ma pewną energię. Te wszystkie
energie dodane do siebie dają nam energię całkowitą. Może więc każdy atom ma pewną
entropię i jeżeli dodamy wszystko razem, otrzymamy entropię całkowitą? Tak dobrze nie
jest, lecz zobaczmy, jak to wygląda naprawdę.
Obliczymy na przykład różnicę eptropii gazu o pewnej temperaturze i o pewnej objętości
i gazu o tej samej temperaturze, ale o innej objętości. Pamiętamy z rozdz. 44, że zmianę
entropii zapisujemy jako
-If
W naszym przypadku energia gazu jest taka sama przed, jak i po rozprężeniu, bo
temperatura się nie zmienia. Musimy więc dodać odpowiednią ilość ciepła do wyrównania pracy
wykonanej przez gaz, czyli dla każdej małej zmiany objętości
dQ = PdV.
Podstawiając to wyrażenie za dQ, otrzymujemy
Vi Vi
f dV CNkTdV V2
J T J V T P,'
v, v,
tak jak w rozdz. 44. Jeżeli zwiększymy na przykład objętość dwukrotnie, to zmiana entropii
wyniesie Nk In 2.
Zastanówmy się teraz nad innym interesującym przykładem. Weźmy zbiornik z
przegrodą w środku. Po jednej stronie przegrody znajduje się neon („czarne" cząsteczki), a P°
drugiej argon („białe" cząsteczki). Usuwamy przegrodę i pozwalamy cząsteczkom się
wymieszać. O ile zmieni się entropia? Można też wyobrazić sobie, że zamiast przegrody
46-4 NIEODWRACALNOŚĆ
315
mamy tłok z dziurką przepuszczającą białe, ale zatrzymującą czarne cząsteczki, oraz drugi
tłok, który działa odwrotnie. Po przesunięciu tłoków do przeciwnych końców zbiornika
stwierdzamy, że dla obu gazów problem jest taki sam jak ten, który już rozwiązaliśmy przed
chwilą. A więc uzyskujemy zmianę entropii Nk In 2, co oznacza, że wzrosła ona o k In 2
na każdą cząsteczkę. Czynnik 2 jest związany z dodatkową przestrzenią, którą zyskała
cząsteczka, co jest raczej dziwne. Nie należy to do własności samej cząsteczki, ale związane
jest z rozmiarami przestrzeni, w której się może poruszać. Sytuacja jest dziwna, gdyż
entropia wzrasta, a wszystko ma taką samą energię i temperaturę! Zmiana polega tylko na tym,
że cząsteczki są inaczej rozłożone.
Dobrze wiemy, że gdy usuniemy przegrodę, wszystko po dłuższym czasie wymiesza się
na skutek zderzeń. Białe cząsteczki nieustannie lecą ku czarnym, a czarne — ku białym.
Po pewnym czasie białe przenoszą się tam, gdzie znajdują się czarne, a czarne wpadają
między białe. Jeżeli poczekamy wystarczająco długo, otrzymamy mieszaninę. W rzeczywistym
świecie jest to oczywiście proces nieodwracalny, który powinien spowodować wzrost
entropii.
Mamy tu prosty przykład procesu nieodwracalnego, złożonego wyłącznie z wydarzeń
odwracalnych. W każdej chwili zachodzą zderzenia między dwiema cząsteczkami,
które rozbiegają się potem w określonych kierunkach. Jeżeli film o zderzeniu puścimy
w odwrotnym kierunku, to otrzymamy prawidłowy obraz. Przecież właściwie wszystkie
rodzaje zderzeń są równie prawdopodobne. A więc mechanizm mieszania jest całkowicie
odwracalny, a wynik jest nieodwracalny. Wszyscy wiedzą, że jeśli z początku cząsteczki
białe i czarne będą oddzielone, to po paru minutach otrzymamy ich mieszaninę. Jeżeli
poczekamy spokojnie jeszcze parę minut, to nie rozdzielą się z powrotem, ale nadal będą
stanowiły mieszaninę. Mamy więc sytuację nieodwracalną, wywołaną przez odwracalne
zjawisko. Widzimy teraz jednak, dlaczego mogło do tego dojść. Rozpoczęliśmy od rozkładu,
który był w jakiś sposób uporządkowany. Na skutek chaotycznych zderzeń staje się bezładny.
Źródłem nieodwracalności jest przejście od rozkładu uporządkowanego do bezładnego.
To prawda, że gdy sfilmujemy proces mieszania i puścimy taśmę filmową do tyłu, to
stwierdzimy, że wszystko stopniowo się porządkuje. Ktoś mógłby powiedzieć: „To jest
sprzeczne z prawami fizyki!" Gdybyśmy więc puścili film jeszcze raz i przyjrzeli się każdemu
zderzeniu z osobna, zobaczylibyśmy, że każde jest w porządku i spełnia prawa fizyki.
Wszystkie prędkości cząsteczek są właśnie tak dobrane, że po odwróceniu wszystkich torów
cząsteczki powrócą do swych wyjściowych położeń. Taka sytuacja jest jednak niesłychanie
mało prawdopodobna. Jeżeli na początku mamy gaz nie uporządkowany w jakiś sposób,
po prostu gaz czarno-biały, składający się z czarnych i białych cząsteczek, to gaz ten nigdy
się nie uporządkuje.
46-5. Porządek i entropia
Musimy teraz wyjaśnić, co rozumiemy przez chaos, a co przez porządek. Nie chodzi tu
o przyjemny ład i nieprzyjemny bałagan Gazy wymieszane od uporządkowanych różni
coś innego. Załóżmy, że podzieliliśmy przestrzeń na obszary o małej objętości. Jeżeli
316
46. MECHANI/M ZAPADKOWy
mamy cząsteczki białe i czarne, to na ile sposobów możemy je rozdzielić między te obszary
tak aby białe były zgrupowane po jednej stronie, a czarne po drugiej? A na ile sposobów
moglibyśmy je rozdzelić, gdybyśmy nie musieli oddzielnie grupować kolorów? Oczywiście
w drugim przypadku jest znacznie więcej sposobów rozłożenia cząstek. „Nieporządek"
mierzymy liczbą sposobów, w które można poustawiać składniki, nie naruszając wyglądu
zewnętrznego. Logarytm tej liczby równa się entropii. W przypadku gazów rozdzielonych
liczba rozkładów jest mniejsza, a więc mniejsza jest entropia lub, jak też mówimy, jest
mniejszy „nieporządek".
Przy pomocy tej technicznej definicji nieporządku możemy zrozumieć twierdzenie
o entropii. Po pierwsze — entropia jest miarą chaosu. Po drugie — Wszechświat zawsze
zmierza od „porządku" do „chaosu", a więc entropia zawsze wzrasta. Przez porządek nie
rozumiemy przyjemnego ładu, ale to, że liczba różnych sposobów, na które możemy go
zmienić nie naruszając wyglądu zewnętrznego, jest względnie ograniczona. W chwili kiedy
odwróciliśmy film o mieszaniu się gazów, nie było znów tak wielkiego nieporządku, jak nam się
wydawało. Każdy pojedynczy atom miał właściwą szybkość i kierunek i mógł się z
powodzeniem wydostać z mieszaniny. Entropia mimo wszystko nie była tak duża, jak mogło
się wydawać.
A co z odwracalnością innych praw fizyki? Gdy zajmowaliśmy się polem elektrycznym,
wytworzonym przez przyspieszony ładunek elektryczny, dowiedzieliśmy się, że musi to
być pole opóźnione. W chwili t i w odległości r od ładunku bierzemy pole wywołane przez
przyspieszenie w chwili r — r/c, a nie / + r/c. Na pierwszy rzut oka wydawałoby się, że prawo
opisujące oddziaływanie elektryczne nie jest odwracalne. A tymczasem, co bardzo dziwne,
stosowane przez nas prawa wynikają z układu równań zwanych równaniami Maxwella,
które są przecież odwracalne. Można ponadto dowieść, że gdybyśmy używali tylko pola
wyprzedzającego, tzn. pola zdającego sprawę ze stanu w chwili t + rjc, i robili to z całkowitą
konsekwencją w zamkniętej przestrzeni, to wszystko zaszłoby tak samo jak przy użyciu
pól opóźnionych! A więc ta pozorna nieodwracalność praw elektryczności, przynajmniej
w przestrzeni zamkniętej, nie jest wcale nieodwracalnością. Powinniśmy się tego
spodziewać, ponieważ wiemy, że w przypadku gdy drgający ładunek wytwarza pole elektryczne
odbijające się od ścian zbiornika, w końcu osiągamy równowagę, w której nie ma żadnego
wyróżnionego zwrotu czasu. Przyjęcie pola opóźnionego jest tylko wygodną metodą
otrzymania rozwiązania.
Jak wiemy dotychczas, wszystkie podstawowe prawa fizyki, np. równania Newtona,
są odwracalne. Skąd się więc bierze nieodwracalność? Pochodzi ona stąd, że porządek
przechodzi w chaos. Jednak nic to nam nie wyjaśnia, póki nie znamy źródła porządku.
Dlaczego sytuacje, z którymi się ciągle stykamy zawsze charakteryzują się brakiem
równowagi? Oto jedno z wyjaśnień. Spójrzmy jeszcze raz na zbiornik z wymieszanymi białymi
i czarnymi cząsteczkami. Jeżeli poczekamy dostatecznie długo, to bardzo mało prawdopo
dobny, ale w każdym razie możliwy jest przypadek, że cząsteczki ułożą się tak, aby białe
występowały przeważnie po jednej stronie, a czarne po drugiej. Potem, wraz z upływem
czasu, cząsteczki znów się wymieszają.
W ten sposób jednym z wyjaśnień wysokiego stopnia uporządkowania współczesnego
świata jest stwierdzenie, że jest to jedynie kwestia przypadku. Może nasz Wszechświa
46-5. PORZĄDEK 1 ENTROPIA
317
doznał w przeszłości jakiejś fluktuacji, w której nastąpiło rozdzielenie wszystkich rzeczy,
a obecnie wszystko zmierza do ponownego wymieszania. Ta teoria nie jest niesymetryczna.
Na pytanie bowiem, jak będzie wyglądał rozdzielony gaz w niedalekiej przyszłości lub jak
wyglądał w niedawnej przeszłości odpowiada ona: w obu przypadkach ujrzelibyśmy szarą
masę na granicy między cząsteczkami białymi i czarnymi, ponieważ znów się mieszają.
Niezależnie jaki zwrot ma bieg czasu, gaz ulegnie wymieszaniu. Teoria ta głosi więc, że
nieodwracalność została wywołana przypadkowo.
Spróbujmy dowieść, że tak nie jest. Załóżmy, że nie oglądamy całego zbiornika od razu,
a tylko jego część. Załóżmy dalej, że w pewnej chwili stwierdzamy w tej części pewien
stopień uporządkowania, białe i czarne cząsteczki oddzieliły się. Co moglibyśmy wówczas
wywnioskować o sytuacji w innych częściach zbiornika, których jeszcze nie oglądaliśmy?
Jeżeli naprawdę wierzymy, że stan uporządkowania powstał z zupełnego chaosu na skutek
fluktuacji, to musimy założyć, że była to fluktuacja najbardziej prawdopodobna z tych,
które mogły uporządkować gaz w naszej części, oraz że najbardziej prawdopodobnym
stanem reszty zbiornika jest brak uporządkowania! Dlatego z hipotezy, że świat jest
fluktuacją, wynika wniosek, że gdy spojrzymy na część świata, której nigdy nie widzieliśmy,
powinniśmy znaleźć go w stanie chaosu, inaczej niż część nam znaną? Jeżeli nasz porządek
został spowodowany fluktuacją, to nie powinniśmy oczekiwać go nigdzie poza miejscem
już nam znanym.
Obecnie przyjmujemy, że przyczyn porządku należy szukać w historii Wszechświata,
ponieważ w przeszłości Wszechświat był rzeczywiście uporządkowany. Porządek nie został
wywołany fluktuacjami, lecz po prostu wszystko było kiedyś białe albo czarne.
Teoria ta przewiduje, że uporządkowanie wystąpi i w innych miejscach — nie wynikło
bowiem z fluktuacji, ale z wysokiego stopnia uporządkowania na początku czasu.
Spodziewamy się więc, że znajdziemy porządek w miejscach, których do tej pory nie
oglądaliśmy.
Astronomowie na przykład oglądają tylko niektóre gwiazdy. Co noc kierują swe
teleskopy na coraz nowe ciała niebieskie, które zachowują się tak samo jak pozostałe.
Wnioskujemy .stąd, że Wszechświat nie jest fluktuacją oraz że porządek jest pozostałością po
warunkach, które były na początku. Nie mówimy przez to, że rozumiemy jego sens. Z nieznanych
nam powodów Wszechświat miał kiedyś bardzo niską entropię w porównaniu z posiadanymi
zasobami energii i od tego czasu entropia wzrasta. Taka jest więc droga ku przyszłości.
To jest właśnie przyczyną wszelkiej nieodwracalności, to kieruje procesami wzrostu i
rozpadu. Dzięki temu pamiętamy przeszłość, a nie przyszłość, pamiętamy wypadki bliższe tej
razie historii Wszechświata, w której był wyższy porządek niż obecnie, a nie wiemy nic
o tej, w której chaos będzie większy, nie wiemy nic o przyszłości. Tak więc, jak
powiedzieliśmy już w jednym z wcześniejszych rozdziałów, cały Wszechświat zawiera się w
lampce wina, jeżeli tylko przyjrzymy się jej dokładnie. W tym przypadku ta lampka jest dość
złożona, ponieważ istnieje i ciecz i szkło i światło i wszystko inne.
Fizyka ma jeszcze tę przyjemną cechę, że nawet tak proste i wyidealizowane urządzenia
jak zębatka pracują tylko dlatego, iż są częścią Wszechświata. Zębatka pracuje tylko w
jednym kierunku, ponieważ pozostaje w jakimś istotnym związku z resztą Wszechświata.
Gdybyśmy ją umieścili w pudełku i odizolowali na dość długo, to kółko poruszałoby się
318
46. MECHANIZM ZAPADKOWY
równie dobrze w jedną stronę, jak i drugą. Ale gdy podnosimy zasłony, światło wydostaje
się z zamknięcia, gdy chcemy się ochłodzić, szukamy cienia na ziemi, a ciepło czerpiemy ze
słońca i dlatego „zębatki", które my stanowimy, mogą pracować tylko w jednym kierunku
Ta jednokierunkowość jest wewnętrznie związana z faktem, że zębatka jest częścią
Wszechświata. Jest jego częścią nie tylko w tym sensie, że spełnia prawa fizyki obowiązujące
we Wszechświecie, ale także dlatego, że jej jednokierunkowy ruch jest związany z
jednokierunkowym przebiegiem zjawisk w całym Wszechświecie. Tego wszystkiego nie można
w pełni zrozumieć póki tajemnica początków historii Wszechświata nie zostanie
sprowadzona od domysłów do naukowego pojmowania.
47
dźwięk • równanie falowe
47-1. Fale
W rozdziale niniejszym zajmiemy się zjawiskiem rozchodzenia się fal. Jest to zjawisko,
o którym się mówi wielokrotnie w fizyce i dlatego naszą uwagę skupimy na nim nie tylko
ze względu na rozpatrywany teraz szczególny przykład, którym jest dźwięk, lecz przede
wszystkim ze względu na znacznie szersze zastosowanie związanych z nim pojęć we
wszystkich dziedzinach fizyki.
Zajmując się poprzednio oscylatorem harmonicznym*' mówiliśmy, że istnieją nie tylko
mechaniczne układy drgające, lecz także drgające układy elektryczne. Fale są związane
z układami drgającymi. Drgania falowe nie są jednak tylko drganiami w czasie
ograniczonymi do jednego miejsca, ale rozchodzą się też w przestrzeni.
Właściwie zajmowaliśmy się już falami. Gdy omawialiśmy światło, poznaliśmy jego
własności falowe i zwróciliśmy szczególną uwagę na interferencję przestrzenną fal
pochodzących z paru różnych źródeł mających tę samą częstość drgań. Istnieją jeszcze dwa ważne
zjawiska falowe, przez nas nie omawiane, które występują zarówno w przypadku światła,
tzn. dla fal elektromagnetycznych, jak i dla innych rodzajów fal. Pierwszym z tych zjawisk,
jest interferencja w czasie, a nie w przestrzeni. Gdy mamy dwa źródła dźwięku, których
częstości różnią się nieznacznie i gdy słuchamy ich jednocześnie, to czasem obie fale
dochodzą do nas grzbietami, a czasem jedna grzbietem, a druga doliną (patrz rys. 47.1).
Wznoszenie się i opadanie dźwięku, które wówczas słyszymy, nazywamy dudnieniem;
jest to właśnie interferencja drgań w czasie. Drugie zjawisko dotyczy kształtu fali, która
powstaje, gdy fale zamknięte w pewnej przestrzeni odbijają się od przeciwległych ścian.
Zjawiska te można było oczywiście omawiać przy rozważaniu fal elektromagnetycznych.
•> W rozdz. 21, t. I cz. 1. (Przyp. red. wyd. polskiego.)
320
47 DŹWIĘK. RÓWNANIE FALOWE
47.1. Interferencja w czasie dźwięków
wysyłanych przez dwa źródła o
nieznacznie różniących się częstościach wywołuje
dudnienia.
47.2. Krzywa ciągła przedstawia wykres
pola elektrycznego w pewnej chwili,
a krzywa przerywana przedstawia to
pole w chwilę potem.
-ct-
i \
Nie zrobiliśmy tego, ponieważ nie uświadomili,
byśmy sobie, że własności, o których mówimy
dotyczą wielu różnych zjawisk. Aby
przypomnieć, że zjawiska falowe występują nie tylko
w elektrodynamice, zajmiemy się teraz innym
przykładem, a mianowicie falami dźwiękowymi.
Znamy także inne przykłady fal: fale
morskie długie, które widzimy stojąc nad brzegiem
morza, lub też drobniejsze fale, zmarszczki na
powierzchni wody wywołane przez napięcie
powierzchniowe. Oprócz tego mamy dwa
rodzaje fal sprężystych w ciałach stałych: fale
zgęszczeniowe (podłużne), w których cząsteczki
ciała drgają tam i z powrotem wzdłuż kierunku
rozchodzenia się fal (należą do nich fale
dźwiękowe w gazie), i fale poprzeczne, w których
cząsteczki ciała drgają prostopadle do
kierunku rozchodzenia się fal. Fale sejsmiczne
składają się z fal sprężystych obu rodzajów
wywołanych przez lokalne ruchy w skorupie
ziemskiej.
Istnieje jeszcze jeden rodzaj fal, odkrytych
przez fizykę współczesną. Są to fale, które
określają amplitudę prawdopodobieństwa
znalezienia cząstki w danym miejscu — „fale
materii", którymi już się zajmowaliśmy. Ich
częstość jest proporcjonalna do energii
cząsteczki, a liczba falowa do jej pędu. Fale te
zostały odkryte przez mechanikę kwantową.
W rozdziale niniejszym zajmiemy się tylko
falami, których prędkość nie zależy od ich
długości. Zachodzi to na przykład dla fal
świetlnych w próżni. Prędkość światła jest więc taka
sama dla fal radiowych, dla światła niebieskiego,
zielonego, a także dla światła o każdej innej
długości fali. To było właśnie powodem, że
rozpoczynając opis zjawisk falowych nie
zwróciliśmy początkowo uwagi na zjawisko
rozchodzenia się fal. Mówiliśmy tylko, że gdy ładunek
porusza się, pole elektryczne w odległości x jest
proporcjonalne do jego przyspieszenia nie
w chwili /, lecz w chwili wcześniejszej t — x\c-
Dlatego też gdybyśmy sporządzili wykres po'3
„7.I. FALE
321
elektrycznego w przestrzeni, w pewnej chwili, jak na rys. 47.2, to po czasie t pole
elektryczne przesunęłoby się na odległość et, jak to zaznaczono na rysunku. Możemy to
ująć matematycznie przyjmując, że w przypadku jednowymiarowym, którym się tu
zajmujemy, pole elektryczne jest funkcją zmiennej x — et. Widzimy, że w chwili / = 0 jest
ono pewną funkcją zmiennej x. Jeżeli bierzemy pod uwagę stan nieco późniejszy, to
musimy tylko nieco zwiększyć x, aby otrzymać tę samą wartość pola elektrycznego. Jeżeli
na przykład pole ma wartość maksymalną w punkcie x = 3, w chwili 0, to dla znalezienia
nowego położenia maksimum pola w chwili t trzeba, aby
x — cl = 3, czyli x = 3 + et.
Widzimy więc, że takie właśnie funkcje odpowiadają rozchodzeniu się fali.
Zatem funkcja f(x—ct) przedstawia pewną falę. Możemy krótko ująć podany wyżej
opis własności fali stwierdzając po prostu, że
f{x-ct)=f(x+Ax-c(t + At)),
gdzie Ax=c At. Istnieje oczywiście jeszcze jedna możliwość, mianowicie że zamiast źródła
z lewej strony, tak jak na rys. 47.2, mamy źródło z prawej, tak że fala porusza się w
kierunku ujemnych wartości osi x. Taką falę można opisać funkcją g(x + ct).
Może się również zdarzyć, że w tej samej chwili będziemy mieli więcej niż jedną falę
i wtedy pole elektryczne, na przykład, będzie sumą pól, z których każde będzie się
rozchodziło niezależnie. To zachowanie się pól elektrycznych można opisać mówiąc, że
jeżeli fi(x— cf) jest falą, a/2(x — et) inną falą, to ich suma jest także falą. Jest to tzw.
zasada superpozycji. Ta sama zasada stosuje się w przypadku dźwięku.
Wiemy, że podczas wytwarzania dźwięków słyszymy je z doskonałą wiernością w
takiej samej kolejności, w jakiej były wytwarzane. Gdyby częstości wyższe poruszały się
szybciej niż niskie, to słyszelibyśmy urywany ostry hałas zamiast, na przykład, dźwięków
muzyki. Podobnie, gdyby czerwone światło poruszało się szybciej niż niebieskie, błysk
hiałego światła widzielibyśmy najpierw jako czerwony, później jako biały, a w końcu
jako niebieski. Dobrze wiemy, że tak się nie dzieje. Zarówno dźwięk, jak i światło
poruszają się w powietrzu z prędkością, która prawie nie zależy od częstości. W rozdziale
48 omówimy przykłady fal, w których ta niezależność nie będzie już występować.
W przypadku światła (fal elektromagnetycznych) podaliśmy regułę określającą pole
elektryczne w pewnym punkcie, powstałe na skutek przyspieszenia ładunku. Można by
oczekiwać, że tym razem też powinniśmy podać regułę, za której pomocą jakaś cecha
powietrza, powiedzmy ciśnienie, którego wartość chcemy znać w pewnej odległości od
źródła, byłaby zależna od ruchu źródła i opóźniona o czas przelotu dźwięku. W przypadku
światła można było się zgodzić na takie postępowanie, ponieważ wiedzielibyśmy tylko,
^e ładunek umieszczony w jednym punkcie działa pewną siłą na ładunek umieszczony
w innym punkcie. Znajomość szczegółów rozchodzenia się od jednego miejsca do
drugiego nie była tam bezwzględnie konieczna. Jednak w przypadku dźwięku wiemy, że
rozchodzi się on w powietrzu między źródłem a słuchaczem i każdy na pewno zapyta,
jakie w danym momencie jest ciśnienie powietrza. Chcielibyśmy oprócz tego dokładnie
wiedzieć jak się przy tym porusza powietrze W przypadku elektryczności mogliśmy
322
47. DŹWIĘK. RÓWNANIE FALOWfc
akceptować sformułowaną wtedy regułę, ponieważ mogliśmy twierdzić, że nie znamy jeszcze
praw elektryczności, lecz nie możemy na tym poprzestać w przypadku dźwięku. Nie
zadowoliłaby nas reguła ustalająca, jak rozchodzi się ciśnienie powietrza, ponieważ powinniśmy ten
proces wyjaśnić w oparciu o prawa mechaniki. Krótko mówiąc, rozchodzenie się dźwięku jest
zjawiskiem należącym do mechaniki i dlatego powinniśmy je zrozumieć za pomocą praw
Newtona. Rozchodzenie się dźwięku w przestrzeni opisują jedynie prawa mechaniki
i zależy ono od własności gazów, gdy dźwięk rozchodzi się w gazie, lub od własności
cieczy czy ciał starych, gdy rozchodzi się on w tych właśnie ośrodkach. Później w podobny
sposób wyprowadzimy z praw elektrodynamiki własności światła i rozchodzenia się fal
świetlnych.
47-2. Rozchodzenie się dźwięku
Wyprowadzimy teraz z praw Newtona własności rozchodzenia się dźwięku między
źródłem i odbiornikiem. Nie będziemy przy tym uwzględniać wzajemnego oddziaływania
źródła i odbiornika. Zwykle kładliśmy raczej nacisk na wynik niż na sposób jego
otrzymania. W tym rozdziale postąpimy odwrotnie. Celem naszym stanie się w pewnym sensie
samo wyprowadzenie. Problem wyjaśniania nowych zjawisk na podstawie zjawisk
znanych, których prawa znamy, jest być może największą sztuką w fizyce teoretycznej. Fizyka
teoretyczna zajmuje się problemami dwojakiego rodzaju: pierwsze polegają na
znalezieniu rozwiązań danych równań, a- drugie — na znalezieniu równań, które opisują nowe
zjawisko. Nasze zadanie jest przykładem drugiego rodzaju problemów.
Zajmiemy się tu najprostszym przykładem — rozchodzeniem się dźwięku w jednym
wymiarze. Aby wykonać nasz zamiar, musimy najpierw zdać sobie sprawę, co tu się dzieje.
Otóż podstawą wszystkiego jest tu to, że ruch jakiegoś obiektu w powietrzu
zapoczątkowuje rozprzestrzenianie się zaburzeń powietrza. Jeżeli chodzi o rodzaj tych zaburzeń, to
spodziewamy się, że ruch obiektu wywoła zmianę ciśnienia. Gdy obiekt porusza się
powoli, powietrze oczywiście opływa go, ale nam chodzi o ruch bardzo szybki, w którym
nie ma czasu na tego rodzaju opływanie. Powietrze jest zatem podczas ruchu sprężane
i powstaje zmiana ciśnienia, która wywiera nacisk na jego dalsze warstwy. Te warstwy
z kolei są sprężane, co wywołuje wzrost ich ciśnienia i w ten sposób w przestrzeni
rozchodzi się fala zgęszczeń i rozrzedzeń powietrza.
Chcielibyśmy teraz opisać ten proces przy pomocy wzorów. Musimy się zdecydować
na wybór zmiennych. W naszym zagadnieniu chcielibyśmy wiedzieć, jakiemu
przemieszczeniu ulegnie powietrze, na pewno więc odpowiednią zmienną będzie to
przemieszczenie. Oprócz tego chcielibyśmy opisać towarzyszącą temu przemieszczeniu zmianę gęstości
powietrza. Ciśnienie powietrza także się zmienia i tym samym też nas interesuje.
Ponadto powietrze porusza się przecież z jakąś prędkością, musimy więc umieć określić
prędkość jego cząsteczek. Cząsteczki powietrza poruszają się także z pewnym
przyspieszeniem. Zastanawiając się jednak nad wyborem zmiennych szybko dojdziemy do wniosku,
że prędkość i przyspieszenie będą znane, gdy będziemy wiedzieli jak przemieszczenie
powietrza zmienia się w czasie.
47-2. ROZCHODZENIE SIĘ DŹWIĘKU
323
Zapowiedzieliśmy, że będziemy się zajmować falą w jednym wymiarze. Możemy tak
postąpić, jeśli jesteśmy tak daleko od źródła, że tzw. czoło fali jest prawie płaszczyzną.
Uprościliśmy więc nasze rozważania wybierając możliwie najmniej skomplikowany
przypadek. W tej sytuacji możemy powiedzieć, że przemieszczenie x zależy tylko od
zmiennych xif,a nie zależy od y i z. Opisujemy więc ruch powietrza za pomocą funkcji #(x, /).
Czy opis ten jest zupełny? Wydawałoby się, że nie, gdyż nic nie wiemy o szczegółach
ruchu cząsteczek powietrza. Poruszają się one we wszystkich kierunkach, a tego z
pewnością nie opisuje funkcja %(x, t). Z punktu widzenia teorii kinetycznej, gdy w pewnym
miejscu gęstość cząsteczek jest większa niż w sąsiednim, cząsteczki powinny poruszać
się z obszaru o większej gęstości do obszaru o mniejszej gęstości, aż do wyrównania tej
różnicy. Nie otrzymalibyśmy więc drgań i dźwięk by się nie wytworzył. Aby mogła
powstać fala dźwiękowa, musi być spełniony pewien warunek. Otóż cząsteczki wybiegając
z obszaru o większej gęstości i ciśnieniu przekazują pęd cząsteczkom znajdującym się
w sąsiednim obszarze o mniejszej gęstości. Aby powstała fala dźwiękowa, obszar, w
którym zmienia się ciśnienie i gęstość, musi być większy od odległości, którą przebywają
cząsteczki, zanim zderzą się z innymi cząsteczkami. Ta odległość równa się średniej
drodze swobodnej i dlatego odstęp między grzbietem i doliną ciśnienia musi być znacznie
od niej większy. W przeciwnym przypadku cząsteczki poruszałyby się swobodnie od
grzbietu do doliny i natychmiast spłaszczyłyby falę.
Mamy oczywiście opisywać zachowanie się dużych obszarów gazu, których rozmiary
są znacznie większe od średniej drogi swobodnej, a więc własności gazu nie będziemy
wyjaśniali za pomocą zachowania się poszczególnych cząsteczek. Przemieszczenie, na
przykład, będzie oznaczało przesunięcie środka masy małego obszaru gazu, a ciśnienie i
gęstość będą oznaczały ciśnienie i gęstość w tym obszarze. Ciśnienie oznaczamy literą P,
a gęstość literą p. Będą one funkcjami zmiennych x i /. Musimy pamiętać, że opis ten
jest pewnym przybliżeniem, które jest słuszne tylko wtedy, gdy te własności gazu nie
zmieniają się zbyt szybko wraz z odległością.
47-3. Równanie falowe
Zjawiska fizyczne zachodzące w fali dźwiękowej odznaczają się więc następującymi
trzema własnościami:
I. Ruch gazu wywołuje zmianę gęstości.
II. Zmiana gęstości odpowiada zmianie ciśnienia.
111. Nierównomierny rozkład ciśnienia wywołuje ruch gazu.
Zajmijmy się najpierw drugą własnością. Dla gazu, cieczy lub ciała stałego ciśnienie
jest pewną funkcją gęstości. Przed nadejściem fali dźwiękowej mamy stan równowagi
przy ciśnieniu P0 i odpowiedniej gęstości p0. Ciśnienie P w ośrodku wiąże się z gęstością
pewną charakterystyczną zależnością P=f(p) i w szczególności ciśnienie w stanie
równowagi P0 jest dane przez P0 =f(Po)- Zmiany ciśnienia wywołane przez dźwięk w
porównaniu z jego wartością w stanie równowagi są bardzo małe. Wygodną jednostką, w której
mierzymy ciśnienie, jest bar; równa się on 105 N m2. Ciśnienie jednej atmosfery jest pra-
324
47. DŹWIĘK. RÓWNANIE FALOWE
wie równe ciśnieniu jednego bara: 1 atm= 1,0133 barów. W przypadku dźwięku używamy
logarytmicznej skali natężeń, ponieważ czułość ucha z grubsza biorąc wzrasta
logarytmicznie. Skalę tę nazywa się skalą decybeli. Określamy w niej poziom siły dźwięku dla
danej amplitudy ciśnienia P w następujący sposób:
/(poziom siły dźwięku) = 20 logI0(P/PsUr) w decybelach (dB), (47.1)
gdzie ciśnienie standardowe wynosi />s„n = 210~'° barów. Amplituda ciśnienia P=
= 103 • PMB = 2 ■ 10 ~7 barów*' odpowiada dźwiękowi o umiarkowanym natężeniu 60 dB.
Widzimy, że zmiana ciśnienia wywołana przez dźwięk jest bardzo mała w porównaniu z
ciśnieniem w stanie równowagi czy też ciśnieniem średnim równym 1 atm. Odpowiednio
małe są również przemieszczenia i zmiany gęstości. O wiele większe zmiany występują
podczas eksplozji, w których przyrost ciśnienia może przekraczać 1 atm. Tak duże zmiany
ciśnienia wywołują nowe zjawiska, którymi zajmiemy się później. W przypadku dźwięku
rzadko mamy do czynienia z natężeniami przekraczającymi 100 dB. Dźwięk o
natężeniu 120 dB wywołuje już uczucie bólu w uchu. Dlatego jeżeli zapiszemy dla dźwięku
P = P0 + Pe, P = Po + P,. (47.2)
to zawsze zmiana ciśnienia Pe będzie bardzo mała w porównaniu z P0, a zmiana gęstości
pe bardzo mała w porównaniu z p0. Wówczas
Po + P. =f(Po + Pe) =f(Po) + Pef(Po), (47.3)
gdzie P0=f(Po)> & f'(Po) oznacza pochodną funkcji/(p) obliczoną dla p = p0. Drugie
przekształcenie w naszej równości mogliśmy wykonać tylko dlatego, że pe jest bardzo
małe. Stwierdziliśmy w ten sposób, że przyrost ciśnienia Pe jest proporcjonalny do
przyrostu gęstości pe, wprowadzając więc współczynnik proporcjonalności k możemy napisać:
(II) P. = Kpt, K=f'{p0) = (dPldp)0. (47.4)
Ten bardzo prosty wzór jest sformułowaniem pod względem ilościowym przytoczonej
na wstępie własności II.
Zajmijmy się teraz własnością I. Położenie pewnego małego obszaru powietrza nie-
zaburzonego przez dźwięk oznaczymy przez x, a jego przemieszczenie w czasie /
wywołane przez dźwięk przez %(x, /), a więc nowe położenie tego obszaru równa się x+x(x, ')■
tak jak na rys. 47.3. Położenie sąsiedniego obszaru niezaburzonego równa się x + Ax-
a jego nowe położenie równa się x+Ax+x(x + dx, /). Zmianę gęstości możemy
obliczyć w następujący sposób. Ponieważ ograniczyliśmy się do fal płaskich, możemy
wybrać jednostkową powierzchnię prostopadłą do kierunku x, który jest kierunkiem
rozchodzenia się fali dźwiękowej. Ilość powietrza zawarta w prostopadłościanie o wysokości
x i o jednostkowej powierzchni podstawy równa się p0 Ax, gdzie p0 oznacza niezaburzoną
gęstość powietrza odpowiadającą stanowi równowagi. Powietrze to po przesunięciu przez
* Przy przyjętej tu wartości /%,.„ ciśnienie P nie oznacza najwyższego ciśnienia wywołanego
przez falę dźwiękową, ale pierwiastek ze średniego kwadratu ciśnienia, który równa się 1,(2)"2 razy
ciśnienie maksymalne.
47-J RÓWNANIE FALOWE
325
X(*,t)
pt ^
i objętość dawna i objętość nowa
V«i »-( h*-J fcn
II | I
i 1 . 1 _|
x x+Ax "+x(x,t) (x+Ax)+X(x+Ax,t)
i I
|_ x(x+A*.t) J
47.3. Przemieszczenie powietrza w punkcie x równa się xix, /), a w punkcie x+/3x wynosi x(x + Ax, r).
Początkowa objętość powietrza przypadająca na jednostkową powierzchnię fali płaskiej równa jest
ix: nowa objętość wynosi Ax + x(x + Ax, /) — x(x, t).
falę dźwiękową znajduje się między x+x(x, t) oraz x + Ax+x(x + Ax, /). A więc w tym
przedziale znajduje się ta sama ilość substancji, która była zawarta w niezaburzonym
przedziale Ax. Jeżeli p oznacza nową gęstość,
P04x=p[x+Ax + x(x+/lx,t)-x-x(x, r)]. (47.5)
Ponieważ Ax jest małe, możemy napisać x(x + Axy t)-x{x, t) = (dx/dx)Ax. Pochodna
ta jest pochodną cząstkową, ponieważ x zależy od czasu i od x. Nasze równanie
przybiera postać
Po
czyli
Ax = p(-— Ax + Ax\, (47.6)
Po = (Po + Pe) gj + Po + Pe ■ (47.7)
W fali dźwiękowej wszystkie zmiany są małe, a więc pe jest małe, x jest małe oraz dx/dx
jest także małe. Dlatego w zależności, którą przed chwilą znaleźliśmy,
P<=-p°Tx-p<-8x (47-8>
możemy pominąć pe(dx/dx) w porównaniu z p0(dxldx). W ten sposób otrzymujemy
zależność potrzebną do opisu własności I:
Sy
0) P.= -Po — . (47.9)
dx
Równanie powyższe zawiera to, czego można się spodziewać na podstawie rozważań
fizycznych. Jeżeli przemieszczenie zmienia się wraz z x, to zmienia się także gęstość. Znak
jest także w porządku: jeżeli przemieszczenie x rośnie wraz z jc, a więc powietrze rozszerza
s'?» gęstość musi maleć.
Potrzebne nam jest jeszcze trzecie równanie, równanie ruchu wywołanego przez zmianę
ciśnienia. Skoro znamy zależność między siłą i ciśnieniem, to możemy znaleźć równanie
ruchu. Jeżeli weźmiemy cienką warstewkę powietrza zawartą w prostopadłościanie o
wysokości Ax i o jednostkowej powierzchni podstawy, to masa powietrza zawartego w tej
326
47. DŹWIĘK. RÓWNANIE FALOWE
p(*,*)Z
^
-—4x -
^ P(*+Ax,t)
•9- X
warstewce wynosi p0Ax, a jej przyspieszenie
d2x/dt2. A więc iloczyn masy i
przyspieszenia tej warstewki równa się p0Ax(d2x/dt2).
(Dla małych Ax nie jest istotne, czy
przyspieszenie liczymy na brzegu, czy też wewnątrz
tej warstewki.) Jeżeli następnie obliczymy silę
działającą na warstewkę, przypadającą na
jednostkę powierzchni prostopadłej do osi
x, to wynik będzie brzmiał: p0Ax(d2xldf2).
Znamy siłę działającą w dodatnim kierunku
osi x w punkcie x, która wynosi P(x, t) na jednostkę powierzchni, oraz siłę działającą
w przeciwnym kierunku w punkcie x + Ax (rys. 47.4), wynoszącą P(x + Ax, t), a więc
47.4. Sita wypadkowa działająca w dodatnim
kierunku osi x wywołana przez ciśnienie
wywierane na jednostkową powierzchnię
prostopadłą do osi x równa się —(iPjdx) Ax
dP dPe
P(x,t)-P(x + Ax,t) = Ax=-~-Ax,
ex ex
(47.10)
ponieważ Ax jest małe, a jedyną częścią P, która się zmienia, jest dodatkowe ciśnienie
P.. Mamy więc własność HI:
' dx
(III)
~d7
(47.11)
I w ten sposób znamy już wystarczającą liczbę równań do powiązania występujących
wielkości i sprowadzenia wszystkiego do jednej funkcji, powiedzmy do funkcji x-
Możemy wyeliminować Pe z równania III, korzystając z równania II. W ten sposób
otrzymujemy
P°c?=-KTx
(47.12)
Z kolei korzystamy z równania I do eliminacji pe. W ten sposób p0 upraszcza się i
otrzymujemy równanie
dt2
-2 dx2
(47.13)
Wprowadzimy oznaczenie c2 = k, możemy więc napisać
dx2 ć dt2 '
(47.14)
To jest właśnie równanie falowe, które opisuje zachowanie się dźwięku w materii.
47-4. Rozwiązania równania falowego
Możemy teraz sprawdzić, czy równanie to naprawdę opisuje istotne własności fal
dźwiękowych w materii. Chcemy przekonać się czy impuls wywołany przez dźwięk, a więc
zaburzenie, którego rozchodzenie opisuje równanie falowe, będzie się poruszało ze stałą
47^4. ROZWIĄZANIA RÓWNANIA FALOWEGO
327
szybkością. Chcemy sprawdzić, czy dwa różne impulsy mogą się nakładać — czy słuszna
jest zasada superpozycji. Chcielibyśmy się także przekonać, czy dźwięk może poruszać
się zarówno w lewo, jak i w prawo. Wszystkie te własności powinny być zawarte w tym
właśnie równaniu.
Zauważyliśmy już, że każde zaburzenie w postaci płaskiej fali, która porusza się ze
stałą prędkością v, opisuje funkcja f(x—vt). Mamy teraz sprawdzić, czy funkcja #(x, /) =
=f(x—vt) jest rozwiązaniem równania falowego. W tym celu należy dx/dx wyrazić
przez pochodną funkcji /(x): dxldx=f'(x—vt). Różniczkując jeszcze raz otrzymamy:
d\
-±=f"(x-vt). (47.15)
ex
Różniczkowanie tej samej funkcji względem t daje —v razy pochodna funkcji, czyli
d%/dt= —vf"(x—vt). Stąd druga pochodna względem czasu równa się
~c7
= v2f"[x-vt). (47.16)
Tak więc funkcja f{x—vt) będzie spełniała równanie falowe, jeżeli prędkość fali v będzie
równa c3.
Obliczyliśmy więc na podstawie praw mechaniki, że dowolne zaburzenie dźwiękowe
rozchodzi się z prędkością cs i ponadto, że
Cs = Kl'2=(dPldP)l0'\
wiążąc tym samym prędkość fali z własnościami ośrodka.
Wprzypadku fali poruszającej się w przeciwnym kierunku, dla której ^(jc, t) = g(x+vt),
łatwo sprawdzić, że takie zaburzenie również spełnia równanie falowe. Jedyna
różnica między tą falą i falą poprzednio omawianą zawarta jest w znaku v. Ale niezależnie
od tego, czy zmienną w funkcji jest x + xt, czy x—vt, znak d2xldt2 pozostaje bez zmiany,
ponieważ pochodna zawiera tylko v2. Wynika stąd, że nasze rozwiązanie przedstawia
fale rozchodzące się w obu kierunkach z szybkością cs.
Wyjątkowo interesująca jest superpozycja rozwiązań. Załóżmy, że znaleźliśmy jedno
rozwiązanie równania falowego, np. Xi ■ Oznacza to, że druga pochodna Xi względem
x równa się iloczynowi l/c2 i drugiej pochodnej Xi względem /. Także dowolne inne
rozwiązanie Xi ma tC własność. Jeżeli dodamy oba te rozwiązania, otrzymamy:
X(x,0 = Xi(*,0 + X2(*,0-. <4717)
Chcielibyśmy teraz sprawdzić, czy #(jc, t) jest także falą, tzn. czy x spełnia równanie
falowe. Możemy to łatwo udowodnić, ponieważ
d2y d\i d\i
oraz
S2y c2y. a2v,
* ^+ *2. (47 19)
dt2 dt2 dt2
47. DŹWIĘK RÓWNANIE FALOWE
Stąd zaś wynika że d2x/dx2 = (l/c*) d2x/('t2, czyli zasada superpozycji jest spełniona.
W jej dowodzie w sposób istotny skorzystaliśmy z tego, że równanie falowe jest liniowe
względem x-
Możemy teraz przypuszczać, że świetlna fala płaska rozchodząca się w kierunku osi
x i spolaryzowana tak, że pole elektryczne ma kierunek osi y, będzie spełniała równanie
falowe
d2Ey_ 1 d2Ey
CX C Ct
2 ^ • (47.20)
gdzie c jest prędkością światła. Takie równanie falowe jest jedną z konsekwencji równań
Maxwella. Z równań elektrodynamiki będzie wynikało równanie falowe dla światła,
podobnie jak z równań mechaniki wynika równanie dla fali dźwiękowej.
47-5. Szybkość dźwięku
Wyprowadzenie równania falowego dla dźwięku pozwala nam otrzymać wzór, który
wiąże szybkość fali ze zmianą ciśnienia wywołaną zmianą gęstości i wyznaczoną dla
wartości normalnej ciśnienia:
H3:
(47.21)
Do obliczenia tej pochodnej konieczna jest znajomość zmian temperatury. Powinniśmy
oczekiwać, że w fali dźwiękowej temperatura maleje w obszarze rozrzedzenia i rośnie
w obszarze zgęszczenia. Pochodną tę pierwszy obliczył Newton zakładając, że
temperatura się nie zmienia. Sądził on, że ciepło przepływa z jednego obszaru do drugiego tak
szybko, iż temperatura nie może ani wzrosnąć, ani zmaleć. Założenie to pozwala
obliczyć izotermiczną szybkość dźwięku, która jednak nie odpowiada rzeczywistości.
Prawidłowe wyprowadzenie podał później Laplace, który zakładał coś odwrotnego że
w fali dźwiękowej ciśnienie i temperatura zmieniają się adiabatycznie. Przepływ ciepła
z obszaru zagęszczenia do obszaru rozrzedzenia można pomijać tylko dopóty, dopóki
długość fali będzie stosunkowo duża w porównaniu ze średnią drogą swobodną. Przy
tym założeniu mały strumień ciepła wywołany falą dźwiękową nie zmienia prędkości,
chociaż pochłania nieco energii dźwięku. Możemy słusznie oczekiwać, że ta absorpcja
wzrośnie, gdy długość fali zbliży się do średniej drogi swobodnej, ale takie długości są
mniejsze o około milion razy od długości fali słyszalnych dźwięków.
A więc w fali dźwiękowej zmiana ciśnienia przy zmianie gęstości odbywa się bez
przepływu ciepła. To odpowiada adiabatycznej zmianie ciśnienia, dla której, jak wiemy, PV =
= const, gdzie V oznacza objętość. Ponieważ gęstość p zmienia się jak 1/V, dla procesów
adiabatycznych związek P z p jest następujący:
P=consty. (47.22)
Stąd zaś dPjdp = yPlp. Mamy wiec następującą zależność dla szybkości dźwięku:
47-5 SZYBKOŚĆ DŹWIĘKU
329
c;=—. (47.23)
P
Możemy także napisać c]~yPVipV i skorzystać z zależności pV=NkT. Następnie
widzimy, że pV jest masą gazu, którą możemy także wyrazić jako Nm lub jako //, gdzie m
oznacza masę cząsteczki a // jest masą jednego mola. W ten sposób znajdujemy, że
c]J<TjRT (4?24)
m fi
Stąd staje się oczywiste, że szybkość dźwięku zależy tylko od temperatury gazu, a nie od
ciśnienia ani od objętości. Wiemy także, że
kr = im<r2>, (47.25)
gdzie <t>2> jest średnią kwadratową szybkości cząsteczek. Stąd wynika, że c2 = (y/3)<t>2>,
czyli
l/2\
(47.26)
^(jwijoir
Równanie to głosi, że szybkość dźwięku jest liczbą, która równa się w przybliżeniu
iloczynowi l/(3)"2 i pewnej uśrednionej szybkości cząsteczek vb (pierwiastkowi
kwadratowemu średniej kwadratów prędkości). Inaczej mówiąc, szybkość dźwięku jest wielkością
tego samego rzędu co szybkość cząsteczek, a właściwie jest nieco mniejsza od ich
średniej szybkości.
Mogliśmy się oczywiście spodziewać takiego wyniku, trzeba bowiem pamiętać, że takie
zaburzenie jak zmiana ciśnienia rozchodzi się przede wszystkim dzięki ruchowi cząsteczek.
Rozumowanie to nie podaje nam jednak dokładnej szybkości rozchodzenia się dźwięku.
Mogłoby się okazać, że dźwięk jest przenoszony przede wszystkim przez najszybsze
cząsteczki lub przez najwolniejsze. A więc zupełnie uzasadnione i zadowalające jest
stwierdzenie, że szybkość dźwięku z grubsza biorąc okazała się równa \ średniej szybkości
cząsteczek viT.
48
dudnienia
48-1. Dodawanie dwóch fal
Niedawno omawialiśmy dość szczegółowo własności fal świetlnych i ich interferencję,
tzn. zjawisko superpozycji dwu fal pochodzących z różnych źródeł. Zakładaliśmy
wówczas, że częstości obu źródeł są takie same. Obecnie zajmiemy się pewnymi zjawiskami,
które zachodzą na skutek interferencji fal z dwu źródeł o różnych częstościach.
Łatwo przewidzieć przebieg tego zjawiska. Postępując w ten sam sposób jak
poprzednio załóżmy, że mamy dwa jednakowe źródła drgające o tej samej częstości, których fazy
są tak dopasowane, że sygnały dobiegają do punktu P ze zgodnymi fazami. W punkcie
tym występuje bądź silne światło, jeżeli są to fale świetlne, bądź bardzo głośny dźwięk
w wypadku sygnałów głosowych albo też znajduje się tam wiele elektronów, jeżeli mamy
do czynienia ze źródłami elektronów. Z drugiej strony, gdy fazy różnią się o 180°, nie
otrzymujemy żadnego sygnału w punkcie P, ponieważ wypadkowa amplituda osiąga
wtedy minimum. Przypuśćmy teraz, że ktoś przekręca „gałkę regulacji fazy" jednego
ze źródeł i zmienia w ten sposób fazę w punkcie P, np. od powiedzmy 0° do 180° i z
powrotem. Wtedy oczywiście stwierdzimy zmianę w natężeniu sygnału wypadkowego.
Widzimy więc, że gdy faza jednego źródła powoli zmienia się względem fazy drugiego,
stopniowo i regularnie przechodząc przez 0°, 10°, 20°, 30°, 40° itd., to w punkcie P
stwierdzimy serie silnych i słabych „pulsacji". Jeżeli bowiem faza przechodzi przez 360°,
amplituda powtórnie osiąga maksimum. Stwierdzenie, że jedno źródło przesuwa swą faz?
względem fazy drugiego w sposób jednostajny, jest oczywiście równoważne stwierdzeniu,
że liczby drgań na sekundę obu źródeł nieznacznie się różnią.
A więc znamy już odpowiedź: jeżeli mamy dwa źródła o nieznacznie się różniących
częstościach, w wyniku otrzymamy wypadkowe drganie o powoli zmieniającym się
natężeniu. I to jest naprawdę wszystko, co zawiera nasz temat!
48-1. DODAWANIE DWÓCH FAL
331
Łatwo jest także sformułować ten wynik matematycznie. Załóżmy na przykład, że
mamy dwie fale i że na razie nie troszczymy się wcale o zależności przestrzenne, lecz po
prostu badamy, co przybywa do punktu P. Z jednego źródła mamy, na przykład, cos w,/,
a z drugiego cosco2f, przy czym obie wartości w nie są dokładnie takie same. Oczywiście,
amplitudy mogą być także różne, ale ten ogólniejszy problem zostawimy na później;
z początku zajmijmy się przypadkiem jednakowych amplitud. Zatem całkowite
wychylenie w punkcie P będzie sumą tych cosinusów. Jeżeli wykreślimy zależność od czasu, jak
na rys. 48.1, to zobaczymy, że dla obu fal, tam gdzie spotykają się grzbiety fal, wystąpi
silne wychylenie, a gdzie zbiegną się grzbiety z doliną, praktycznie otrzymujemy zero,
dwie natomiast doliny znów dadzą silną falę.
Aby to wyrazić w postaci matematycznej, musimy tylko dodać dwa cosinusy i
wykonać parę przekształceń. Istnieje między cosinusami wiele użytecznych zależności, które
nietrudno wyprowadzić. Oczywiście, pamiętamy, że
e'ł'+w=etae", (48.1)
oraz że e'" ma część rzeczywistą, równą cos a, oraz część urojoną równą sin o. Część
rzeczywista e'ia+b) równa się cos (a + b). Gdy pomnożymy:
e'" e'b = (cos a + i sin a) (cos b + i sin b),
otrzymamy cos a cos b — sin a sin b plus pewna część urojona. Nas jednak interesuje tylko
część rzeczywista, a więc mamy
cos(a + fc) = coso cosb— sina sinfc. (48.2)
Zmieniając znak b otrzymujemy, ponieważ cosinus nie zmienia znaku wraz z b a sinus
48.1. Nakładanie się dwu fal cosinusoidalnych o częstościach w stosunku 8:10. Nie zawsze musi
występować dokładne powtórzenie kształtu fali wewnątrz każdego „garbu"
cos Wjft
WWWWWIAA
wwwww
cosSjrt
cos(5jrt/2)+cos 2jrt=2cos (irt/4)- cos (9jrt/4)
332
48. DUDNIENIA
go zmienia, następującą równość:
cos (a — b)=cos a cos b + sin a sin b. (48.3)
Gdy dodamy te dwie równości, wyrazy z sinusami uproszczą się i widzimy, że iloczyn
dwóch cosinusów równa się \ cosinusa sumy plus \- cosinusa różnicy:
cos a cos b = \ cos {a + b) + \ cos {a — b). (48.4)
Możemy także odwrócić ten wzór i wyprowadzić wzór dla cos a + cos fi, jeżeli tylko
podstawimy <x = a + b i f}=a — b, tzn. przyjmiemy a = \~(<x + fł) oraz b = \(<x—fi), tak że
cos a + cos P = 2 cos \ (a + /?) cos i (a - /?). (48.5)
Teraz możemy przejść do naszego problemu. Suma cos co,/ oraz cos co2/ równa się
cosco, r+cosco2i=2 cosJ(w,+G)2)icosi(w,— co2)i. (48.6)
Załóżmy teraz, że obie częstości są tu prawie jednakowe, a więc \-ifiii + o)2), średnia
częstość, jest mniej więcej taka sama jak każda ze składowych. Ale w, — w2 jest znacznie
mniejsze zarówno od w,, jak i od <a2, ponieważ zgodnie z założeniem co, i <o2 są prawie
równe. To znaczy, że możemy przedstawić rozwiązanie jako falę cosinusoidalną o wysokiej
częstości, mniej więcej zbliżonej do częstości składowych, której „kształt" powoli się
zmienia — pulsuje z częstością równą i(<w, — w2). Ale czy z taką częstością słyszymy
dudnienie? Chociaż wzór (48.6) mówi, że amplituda zmienia się jak cos ^ (co, — a>2), to
naprawdę chodzi w nim tylko o to, że oscylacje o wysokiej częstości są zawarte między
dwoma cosinusoidami o przeciwnych znakach (wykreskowanymi na rys. 48.1). Na tej
podstawie można powiedzieć, że amplituda zmienia się z częstością \(<ay —oo2), jeżeli
jednak interesuje nas natężenie fali, to musimy uznać, że zmienia się ono z dwukrotnie
większą częstością. To znaczy, że modulacja amplitudy, gdy chodzi o wielkość
natężenia, odbywa się z częstością w, — co2, chociaż ze wzoru widzimy, że mnożymy przez cosi-
nusoidę, która ma częstość dwa razy mniejszą.
Pomijając tę małą komplikację, wnioskujemy, że dodając dwie fale o częstościach
co, i w2 otrzymamy falę wypadkową o średniej częstości i(W|+w2). której natężenie
zmienia się z częstością <al—w2.
Jeżeli obie amplitudy są różne, to możemy wszystko wykonać jeszcze raz mnożąc
cosinusy przez różne amplitudy At i A2 i wykonując za pomocą równań (48.2)-(48.5)
szereg przekształceń. Tę samą analizę można jednak przeprowadzić inaczej i łatwiej.
Wiemy na przykład, że znacznie łatwiej pracować posługując się zespolonymi funkcjami
wykładniczymi niż funkcjami trygonometrycznymi. Wtedy bowiem możemy
przedstawić Ai cos Wit jako część rzeczywistą At exp(iW|f). Druga fala byłaby podobnie częścią
rzeczywistą A2 exp(iw2t). Gdy je dodamy otrzymamy Ax exp(iw,r) + /42 exp (iw2t). Je"
żeli następnie wydzielimy wyraz z częstością średnią, otrzymamy:
A t exp (ia>l ) + A2 exp (ico21) = exp [^ i (co, + w2) i] x
x {A! exp [} i (co, -<o2) t] -M2exp[ -{• i (c^-coj)/]} . (48.7)
I znów mamy falę o wysokiej częstości z amplitudą, która zmienia się z mniejszą częstością
48-2. DUDNIENIE I MODULACJA
333
48-2. Dudnienie i modulacja
Jeśli chcemy znaleźć natężenie fali, którą przedstawia równanie (48.7), możemy wziąć
kwadrat wartości bezwzględnej lewej, bądź też prawej strony. Zróbmy to dla lewej strony.
Wówczas natężenie będzie się równało
I = A2i+Al + 2At A2cos{coi-co2)t
(48.8)
<U|=6j£=UJ
48.2. Wynik złożenia dwu
zespolonych wektorów o równych
częstościach
Widzimy, że natężenie wzrasta i maleje z częstością w,—o»2 zmieniając się w granicach
od (Ai +A2)2 do (Ai— A2)2- Jeśli Ay^A2, to minimalne natężenie nie równa się zeru.
To samo można też przedstawić graficznie,
w sposób zilustrowany na rys. 48.2. Rysujemy
wektor o długości A,, obracający się z częstością
w i. Wektor ten przedstawia jedną z fal w
płaszczyźnie zespolonej. Drugi wektor o długości A2,
obracający się częstością co2, przedstawia inną
falę. Jeżeli te dwie częstości będą dokładnie
równe, w wyniku otrzymujemy obracający się wektor
o stałej w czasie długości, tzn. ze złożenia dwóch
fal otrzymamy falę o określonym, ustalonym
w czasie natężeniu. Ale gdy częstości będą się
nieznacznie różnić, oba zespolone wektory będą się
obracać z różnymi szybkościami. Rysunek 48.3
przedstawia, jak to wygląda z punktu widzenia
wektora /4, exp (iw,/). Wektor A2exp(ia)2t)
powoli się obraca oddalając się od A {. Z początku
amplituda, którą otrzymujemy ze złożenia dwóch
wektorów, jest duża, później, gdy wektor A2
oddalając się osiągnie 180° względem At,
wypadkowa amplituda będzie najmniejsza, itd. Gdy
wektory obracają się, amplituda ich sumy kolejno
wzrasta i maleje i tak samo pulsuje natężenie. Są
to stosunkowo proste sprawy i istnieje wiele
różnych sposobów ich przedstawienia.
Można bardzo łatwo obserwować te zjawiska
eksperymentalnie. Jeżeli chodzi o drgania
akustyczne, to możemy ustawić dwa głośniki sterowane
przez dwa oddzielne oscylatory, po jednym dla
każdego głośnika. Każdy głośnik wydaje pewien
ton. Słyszymy więc z obu źródeł różne tony. Gdy
obie częstości będą dokładnie takie same,
otrzymamy określone natężenie w każdym punkcie
przestrzeni. Jeśli teraz trochę rozstroimy oscylatory,
Usłv*i7vmv npu/m 7minnf» nntP^Pnin H-źu/i*»I^n Iro
48.3. Wynik złożenia dwu
zespolonych wektorów o różnych
częstościach widziany w obracającym się
układzie odniesienia jednego z
wektorów. Widać 9 kolejnych położeń
wolno obracającego się wektora
334
48. DUDNIENIA
bardziej głośniki są rozstrojone, tym
szybciej następują zmiany dźwięku. Ucho z
trudnością odbiera zmiany szybsze niż około 10
na sekundę.
Możemy także obserwować to zjawisko
na ekranie oscyloskopu, gdzie widzimy sumę
.„„,.. r , ,., . prądów płynących do dwu głośników. Gdy
48.4. Zmodulowana fala nośna. Na tym r •* r j -z j o ^y
schematycznym wykresie ««/«,„ = 5. W zwy- częstość pulsacji jest stosunkowo niska, wi-
kłej fali radiowej (oc/(o„« 100 dzimy po prostu falę sinusoidalną o
pulsującej amplitudzie, ale gdy przyspieszymy pul-
sacje, widzimy taką falę jak na rys. 48.1.
Gdy różnica częstości rośnie, „grzbiety" zbliżają się coraz bardziej. Także gdy
amplitudy nie są równe i gdy zwiększymy jeden sygnał w porównaniu z innymi, otrzymamy falę,
której amplituda, zgodnie z przewidywaniem, nigdy nie będzie równa zeru. Wszystko
dzieje się jak trzeba, zarówno w akustyce, jak i w elektryczności.
Występuje także zjawisko odwrotne! Przy emisji fal radiowych z rozgłośni
wykorzystujących zjawisko modulacji amplitudy (MA) dźwięk jest emitowany w następujący
sposób: Nadajnik radiowy emituje drgania elektryczne o stałej amplitudzie (AS) i o bardzo
dużej częstości, np. 800 kHz, zawartej w paśmie przeznaczonym dla danej rozgłośni.
Jeżeli ten sygnał nośny zostanie włączony, radiostacja będzie emitować falę o stałej
amplitudzie i o częstości 800 000 Hz. Sposób przekazywania „informacji" polega na tym, że
w chwili, gdy ktoś mówi do mikrofonu, amplituda sygnału nośnego zmienia się w rytmie
drgań dźwiękowych dochodzących do mikrofonu.
W najprostszej, z punktu widzenia matematyki, sytuacji, gdy śpiewaczka śpiewa
czystym głosem jedną nutę i jej struny głosowe drgają dokładnie sinusoidalnie,
otrzymujemy sygnał, którego natężenie zmienia się tak, jak widać z rys. 48.4. Z kolei częstość
akustyczną odczytuje odbiornik, który odrzuca falę nośną i zajmuje się tylko jej
„opakowaniem", a więc drganiami strun głosowych, czyli głosem śpiewaczki. Z kolei głośnik
wywołuje odpowiednie drgania powietrza o tej samej częstości i jak się to zwykle mówi,
słuchacz ma pełne złudzenie żywego głosu. W rzeczywistości na skutek licznych
zniekształceń i innych subtelnych efektów, łatwo stwierdzić, czy słuchamy radia czy też
bezpośrednio śpiewaczki, poza tym wszystko jest tak, jak powiedzieliśmy wyżej.
48-3. Pasma boczne
Falę zmodulowaną, o której mówiliśmy przed chwilą, można przedstawić w postaci
następującego wzoru:
S = (l + bcoscomt)coswct, (48.9)
gdzie wc oznacza częstość nośną, a o»m — częstość akustyczną. Znów korzystamy z
naszych twierdzeń o cosinusach lub też bierzemy e", co jest łatwiejsze, a w obu wypadkach
wynik jest taki sam. Otrzymujemy wówczas:
Wm
48-3. PASMA BOCZNE
335
S = coswc t + i b cos {wc + com) t +
+ łbcos(wc-wm)t. (48.10)
Patrząc na ten wzór z innego punktu
widzenia możemy powiedzieć, że fala wychodząca
składa się z nałożonych na siebie trzech fal:
ze zwykłej fali o częstości o»c, tzn. o częstości
nośnej oraz z dwu nowych fal o dwu nowych
częstościach. Jedna z nich równa się sumie
częstości nośnej i częstości modulacji, a
druga — ich różnicy. Gdy więc wykreślimy
natężenie dźwięku wytwarzanego przez generator jako funkcję częstości drgań, to
oczywiście stwierdzimy bardzo duże natężenie przy częstości nośnej, ale gdy nagle artysta
zaśpiewa, to od razu zauważymy natężenie proporcjonalne do siły głosu artysty b2, przy
częstości wc + wmorazojc—a>m, jak to widać z rys. 48.5. Są to tzw. pasma boczne. Gdy
nadajnik emituje modulowany sygnał, pojawiają się pasma boczne. Jeżeli występuje więcej
niż jeden ton jednocześnie, np. io„ i <am., gdy grają dwa instrumenty lub gdy pojawia się
inna skomplikowana fala cosinusoidalna możemy stwierdzić na podstawie obliczeń, że
mamy wówczas dwie nowe fale, które odpowiadają częstościom wm±a»m-.
Dlatego gdy występuje skomplikowana modulacja, którą można przedstawić jako
sumę wielu cosinusów*', okazuje się, że nadajnik emituje sygnały w szerokim paśmie
częstości zawartym między częstością równą sumie częstości nośnej i maksymalnej
częstości, którą zawiera modulowany sygnał, i częstością równą różnicy tych częstości.
Chociaż początkowo mogliśmy sądzić, że nadajnik radiowy emituje tylko nominalną
częstość nośną, ponieważ zawiera wielkie superstabilne krystaliczne obwody drgające
i wszystko jest tak dobrane, aby wypadło dokładnie 800 kHz, to w momencie, gdy ktoś
zapowiada, że mówi na częstości 800 kHz, tym samym tak moduluje te 800 kHz, że nie
mamy już dokładnie 800 kHz! Jeżeli wzmacniacze tak są zbudowane, że mogą pracować
w zakresie odpowiadającym czułości uszu (ucho słyszy dźwięk o częstościach do 20 000 Hz,
lecz zwykle nadajniki radiowe i odbiorniki nie pracują powyżej 10 000 kHz, a więc nie
słyszymy najwyższych częstości), to gdy ktoś mówi, a jego głos może na przykład
zawierać częstości aż do 10 000 Hz, nadajnik emituje częstości zawarte w zakresie od 790
do 810 kHz. Gdyby więc istniała inna stacja pracująca na częstości 795 kHz, powstałyby
zakłócenia. Gdybyśmy natomiast zbudowali odbiornik tak czuły, że odbierałby tylko
800 kHz, a nie reagowałby na odchylenia częstości 10 kHz w obie strony, to nie
słyszelibyśmy w ogóle spikera, ponieważ informacje zawarte byłyby właśnie w tych innych czę-
*' Mała dygresja. Pylanie: W jakich warunkach dowolną krzywą można przedstawić jako sumę
dużej liczby cosinusów? Odpowiedz: We wszystkich zwykłych okolicznościach oprócz kilku tych, które
wymyślili matematycy. Oczywiście, krzywa musi mieć tylko jedną wartość w danym punkcie i nie
może to być zwariowana krzywa, która skacze nieskończoną liczbę razy na nieskończenie małym odcinku
lub wyczynia coś podobnego. Ale oprócz tych ograniczeń każda sensowna krzywa (i ta, którą
wytworzą drgające struny głosowe występującego śpiewaka) może być zawsze przedstawiona jako suma fal
cosinusoidalnvch.
/.i
OJc-<*>m <*>c <->c+<^m
U)
48.5. Widmo częstości fali nośnej <x>c
zmodulowanej jedną falą cosinusoidalna co„
336
48. DUDNIENIA
stościach! Dlatego bezwzględnie konieczne jest rozmieszczanie częstości stacji nadawczych
w pewnych od siebie odległościach, tak aby ich pasma boczne nie nakładały się. Również
odbiornik nie może być tak selektywny, aby nie zezwalał na odbiór pasm bocznych
razem z główną częstością nominalną. W przypadku dźwięku nie mamy z tym wielkich
kłopotów. Możemy słyszeć w zakresie ±20 kHz i zwykle mamy od 500 do 1500 kHz
w paśmie radiofonii, tak że jest bardzo dużo miejsca dla ogromnej liczby stacji
nadawczych.
Nieco gorzej jest z telewizją. Gdy strumień elektronów obiega ekran telewizora, to
widzimy na nim różne małe plamki jasne i ciemne. Ich „jasność" i „ciemność" jest
„sygnałem". Zwykle strumień elektronów omiata cały obraz w przybliżeniu 500 linii *', w ciągu
jg s. Załóżmy, że rozkład obrazu jest taki sam w kierunku poziomym, jak i pionowym,
tak że wzdłuż linii, po której biegnie strumień, znajduje się taka sama liczba plamek na
1 cm2. Chcemy odróżnić plamki jasne od ciemnych, np. na 500 liniach. Aby można było
to zrobić przy pomocy fal cosinusoidalnych, najmniejsza długość fali musi odpowiadać
długości fali równej około 2-|g części rozmiarów ekranu. A więc mamy 250-500-30
informacji w ciągu sekundy. Najwyższa częstość, którą mamy przenieść, bliska jest zatem 4 MHz.
W rzeczywistości rozmieszczając stacje tak, aby się nie zakłócały, korzystamy z nieco
szerszego pasma, około 6 MHz; część tego pasma wykorzystujemy do przenoszenia
dźwięku oraz innych informacji. A więc kanały telewizyjne" mają szerokość 6 MHz.
Oczywiście, nie można transmitować programów telewizyjnych na fali nośnej o częstości 800 kHz,
ponieważ częstość modulacji nie może być większa od częstości nośnej.
W każdym razie pasmo telewizyjne rozpoczyna się od częstości 54 MHz. W USA
pierwszy kanał telewizyjny nazywany kanałem 2 (!) jest zawarty między 54 MHz i 60 MHz,
a więc jego szerokość równa się 6 MHz **'. „Ale przecież" — mógłby ktoś powiedzieć
— „przed chwilą udowodniliśmy istnienie pasm bocznych po obu stronach i dlatego kanał
powinien być dwukrotnie szerszy." Okazuje się, że inżynierowie radiotechnicy są bardzo
przemyślni. Jeżeli zanalizujemy sygnał modulacji rozkładając go nie na cosinusy, lecz na
sinusy i cosinusy, aby uwzględnić różnice faz, to okaże się, że istnieje określona stała
zależność między pasmem bocznym po stronie wysokiej częstości i pasmem po stronie
niskiej częstości. Rzecz w tym, że to drugie pasmo boczne nie zawiera nowych informacji.
A więc należy odciąć jedno pasmo boczne i tak zbudować odbiornik, aby mógł
odzyskać brakującą informację tylko za pomocą sygnału nośnego i jednego pasma
bocznego. Przenoszenie informacji za pomocą tylko jednego pasma bocznego jest bardzo sprytną
metodą zmniejszania szerokości pasma potrzebnego do przekazywania informacji.
48-4. Zlokalizowane paczki falowe
Następnym zjawiskiem, które chcemy rozpatrzyć, jest interferencja fal jednocześnie
w przestrzeni i czasie. Załóżmy, że -w przestrzeni rozchodzą się dwie fale. Wiemy, oczywi-
•' W Polsce 625 linii. (Przyp. tłum.)
**' W Polsce obraz telewizyjny ma 625 linii i dlatego szerokość kanałów jest nieco większa i
wynosi 6.5 MHz. (Przyp. tłum.)
48-4. ZLOKALIZOWANE PACZKI FALOWE 337
ście, że falę rozchodzącą się w przestrzeni możemy przedstawić jako e"*"'"'"". Może to być
na przykład przemieszczenie wywołane falą dźwiękową. Funkcja ta będzie rozwiązaniem
równania falowego pod warunkiem, ±e'io2 = k2c2, gdzie c jest szybkością rozchodzenia się
fali. W tym przypadku możemy to zapisać jako e'*(x~c,), co jest szczególnym przypadkiem
funkcji f(x-ct). Taka funkcja przedstawia falę, która biegnie z szybkością w/k, a. właśnie
tyle wynosi c i wszystko jest w porządku.
Chcemy teraz dodać dwie takie fale. Załóżmy, że jedna z biegnących fal ma pewną
częstość, a druga — częstość od niej różną. Pozostawiamy czytelnikowi zajęcie się przypadkiem,
gdy również amplitudy są rożne: nie wprowadza to żadnej istotnej różnicy. Chcemy więc
dodać exp [i'(io,f —/c,x)] + exp [i{oj1t — k2x)\. Możemy postąpić tak samo jak przy
dodawaniu sygnałów. Oczywiście, łatwo to zrobić, gdy c jest takie samo dla obydwu fal, ponieważ
postępowanie nie różni się od tego co robiliśmy poprzednio:
exp[i<y,(f-x/e)]+exp[/<y2(f — x/c)]=exp(ito, t') + exp(iw2t'), (48.11
z tym wyjątkiem, że teraz zmienną jest t' = t — xjc, a nie /. Otrzymaliśmy więc naturalnie
ten sam rodzaj modulacji, ale widzimy, że te modulacje poruszają się wraz z falą. Inaczej
mówiąc, gdy dodajemy dwie fale, które nie tylko oscylują, ale także poruszają się w
przestrzeni, wówczas fala wypadkowa porusza się także z tą samą szybkością.
Chcemy teraz uogólnić, to na przypadek fal, dla których zależność między częstością
i liczbą falową k nie jest tak prosta. Przykład: substancja ma pewien współczynnik
załamania. Zajmowaliśmy się już teorią współczynnika załamania w rozdz. 31. Przekonaliśmy się
wtedy, że możemy napisać k = nw/c, gdzie n oznacza współczynnik załamania. Tak na
przykład dla promieni Róntgena obliczyliśmy, że współczynnik załamania n wynosi:
n=\ ^-z. (48.12)
2e0mw
Właściwie w rozdz. 31 znaleźliśmy bardziej skomplikowane wzory, ale ten jako przykład
jest równie dobry.
Przy sposobności przypomnimy, że nawet gdy oj i k nie są wprost proporcjonalne,
stosunek co/k z pewnością oznacza szybkość rozchodzenia się przy danej częstości i liczbie
falowej. Nazywamy ten stosunek prędkością fazową. Jest to prędkość, z jaką porusza się
faza, np. węzeł pojedynczej fali:
vf=— (48.13)
Prędkość fazowa promieni Róntgena w szkle jest większa od szybkości światła w próżni
[ponieważ n we wzorze (48.12) jest mniejsza od l]. Trochę nas to niepokoi, ponieważ nie
przypuszczaliśmy, że można wysyłać sygnały biegnące szybciej od światła!
Zajmiemy się teraz interferencją dwu fal, dla których wielkości tu i k związane są
określoną zależnością. Powyższy wzór dla n mówi, że k jest określoną funkcją w. Ściśle mówiąc,
w tym szczególnym przypadku zależność A: od w jest następująca:
co a
k = ,
c we
(48.14)
338
48 DUDNIENIA
gdzie a = Nq]/2c0m i jest stałe. W każdym razie określonej częstości odpowiada określona
liczba falowa i właśnie dwie takie fale chcemy dodać.
Postąpmy tak jak w równaniu (48.7):
exp[i(cu, t-kl x)~] + exp[i(a>2t - k2x)] = exp{ł i[(wl+a}2)t-(kl+ k2)x]} x
x(exp{łi[lu)l-w2)t-(kl-k2)x]} + eKp{-ti[(toi-o)2)t-(kl-k2)x]}). (48.15)
A więc znów mamy falę zmodulowaną, poruszającą się ze średnią częstością i mającą
średnią liczbę falową; natomiast jej natężenie zmienia się zależnie od różnicy częstości
i różnicy liczb falowych.
Zajmijmy się przypadkiem względnie małej różnicy między obiema falami. Załóżmy,
że dodajemy dwie fale, których częstości są prawie równe; wówczas (cu, + cu2)/2 jest
praktycznie biorąc równe każdej z co. To samo dotyczy wyrażenia (kl +k2)/2. Zatem szybkość
fali, szybkość węzłów nie zmienia się i wynosi nadal co/k. Ale spójrzmy, szybkość
rozchodzenia się modulacji jest inna! O ile trzeba zmienić x, aby skompensować zmianę wywołaną
upływem czasu /? Szybkość rozchodzenia się modulującej fali równa się stosunkowi
co, — a>2
"M=71-ri (4816)
k, — k2
Czasami szybkość rozchodzenia się modulacji nazywamy prędkością grupową. Jeżeli
zajmiemy się przypadkiem, w którym różnica częstości jest względnie mała i różnica liczb
falowych jest także mała, to nasze wyrażenie w granicy osiąga wartość
dco
••-«■ <48">
Wynika stąd coś bardzo dziwnego, że dla najwolniejszych modulacji, najwolniejszych
dudnień istnieje określona szybkość ich rozchodzenia się, która różni się od fazowej szybkości
fal!
Prędkość grupowa równa się pochodnej co względem k, a prędkość fazowa wynosi io/k.
Sprawdźmy, czy rozumiemy, dlaczego tak jest. Zastanówmy się znów nad dwiema
falami o mało różniących się długościach, jak na rys. 48.1. Są one kolejno najpierw w fazie,
potem nie w fazie, itd. Otóż teraz przedstawiają one również rzeczywiste fale o nieco
różnych częstościach rozchodzące się w przestrzeni. Ponieważ jednak prędkości fazowe,
prędkości węzłów obu fal nieco się różnią, dzieje się coś nowego. Załóżmy, że poruszamy
się wraz z jedną z nich i obserwujemy drugą. Jeżeli obie poruszają się z tą samą szybkością,
to druga pozostaje stale w tym samym miejscu względem nas, gdy jedziemy na grzbiecie
pierwszej. Jedziemy na grzbiecie fali i obok widzimy stale grzbiet drugiej. Gdy obie
szybkości są takie same, ich grzbiety stale się pokrywają. Ale w naszym przypadku obie szybkości
naprawdę nie są jednakowe. Częstością różnią się niewiele, a więc i mała jest różnica ich
szybkości. Ale ponieważ prędkości nie są jednakowe, to gdy poruszamy się wraz z jedną
falą, druga z nich wyprzedza nas lub zostaje z tyłu. Co się więc dzieje z węzłem w miarę
upływu czasu? Jeśli jedną falę przesuniemy odrobinę do przodu, to węzeł przesunie się
48-*. ZLOKALIZOWANE PACZKI FALOWE
339
do przodu (lub do tyłu) na dostrzegalną odległość. Suma obu tych fal ma zatem otoczkę,
która, gdy fale się poruszają, przesuwa się wraz z nimi, ale z inną szybkością. Prędkość
grupowa jest szybkością, z którą są przesyłane modulujące sygnały.
Jeżeli wytworzymy sygnał, tzn. pewną zmianę fali, którą może stwierdzić słuchacz,
to sygnał ten, będący pewną modulacją fali, porusza się z szybkością grupową, jeżeli
modulacje te były względnie powolne. (W przypadku szybkich modulacji analiza jest
znacznie trudniejsza.)
Teraz już (po wielu trudach) możemy udowodnić, że szybkość rozchodzenia się
promieni Róntgena w kawałku węgla nie jest większa od szybkości światła, chociaż jest od
niej większa szybkość fazowa. W tym celu musimy obliczyć wartość dco/dk, korzystając
z wzoru (48.14): dk/dco = (llc) + (a/a)2c). Prędkość grupowa równa się odwrotności tego
wyrażenia, a więc
c
i jest mniejsza od c! Chociaż więc fazy mogą poruszać się szybciej niż światło, modulujące
sygnały poruszają się wolniej i takie jest właśnie rozwiązanie pozornego paradoksu!
Oczywiście, w prostym przypadku, gdy w = kc, dcjfók także równa się c. A więc gdy
wszystkie fazy mają tę samą prędkość, to będzie ona równa także prędkości grupowej.
48-5. Amplitudy prawdopodobieństw dla cząstek
Zajmijmy się jeszcze jednym bardzo interesującym przykładem prędkości fazowej.
Dotyczy on mechaniki kwantowej. Wiemy, że amplituda określająca prawdopodobieństwo
znalezienia cząstki w jakimś miejscu może się w pewnych okolicznościach zmieniać w
przestrzeni i w czasie; w jednowymiarowym przypadku będzie się ona zmieniała
następująco:
v, = Aeila"-kx\ (48.19)
gdzie co oznacza częstość związaną z klasycznym pojęciem energii E=hw, a k jest liczbą
falową, która wiąże się z pędem p=hk. Mówimy, że cząstka ma określony pęd p, jeżeli
jej liczba falowa dokładnie równa się k, czyli jeżeli będzie to fala idealna, poruszająca się
wszędzie z tą samą amplitudą. Równanie (48.19) określa tę amplitudę i gdy obliczymy
kwadrat jej bezwzględnej wartości, otrzymamy względne prawdopodobieństwo znalezienia
cząstki jako funkcję położenia i czasu. W tym przypadku daje to stałą wartość, to znaczy,
że prawdopodobieństwo znalezienia cząstki jest w każdym miejscu takie samo. Załóżmy
jednak coś przeciwnego: sytuację, w której cząstkę łatwiej znaleźć w jednym miejscu niż
w jakimś innym. Przedstawimy to przy pomocy fali, która ma jedno maksimum i znika
na obu końcach (rys. 48.6). (To nie jest całkiem taka sama fala jak przedstawiona na rys.
48.1, która ma szereg maksimów. Można jednak dodając parę fal o prawie takich samych
(o i k zlikwidować wszystkie maksima oprócz jednego.)
W tych warunkach, ponieważ kwadrat wyrażenia (48.19) przedstawia prawdopodo-
340
48. DUDN1EN1A
#*
bieństwo znalezienia cząstki w pewnym
miejscu, wiemy, że w danej chwili cząstka
najprawdopodobniej znajduje się blisko
środka „paczki", gdzie amplituda fali
jest największa. Jeżeli teraz odczekamy
chwilę, to ponieważ fale się poruszają,
„paczka" przesunie się w inne miejsce.
48.6. Zlokalizowana paczka falowa Jeżeli wiedzieliśmy, że początkowo
cząstka, zgodnie z teorią klasyczną,
znajdowała się w jakimś miejscu, to spodziewamy się, że po pewnym czasie na pewno będzie
gdzie indziej, ponieważ ma pewną prędkość i pęd. Teoria kwantowa przejdzie więc w
poprawną teorię klasyczną zależności między pędem, energią i prędkością tylko wtedy, gdy
prędkość grupowa, prędkość modulacji będzie się równała prędkości, którą
otrzymalibyśmy zgodnie z teorią klasyczną dla cząstki o tym samym pędzie.
Musimy teraz sprawdzić, czy tak jest naprawdę. Zgodnie z teorią klasyczną energia
wiąże się w następujący sposób z prędkością:
mc2
£ = —== . (48.20)
Vi-i>V
Podobnie pęd równa się
mv
p=-r== (48.21)
Vl-D2/C2
Jest to teoria klasyczna i na jej podstawie eliminując v możemy udowodnić, że
£2-pV = mV.
Jest to ten wielki wzór dla czterowektora energii — pędu, o którym tyle mówiliśmy:
pi,pi, = m2. Określa on zależność między energią i pędem w teorii klasycznej. Teraz oznacza
on (po podstawieniu E=hto oraz p=hk), że w mechanice kwantowej musi być spełnione
równanie
hW-h2k2 = m2c2 (48 22)
c2
Taka jest więc w mechanice kwantowej zależność między częstością i liczbą falową fali
przedstawiającej cząstkę o masie m. Z tego równania wnioskujemy, że w równa się:
w = cs]k2 + m2c2lh2
A więc szybkość fazowa cojk znów jest większa od szybkości światła!
Zajmijmy się teraz prędkością grupową. Prędkość grupowa powinna równać się
dco/dk — prędkości, z jaką poruszają się modulacje. Musimy zróżniczkować pierwiastek
kwadratowy, co nie jest zbyt trudne. Otrzymujemy:
dco kc
48-5. AMPLITUDY PRAWDOPODOBIEŃSTW DLA CZĄSTEK 341
pierwiastek kwadratowy w mianowniku równa się co/c, tak więc możemy napisać dcoldk —
^c2k[io. Ponadto A/w równa się pjE, a więc
Ale z zależności (48.20) oraz (48.21) wynika, że c2p/E=v, prędkości cząstki, zgodnie z
mechaniką klasyczną. Widzimy więc, że chociaż podstawowe zależności w mechanice kwantowej
E=fiw i p=hk, potrzebne do powiązania to \ k z klasycznymi pojęciami E i p, dają tylko
równanie to2 — k2c2 = m2c*jh2, znajomość pojęcia prędkości grupowej pozwala zrozumieć
także zależności (48.20) i (48.21), które wiążą wielkość E i p z prędkością. Oczywiście,
prędkość grupowa musi być prędkością cząstki, skoro nasza interpretacja ma mieć
jakikolwiek sens. Jeżeli przypuszczamy, że w pewnej chwili cząstka znajduje się w jednym
miejscu, a po 10 min w innym, to zgodnie z mechaniką kwantową odległość przebyta przez
„paczkę falową" podzielona przez ten odstęp czasu musi równać się klasycznej prędkości
cząstki.
48-6. Fale trójwymiarowe
Nasze rozważania o własnościach fal chcemy zakończyć paroma ogólnymi uwagami
dotyczącymi równania fali. Spostrzeżenia te pomogą nam spojrzeć w przyszłość — nie
chodzi o to, abyśmy wszystko teraz dokładnie zrozumieli, lecz raczej abyśmy zorientowali
się, jak to wszystko będzie wyglądało, gdy bardziej szczegółowo zajmiemy się falami.
Przede wszystkim równanie fali dźwiękowej jednowymiarowej miało postać
d2X 1 d2X
8x2 c2 dt2 '
gdzie c oznaczało szybkość dźwięku w przypadku równania fali dźwiękowej lub szybkość
światła dla fali świetlnej. Udowodniliśmy, że w fali dźwiękowej przemieszczenia poruszają
się z pewną szybkością. Ponadto dodatkowe ciśnienie wywołane przez tę falę także porusza
się z pewną szybkością; to samo dotyczy zmiany gęstości. Powinniśmy więc oczekiwać,
że to ciśnienie powinno spełniać takie samo równanie i tak rzeczywiście się dzieje.
Pozostawiamy to czytelnikowi do sprawdzenia. Wskazówka: pe jest proporcjonalne do
pochodnej x względem x. Dlatego po zróżniczkowaniu równania falowego względem x
natychmiast stwierdzamy, że dx/dx spełnia to samo równanie. A to oznacza, że pe także je spełnia.
Ciśnienie Pe jest zaś proporcjonalne do pe, a zatem Pt też spełnia równanie falowe. A więc,
ciśnienie, przemieszczenie itd, spełniają to samo równanie falowe.
Zwykle spotyka się równania falowe dla dźwięku zapisane dla ciśnienia, a nie
przemieszczenia. Ciśnienie jest bowiem skalarem i nie ma kierunku. Natomiast przemieszczenie
jest wektorem o pewnym kierunku i dlatego łatwiej zajmować się ciśnieniem.
Druga sprawa, którą chcemy się zająć, dotyczy równania falowego w trzech
wymiarach. Wiemy, że dla fali dźwiękowej rozwiązaniem w jednym wymiarze jest: e a ,
342
4*. DUDNIENIA
gdzie co=kcs. Wiemy także, że w trzech wymiarach fala mogłaby być przedstawiona jako-
exp[i(cot-kxx-kyy-kzz)], gdzie co2-k2c2 i oczywiście co2 = (kl + k2, + k2)c2. Chcemy
teraz odgadnąć postać równania falowego w trzech wymiarach. Dla dźwięku można je
naturalnie wyprowadzić powtarzając te same dynamiczne rozważania, które
przeprowadziliśmy dla jednego wymiaru. Jednak tak nie postąpimy, lecz od razu napiszemy sam wynik-
równaniem dla ciśnienia (przemieszczenia lub czegokolwiek innego) jest
82Pe d2Pe d2Pe_ 1 d2Pe
(48.23)
O tym, że jest ono prawdziwe możemy się przekonać podstawiając do niego funkcję
e«<»«-kr) jest ona oczywiście jego rozwiązaniem, bo ilekroć różniczkujemy względem x,
tylekroć mnożymy przez — ikx. Dwukrotne różniczkowanie względem x jest równoważne
pomnożeniu przez —A:*. A więc pierwszy wyraz dla tej fali równa się —k2Pe. Podobnie
drugi wyraz równa się -k2Pe, a trzeci —k2zPt. Z prawej zaś strony otrzymujemy —(co2/c2)Pe.
Po uproszczeniu przez Pe i zmianie znaku widzimy, że otrzymujemy żądaną zależność
między k i co.
Znów postępując „od końca" nie możemy oprzeć się pokusie napisania wielkiego
równania, które odpowiada dyspersyjnemu równaniu (48.22) dla fal materii. Jeżeli ę
przedstawia amplitudę znalezienia cząstki w punkcie x, y, z w chwili t, to wielkie równanie
fal materii opisujących cząstki swobodne ma następującą postać:
d2tp d2<p d2<p 1 d2c> m2c2
—2-+—r + —T--T—r=—-r~<P- (48.24)
dx2 dy2 dz2 c2 dt2 h2
Po pierwsze, od razu widoczny jest relatywistyczny charakter tego równania ze względu
na wystąpienie x, y, z oraz t w odpowiedniej kombinacji spotykanej zawsze w teorii
względności. Po drugie, jest to równanie falowe, z którego po podstawieniu fali płaskiej wynika,
że —k2 + co2lc2 = m2c2lh2, co jest dobrą relacją znaną z mechaniki kwantowej. To równanie
ma jeszcze jedną ważną cechę: jego rozwiązaniem jest także dowolna superpozycja fal.
A więc zawiera ono wszystko, co dotychczas poznaliśmy z mechaniki kwantowej i z teorii
względności, przynajmniej w zakresie, który dotyczy pojedynczej cząstki w pustej
przestrzeni, bez zewnętrznych potencjałów i działających na nią sił!
48-7. Drgania własne
Obecnie zajmiemy się innym przykładem zjawiska dudnień. Jest to przykład nieco
dziwny i odmienny od tych, którymi zajmowaliśmy się dotychczas. Wyobraźmy sobie
dwa równe wahadła połączone dosyć słabą sprężyną. Ich długości są w miarę możności
równe. Gdy jedno z nich poruszymy, zacznie się wahać pociągając za sobą sprężynę, a więc
stanie się po prostu maszyną do wytwarzania siły o częstości równej częstości własnej
drugiego wahadła. Dlatego, zgodnie z teorią rezonansu, którą zajmowaliśmy się przedtem.
4g_7. DRGANIA WŁASNE
343
wiemy, że gdy podziałamy na jakieś ciało siłą o odpowiedniej częstości, możemy ją
przekazać temu ciału. Widzimy tu, że drgania jednego wahadła wprowadzają w ruch drugie.
Jednak w tych warunkach występuje nowe zjawisko: ponieważ całkowita energia układu
jest skończona, gdy więc jedno wahadło przekazuje swoją energię drugiemu, samo traci
ją stopniowo, aż odda całą swą energię i zatrzyma się, jeżeli przez cały czas wahadła są
zsynchronizowane. Z kolei drugie wahadło zyskuje całą energię z upływem czasu, wszystko
przebiega w odwrotnym kierunku i energia zostaje przekazana z powrotem pierwszemu
wahadłu. Jest to bardzo interesujące i zabawne zjawisko. Powiedzieliśmy jednak, że wiąże
się ono z teorią dudnień i musimy teraz wyjaśnić, jak można zbadać ten ruch z punktu
widzenia tej teorii.
Zauważmy, że ruch każdego z wahadeł jest ruchem drgającym ze zmieniającą się
cyklicznie amplitudą. Dlatego też ruch jednego z wahadeł można prawdopodobnie zbadać
w inny sposób, jako sumę dwóch jednoczesnych drgań mających nieco różniące się
częstości. Powinniśmy więc znaleźć dwa inne ruchy w tym układzie i stwierdzić, że to, co
obserwujemy, jest wynikiem nakładania się dwóch drgań, ponieważ jest to oczywiście układ
liniowy. Rzeczywiście, łatwo znaleźć dwa sposoby rozpoczęcia ruchu, z których każdy byłby
idealnym ruchem periodycznym o jednej częstości. Ruch, od którego zaczęliśmy poprzednio,
nie był ściśle periodyczny, ponieważ nie był trwały; bardzo szybko jedno wahadło
przekazywało energię drugiemu i zmieniało amplitudę drgań. Istnieją takie sposoby rozpoczęcia
ruchu, że nic się w nim nie zmienia w czasie, co łatwo zrozumiemy, jak tylko je poznamy.
Gdy na przykład popchniemy oba wahadła jednocześnie w tym samym kierunku, to dzięki
temu, że mają taką samą długość, sprężyna nie wywrze żadnego wpływu, czyli oba
wahadła będą stale się wahać, jeżeli nie wystąpi tarcie, a całe zjawisko będzie miało idealny
przebieg. Może istnieć także inny ruch, również o określonej częstości: mianowicie, gdy
poruszymy wahadła w przeciwnych kierunkach, odsuwając je na równe odległości, to również
będą się wahać ściśle periodycznie. Możemy spostrzec, że sprężyna nieco zwiększa siły
pochodzące od grawitacji i wskutek tego cały układ drga z nieco większą częstością niż
w pierwszym przypadku. Dlaczego z większą? Ponieważ sprężyna ściąga wahadła
uzupełniając siłę ciążenia, a to powoduje, że układ staje się „sztywniejszy", a więc częstość jego drgań
trochę wzrasta w porównaniu z częstością pierwszego układu.
Układ taki może więc drgać w dwojaki sposób ze stałą amplitudą: albo w ten
sposób, że oba wahadła drgają jednakowo i przez cały czas z tą samą częstością, albo też
oba wahadła poruszają się w przeciwnych kierunkach też ze stałą, ale nieco większą
częstością.
Ruch rzeczywisty tego układu, ponieważ jest to układ liniowy, można przedstawić
jako superpozycję obu takich ruchów. (Pamiętajmy, że przedmiotem rozważań tego
rozdziału jest wynik złożenia dwóch ruchów o różnych częstościach.) Pomyślmy, co się stanie,
gdy dodamy oba rozwiązania. Jeżeli w chwili /=0 oba ruchy rozpoczynają się z
jednakowymi amplitudami i w tej samej fazie, to suma ich oznacza, że jedno z wahadeł ciągnięte
w jedną stronę w pierwszym ruchu i w przeciwną w drugim, znajduje się w pozycji
początkowej, natomiast drugie wahadło przesuwane w tę samą stronę w obu ruchach ma dużą
amplitudę drgań. Ponieważ jednak oba te podstawowe ruchy zachodzą niezależnie, więc
344
48. DUDNIENIA
z upływem czasu ich względna faza powoli się zmienia. To znaczy, że po dostatecznie
długim czasie, wystarczającym na to, aby w jednym ruchu zaszło „900^" drgań, a w drugim
tylko „900", względna faza tych ruchów zmieni się na przeciwną w stosunku do pierwotnej
Wówczas ruch o dużej amplitudzie ustanie, a wahadło początkowo nieruchome stopniowo
osiągnie oczywiście maksymalną amplitudę.
Widzimy więc, że można badać taki skomplikowany ruch bądź przy pomocy zjawiska
rezonansu, w którym jedno wahadło przekazuje energię drugiemu, bądź jako nakładanie
się dwu ruchów o stałej amplitudzie i o różnych częstościach.
49
fale stojqce
49-1. Odbicie fal
W niniejszym rozdziale omówimy niektóre ważne zjawiska zachodzące wówczas, gdy
fale są zamknięte w pewnym skończonym obszarze. Najpierw poznamy poszczególne
zjawiska dotyczące drgającej struny. Ich uogólnienie pozwoli nam później sformułować
zasadę, która jest chyba najogólniejszą zasadą fizyki teoretycznej.
Pierwszym przykładem fal zamkniętych, jakie rozpatrzymy, będą fale ograniczone
z jednej strony. Zajmijmy się prostym przykładem fal jednowymiarowych w strunie.
Można by również dobrze zająć się przykładem fal dźwiękowych, odbijających się od ściany
lub jakimś innym podobnym, ale dla naszych celów przykład struny zupełnie wystarczy.
Załóżmy, że struna jest przytwierdzona jednym końcem do „nieskończenie sztywnej"
ściany. Matematycznie wyrazimy to w ten sposób, że wychylenie y struny w punkcie x=0
równa się zeru, ponieważ jej koniec jest nieruchomy. Gdyby nie uwzględniać ściany, ogólne
rozwiązanie dla ruchu struny byłoby sumą dwóch funkcji F(x—ct) i G{x + ct), z których
pierwsza przedstawia falę poruszającą się w jedną stronę, a druga — falę biegnącą w stronę
przeciwną:
y=F(x-ct) + G(x + ct) (49.1)
— i to jest ogólne rozwiązanie dla dowolnej struny. Musimy jednak uwzględnić fakt, że
jeden koniec struny jest nieruchomy. Jeżeli przyjmiemy x=0 w równaniu (49.1) i zbadamy
wartość y dla dowolnej chwili /, to otrzymamy y=F( —ct)+G(+ct). Jeżeli y ma być
zawsze równe zeru, to znaczy, że funkcja G(ct) musi równać się — F(—et). Inaczej mówiąc,
funkcja G pewnej wielkości musi równać się funkcji —F tej samej wielkości ze
znakiem minus. Po podstawieniu tego wyniku do równania (49.1) znajdziemy następujące
rozwiązanie:
y=F{x-ct)-F(-x-ct). (49.2)
346
49. FALE STOJĄCE
Koniec
nieruchomy
\
F(-x-tvt)
,' V
Łatwo stwierdzić, że otrzymamy _v = 0, jeśli
przyjmiemy .v = 0.
Rysunek 49.1 pokazuje falę biegnącą
w kierunku ujemnych x blisko punktu x = o
i hipotetyczną falę poruszającą się w
przeciwnym kierunku ze zmienionym znakiem i z
drugiej strony początku układu. Nazwaliśmy ją
hipotetyczną, bo oczywiście nie ma struny
drgającej po drugiej stronie początku
układu. Całkowity ruch struny należy traktować
jako sumę tych dwóch fal dla dodatnich x.
Gdy osiągną one początek układu to zawsze
się zniosą, dając zero dla punktu x=0
i ostatecznie druga (odbita) fala będzie
jedyną falą istniejącą dla dodatnich x i
oczywiście będzie poruszała się w przeciwnym
kierunku. Te wyniki są równoważne
następującemu stwierdzeniu: gdy fala dobiega do
nieruchomego końca struny, odbija się od
niego, zmieniając znak. Takie odbicie można łatwo zrozumieć wyobrażając sobie, że to,
co dobiega do końca struny, wychodzi potem odwrócone zza ściany. Krótko mówiąc,
należy przyjąć, że struna jest nieskończona i że ilekroć mamy falę biegnącą w jedną
stronę, to zawsze znajdziemy falę rozchodzącą się w przeciwnym kierunku z ustaloną
symetrią; wtedy — przy takim założeniu — wychylenie w punkcie x = 0 zawsze będzie
równało się zeru i nic nie stoi na przeszkodzie, by umocować strunę właśnie w tym
punkcie.
Z kolei omówimy zjawisko odbijania się fal periodycznych. Załóżmy, że fala
przedstawiana przez funkcję F(x —et) jest falą sinusoidalną, która ma się odbić. Wtedy fala
odbita, którą przedstawia funkcja -F(—x—ct), jest także falą sinusoidalną o tej samej
częstości, ale poruszającą się w przeciwnym kierunku. Sytuację taką najprościej można-
opisać korzystając z zapisu za pomocą funkcji zespolonych: F(x— ct) = e,cli'~x,c} oraz
F(— x — c/) = e""c,+x'c). Widać, że po podstawieniu tych wyrażeń do równania (49.2)
i podstawieniu x=0 otrzymamy y = 0 dla wszystkich wartości /, co spełnia warunek
konieczny. Ze względu na własności funkcji wykładniczych możemy to zapisać w prostszej
postaci:
49.1. Odbicie fali jako superpozycja dwu fal
biegnących
y = e (e
- .o»/c _ gicx/cj =_2i e'""' sin (loxjc)
(49.3)
Z rozwiązania tego dowiadujemy się ciekawej rzeczy. Gdy obserwujemy określony
punkt x struny, widzimy, że drga on z częstością co. Niezależnie od wyboru tego punktu
częstość jest taka sama. Istnieją jednak pewne punkty, w szczególności takie, dla których
sin (<yx/c) = 0, gdzie nie ma w ogóle wychyleń. Ponadto jeżeli w pewnej chwili t
sfotografujemy drgającą strunę, to na zdjęciu otrzymamy sinusoidę. Jej wychylenia jednak będą
zależały od czasu, w którym zrobiono zdjęcie. Na podstawie równania (49.3)
stwierdzamy, że długość jednego cyklu naszej fali sinusoidalnej równa się długości fali dowol-
49-1. ODBICIE FAL
347
nej z fal składowych:
X = 2kc\id (49.4)
Punkty, w których nie ma drgań, spełniają warunek sin (cox/c) = 0, z którego wynika, że
(u)x/ć) = 0, n,2n, ...,nn. Punkty te nazywamy węzłami Między dwoma kolejnymi
węzłami każdy punkt porusza się do góry i na dół sinusoidalnie. Amplituda tego ruchu
zależy od położenia punktu na strunie. Jest to podstawowa cecha tzw. fal stojących. Jeśli
stwierdzimy taką postać ruchu, w którym dowolny punkt obiektu porusza się ściśle
sinusoidalnie, a wszystkie jego punkty drgają z tą samą częstością (chociaż jedne wychylają
się bardziej niż inne), to znaczy, że mamy do czynienia z falą stojącą.
49-2. Fale stojące i częstości własne
Z następnym ciekawym problemem stykamy się wówczas, gdy naszą strunę
umocujemy na obu końcach, powiedzmy w punktach x=0 i x=L. Nasze rozważania zaczniemy
od zjawiska odbicia fal, zajmując się na początek grzbietem fali poruszającej się w
jednym kierunku. Po jakimś czasie grzbiet ten zbliży się do jednego z końców struny i
zacznie się zmniejszać na skutek interferencji z odwróconym grzbietem fali zbliżającej się
z przeciwnej strony. Ostatecznie, początkowy grzbiet zniknie, a grzbiet odbity zacznie
poruszać się w przeciwnym kierunku aż do powtórzenia procesu z przeciwnej strony.
A więc nasz problem łatwo rozwiązać. Powstaje tylko pytanie, czy możemy otrzymać
ruch sinusoidalny (rozwiązanie opisane przed chwilą jest periodyczne, ale oczywiście nie
jest sinusoidalnie periodyczne). Spróbujmy wywołać w strunie sinusoidalną falę
periodyczną. Jeżeli struna jest umocowana na jednym końcu, to wiemy, że ruch jej musi mieć
taką matematyczną postać, jak nasze poprzednie rozwiązanie (49.3). To samo się dzieje,
gdy struna jest umocowana na drugim końcu. A więc jedyna możliwość periodycznego
mchu sinusoidalnego istnieje wtedy, gdy długość fali sinusoidalnej jest dokładnie
dopasowana do długości struny. Jeżeli nie pasuje ona do długości struny, to znaczy, że częstość
fali nie równa się częstości drgań własnych struny. Krótko mówiąc, gdy w strunie
wywołamy falę sinusoidalną, której postać dokładnie pasuje do struny, to struna będzie
utrzymywała dokładny kształt tej fali, drgając harmonicznie z pewną częstością.
Matematyczną postać tej fali możemy przedstawić jako sin kx, gdzie k równa się
czynnikowi (tu/c) w równaniach (49.3) i (49.4). Funkcja sin Jot równa się zeru dla x = 0.
Musi ona się jednak równać zeru też na drugim końcu struny. To oznacza, że k nie może
być już dowolne, tak jak to było w wypadku struny półotwartej. Dla struny umocowanej
z obu stron musi być spełniony warunek sin (kL)=0, ponieważ tylko ten warunek
zapewnia, że oba końce będą nieruchome. Z kolei, aby sinus równał się zeru, kąt musi
wynosić 0, 7C, 2n lub dowolną całkowitą wielokrotność n. Równanie
kL = nn (49.5)
będzie więc określało możliwe wartości k, zależnie od wybranej liczby całkowitej. Dla
każdego k istnieje pewna częstość, która zgodnie z równaniem (49.3) równa się po prostu
a>=kc=nnc\L. (49.6)
348
49. FALE STOJĄCŁ
49.2. Trzy pierwsze fale stojące, wywołane
w drgającej strunie
49.3. Dwie dodane fale stojące wytwarzają
falę biegnącą
■fala stojąca
-fata stojąca
fala
złożona
Znaleźliśmy więc następującą własność
struny: może ona drgać sinusoidalnie, ale tylko
przy pewnych częstościach. Jest to
najważniejsza cecha fal zamkniętych. Niezależnie od
stopnia złożoności układu, zawsze istnieją
dla niego pewne postacie ruchu, mające
idealnie sinusoidalny przebieg czasowy, lecz
z częstościami, które są zależne od
wybranego układu i od warunków na brzegach.
Dla struny istnieje wiele różnych możliwych
częstości własnych, z których każda z definicji
odpowiada fali stojącej, ponieważ fala ta jest
postacią ruchu, który stale odtwarza swój
sinusoidalny kształt. Rysunek 49.2 pokazuje
trzy pierwsze fale stojące dla struny. Dla
pierwszej fali długość fali, k, równa się 2L.
Łatwo się o tym przekonać, gdy przedłużymy
falę do punktu x — 2L, bowiem otrzymamy
wówczas jeden pełny okres sinusoidy.
Częstość kołowa co równa się 2nc podzielone
przez długość fali. W naszym przypadku,
ponieważ /. równa się 2L, częstość ta równa
się nc/L, co zgadza się z zależnością (49.6)
dla n—\. Oznaczmy częstość własną
odpowiadającą pierwszej fali stojącej przez o>,.
Druga fala stojąca - zwana też drugą
składową harmoniczną — ma dwa grzbiety
rozdzielone po środku węzłem. Jej długość równa
się po prostu L, a więc odpowiadająca jej
wartość k jest dwukrotnie większa. Również
częstość własna jest dwa razy większa i równa
się 2o>,. Dla trzeciej fali stojącej - trzeciej
składowej harmonicznej - równa się ona
3tu, itd. A więc wszystkie dozwolone częstości
struny równają się 1, 2, 3, 4 itd. razy
najniższa częstość w i.
Wracamy teraz do ogólnego ruchu
struny. Okazuje się, że dowolny ruch struny
można zawsze wyjaśnić przyjmując, że w strunie
wywołano jednocześnie więcej niż jedną falę
stojącą. W rzeczywistości w ogólnym
przypadku ruchu musimy wzbudzić jednocześnie
nieskończoną liczbę fal stojących. Aby trochę
49-2. FALE STOJĄCE I CZĘSTOŚCI WŁASNE
349
się w tym zorientować, zobaczymy, co się będzie działo przy jednoczesnym wzbudzeniu
dwu kolejnych drgań harmonicznych. Przypuśćmy, że drgania pierwszej fali stojącej
wyglądają tak, jak na poszczególnych fragmentach rys. 49.3, gdzie widzimy
odkształcenia struny w równych odstępach czasu w ciągu połowy okresu odpowiadającego
najniższej częstości.
Załóżmy też, ze jednocześnie istnieją drgania drugiej fali stojącej. Na rysunku 49.3
widać szereg stanów wychylenia także tej fali, która na początku jest przesunięta o 90°
w fazie względem pierwszej. Oznacza to, że w pierwszej chwili w ogóle nie ma
wychylenia, a obie połowy struny mają prędkości przeciwnie skierowane. Teraz przypomnimy
ogólną zasadę, słuszną dla układów liniowych: jeżeli istnieją dwa dowolne rozwiązania,
to ich suma jest także rozwiązaniem. Dlatego trzeci możliwy ruch struny otrzymamy
dodając dwa rozwiązania pokazane na rys. 49.3. Wynik, także pokazany na rysunku,
zaczyna przypominać grzbiet fali, poruszający się tam i z powrotem między końcami struny.
Jednak za pomocą tylko dwu fal stojących nie możemy go przedstawić realistycznie;
do tego potrzeba znacznie więcej takich fal. Wynik, który przed chwilą otrzymaliśmy,
jest szczególnym przypadkiem wielkiej zasady spełnionej przez układy liniowe:
Każdy dowolny ruch można zbadać zakładając, że jest on sumą ruchów wszystkich
różnych składowych harmonicznych dodanych z odpowiednimi amplitudami i w odpowiednich
fazach.
Znaczenie tej zasady wypływa z faktu, że każda fala stojąca jest bardzo prostym
ruchem drgającym — nie jest niczym innym, jak- tylko sinusoidalnym ruchem w czasie,
o częstości odpowiadającej jednej z częstości własnych układu. To prawda, że nawet
dowolny ruch struny nie jest zbyt skomplikowany. Istnieją jednak inne układy, np.
drgające skrzydła samolotów, których ruchy są znacznie bardziej skomplikowane. Mimo to,
nawet w wypadku skrzydeł samolotu wykrywamy pewne szczególne sposoby drgań o
określonych częstościach. Jeżeli znajdziemy te fale stojące, to wówczas dowolny ruch skrzydła
można zawsze traktować jako superpozycję odpowiednich drgań harmonicznych (oprócz
przypadków, w których drgania skrzydeł są tak znaczne, że nie można ich uważać za
liniowe).
49-3. Dwuwymiarowe fale stojące
Zajmijmy się teraz interesującym zjawiskiem, dwuwymiarowej fali stojącej. Do tej
pory mówiliśmy tylko o jednowymiarowych zjawiskach — o napiętej strunie lub o fali
dźwiękowej w rurze. W końcu powinniśmy zająć się trzema wymiarami, lecz łatwiejszym
etapem będzie fala dwuwymiarowa. W celu uproszczenia rozumowania weźmy pod uwagę
prostokątną membranę gumową umocowaną w ten sposób, że jej prostokątny obwód
nie może wykonywać drgań. Przy tym niech rozmiary tego prostokąta będą równe a i b,
jak na rys. 49.4. Powstaje pytanie: jakie są cechy ruchu membrany? Możemy rozpocząć
od tego samego postępowania, co przy strunie. Gdyby nie było żadnych więzów, mogli-
350
49. FALE STOJĄCE
unieruchomione byśmy się spodziewać, że w membranie będą się roz-
brzegi \ chodzić jakieś fale. Tak na przykład funkcja
„SW^^aSI.wv. expd'tu/) [exp(-ikxx+ikyy)] przedstawiałaby falę
sinusoidalną biegnącą w pewnym kierunku zależnym
od względnych wartości kx i ky. W jaki sposób
możemy uczynić oś x, tzn. linię y = 0, linią węzłów?
Korzystając z pojęć wprowadzonych dla struny jedno-
?o'^"- LV.UW^V^"' w£§ * wymiarowej, możemy wyobrazić sobie inną falę
\ przedstawioną za pomocą funkcji zespolonej
49.4. Prostokątna płaszczyzna exp (-»>/) [exp ( -ik^ -ikyy)]. Superpozycja tych
drgająca ^a' ^a zerowe przesunięcia dla osi y=0, niezależnie
od wartości x i / (chociaż te funkcje są zdefiniowane
również dla ujemnych y, gdzie nie ma membrany,
która mogłaby drgać, to nie przejmujmy się tym, ponieważ wychylenie równa się zeru
dla y=0). W tym przypadku drugą funkcję traktujemy jako falę odbitą.
Jednak chcemy mieć linię węzłów nie tylko dla osi y = 0, ale i dla osi y = b. Jak
możemy to osiągnąć9 Odpowiedź wiąże się w pewnym stopniu z tym, co robiliśmy zajmując
się odbiciem od kryształów. Te fale, które znoszą się wzajemnie dla y=0, zrobią to samo
dla y=b, jeżeli tylko 2bsin6 będzie się równać iloczynowi liczby całkowitej i )., gdzie
6 jest kątem pokazanym na rys. 49.4:
mX = 2bsmB, j*=0,l,2,... (49.7)
W podobny sposób możemy uczynić oś y linią węzłów dodając dwie inne funkcje
—exp {itot) [exp (ikxx + ikyy)] oraz +exp(icot)[exp(ikxx — ikyy)], z których każda
przedstawia odbicie drugiej od linii jc = 0. Warunek dla linii węzłów x = a przypomina warunek
dla y = b. Mówi on, że 2acos6 musi także równać się iloczynowi liczby całkowitej i X:
nX = 2acos0. (49.8)
A więc w końcu dowiedzieliśmy się, że fale odbijające się od ścian pudła wytwarzają fale
stojące, to znaczy drgania sinusoidalne o częstościach własnych.
Aby więc otrzymać falę stojącą, musimy spełnić dwa powyższe warunki (49.7) i (49.8)-
Znajdźmy najpierw długość tej fali. Możemy to zrobić eliminując kąt 0 z równań (49.7)
i (49.8) i otrzymując długość fali w zależności od wielkości a, b, n i m. Zrobimy to
najprościej dzieląc obie strony odpowiednich równań przez Ib i 2a. podnosząc je do kwadratu
i dodając oba równania. W rezultacie otrzymamy równanie: sin2 0 +cos2 0= 1 = {nXj2a)2 +
+ (mX/2b)2. Możemy je rozwiązać dla X i otrzymamy:
-7= J + T- (499)
X2 4a2 4b2
W ten sposób wyraziliśmy długość fali za pomocą dwóch liczb całkowitych. Mając długość
fali natychmiast obliczymy częstość własną co, ponieważ, jak wiemy, częstość równa si?
2nc dzielone przez długość fali.
Wynik jest na tyle interesujący i ważny, że powinniśmy go wyprowadzić wyłączni
49-3. DWUWYMIAROWE FALE STOJĄCE
351
z samej analizy matematycznej, bez rozważania odbić. Przedstawmy w tym celu wibracje
membrany jako superpozycję czterech fal wybranych tak, te cztery proste x = 0,
x = a, v = 0 i y — b są liniami węzłów. Ponadto będziemy wymagać, żeby wszystkie
fale miały tę samą częstość, a więc żeby ruch wypadkowy przedstawiał falę stojącą.
Z naszych poprzednich rozważań dotyczących odbicia światła w'iemy, że funkcja
exp (iot) [exp( — ikxx + ikyy)] przedstawia falę poruszającą się w kierunku oznaczonym
na rys. 49.4. Równanie (49.6), tzn. k = toic, jest nadal spełnione, jeżeli przyjmiemy, że
k2 = k2x + k2y. (49.10)
Z rysunku widzimy, że kx = k cos 6 i ky = k sin 0.
Teraz nasze równanie dla wychylenia prostokątnej membrany, które oznaczamy przez
(p, przyjmuje bardzo skomplikowaną postać:
ę = exp (icoł) [exp (— ikx x + iky y) — exp (ikxx+iky y) —
— exp ( - ikx x - iky y) + exp (ikx x — iky >•)] (49.11 a)
Chociaż wygląda to dość zawile, sumę tych wyrażeń otrzymujemy jednak bez trudu.
Funkcje wykładnicze grupują się dając sinusy, tak że wychylenie równa się
^ = [ — 4sinfcJcx-sinfcJ,_y]exp(i'cu/). (49.1 Ib)
Inaczej mówiąc, jest to drganie sinusoidalne, które ma kształt sinusoidy zarówno w
kierunku osi x, jak i y. Nasze warunki graniczne są spełnione oczywiście dla x = 0 i y = 0.
Chcemy także, aby c równało się zeru dla x = a i y = b. Dlatego dodajemy dwa nowe
warunki: kxa musi równać się iloczynowi liczby całkowitej i n, a także kyb musi być równe
całkowitej wielokrotności it. Ponieważ widzieliśmy, że kx = k cos 6 i ky = k sin 6,
natychmiast otrzymamy równania (49.7) i (49.8), a z nich końcowy wynik (49.9).
Dla przykładu rozważmy prostokąt, którego szerokość jest dwa razy większa od
wysokości. Jeśli przyjmiemy a = 2b i skorzystamy z równań (49.4) i (49.9), możemy
obliczyć częstości wszystkich fal stojących:
, (nc\2m2 + n2
"St)-t- (49'2'
W tablicy 49.1 zebrano wartości liczbowe dla kilku prostych fal stojących i pokazano
jakościowo ich kształt.
Najważniejszą rzeczą, na którą należy zwrócić uwagę w tym szczególnym przypadku,
jest to, że częstości nawzajem nie są swoimi wielokrotnościami, ani też nie stanowią
wielokrotności jakiejś liczby. Zasada, że częstości własne są harmonicznie związane, nie jest
ogólnie słuszna. Nie jest słuszna dla układów o więcej niż jednym wymiarze, a także nie
zachodzi dla tych jednowymiarowych układów, które są bardziej skomplikowane niż
struna o jednorodnej gęstości i napięciu. Takim prostym przykładem jest wiszący
łańcuch, którego napięcie jest większe u góry niż na dole. Jeżeli taki łańcuch wprawimy
w drganie harmoniczne, wystąpią fale stojące o różnych częstościach, lecz ani częstości
te nie są prostymi wielokrotnościami jakiejś liczby, ani kształty fal nie są sinusoidalne.
352
Tabela 49.1
49. FALE STOJĄCE
Postać fali stojącej
(to/too)2
<o/w0
+ ' -
+ I - I +
i +
-~l
I —
i
1,25
2,00
3,25
4,25
5,00
1,12
1,41
1,80
2,06
2,24
Fale stojące dla bardziej złożonych układów są jeszcze bardziej zawiłe. U ludzi, na
przykład, ponad strunami głosowymi znajduje się jama ustna. Poruszając językiem i
wargami tworzymy z niej zamkniętą lub otwartą rurę o różnych średnicach i kształtach.
Jest to ogromnie skomplikowany rezonator, ale mimo wszystko jest to rezonator. Gdy
ktoś mówi, wprawia w drgania struny głosowe i wydają one pewien dźwięk. Dźwięk ten
jest bardzo skomplikowany, składa się z wielu tonów, ale jama ustna jeszcze bardziej go
modyfikuje, ponieważ ma ona różne częstości rezonansowe. Tak na przykład śpiewak
może śpiewać samogłoski, a, o, e itd. na tej samej wysokości, lecz brzmią one różnie,
ponieważ różne składowe harmoniczne w różnym stopniu rezonują w jamie ustnej. Tę
doniosłą rolę częstości rezonansowych jamy ustnej w przekształceniu dźwięków mowy
można udowodnić za pomocą prostego doświadczenia. Ponieważ szybkość dźwięku
zmienia się jak odwrotność pierwiastka kwadratowego z gęstości, można ją zmieniać
używając różnych gazów. Jeżeli użyjemy helu zamiast powietrza obniżając w ten sposób
gęstość, szybkość dźwięku będzie większa i wszystkie częstości rezonansowe jamy ustnej
wzrosną. A więc gdy ktoś napełni płuca helem, charakter jego głosu zmieni się bardzo
wyraźnie, nawet jeżeli struny głosowe będą drgały stale z tą samą częstością.
49-4. WAHADŁA SPRZĘŻONE
353
49-4. Wahadła sprzężone
Na zakończenie powinniśmy zwrócić uwagę na fakt, że fale stojące powstają nie tylko
w złożonych, ciągłych układach, ale również w bardzo prostych układach mechanicznych.
Dobry przykład stanowią dwa sprzężone wahadła, którymi zajmowaliśmy się w
poprzednim rozdziale. Udowodniliśmy, że ruch ich można traktować jako superpozycję dwu
ruchów harmonicznych o różnych częstościach. A więc nawet ten układ można badać
przy pomocy ruchów harmonicznych, czyli fal stojących. W przypadku drgającej struny
mamy do czynienia z nieskończoną liczbą drgań własnych, to samo dotyczy drgającej
membrany. Gdybyśmy umieli liczyć nieskończoności, można by powiedzieć, że membrana
jest podwójnie nieskończona. Ale w drgającym prostym urządzeniu mechanicznym, które
ma tylko dwa stopnie swobody i wymaga tylko dwóch zmiennych do ich opisu, mogą
powstać tylko dwa drgania własne.
Zbadajmy te dwie częstości własne, w przypadku gdy oba wahadła mają taką samą
długość. Oznaczmy wychylenie jednego wahadła symbolem x, a drugiego — symbolem y, tak
jak na rys. 49.5. Bez sprężyny siła działająca na pierwszą masę, spowodowana ciążeniem,
jest proporcjonalna do wychylenia tej masy. Gdyby nie było sprężyny, masa ta
poruszałaby się z pewną częstością własną oj0. Równanie takiego ruchu byłoby następujące:
m
d2x
~d?
= — mean x
(49.13)
Drugie wahadło bez połączenia sprężyną z pierwszym, poruszałoby się w ten sam sposób.
Gdy natomiast wahadła połączone są sprężyną, oprócz siły grawitacji występuje dodatkowa
siła ciągnąca pierwszą masę. Siła ta zależy od różnicy wychyleń x i y, jest do niej wprost
proporcjonalna. Równa się ona iloczynowi pewnej stałej zależnej od geometrii układu
i od różnicy (x—y). Ta sama siła działa w przeciwną stronę na drugą masę. Musimy więc
rozwiązać następujące równania ruchu:
m
*1
dt2
— mw0x — k(x—y),
d2y
m —T=-mo}0y-k(y-x)
(49.14)
Aby znaleźć ruch, w którym obie masy poruszają
się z tą samą częstością, musimy najpierw określić ruch
każdej z mas z osobna. Inaczej mówiąc: wahadło x
i wahadło y będą drgały z tą samą częstością, lecz
musi istnieć ustalona zależność między wartościami
ich amplitud A i B. Wypróbujemy takie
rozwiązanie:
x=Ae
lat
y=Be'
lat
(49.15)
Po podstawieniu powyższych wyrażeń do równań
(49.14) i zebraniu wyrazów podobnych, otrzymamy:
49.5. Dwa wahadła sprzężone
yy//^. f
—'"0"0"0000'^—
Ó-r G-t
354
49. FA.LE STOJ Act
(w2-Wo M= 6
\ m J m
ioj2-cal ]B=- ~A
\ m) m
(49.16)
Tę postać równań otrzymano po uproszczeniu wspólnego czynnika e"1" i podzieleniu
ich przez in.
Widzimy więc, że mamy jak gdyby dwa równania z dwiema niewiadomymi. W
rzeczywistości jednak nie ma dwóch niewiadomych, ponieważ całego ruchu i tak nie możemy
określić z tych równań. Powyższe równania mogą tylko określić stosunek A do B, przy
czym oba muszą dać ten sam stosunek. Żądanie zgodności obu równań stawia częstości
bardzo szczególne wymagania.
W naszym przypadku postępowanie jest dosyć łatwe. Mnożąc stronami oba
równania otrzymujemy:
(co2 -col ) AB = (—J AB (49.17)
Iloczynu AB możemy się łatwo pozbyć, chyba że wielkości A albo B są równe zeru, co
oznaczałoby, że ruchu w ogóle nie ma. Jeżeli ruch występuje, to oba czynniki w
nawiasach muszą być równe, co daje równanie kwadratowe, które trzeba rozwiązać. W wyniku
otrzymujemy dwie możliwe częstości:
2/c
co2 = col, a>l = a>2+— (49.18)
m
Jeżeli następnie podstawimy te częstości z powrotem do równania (49.16), to okaże się,
że dla pierwszej częstości A = B, a dla drugiej A = — B. Taką postać mają więc szukane
fale stojące, co można łatwo sprawdzić doświadczalnie.
Oczywiście, że w pierwszej fali stojącej, dla której A = B, sprężyna nigdy nie jest
rozciągnięta i obie masy drgają z częstością co0, jak gdyby sprężyny w ogóle nie było. W
drugim przypadku, gdy A= —B, sprężyna dostarcza dodatkowej siły, co zwiększa częstość
Bardziej interesujące wyniki otrzymamy dla dwu wahadeł o różnych długościach.
Postępowanie jest wówczas bardzo podobne do powyższego i dlatego przeprowadzenie
jego pozostawimy czytelnikowi jako ćwiczenie.
49-5. Układ} liniowe
Podsumujmy teraz to wszystko, co powiedzieliśmy dotychczas na temat chyba
najogólniejszej i najwspanialszej zasady fizyki teoretycznej. Jeżeli mamy pewien układ
liniowy, którego charakter jest niezależny od czasu, to jego ruch nie musi być szczególnie
prosty, a właściwie może być ogromnie skomplikowany. Istnieją jednak pewne bardzo
49-5. UKŁADY LINIOWE
355
specjalne ruchy tego układu, zwykle serie takich ruchów specjalnych, których cała postać
zmienia się wykładniczo wraz z czasem. Dla układów drgających, bo o nich mówimy,
ta funkcja wykładnicza jest urojona i zamiast mówić o wykładniczej zmienności, możemy
powiedzieć, że zależność od czasu jest „sinusoidalna". Można jednak powiedzieć
ogólniej, że ruchy te zmieniają się w czasie w bardzo szczególny sposób, przybierając bardzo
specjalną postać. Najogólniejszy ruch takiego układu można zawsze przedstawić jako
superpozycję ruchów, zawierającą wszystkie różne funkcje wykładnicze.
Warto zwrócić uwagę na przypadek ruchu sinusoidalnego: układ liniowy nie musi
poruszać się idealnie sinusoidalnie, to znaczy z określoną jedną częstością, lecz mimo
to ruch jego można przedstawić jako superpozycję czystych ruchów sinusoidalnych.
Częstość i postać każdego z tych ruchów jest cechą charakterystyczną układu. Dowolny
ruch takiego układu można scharakteryzować podając natężenia i fazy każdego z ruchów
składowych i następnie je dodając. Inaczej można to wyrazić mówiąc, że dowolny liniowy
układ drgający jest równoważny zespołowi niezależnych harmonicznych oscylatorów,
których częstości odpowiadają poszczególnym częstościom własnym układu.
Rozdział ten zakończymy uwagami na temat związku teorii fal stojących z mechaniką
kwantową. W mechanice kwantowej obiektem drgającym, a więc tym co zmienia się
w czasie, jest amplituda prawdopodobieństwa, która podaje prawdopodobieństwo
znalezienia elektronu lub układu elektronów w danej konfiguracji. Amplituda ta może zmieniać
się w przestrzeni i w czasie spełniając równanie liniowe. Ale częstości amplitudy
prawdopodobieństwa w mechanice kwantowej odpowiada energia w fizyce klasycznej. Możemy
więc naszą zasadę przenieść na grunt mechaniki kwantowej, zastępując w niej wszędzie
pojecie częstość pojęciem energia. Brzmi teraz ta zasada mniej więcej tak: układ kwantowy,
np. atom, nie musi mieć określonej energii, podobnie jak prosty układ mechaniczny nie
musi mieć określonej częstości. Jednak każdy sposób zachowania się tego układu można
zawsze przedstawić jako superpozycję stanów o określonej energii. Energia każdego
stanu jest cechą charakterystyczną atomu. To samo można powiedzieć o kształcie
amplitudy określającej prawdopodobieństwo znalezienia cząstek w różnych miejscach.
Podając amplitudę każdego z tych różnych stanów energetycznych możemy opisać ogólny
ruch układu. Stąd właśnie bierze się pojęcie poziomów energetycznych w mechanice
kwantowej. Ponieważ w mechanice kwantowej opisujemy wszystkie zjawiska za pomocą
fal, to w tych warunkach, w których elektron nie ma dostatecznej energii, aby oderwać
się od protonu, mówimy o falach zamkniętych. Podobnie jak dla fal zamkniętych w
strunie, istnieją w tym przypadku określone częstości dla rozwiązań równania falowego w
mechanice kwantowej. Ich kwantową interpretację stanowią określone energie. Dlatego
układ kwantowy, ponieważ przedstawiamy go za pomocą fal, może mieć określone stany
o ustalonej energii. Przykładem tego są poziomy energetyczne różnych atomów.
50
składowe harmoniczne
50-1. Tony muzyczne
Podobno Pitagoras odkrył, że dwie jednakowo napięte struny o różnych długościach
tylko wtedy wydają dźwięk przyjemny dla ucha, gdy ich długości są do siebie w stosunku
niewielkich liczb całkowitych. Jeżeli stosunek ten równa się 1 : 2, to długości te
odpowiadają oktawie muzycznej. Jeżeli mają się do siebie jak 1 : 3, to wydawany dźwięk
odpowiada interwałowi między dźwiękami c i g, który nosi nazwę kwinty. Interwały te ogólnie
uznano za „przyjemnie" brzmiące akordy.
Pitagoras był pod tak wielkim wrażeniem tego odkrycia, że uczynił zeń podstawę
szkoły filozoficznej, Pitagorejczyków, którzy wierzyli w mistyczną potęgę liczb. Wierzono,
że coś podobnego powinno zachodzić dla planet lub „sfer" (czasami słyszymy określenie
„muzyka sfer"). Pitagorejczycy twierdzili, że powinny istnieć pewne liczbowe zależności
między orbitami planet, a także między innymi rzeczami w przyrodzie. Sądzi się zwykle,
że był to po prostu rodzaj przesądu panującego u Greków. Ale czy w naszym
zainteresowaniu się zależnościami liczbowymi tak bardzo oddaliliśmy się od tego przesądu?
Odkrycie dokonane przez Pitagorasa było pierwszym wykraczającym poza geometrię
przykładem liczbowych zależności w przyrodzie. Zaskakujące musiało być to nagłe odkrycie,
że istnieje w przyrodzie zjawisko, w którym zawarta jest prosta zależność liczbowa. Proste
pomiary długości pozwoliły przewidzieć coś, co nie miało widocznego związku z geometrią
— wytworzenie przyjemnych dla ucha dźwięków. Odkrycie to pozwalało przypuszczać,
że arytmetyka i analiza matematyczna są narzędziami, które pozwalają poznać przyrodę.
Zdobycze nowoczesnej nauki potwierdzają to stanowisko.
Pitagoras mógł dokonać swego odkrycia tylko drogą eksperymentalnej obserwacji-
Jednak wydaje się, że nie zwrócił uwagi na tę ważną rolę doświadczenia. W przeciwnym
razie fizyka mogłaby rozpocząć się znacznie wcześniej. (Zwykle bardzo łatwo krytykować
to, czego ktoś już dokonał, i wyrokować, co powinien był zrobić!)
50-1. TONY MUZYCZNE
357
Może dostrzegliśmy jeszcze jeden szczegół tego bardzo interesującego odkrycia:
dotyczyło ono przecież dwóch tonów, które brzmią przyjemnie dla ucha. Możemy zapytać,
czy my zdajemy sobie sprawę lepiej niż Pitagoras, dlaczego tylko pewne dźwięki są
przyjemne dla naszych uszu. Ogólna teoria estetyki chyba nie jest dziś bardziej rozwinięta
niż w czasach Pitagorasa. A więc w tym jednym odkryciu Greków kryją się trzy aspekty:
doświadczenie, zależności matematyczne i estetyka. Fizycy dokonali wielkiego postępu
tylko w dwu z wymienionych dziedzin. Rozdział ten poświęcimy naszemu współczesnemu
rozumieniu odkrycia Pitagorasa.
Jeden z rodzajów odgłosów, które słyszymy, nazywamy hałasem. Odpowiada on
nieregularnym wibracjom jakiegoś bliskiego obiektu. Gdybyśmy sporządzili wykres
ciśnienia powietrza na błonkę bębenkową (a więc i jej wychylenia) jako funkcji czasu, to
krzywa odpowiadająca hałasowi mogłaby wyglądać jak ta, którą widać na rys. 50.la
(hałas ten odpowiada z grubsza tupaniu). Dźwięki muzyki mają inny charakter. Muzykę
charakteryzuje obecność mniej lub bardziej długotrwałych tonów — „nut" muzycznych
(instrumenty muzyczne mogą też hałasować!). Ton może trwać stosunkowo krótko, np.
gdy ktoś uderzy w klawisz pianina, lub też może ciągnąć się nieskończenie, gdy flecista
gra na flecie długą nutę.
Co szczególnie charakteryzuje tony muzyczne z punktu widzenia ciśnienia powietrza?
Tony muzyczne różnią się od hałasu periodycznością dostrzegalną na ich wykresach.
Istnieje pewien wielokrotnie powtarzający się kształt zmian ciśnienia powietrza wraz
z czasem. Na rysunku 50.Ib widać przykład funkcyjnej zależności ciśnienia od czasu,
odpowiadającej tonowi muzycznemu.
Muzycy wyróżniają zwykle trzy charakterystyczne cechy tonu muzycznego: natężenie,
wysokość i „barwę". „Natężenie" jest związane z wielkością zmian ciśnienia. „Wysokość"
tonu odpowiada czasowi, który potrzebny jest do jednego powtórzenia podstawowej
50.1. Ciśnienie jako funkcja czasu dla a) hałasu i b) dla tonu muzycznego
O)
'E
O)
'c
10
o
m
L-r-J
358
50. SKŁADOWE HARMONICZNE
funkcji ciśnienia („niskie" tony mają dłuższe okresy niż tony „wysokie"). „Barwa" tonu
związana jest z dającą się usłyszeć różnicą między dwoma tonami o tym samym
natężeniu i wysokości. Zawsze odróżnimy dźwięki oboju, skrzypiec i śpiewaka, chociaż mogą
mieć tę samą wysokość. Barwę dźwięku określa budowa powtarzającego się segmentu.
Zajmijmy się na chwilę dźwiękiem wytwarzanym przez drgającą strunę. Gdy
szarpniemy ją w jedną stronę i puścimy, jej dalszy ruch będzie określony przez fale, które w niej
wytworzyliśmy. Wiemy, że fale te będą biegły w obu kierunkach wzdłuż struny i odbijały
się od obu jej końców. Będą tak bardzo długo wędrować tam i z powrotem. Fala będzie
się odtwarzać niezależnie od tego, jak bardzo jest skomplikowana. Okres odtwarzania
równa się dokładnie czasowi T potrzebnemu na to, aby fala przebiegała dwie pełne
długości struny, bowiem w tym właśnie czasie fala od chwili wytworzenia zdąży się odbić
od obu końców, powrócić do położenia wyjściowego i znów zwrócić się w tym samym
kierunku. Czas ten jest taki sam dla fal wybiegających w obu kierunkach. A więc każdy
punkt struny będzie powracał do swego wyjściowego położenia po upływie jednego okresu,
dwu okresów itd. Wytworzone fale dźwiękowe muszą także powtarzać się w taki sam
sposób. Wiemy więc, dlaczego szarpnięta struna wytwarza ton muzyczny.
50-2. Szeregi Fouriera
50.2. Dowolna funkcja okresowa /(/) równa
się sumie prostych funkcji harmonicznych
W poprzednim rozdziale zajmowaliśmy się ruchem drgającym układu z innego punktu
widzenia. Widzieliśmy, że struna może drgać z różnymi częstościami własnymi i że
dowolne drganie struny wywołane przez
określone warunki początkowe może być
traktowane jako złożenie — w odpowiednich
proporcjach — paru drgań własnych zachodzących
jednocześnie. Dla struny znaleźliśmy, że
drgania własne mają następujące częstości: co0,
2co0,3a)0,... Dlatego dowolny ruch
szarpniętej struny jest złożony z sumy drgań
sinusoidalnych o częstości własnej podstawowej
co0, drugiej składowej harmonicznej o
częstości 2o)0, trzeciej składowej harmonicznej
o częstości 3w0 itd. Drganie podstawowe
powtarza się w okresie 7", = 2n/w0 • Druga
składowa harmoniczna powtarza się w okresie
T2 = 2n/2ca0. Powtarza się ona również co
okres Tx =2T2. tzn. po dwu swoich okresach.
Podobnie trzecia składowa harmoniczna
powtarza się po czasie 7",, który równa się
trzem jej okresom. Widzimy teraz znów,
dlaczego szarpnięta struna powtarza swój kształt
w okresie T, i wytwarza ton muzyczny.
Qo
T t
"'h^
*■ +0(
+ a2
W^r
itd.
itd.
50-2. SZEREGI FOURIERA
359
Mówiliśmy o ruchu struny. Ale dźwięk, który jest ruchem powietrza, jest wywołany
przez ruchy struny, a więc jego drgania także muszą się składać z tych samych
składowych harmonicznych — chociaż nie są to już drgania własne powietrza. Także względne
natężenia składowych harmonicznych mogą być inne w powietrzu niż w strunie,
szczególnie jeżeli struna jest „sprzężona" z powietrzem poprzez drgającą deskę. Wydajność
tego sprzężenia jest różna dla różnych składowych harmonicznych.
Jeśli funkcja /(/) ma przedstawiać ciśnienie powietrza jako funkcję czasu dla tonu
muzycznego (taką, jak na rys. 50.Ib), to przypuszczamy, że funkcję f(t) można będzie
zapisać jako sumę pewnej liczby prostych harmonicznych funkcji czasu — takich jak
cos (ot — dla każdej z różnych częstości harmonicznych. Jeżeli okres drgań wynosi T,
podstawowa częstość kołowa równa się 2njT, a kolejne składowe harmoniczne będą
miały częstości lxv, 3cv itd.
Trochę się wszystko komplikuje. Możemy się spodziewać, że fazy początkowe nie
muszą być także same dla wszystkich częstości. Powinniśmy więc zastosować funkcję
cos (cot+c). Prościej jednak będzie wziąć obie funkcje sinus i cosinus dla każdej częstości.
Przypominamy, że
cos(a>t + <o) = (cos (pcoscot — sin cpsincot) (50.1]
i ponieważ cp jest stałe, to dowolne sinusoidalne drgania o częstości w można zapisać jakc
sumę wyrazu z cos cot i drugiego z sin cot.
Wnioskujemy stąd, że dowolną funkcję f{t), która jest funkcją okresową z okresem
T, można matematycznie zapisać jako
/(0 = fl0 +
+ alcoscot +blsinwt +
+ a2 cos 2cot + b2 sin 2wt +
+ a3 cos 3coi + b3 sin 3cot +
+ ... + (50.2,
gdzie co = 2n/T oraz a, i bt są stałymi liczbowymi, które mówią nam, jak duży jest udzia
każdego z drgań składowych w drganiu opisanym funkcją/(f)- Dodaliśmy wyraz o
„zerowej częstości" a0, tak aby nasz wzór był zupełnie ogólny, chociaż dla tonów muzycznych
wyraz ten zwykle równa się zeru. Przedstawia on przesunięcie średniej wartości (tzn
poziomu „zero") ciśnienia dźwięku. Z tym wyrazem nasz wzór można zastosować dc
każdego przypadku. Równość (50.2) jest schematycznie przedstawiona na rys. 50.2
(Amplitudy funkcji harmonicznych a„, b„ należy odpowiednio dobrać. Na rysunku
przedstawiono je schematycznie, bez wyboru żadnej skali.) Szereg (50.2) nosi nazwę szeregi
Fouriera dla funkcji /"(f)-
Mówiliśmy, że w ten sposób można przedstawić dowolną funkcję okresową.
Powinniśmy nieco to sprecyzować i powiedzieć, że dowolną falę dźwiękową lub dowolną funkcję,
którą zwykle spotykamy w fizyce, możemy przedstawić w postaci takiej sumy. Matematyce
wymyślili funkcje, których nie można przedstawić w postaci sumy prostych funkcji har
360
50. SKŁADOWE HARMONICZNE
monicznych — do nich należy na przykład funkcja, która „skręca z powrotem", a więc
ma dwie wartości dla pewnych wartości /! Nie musimy się tu jednak martwić takimi
funkcjami.
50-3. Barwa i harmonia
Teraz możemy już określić co decyduje o „barwie" dźwięku. Otóż zależy ona od
względnej wielkości różnych składowych harmonicznych — od wartości a„ i bn. Ton
zawierający tylko pierwszą składową harmoniczną jest tonem „czystym". Ton z wieloma
składowymi jest tonem „pełnym". Skrzypce dają inną proporcję składowych
harmonicznych niż obój.
Możemy „produkować" różne dźwięki muzyczne przyłączając parę „oscylatorów"
do głośnika. Możemy tak wybrać częstości oscylatorów, aby równały się one co, 2co, 3co
itd. Następnie regulując siłę głosu każdego oscylatora możemy dodawać każdą ze
składowych z dowolnym natężeniem — otrzymując w ten sposób tony o różnej barwie. Organy
elektryczne działają na podobnej zasadzie. „Klawisze" wybierają odpowiednią częstość
podstawowego oscylatora, a „rejestry" służą do kontroli względnych proporcji składowych
harmonicznych. Przełączając te rejestry możemy otrzymać z organów dźwięki podobne
do dźwięków fletu, oboju lub skrzypiec.
Interesujące, że do wytworzenia takich „sztucznych" tonów potrzebny nam jest tylko
jeden oscylator dla każdej częstości — nie potrzebne są oddzielne oscylatory dla drgań
reprezentowanych przez sinusoidy i cosinusoidy. Ucho nie jest zbyt czułe na względne
fazy składowych harmonicznych. Chwyta przede wszystkim sumę części sinusowej i co-
sinusowej każdej częstości. Nasza analiza jest bardziej dokładna, niż to jest konieczne
do wyjaśnienia subiektywnego aspektu muzyki. Jednak reakcja mikrofonów oraz innych
instrumentów fizycznych zależy od faz i dokładna analiza może być przydatna, gdy
zajmujemy się właśnie tymi przypadkami.
„Barwa" mowy zależy także od dźwięków samogłosek. Kształt ust decyduje o
częstościach własnych drgań powietrza w jamie ustnej. Niektóre z tych drgań są wzbudzane
przez fale dźwiękowe wywołane drganiami strun głosowych. W ten sposób amplitudy
pewnych składowych harmonicznych głosu zwiększają się w porównaniu z innymi.
Zmieniając kształt ust dajemy pierwszeństwo składowym harmonicznym o różnych
częstościach. W ten sposób powstaje różnica między dźwiękiem „e-e-e" oraz dźwiękiem „a-a-a"
Wiemy, że wybrany dźwięk samogłoski powiedzmy „e-e-e" brzmi jednakowo,
niezależnie od tego, czy wymawiamy (lub śpiewamy) go wysoko, czy też nisko. Z opisanego
mechanizmu wynikałoby, że wzmacniamy tylko określone częstości, zawsze te same, gdy
układamy nasze usta do „e-e-e" i że nie zmieniają się one, gdy zmieniamy wysokość
naszego głosu. A więc stosunek najważniejszych składowych harmonicznych do składowej
podstawowej — tzn. „barwa" — zmienia się, gdy zmienimy wysokość głosu. Widocznie
mechanizm, za pomocą którego rozpoznajemy mowę, nie jest oparty na specyficznych
zależnościach harmonicznych.
Co możemy teraz powiedzieć o odkryciu Pitagorasa? Rozumiemy, że dwie podobne
50-3 BARWA 1 HARMONIA
361
struny o długościach, których stosunek wynosi 2: 3 będą miały częstości podstawowe
w stosunku 3 : 2. Ale dlaczego razem „brzmią przyjemnie"? Być może rozwiązanie leży
w częstościach składowych harmonicznych. Druga składowa krótszej struny będzie miała
taką samą częstość, jak trzecia składowa harmoniczna struny dłuższej. (Łatwo wykazać
lub po prostu uwierzyć, że szarpnięta struna wytwarza przede wszystkim najniższe
składowe harmoniczne.)
Prawdopodobnie słuszne są następujące reguły. Dwa tony współbrzmią harmonicznie
(są w konsonansie), gdy oba zawierają składowe harmoniczne o tej samej częstości. Tony
brzmią w dysonansie, jeżeli ich wyższe składowe harmoniczne mają częstości bliskie siebie,
ale na tyle odległe, że występują szybkie dudnienia. Dlaczego dudnienia nie brzmią
przyjemnie, a unisono wyższych składowych harmonicznych brzmi przyjemnie —
jest zagadnieniem, którego nie jesteśmy w stanie ani określić, ani opisać. Na podstawie
naszej wiedzy, nie możemy przewidzieć, co powinno brzmieć dobrze, podobnie jak nie
wiemy, co powinno np. pachnieć przyjemnie. Inaczej mówiąc, nasza znajomość rzeczy
nie wykracza poza stwierdzenie, że gdy dźwięki brzmią unisono, to brzmią przyjemnie.
Nie możemy z tego wywnioskować nic innego oprócz istnienia własności harmonii w
muzyce.
Bardzo łatwo sprawdzić opisane przez nas zależności harmoniczne w prostych
doświadczeniach z fortepianem. Oznaczamy trzy kolejne dźwięki c blisko środka klawiatury
jako c, c' i c" oraz sąsiednie g jako g, g' i g". Wówczas tony podstawowe będą miały
następujące częstości względne:
c-2, g-3
C-4, g'-6 ,
c"-8 , g"-12.
Te zależności harmoniczne można zademonstrować w następujący sposób. Załóżmy, że
lekko przyciskamy klawisz c' — a więc dźwięku nie ma, ale podnosimy tłumik. Jeżeli
teraz uderzymy w c, to wytworzy on swe drganie podstawowe oraz jakąś drugą składową
harmoniczną. Ta druga składowa wzbudzi drgania w c'. Gdy zwolnimy klawisz c
(trzymając c' naciśnięty), to tłumik zatrzyma drgania c i usłyszymy (cicho) ton c' powoli
gasnący. W podobny sposób trzecia składowa harmoniczna struny c może wywołać
drgania struny g'. Albo też szósta składowa harmoniczna c (teraz znacznie słabiej) może
wzbudzić drganie podstawowe struny g".
Otrzymamy nieco inny wynik, gdy lekko naciśniemy klawisz g, a następnie zagramy
c'. Trzecia składowa c' będzie odpowiadała czwartej harmonicznej g', tak że zostanie
pobudzona tylko czwarta harmoniczna g. Usłyszymy wówczas (jeżeli słuchamy uważnie)
dźwięk g", który jest o dwie oktawy wyższy od g, które przycisnęliśmy. Łatwo wymyślić
znacznie więcej kombinacji dla tej gamy.
Przy okazji możemy zauważyć, że skalę majorową można określić jedynie przez
warunek, że trzy główne akordy (f-a-c); (c-e-g) i (g-b-d) przedstawiają zbiory tonów, których
stosunek częstości równa się (4:5: 6). Te stosunki oraz fakt, że dowolna oktawa (c-c',
b-b' itd.) ma stosunek częstości 1:2 — określa całą skalę dla przypadku „idealnego"
lub określa, jak mówimy, „skalę naturalną". Instrumenty klawiszowe, np. fortepiany.
362
50. SKŁADOWE HARMONICZNE
zwykle nie dostraja się w ten sposób, lecz trochę się je „psuje", tak że stosunki częstości
wszystkich możliwych tonów wyjściowych są spełnione tylko w przybliżeniu. Przy tym tzw.
dostrojeniu „temperowanym" oktawa (nadal 1 : 2) dzieli się na 12 równych interwałów,
dla których stosunek częstości równa się (2)1'12, kwinta nie ma już stosunku częstości 3 -. 2,
ale 27,12 = 1,499 — tej różnicy większość ludzi nie słyszy.
Ustaliliśmy regułę dla konsonansu (harmonicznego współbrzmienia) jako zgodność
składowych harmonicznych. Czyżby ta zgodność stanowiła przyczynę, dla której dwa
tony byłyby w konsonansie? Ktoś stwierdził, że czyste tony — wytwarzane bez żadnych
składowych harmonicznych — nie sprawiają wrażenia konsonansu lub dysonansu, gdy
względne częstości są dobrane w odpowiednim stosunku, czy też tylko blisko niego. (Takie
doświadczenia są trudne do przeprowadzenia, ponieważ z powodów, o których dowiemy
się później, bardzo trudno wytworzyć czyste tony.) Nadal nie możemy być pewni, czy gdy
stwierdzamy, że lubimy jakiś dźwięk, nasze ucho porównuje składowe harmoniczne,
czy też przeprowadza obliczenia.
50-4. Współczynniki Fouriera
Wróćmy teraz do twierdzenia, że dowolny ton — tzn. dźwięk periodyczny — można
przedstawić przy pomocy odpowiedniej kombinacji składowych harmonicznych.
Chcielibyśmy podać sposób obliczenia potrzebnego natężenia każdej składowej. Łatwo,
oczywiście, obliczyć funkcję/"(f) z równania (50.2), jeżeli mamy dane wszystkie współczynniki
a i b. Powstaje pytanie: czy znając funkcję f(t) możemy wiedzieć, jakie powinny hyć
współczynniki przy różnych składowych harmonicznych? (Łatwo upiec ciasto według
przepisu, ale jak napisać przepis mając gotowe ciasto?)
Fourier odkrył, że właściwie nie jest to wcale trudne. Wyraz a0 naprawdę łatwo znaleźć.
Mówiliśmy już, że równa się on uśrednionej wartości funkcji/(f) w ciągu jednego okresu
(od : = 0 do t=T). Łatwo możemy się przekonać, że tak jest naprawdę. Średnia wartość
sinusa lub cosinusa w ciągu jednego okresu równa się zeru. Obliczona dla dwóch, trzech
lub dowolnej całkowitej liczby okresów także równa się zeru. A więc średnia wartość
wszystkich wyrazów z prawej strony równania (50.2) równa się zeru, oprócz wyrazu a0.
(Pamiętajmy, że musimy wybrać o) = 2n/T.)
Ale średnia sumy równa się sumie średnich. A więc średnia wartość funkcji/(/) równa
się średniej wartości a0. Jednak a0 jest stale, a więc jego wartość średnia równa się a0
Przypominając definicję średniej mamy
"o=M/(')</r. (50.3)
o
Dalsze współczynniki są trochę trudniejsze do znalezienia. Aby je obliczyć, możemy
się posłużyć chwytem matematycznym, odkrytym przez Fouriera. Załóżmy, że
pomnożyliśmy obie strony równania (50.2) przez pewną funkcję harmoniczną — powiedzmy przez
cos lat. Otrzymamy wtedy
SO-4. WSPÓŁCZYNNIKI FOURIERA
363
f(t) cos 7wt = a0 cos lwi +
+ al cos ot coslcot + bt sin col cos 7<w/+
+ a2 cos 2wt cos lot + b2 sin 2wt cos lot +
+ ... + ...
+ a 7 cos 7<«f cos Iwt + b-, sin 7w/ cos 7ca/ +
+ +... (50.4)
Teraz obliczymy średnie wartości obu stron. Średnia wartość wyrażenia a0 cos lott
obliczona dla jednego okresu T jest wprost proporcjonalna do średniej wartości cosinusa
obliczonej dla 7 całych okresów. Ale to równa się zeru. Średnia wartość prawie wszystkich
pozostałych wyrazów jest także równa zeru Przyjrzyjmy się wyrazowi za,. Wiemy,
że ogólnie
cos>lcosB = icosM + B) + icos(^-B). (50.5)
Wyraz z a, równa się wówczas
i a,(cos 8cof +cos 6cur). (50.6)
Mamy w ten sposób dwa wyrazy z cosinusami: jeden z 8 całymi okresami T, a drugi z 6
okresami. Dla obu średnie wartości równają się zeru. A więc średnia wartość wyrazu z at
równa się zeru.
Dla wyrazu z a2 znaleźliśmy a2 cos 9wt i a1 cos 5wt — oba wyrazy uśredniają się do
zera. Wyraz a^ dawałby cos 16wf oraz cos( — 2wt). Ale cos( — lun) równa się cos 2ojf. a więc
oba wyrazy mają średnią wartość równą zeru. Jasne więc, że wszystkie wyrażenia przy a
będą miały średnią wartość równą zeru, z wyjątkiem jednego. A tym jednym jest wyraz a-,.
Mamy dla niego
^c7(cosl4air+cos0). (50.7)
Cosinus zera równa się jedności i jego wartość średnia też wynosi jeden. Otrzymaliśmy
więc wynik, że średnia wszystkich wyrażeń z a w równaniu (50.4) równa się \an
Wyrazy z b są nawet łatwiejsze do wyznaczenia. Po pomnożeniu przez dowolny wyraz
typu cos wół możemy udowodnić przy pomocy tej samej metody, że wszystkie wyrazy
z b mają średnią wartość równą zeru.
Widzimy, że chwyt wymyślony przez Fouriera działa jak pewnego rodzaju sito. Gdy
pomnożymy/ (t) przez cos Iwt i uśrednimy, znikają wszystkie wyrazy oprócz a-,.
Mamy stąd:
średnia [f(i) cos liot] = a-]2 , (50.8)
czyli
c7=— j(t)coslwtdt (50 9)
o
Pozostawiamy czytelnikowi do udowodnienia, że współczynnik b7 można otrzymać
364
SO SKŁADOWE HARMONICZNI
mnożąc równanie (50.2) przez sin lat i uśredniając obie strony. Wynik jest następujący
T
b7^—\f(t)sm7atdt (50.10)
o
Przewidujemy, że to, co jest prawdziwe dla 7, zachodzi także dla dowolnej liczby
całkowitej. Możemy więc podsumować nasz dowód i nasze wyniki w następujący,
matematycznie bardziej elegancki sposób: Jeżeli m i n są liczbami całkowitymi różnymi od zera
i jeżeli o>=2n/T, to
1. J sin ncot cos mat dt = 0 . (50.11)
o
T
II. JcosMa>łcosm<y/</f =
T
III. J sinwcaisinmcof di =
0, jeśli »#m,
T/2 , jeśli h = m .
(50.12)
IV. f(t)=a0+ Y. ancosncot+ £ bnsinnat. (50.13)
n=l n=l
T
V. a„=-i-f/(0A. (50.14)
r
y'(0 cos nwtdt. (50.15)
o
r
.-yJj
o
T
, = y|/0)si:
sin nwtdt. (50.16)
o
W poprzednich rozdziałach wygodne było zapisywanie prostych ruchów
harmonicznych przy pomocy funkcji wykładniczych. Zamiast cos cot używaliśmy Re e'"",
rzeczywistej części funkcji wykładniczej. Natomiast tutaj używaliśmy sinusów i cosinusow, co
sprawiało, ie wyprowadzenie było nieco bardziej przejrzyste. Można jednak nasz końcowy
wynik, równanie (50.13), zapisać w zwartej postaci:
yOHRefa.e*"-, (50.17)
n = 0
gdzie fl, jest liczbą zespoloną: an — ib„ (z bo=0). Jeżeli chcemy stale używać tego samego
"">«"'" #*"* m"h-»*4*»w*"i»f rńu;mp4 nontGQra
50-4. WSPÓŁCZYNNIKI FOURIERA
365
fl»4I
+1
-1
1
1
1
1
1
1
i
i
i
i
i
50.3. Funkcja opisująca falę schodkową:
/(r)=+l dla 0<t<TI2.
/(/)=-! dla T/2<t<T
— /(0e"'na"dl («>l). (50.18)
Wiemy teraz jak „rozłożyć" falę
periodyczną na jej składowe harmoniczne. Ta
procedura nosi nazwę analizy Fouriera, a
oddzielne wyrazy nazywamy składowymi Fouriera.
Nie udowodniliśmy jednak, że skoro
znajdziemy wszystkie składowe Fouriera i dodamy je
do siebie, to rzeczywiście otrzymamy z
powrotem naszą funkcję/(r). Matematycy
udowodnili dla szerokiej klasy funkcji, a właściwie
dla wszystkich, które interesują fizyków, że po
obliczeniu całek otrzymamy z powrotem funkcję /(/). Istnieje jeden mały wyjątek. Jeżeli
funkcja /(/) jest nieciągła, to znaczy skacze gwałtownie od jednej wartości do drugiej,
suma Fouriera w punkcie skoku da wartość leżącą w połowie drogi między dolną i górną
wartością funkcji w punkcie nieciągłości. A wiec jeśli mamy taką dziwną funkcję f(t) = 0,
0<f<fo i/(0 = l dla t0^t^T, to suma Fouriera da poprawną wartość wszędzie oprócz
punktu t0, gdzie będzie miała wartość { zamiast 1. W każdym razie żądanie, aby funkcja
równała się zeru aż do punktu f0, a dokładnie 1 w punkcie /0, jest raczej niefizyczne. Może
więc powinniśmy ustalić dla fizyków „regułę", że dowolna funkcja nieciągła (która może
być tylko uproszczeniem jakiejś realnej funkcji fizycznej) powinna być dookreślona w ten
sposób, że jej wartości w punktach nieciągłości równają się sumie Fouriera obliczonej
w tych punktach. Wówczas dowolna funkcja tego rodzaju — z dowolną skończoną liczbą
takich skoków — podobnie jak inne fizycznie interesujące funkcje zostaje przez sumę
Fouriera określona prawidłowo.
Jako ćwiczenie proponujemy, aby czytelnik znalazł szereg Fouriera dla funkcji
przedstawionej na rys. 50.3. Ponieważ funkcji tej nie można zapisać w jawnej postaci analitycznej,
nie będzie można obliczyć całek od 0 do T w zwykły sposób. Całki te łatwo obliczyć po
rozdzieleniu ich na dwie: całkę od zera do T/2 [gdzie/(/)=1] i całkę od punktu T/2 do T
[gdzie /(/)= — 1]. Powinniśmy otrzymać następujący wynik:
/(0 = —(sin cot+^ sin 3cot+$sin Scot + ...),
(50.19)
gdzie co = 2n/T.
Stwierdziliśmy w ten sposób, że nasza fala schodkowa (z wybraną szczególną fazą)
ma tylko nieparzyste składowe harmoniczne, a ich amplitudy są odwrotnie
proporcjonalne do częstości.
Sprawdźmy, że równanie (50.19) daje nam rzeczywiście z powrotem funkcję/(O dla
pewnej wartości t. Wybierzmy wartości t=T/4, czyli wt=n/2. Podstawiając wybrane
wartości do równania (50.19) otrzymujemy
66
SKŁADOWI HARMONIC
4 / Tc 1 3n 1 5n
Ul) sin sin - - mii .1= (50 2'
k \ 2 3 " ' " '
2 5 2
Suma*' tego szeregu równa się rr 4 a stąd znajdujemy, że / (/) 1.
50...,
50-5. Twierdzenie o energii
Energia fali jest proporcjonalna do kwadratu amplitudy. Dla fali o skomplikowanym
T
kształcie energia w ciągu jednego okresu jest proporcjonalna do j f2(t) dl Możemy również
p
powiązać tę energię ze współczynnikami Fouriera. Piszemy:
T T X. a
\f2(t)dt \ [a0 Y. a„cosnwt+ £ ''„sinnw*]2^ . (50.22)
l' O n- 1 n= 1
Pr podniesieniu do kwadratu wyrażenia w nawiasie otrzymamy wszystkie możliwe
iloczyny, takie jak a5 cos Sotb-, cos 7wf Jednak udowodniliśmy już [równania (50 11)
i (50.12)], że wszystkie całki z takich wyrazów obliczone dla jednego okresu dają zero
Pozostają nam tylko wyrazy kwadratowe typu a&cos 2 5a>t Całka z cosinusa do kwadratu
lub sinusa do kwadratu, obliczona dla jednego okresu, jest równa 772, a więc otrzymujemy
;
f2(t)dt=Ta20 + --(a2 a22 + +b2 + b22 + b23+ )=Ta20+ ^Y(an + b2n) (50.23.
^ n =
Równanie to nazywamy .twierdzeniem energii" , głosi ono, że całkowita energia tali
' iwna się sumie energii wszystkich składowych Fouriera. Stosując na przykład to twierdz
■lie do szeregu (50.19). ponieważ [/(M]2=l. otrzymujemy
r , 4 , / ' '
1 U
I 1
więc dowiadujemy się. ze suma odwrotności kwadratów liczb nieparzvstych ro \n
Podobnie <.-trz\mu|ąL najpierw szereg Fouriera din funkcii c następnie korzy
uerdzenia nergii, m vna udowodnić że I -*- I 2*- I 34 równa się t4 90. n
v 'trzym^ .nik. ktor\ ył nam potrzebnv w rozdz 45
* zereg_ *m jstępi_. Najpierw stwierd
N nk cp alk *ą w szereg 1
.razi i otrz>m jemy c .. .
M> ZJAWISKA NI1L1VIOW1
367
50-6. Zjawiska nieliniowe
W teorii drgań harmonicznych istnieje jeszcze pewne bardzo ważne zjawisko - efekty
nieliniowe, o którym trzeba pamiętać ze względu na jego zastosowania praktyczne. Do tej
pory zakładaliśmy, że wszystkie rozważane układy działały liniowo, że przesunięcia i
przyspieszenia wywołane przez siły były zawsze do nich proporcjonalne. Podobnie prądy
w obwodach były proporcjonalne do napięć itd Teraz chcemy się zająć przypadkami,
w których nie ma ścisłej proporcjonalności. Na razie weźmy pod uwagę jakieś urządzenie.
Którego reakcja, nazwiemy ją .xskutek w chwili t, jest określona przez x
Tak na przykład xpT7yc
być prądem, a xskulek
zachodz'c
w chwili /.
,„...„= może
, może oznaczać siłę, a xskutck - przesunięcie, lub xprZi
napięciem. Jeżeli nasze urządzenie działa liniowo, to powinno
XskutekW — KXp
a(0
(50.24)
gdzie K jest stałą niezależną od / i xprzyczyna Załóżmy jednak, że nasze
urządzenie działa prawie, ale nie dokładnie liniowo, tak że zachodzi
-^skutek'')— K- |_Xprzyczyna(O+E*.
a(0]
(50.25)
•*nrz
t)) niel
(.n^J
gdzie £ jest małe w porównaniu z jednością. Takie liniowe i nieliniowe efekty pokazano
na wykresach na rys. 50.4.
Efekty nieliniowe mają pewne
ważne konsekwencje praktyczne.
Niektórymi z nich zajmiemy się
teraz. Najpierw zastanówmy się, co
nastąpi, gdy przez urządzenie
nieliniowe przepuścimy czysty ton.
Mamy xprzyczyna = cos wt. Po
wykreśleniu xskutc.k jako funkcji czasu,
otrzymamy krzywą ciągłą
pokazaną na rys. 50.5. Krzywa
przerywana przedstawia dla porównania
skutek dla układu liniowego.
Widzimy że w urządzeniu nieliniowym
nie otrzymujemy już funkcji cosinus,
lecz funkcję, która jest bardziej stro-
rna na górze i bardziej płaska na
dole. Mówimy, że fala wyjściowa jest
zniekształcona Wiem\ już, że taka
fala nie jest czystym tonem, że
będzie miała składowe harmoniczne.
Możemy teraz znaleźć te składowe.
Biorąc vprzvC2vna cos ot z równania
(50.25) i trz>r..^em>
iniowe
50.4. Zjawiska liniowe i nieliniowe
50.5. Reakcja urządzenia nieliniowego na sygnał
wejściowy cos wt. Dla porównania pokazano reakcję
liniową
k
368
50 SKŁADOWE HARMONICZNE
*skutek = K (COS V>t+E COS2 COt) . (50.26)
Z równości cos2 0 = j(\ +cos 29) mamy:
*sku.ek = K [cOStOt + j + yCOS 2o>M (50.27)
Nasze urządzenie wytworzyło więc falę, która ma nie tylko składowe o częstości
podstawowej, obecnej w fali wejściowej, ale ma także drugą składową harmoniczną. Fala wyjściowa
zawiera także stały wyraz K(e/2), który odpowiada przesunięciu wartości średniej,
pokazanemu na rys. 50.5. Proces wytwarzania przesunięcia wartości średniej nazywamy
rektyfikacją (wyprostowaniem).
Urządzenia nieliniowe będą wyprostowywały (rektyfikowały) falę wejściową oraz
wytwarzały nowe składowe harmoniczne. Chociaż założona nieliniowość wytwarza tylko
drugą składową harmoniczną, to nieliniowości wyższych rzędów — zawierające np.
wyrazy Xprzyczyna oraz Xp^^s, - będą wytwarzały wyższe składowe harmoniczne.
Innym efektem związanym z zjawiskami nieliniowymi jest modulacja. Jeżeli nasza fala
wejściowa zawiera dwa (lub więcej) czyste tony, to fala wyjściowa będzie miała nie tylko ich
składowe harmoniczne, ale także składowe o innych częstościach. Niech -Vprzy„yna =
= A cos cott + B cos co2t, gdzie w, i co2 nie są związane zależnością harmoniczności. Oprócz
wyrazu liniowego (który równa się K razy fala wejściowa) na wyjściu będziemy mieli
składową określoną przez
-Kjkuick = Ke (A cos a>, t + B cos u>21)2 = (50.28)
= Ke(/l2cos2w,r-l-B2cos2W2t + 2/lBcosa>1f cosa>20 - (50.29)
Pierwsze dwa wyrazy w nawiasie w równaniu (50.29) dają stałą składową oraz drugie
składowe harmoniczne, które znaleźliśmy już przedtem. Tylko ostatni wyraz jest nowy.
Możemy spojrzeć na ten nowy iloczyn AB cos co1t cos co2t dwojako. Przede wszystkim,
jeżeli te dwie częstości bardzo się różnią (gdy np. (ot jest znacznie większe od co2), to
możemy traktować ten iloczyn jako drganie cosinusoidalne o zmiennej amplitudzie. Możemy
więc spojrzeć na czynniki tego iloczynu w następujący sposób:
AB cosał, t -cosGJ2f = C(f)cosa>, t, (50.30)
gdzie
C(t) = ABcosio1t. (5031)
Mówimy, że amplituda fali cosa*!/ jest zmodulowana z częstością u>2.
Można też iloczyn ten zapisać w inny sposób:
AB
-46 cosa>, t cosa>2/= [cos(oj, +a>2)/-l-cos(a>1 — a)2)/] . (50.3-)
W tym wypadku powiemy, że zostały wytworzone dwie nowe składowe: jedna — o częstości
(wi+co2), a druga — o częstości równej różnicy częstości (a>, — co2).
Mamy dwa różne, ale równoważne sposoby traktowania tego samego wyniku W
specjalnym przypadku, gdy a»,>o;2» możemy powiązać te dwa punkty widzenia stwierdzając,
50-6. ZJAWISKA NIELINIOWE
369
że skoro (o), -t-a>2) i («, — oj2) są bardzo bliskie siebie, to powinniśmy zaobserwować
dudnienia, dudnienia te jednak wywołują z kolei modulację amplitudy drgań o średniej
częstości w, z częstością równą połowie różnicy częstości 2w2- Widzimy więc, dlaczego
te dwa opisy są równoważne.
W sumie, dowiedzieliśmy się, że reakcje nieliniowe wywołują szereg zjawisk:
rektyfikację, wytworzenie składowych harmonicznych i modulację, tzn. wytworzenie składowych
z sumą i różnicą częstości.
Musimy zwrócić uwagę, że wszystkie efekty wywołane przez te zjawiska [równanie
(50.29)] są proporcjonalne nie tylko do współczynnika nieliniowości e, ale także do
iloczynu obu amplitud, czyli do A1, B2 bądź AB. Spodziewamy się więc, że zjawiska te będą
znacznie istotniejsze dla sygnałów silnych niż dla słabych.
Zjawiska, o których mówiliśmy, mają wiele praktycznych zastosowań. Przede wszystkim,
jeżeli chodzi o dźwięk, to uważa się, że organ słuchu jest układem nieliniowym. Tłumaczy
to fakt, że słuchając głośnych dźwięków odnosimy wrażenie, że słyszymy składowe
harmoniczne, a także dudnienia, nawet gdy fala dźwiękowa zawiera tylko tony czyste.
Części składowe różnych urządzeń odtwarzających dźwięk wzmacniacze, głośniki
itd. — zawsze, wykazują pewną nieliniowość. Powodują one zniekształcenia (wytwarzają
składowe harmoniczne itd.), których nie ma w oryginalnym dźwięku. Te nowe składowe
odbiera ucho i są one z pewnością niepożądane. Dlatego też urządzenia wysokiej klasy,
tzw. „Hi-Fi", powinny być w miarę możności jak najbardziej liniowe. (Nie wiadomo na
pewno, dlaczego nieliniowości słuchu nie są tak samo „niepożądane", ani czy ta
nieliniowość tkwi raczej w głośniku, a nie jest związana ze słuchem}.)
Nieliniowości są jednak konieczne i zostają w rzeczywistości zwiększone w pewnych
radiowych urządzeniach transmisyjnych i odbiorczych. W nadajniku z modulacją
amplitudy AM, sygnał „głosu" (z częstością paru kiioherców) jest nałożony na sygnał nośny
(z częstością paru megaherców) w nieliniowym obwodzie nazywanym modulatorem,w celu
otrzymania drgań zmodulowanych, które są następnie emitowane. W odbiorniku
odbierany sygnał przekazywany jest do obwodu nieliniowego, który dodaje i odejmuje częstości
zmodulowanego sygnału i wytwarza sygnał głosu.
Omawiając rozchodzenie się światła zakładaliśmy, że indukowane drgania ładunków
były proporcjonalne do pola elektrycznego światła, tzn. że reakcja jest liniowa. Jest to
oczywiście bardzo dobre przybliżenie. Dopiero od paru lat istnieją źródła światła (lasery)
wytwarzające światło o takim natężeniu, że można zaobserwować efekty nieliniowe.
Można obecnie wytwarzać wyższe składowe harmoniczne dla światła. Gdy silne czerwone
światło przepuścimy przez kawałek szkła, to w świetle wychodzącym dostrzeżemy również
drugą składową harmoniczną — trochę światła niebieskiego!
51
(ale
51-1. Fale czołowe
Chociaż właściwie zakończyliśmy ilościową analizę zjawisk falowych, poświęcimy im
jeszcze jeden rozdział. Zamierzamy w nim podać jakościową ocenę różnych związanych
z falami zjawisk, które są zbyt skomplikowane, aby się nimi zajmować dokładnie.
Ponieważ zajmowaliśmy się już falami w paru rozdziałach, właściwy tytuł tego rozdziału
powinien brzmieć: „Niektóre bardziej złożone zjawiska związane z falami".
Z początku omówimy zjawiska, które wystąpią, gdy źródło fal będzie się poruszało
szybciej niż same fale, tzn. będzie miało prędkość większą od prędkości fazowej fal.
Najpierw weźmy pod uwagę fale, które mają określoną prędkość, jak np. fala świetlna lub
dźwiękowa. Zobaczmy więc, co się stanie, gdy źródło dźwięku będzie się poruszało
szybciej niż dźwięk. Załóżmy, że w pewnej chwili przez źródło znajdujące się w punkcie .x,
na rys. 51.1 zostaje wytworzona fala dźwiękowa. Następnie gdy źródło przesunie się do
punktu jc2, czoło fali wytworzonej w punkcie x, będzie miało promień rx mniejszy od
odległości, którą przebyło źródło, a z punktu x2 wybiegnie oczywiście druga fala. Gdy
źródło dojdzie do punktu x3, który stanie się nowym z kolei źródłem fali, czoło fali z punktu
x2 będzie już teraz miało promień r2, a fala z punktu xt przebędzie odległość r3. Oczywiście,
wszystko to będzie się działo w sposób ciągły, a nie skokowy i dlatego pojawi się tu ciąg
fal kulistych o wspólnej stycznej, przechodzącej przez środek źródła. Widzimy więc, że
zamiast źródła nieruchomego wytwarzającego fale kuliste mamy teraz źródło poruszające
się, które wytwarza falę o stożkowej powierzchni falowej w trzech wymiarach lub w
przypadku dwuwymiarowym falę, kórej powierzchnię falową tworzą dwie przecinające się
proste. Łatwo znaleźć kąt rozwarcia tego stożka. W ciągu pewnego czasu źródło przebywa
drogę x3— jc, proporcjonalną do prędkości źródła v. Jednocześnie czoło fali przebędzie
odległość r3, proporcjonalną do szybkości fali, którą oznaczymy przez cf. Wnioskujemy
51-1. FALI CZOŁOWE
371
stąd od razu, że sinus połowy kąta przy
wierzchołku stożka równa się stosunkowi
szybkości fali do szybkości źródła i że sinus
ten jest dobrze określony tylko wtedy, gdy
szybkość cs jest mniejsza od v, tzn. gdy
obiekt porusza się szybciej niż dźwięk.
sin0=^ (5l.l)
i'
Nawiasem mówiąc, poruszające się ciało
wcale nie musi być źródłem dźwięku. Okazuje
się, że ciało poruszające się szybciej niż dźwięk
samo wytwarza dźwięk. Dowolne ciało
poruszające się w ośrodku szybciej niż
rozchodząca się w nim fala dźwiękowa wytwarza
automatycznie fale dźwiękowe tylko dzięki
swemu ruchowi. To jest zrozumiałe w
przypadku dźwięku, ale okazuje się, że coś
podobnego występuje też dla światła. Na pierwszy
rzut oka można by sądzić, że nic nie może poruszać się szybciej od światła. Światło w szkle
ma jednak prędkość fazową mniejszą od prędkości światła w próżni. Można więc nadać
naładowanej cząstce tak dużą.energię, że jej prędkość przy przelatywaniu przez blok szkła
będzie bardzo bliska prędkości światła w próżni, podczas gdy szybkość światła w szkle
może stanowić tylko j tej prędkości. Cząstka poruszająca się szybciej niż światło w ośrodku
będzie wytwarzała stożkową falę świetlną z wierzchołkiem w źródle, podobną do fali
czołowej wytwarzanej przez okręt (która przecież stanowi to samo zjawisko). Mierząc
kąt rozwarcia stożka możemy określić prędkość cząstki. Jest to jedna z metod określania
prędkości cząstek, którą używamy do pomiaru energii cząstek elementarnych o bardzo
dużej energii. W tym celu musimy tylko
wyznaczyć kierunek światła.
Światło to nazywamy niekiedy
promieniowaniem Czerenkowa, ponieważ on to za- 51.2. Fala uderzeniowa wywołana w gazie przez
obserwował je po raz pierwszy. Frank zaś P°cisk Poruszający się szybciej niż dźwięk
i Tamm zbadali teoretycznie natężenie tego _^
światła. Ci trzej fizycy otrzymali za tę pracę
Nagrodę Nobla w dziedzinie fizyki w roku
1958.
Przebieg tego zjawiska w przypadku dżwię- _ —■—■■»
ku pokazano na fot. 51.2. Jest to fotografia ""■■■——
ciała poruszającego się w gazie z szybkością
większą niż dźwięk. Zmiany ciśnienia gazu
wywołują zmiany współczynnika załamania
i za pomocą odpowiedniego urządzenia opty-
51.1. Czoło Tali uderzeniowej jest stożkiem,
którego wierzchołek znajduje się w źródle,
aj kąta rozwarcia równa się 0= arc sin (crjv)
372
51. FALE
cznego można obserwować czoło fali. Widzimy, że ciało poruszające się szybciej od dźwięku
rzeczywiście wytwarza falę stożkową. Dokładniejsza jednak obserwacja pozwala
stwierdzić pewną krzywiznę czoła fali. Asymptotycznie jest to powierzchnia płaska, ale zakrzywia
się ona w pobliżu wierzchołka. Teraz musimy wyjaśnić, dlaczego tak się dzieje, ale jest to
już następny temat tego rozdziału.
51-2. Fale uderzeniowe
Szybkość fali zależy często od jej amplitudy. W przypadku fali dźwiękowej zależność
ta powstaje w następujący sposób. Otóż dowolne ciało poruszające się w powietrzu musi
usuwać powietrze ze swej drogi. Dlatego też wywoływane zaburzenie jest czymś w rodzaju
schodka ciśnienia. Przy tym ciśnienie jest większe z tyłu czoła fali niż w obszarze nieza-
burzonym, do którego fala jeszcze nie dotarła (oczywiście fala poruszająca się z normalną
szybkością). Ale powietrze, które zostaje z tyłu po przejściu czoła fali, jest zgęszczone
adiabatycznie i dlatego jego temperatura wzrasta. Ponieważ szybkość dźwięku wzrasta wraz
z temperaturą, więc w obszarze za skokiem ciśnienia jest ona większa od szybkości w
powietrzu przed falą. Oznacza to, że jakieś inne zaburzenie wywołane za skokiem, będzie
miało szybkość większą od czoła fali, ponieważ szybkość będzie wzrastała ze wzrostem
ciśnienia. Na rysunku 51.3 przedstawiono to zjawisko wraz z małymi garbkami
dodatkowego ciśnienia na konturze ciśnienia, umieszczonymi w celu lepszego zobrazowania
zjawiska. Widzimy, że znajdujący się z tyłu obszar podwyższonego ciśnienia wraz z upływem
czasu dogania czoło aż do chwili, gdy fala .zgęszczona wytworzy w końcu ostry skok
ciśnienia. Gdy natężenie fali będzie bardzo duże, wyrażenie „w końcu" praktycznie
oznacza „natychmiast"; gdy natomiast będzie raczej małe, trwa to dość długo. Może
się również zdarzyć, że dźwięk rozprzestrzeni się i wygaśnie przed powstaniem takiego
skoku.
Zmiany ciśnienia wywołane przez dźwięki, które wytwarzamy w trakcie mówienia,
są bardzo słabe w porównaniu z ciśnieniem atmosferycznym — stosunek ich równa się
jeden do miliona. Lecz dla zmian ciśnienia rzędu 1 Atm prędkość fali wzrasta o około
20% i odpowiednio szybko tworzy się prostopadły „skok" ciśnienia. W przyrodzie nic
nie dzieje się nieskończenie szybko, i to, co nazywamy „prostopadłym" skokiem, w rze-
51.3. „Migawkowe zdjęcia" czoła fali uderzeniowej w kolejnych odstępach czasu
odległość
51-2. FALE UDERZENIOWE
373
czywistości ma pewną bardzo małą
szerokość. Skok ten nie jest nieskończenie
stromy, jego szerokość jest rzędu średniej drogi
swobodnej. Do opisu zmian ciśnienia na
takich odległościach nie możemy stosować
równania falowego, ponieważ nie uwzględnia
ono struktury atomowej gazu.
Wracając do rys. 51.2 widzimy, że można
zrozumieć występowanie zakrzywienia czoła
fali, jeżeli zauważymy, że ciśnienia blisko
wierzchołka są większe niż daleko z tyłu,
a więc i kąt 6 jest tu większy. Oznacza to, że
krzywizna powstaje, ponieważ szybkość fali
zależy od jej amplitudy. Dlatego fala uderzę- 51.4
niowa wywołana eksplozją bomby atomowej
porusza się szybciej niż dźwięk, póki nie
oddali się dostatecznie od miejsca wybuchu i nie osłabnie na tyle, że przyrost ciśnienia
przez nią wywołany będzie mały w porównnniu z ciśnieniem atmosferycznym. Szybkość
tej fali osiąga wówczas szybkość dźwięku w gazie, w którym ta fala się porusza. (Nawiasem
mówiąc, okazuje się, że szybkość skoku ciśnienia jest zawsze większa niż szybkość dźwięku
w gazie przed skokiem, ale mniejsza od szybkości dźwięku w gazie za skokiem. Oznacza to,
że impulsy wywołane za skokiem będą doganiały czoło fali, ale czoło to porusza się w
ośrodku z szybkością większą od normalnej szybkości sygnałów. A więc metodami
akustycznymi nie można stwierdzić zbliżania się skoku aż do chwili, gdy jest już za późno.
Błysk wybuchu bomby oczywiście dostrzegamy wcześniej, ale nie można stwierdzić
zbliżania się skoku, zanim on nadejdzie, ponieważ nie ma sygnałów dźwiękowych, które by go
poprzedzały.)
To zjawisko spiętrzania się fal jest bardzo interesujące. Występuje ono dzięki temu, że
po przejściu fali szybkość następnej wywołanej fali wzrasta. Istnieje jeszcze jeden przykład
tego zjawiska. Zastanówmy się nad ruchem wody płynącej w długim kanale. Kanał ten
ma skończoną szerokość i głębokość. Jeśli tłok lub poprzecznie ustawiona ścianka porusza
się dostatecznie szybko wzdłuż kanału, to woda spiętrza się podobnie jak śnieg przed
pługiem śnieżnym. Załóżmy teraz, że sytuacja wygląda tak, jak na fot. 51.4, na której
widzimy nagły skok poziomu wody w kanale. Można udowodnić, że fale długie w kanale
poruszają się szybciej w wodzie głębokiej niż w płytkiej. Dlatego też każde nowe zaburzenia
albo zmiany energii wywołane przez tłok biegną do przodu i spiętrzają czoło fali. I znów,
teoretycznie, otrzymujemy ostry skok poziomu wody. Jednak jak wynika z fot. 51.4,
występują tu pewne komplikacje. Na zdjęciu widzimy falę biegnącą w kanale, tłok znajduje się
daleko po prawej stronie kanału. Początkowo fala może wyglądać zupełnie normalnie,
zgodnie z przewidywaniem, ale dalej wzdłuż kanału czoło fali coraz bardziej się zaostrza,
aż do wystąpienia zjawiska, które widzimy na zdjęciu. Na powierzchni woda opada,
kotłuje się, ale istotny jest tu bardzo ostry wzrost poziomu wody przy braku zaburzeń
przed czołem fali.
374
51- FALE
1
h2
D)-^
V _
-JL+
h
»-
I
I
b)
*2
51.5. Dwa przekroje fali wysokiego
przypływu w kanale: w momencie b) późniejszym
o At w stosunku do a)
W rzeczywistości tego rodzaju zjawiska
falowe w wodzie są bardziej skomplikowane
niż rozchodzenie się dźwięku w powietrzu.
Jednak dla ich zilustrowania spróbujmy
zbadać szybkość tej tzw. fali wysokiego
przypływu w kanale**. Wnioski, jakie stąd
wyciągniemy, nie będą miały podstawowego
znaczenia dla naszych celów — nie posłużą
nam one do żadnych uogólnień — a
pozwolą nam tylko wykazać, że znane nam
prawa mechaniki nadają się do wyjaśnienia
tego typu zjawisk.
Wyobraźmy sobie, że przepływ wody
w kanale można schematycznie przedstawić
tak, jak na rys. 5I.5a. Woda na górnym
poziomie h2 porusza się z prędkością v, a czoło
fali wchodzi z prędkością u w wodę
niezaburzoną, której głębokość równa się hx.
Chcielibyśmy znaleźć szybkość czoła fali. W czasie
At płaszczyzna pionowa znajdująca się początkowo w punkcie x, przesunie się o v At do
punktu x2, podczas gdy czoło fali przesunie się o u At.
Teraz wypiszemy równania zachowania masy oraz zachowania pędu. Najpierw
zajmiemy się pierwszym z nich. Widzimy, że masa h2v At, która przepływa przez jednostkową
powierzchnię kanału umieszczoną w punkcie jc, (na rysunku obszar zakreskowany) jest
skompensowana przez masę (/i2— h,)u At, którą oznaczyliśmy drugim obszarem zakresko-
wanym. Dzieląc obie masy przez At otrzymujemy vh2 = u(h2 — h{). To nam nie wystarcza,
bo chociaż znamy wielkości h2 i ht, nie wiemy, jakie jest u ani v. Spróbujmy obliczyć obie
te prędkości.
W tym celu skorzystajmy z zasady zachowania pędu. Dotychczas nic nie mówiliśmy
o ciśnieniu wódy, nie zajmowaliśmy się hydrodynamiką, ale tak czy inaczej wiemy, że
ciśnienie wody na danej głębokości utrzymuje znajdującą się nad nią kolumnę wody.
Dlatego ciśnienie wody równa się iloczynowi gęstości wody p, przyspieszenia ziemskiego g
oraz głębokości wody. Ponieważ ciśnienie wzrasta liniowo wraz z głębokością, średnie
ciśnienie wywierane na płaszczyznę w punkcie x, równa się \pgh2. Tyle wynosi średnia
siła przypadająca na jednostkę szerokości i jednostkę długości. Siła ta popycha płaszczyznę
znajdującą się w punkcie x{ w kierunku punktu x2. Po pomnożeniu ciśnienia jeszcze raz
przez h2 otrzymujemy całkowitą siłę działającą na wodę z lewej strony. Jednak istnieje
też ciśnienie wody działające w przeciwnym kierunku, które wywiera na omawiany obszar
siłę równą \pgh\, co obliczamy na podstawie podobnej analizy. Teraz musimy porównać
różnicę tych sił z przyrostem pędu. Musimy w tym celu ocenić, o ile większy jest pęd w sytua-
•' To znaczy fali tworzącej się przy ujściu rzeki (lub kanału) podczas przypływu morza. (Przyp-
red. wydania polskiego.)
51-2. FALE UDERZENIOWE
375
cji b z rys. 51.5 w porównaniu z sytuacją a. Widzimy, że dodatkowa masa, która zyskuje
szybkość v, równa się ph2u At — ph2v At (na jednostkową szerokość). Mnożąc to
wyrażenie przez v otrzymujemy dodatkowy pęd, który należy porównać z popędem F At:
(ph2uAt-ph2vAt)v = tipgh\-\pgh\)At.
Gdy pozbędziemy się z tego równania v, podstawiając je ze znanego już równania vh2 =
= u(h2—ht), po uproszczeniach otrzymamy u2 = gh2(h1+łi2)/2h1.
Jeżeli różnica wysokości jest bardzo mała, tak że hx \h2 są prawie równe, nasze równanie
mówi, że u = \'gh. Jak przekonamy się później, jest to słuszne tylko wtedy, gdy długość
fali jest większa od głębokości kanału.
Takie samo rozumowanie można przeprowadzić dla fal dźwiękowych dodając tylko
zasadę zachowania energii wewnętrznej, ale już nie entropii, ponieważ tworzenie skoku
jest nieodwracalne. W rzeczywistości, gdybyśmy chcieli sprawdzić zasadę zachowania
energii dla fali wysokiego przypływu, okazałoby się, że nie jest ono spełnione. Przy małych
różnicach wysokości jest ono prawie idealnie spełnione, natomiast przy znacznych
różnicach występują już duże straty energii. Objawiają się one w postaci opadania wody i
wirów widocznych na fot. 51.4.
Z punktu widzenia procesów adiabatycznych analogiczna dostrzegalna strata energii
występuje w fali uderzeniowej. Energia fali dźwiękowej za skokiem jest użyta do ogrzania
gazu po przejściu skoku, co odpowiada wirom na wodzie w fali wysokiego przypływu.
Do obliczenia tej straty dla fali dźwiękowej potrzebne są trzy równania i okazuje się, że
temperatura za skokiem, zgodnie z tym, co już mówiliśmy, nie równa się temperaturze
gazu przed czołem fali.
Jeżeli spróbujemy wywołać odwrotną falę wysokiego przypływu (h2<h,), to się okaże,
że strata energii na sekundę ma wartość ujemną. Ponieważ nie ma żadnego źródła energii,
fala taka nie może sama się utrzymać, jest nietrwała. Gdy wywołamy taką falę, rozpłynie
się ona, ponieważ zależność szybkości fali od wysokości, która poprzednio spowodowała
zaostrzenie czoła fali, wywoła teraz zjawisko odwrotne.
51-3. Fale w ciałach stałych
Drugim rodzajem fal, którymi teraz się zajmiemy, będą fale rozchodzące się w ciałach
stałych. Fale te są bardziej złożone od fal rozchodzących się w wodzie lub w powietrzu
Zajmowaliśmy się już falami dźwiękowymi w gazach i w cieczach. Analogiczne fale możni
wywołać w ciałach stałych. Gdy raptownie naciśniemy ciało stałe, zmieni ono swą objętość
Ciało to będzie się przy tym przeciwstawiało naciskowi, a to wywoła falę analogiczną dc
fali dźwiękowej. W ciele starym można wywołać jeszcze inny rodzaj fal, które nie występuj,
w cieczach. Gdy ciało stałe odkształcimy bez zmiany objętości, działając siłą styczną dc
powierzchni, to będzie ono usiłowało wrócić do swej pierwotnej postaci. To właśnie z defi
nicji odróżnia ciało stałe od cieczy: jeżeli zaburzymy ciecz przechylając naczynie, a następ
nie przetrzymamy ją chwilę aż do uspokojenia i puścimy swobodnie, to ciecz będzii
trwała nadal w tej nowej postaci. Ale gdy zdeformujemy ciało stałe, np. kawałek galaretki
376
51. FALE
a następnie usuniemy siłę, to galaretka wróci do pierwotnej postaci i wytworzy falę
poprzeczną poruszającą się w podobny sposób jak fale zgęszczeniowe. We wszystkich
przypadkach szybkość fal poprzecznych jest mniejsza od szybkości fal podłużnych. Fale poprzeczne
są bardziej podobne, jeżeli chodzi o własność polaryzacji, do fal świetlnych. Dźwięku
nie można spolaryzować, jest on po prostu falą ciśnieniową. Natomiast światło
charakteryzuje się orientacją prostopadłą do kierunku jego rozchodzenia się.
W ciele starym występują oba rodzaje fal. Przede wszystkim są fale zgęszczeniowe
analogiczne do fal dźwiękowych, poruszające się z pewną prędkością, oraz fale poprzeczne.
Jeżeli dane ciało nie jest ciałem krystalicznym, fala poprzeczna spolaryzowana w
dowolnym kierunku będzie rozchodziła się w tym ciele z pewną szybkością zależną od własności
ciała. (Oczywiście, wszystkie ciała stałe są ciałami krystalicznymi, jeżeli jednak weźmiemy
kawałek substancji zbudowanej z mikrokryształów o różnej orientacji, to anizotropia
krystaliczna się uśredni.)
Istnieje jeszcze jeden ciekawy problem dotyczący fal dźwiękowych. Co się mianowicie
stanie, jeżeli będziemy brali coraz krótsze i krótsze fale w ciele stałym? Jakie mogą być fale
najkrótsze? Oczywiście, że nie ma fali krótszej niż odległość między atomami, ponieważ
wiemy, że w fali jedne punkty poruszają się do góry, a inne na dół, a więc najkrótszą
falą jest fala o długości równej odległości międzyatomowej. Mówiąc o różnych rodzajach
drgań, mamy na myśli drgania podłużne, poprzeczne, drgania długofalowe oraz drgania
krótkofalowe. Gdy bierzemy pod uwagę długości fal porównywalne z odległościami między-
atomowymi, szybkości fal przestają być stałe. Występują tu efekty dyspersji, kiedy prędkość
fali nie jest niezależna od liczby falowej. Ale tak czy inaczej najwyższą częstość będzie miała
ta fala poprzeczna, w której każdy atom porusza się inaczej niż atomy sąsiednie.
Z atomowego punktu widzenia sytuacja jest podobna do omawianego wypadku dwóch
wahadeł mających dwa rodzaje drgań własnych: jeden, kiedy oba poruszają się razem,
i drugi, kiedy poruszają się w przeciwne strony. Można też badać falę w ciele stałym w inny
sposób, rozważając układ sprzężonych oscylatorów harmonicznych, np. olbrzymią liczbę
wahadeł z jedną składową harmoniczną o najwyższej częstości, w której wszystkie wahadła
drgają w różne strony, i o niższych częstościach przy innym sposobie doboru faz drgań.
Najkrótsze fale są tak krótkie, że zwykle są praktycznie nieosiągalne. Odgrywają
jednak bardzo dużą rolę w termodynamice ciał stałych, ponieważ przy pomocy własności
najkrótszych fal dźwiękowych bada się cieplne własności ciał stałych, np. ich ciepła
właściwe. Przechodząc do omawiania najkrótszych fal dźwiękowych z konieczności dochodzimy
do ruchów poszczególnych atomów; w każdym razie oba te zagadnienia dotyczą tego samego
zjawiska.
Bardzo interesującym przykładem, zarówno podłużnych, jak i poprzecznych fal
dźwiękowych w ciele starym są fale wywoływane w skorupie ziemskiej. Co wywołuje te hałasy
wewnątrz Ziemi, nie wiemy, ale czasem wewnątrz kuli ziemskiej jedne skały przesuwają
się względem drugich wywołując trzęsienie Ziemi, przypominające niskie fale dźwiękowe-
W trakcie trzęsienia Ziemi fale podobne do fal dźwiękowych wybiegają z jego źródła,
mając długości znacznie większe od zwykłych fal dźwiękowych. Są to jednak zwykłe fale
dźwiękowe, które obiegają Ziemię wkoło. Jednak wnętrze Ziemi nie ma budowy
jednorodnej i ciśnienie, gęstość, ściśliwość itp., a zatem i szybkość fal zmienia się wraz z głębo-
51-3. FALE W CIAŁACH STAŁYCH •
377
kością. Fale te nie poruszają się więc wzdłuż linii prostych — wnętrze Ziemi wykazuje
pewien współczynnik załamania i dlatego biegną wzdłuż krzywych. Fale poprzeczne
i podłużne różnią się szybkością, istnieją więc dla różnych prędkości różne „mieszanki"
tych fal. Dlatego gdy po umieszczeniu sejsmografu w pewnym miejscu obserwujemy
drgania wywołane jakimś trzęsieniem Ziemi, to nie ujrzymy po prostu nieregularnych
drgań. Możemy natomiast przez pewien czas obserwować drgania, potem ich zupełne
wygaszanie a następnie nowe drgania — wszystko zależy od miejsca, gdzie jest
umieszczony sejsmograf. Jeżeli jest umieszczony dość blisko źródła drgań, to zauważymy
najpierw falę podłużną wywołaną zaburzeniem, a następnie, po pewnym czasie, fale
poprzeczne, ponieważ poruszają się one znacznie wolniej. Mierząc różnicę czasu między tymi
momentami możemy określić odległość od źródła trzęsienia Ziemi, jeśli wiemy dostatecznie
dużo o szybkościach i budowie wnętrza obszaru, w którym to trzęsienie zachodzi.
Na rysunku 51.6 pokazano przykład rozchodzenia się fal w Ziemi. Każdy rodzaj
fal oznaczono innym symbolem. Jeżeli trzęsienie Ziemi zaszło w miejscu oznaczonym
jako „źródło", to fale podłużne i poprzeczne poruszając się po najprostszych drogach
nie przybędą do stacji jednocześnie. Będą ponadto odbijały się na nieciągłościach, co
jeszcze bardziej skomplikuje ich drogi i szybkości. Okazuje się, że wewnątrz Ziemi
znajduje się rdzeń, w którym nie rozchodzą się fale poprzeczne. Jeżeli obserwatorium
znajduje się po przeciwnej stronie kuli ziemskiej od źródła, fale poprzeczne wprawdzie dochodzą
do niego, ale są przesunięte w fazie. Wyjaśniamy to mówiąc, że gdy fala poprzeczna dotrze
do rdzenia i padnie na powierzchnię oddzielającą dwa różne materiały, wówczas powstaną
dwie nowe fale, poprzeczna i podłużna. Natomiast wewnątrz rdzenia fala poprzeczna się
nie rozchodzi (a w każdym razie tego nie stwierdzono w przeciwieństwie do fali
podłużnej). Następnie z rdzenia znów wybiegają dwie fale: podłużna i poprzeczna, które dochodzą
do obserwatorium.
Badając zachowanie się fal wywołanych trzęsieniem Ziemi stwierdzamy, że fale
poprzeczne nie mogą się rozchodzić wewnątrz pewnej kuli stanowiącej rdzeń Ziemi. Oznacza
to, że wnętrze Ziemi jest ciekłe w tym
sensie, że nie przepuszcza fal poprzecznych.
Wszystko, co wiemy o wnętrzu Ziemi,
pochodzi z badania trzęsień ziemi.
Korzystając z olbrzymiej liczby obserwacji
wielu trzęsień z różnych obserwatoriów
poznano wiele szczegółów — szybkości,
krzywe, po których biegną fale itd.;
wszystko to jest znane. Wiemy, jakie są
szybkości różnych rodzajów fal na każdej
głębokości. Mając te wiadomości, można
określić drgania własne Ziemi, ponieważ
znamy szybkość rozchodzenia się fal
dźwiękowych, tzn. sprężyste własności
Ziemi na każdej głębokości. Przypuśćmy,
*e spłaszczyliśmy Ziemię do elipsoidy,
SI.6. Schemat wnętrza Ziemi ukazujący drogi
poprzecznych i podłużnych fal dźwiękowych
źródło
obserwatorium
podłużne (P,K)
poprzecznej
378
51. FALE
a następnie przestaliśmy działać siłą. Wówczas do określenia okresu i kształtu
drgań swobodnych Ziemi musimy znać superpozycję drgań obiegających kulę ziemską.
Wiemy, że w tym przypadku na superpozycję tę składa się wielka liczba drgań własnych
od najniższego, elipsoidalnego, do wyższych o bogatszej strukturze.
Trzęsienie Ziemi w Chile w maju 1960 r. wywołało tak głośne „hałasy", że ich sygnały
obiegły wielokrotnie Ziemię. Akurat na krótko przedtem zainstalowano bardzo czułe
sejsmografy, które mogły zmierzyć częstości podstawowych drgań własnych Ziemi i
porównać je z wartościami otrzymanymi na podstawie teorii dźwięku ze znanych szybkości
fal dźwiękowych zmierzonych w czasie innych trzęsień Ziemi. Wynik tego doświadczenia
przedstawia rys. 51.7, na którym wykreślono zależność natężenia sygnału od częstości
jego drgań (analiza fourierowska). Zauważmy, że dla pewnych częstości sygnały są
szczególnie silne; istnieją bardzo dobrze określone maksima. Odpowiadają one częstościom
własnym Ziemi, ponieważ są to główne częstości, z jakimi Ziemia może drgać. Inaczej
mówiąc, jeżeli dowolny ruch drgający kuli ziemskiej składa się z wielu różnych drgań
własnych, to powinniśmy w każdym obserwatorium otrzymać nieregularne skoki
oznaczające superpozycję wielu częstości. Gdy rozłożymy je na częstości składowe, to będziemy
w stanie określić częstości własne Ziemi. Cienkie pionowe linie na rysunku oznaczają
częstości obliczone; stwierdzamy doskonałą zgodność, która wskazuje na to, że teorię
dźwięku można stosować do wnętrza Ziemi.
Bardzo interesujące zjawisko ujawnia rys. 51.8. Na rysunku tym przedstawiono bardzo
dokładne pomiary, przeprowadzone z większą zdolnością rozdzielczą, najniższego
drgania własnego, drgania elipsoidalnego Ziemi. Zauważmy, że nie ma tu maksimum
pojedynczego, lecz występują dwa, nieco przesunięte, maksima: 54,7 min i 53,1 min. Przyczyna
wystąpienia tych dwóch częstości nie była znana w momencie pomiaru; być może, została
odkryta później. Istnieją przynajmniej dwie możliwości wyjaśnienia. Jedna opiera się na
51.7. Wykres natężenia jako funkcji częstości odczytany z sejsmografów w Nana (Peru) i Isabella
(Kalifornia). Widoczna koherencja jest miarą sprzężenia między obserwatoriami [Benioff, Press and
Smith, J. Geoph. Research 66, 605 (1961)1
drganie powierzchni Ziemi
51-3. FALF W CIAŁACH STAŁYCH
379
400
prawdopodobieństwie występowania
asymetrii w rozkładzie masy Ziemi, co
spowodowałoby pojawienie się dwu podobnych
drgań własnych. Druga możliwość jest
może bardziej interesująca. Wyobraźmy
sobie fale wybiegające ze źródła w dwu
kierunkach wokół Ziemi. Szybkości ich
nie będą równe ze względu na wpływ
obrotu Ziemi na równania ruchu, co nie
zostało uwzględnione przy tej analizie.
Ruch w układzie obracającym się zmienia
się na skutek siły Coriolisa i to może
spowodować obserwowane rozszczepienie.
Jeżeli chodzi o metodę, przy pomocy
której analizowano te trzęsienia, to
wykres otrzymany z sejsmografu nie
przedstawia amplitudy jako funkcji częstości,
ale podaje przemieszczenia powierzchni
Ziemi jako funkcję czasu; jest to zwykle
bardzo nieregularna krzywa. Wiemy, że
w celu znalezienia zawartości różnych
fal sinusoidalnych o różnych częstościach
należy pomnożyć dane z sejsmografu przez
falę sinusoidalną o danej częstości i scał-
kować, to znaczy uśrednić, w wyniku czego znikną wszystkie inne częstości. Nasze
rysunki przedstawiają więc wykresy całek znalezionych po pomnożeniu danych przez
fale sinusoidalne o różnych częstościach.
0,0180 0,0182 0,0184 0.0186 0,0188 0,0190 0/1192
częstość w okresach
na minutę
SI.8. Analiza fourierowska jednego z zapisów
sejsmografu o dużej zdolności rozdzielczej,
ujawniająca dublet widmowy
51-4. Fale powierzchniowe
Następnym rodzajem fal, które każdy łatwo może obserwować i których zwykle używa
się jako przykładu w elementarnych wykładach fizyki, są fale na wodzie. Jak się o tym
wkrótce przekonamy, stanowią one najgorszy z możliwych przykładów, ponieważ nie mają
nic wspólnego z falami dźwiękowymi lub świetlnymi, natomiast są najbardziej
skomplikowane ze wszystkich rodzajów fal. Zacznijmy od fal długich na głębokiej wodzie. Jeżeli
traktujemy ocean jako nieskończenie głęboki i wywołamy zaburzenie na jego powierzchni,
to wytworzy się fala. Występują tu różne ruchy nieregularne, ale ruch sinusoidalny przy
małym zaburzeniu może wyglądać jak gładkie fale biegnące po oceanie ku brzegowi.
Oczywiście, przy takich falach woda średnio biorąc pozostaje nieruchoma, a tylko fale
się poruszają. Jaki jest ten ruch: poprzeczny czy podłużny? Nie może być ani taki, ani taki —
ani podłużny, ani poprzeczny. Chociaż woda w danym miejscu stanowi albo grzbiet, albo
dolinę fali, to nie może po prostu poruszać się do góry i na dół ze względu na zachowanie
380
51. FALE
kierunek fali
fala na wodzie . N. grzbiet fali
poruszają się
po orbiłch kołowych
51.9. Fale na głębokiej wodzie tworzą się dzięki ruchowi cząsieczek po okręgach. Zwróćmy uwagę
na systematyczne przesunięcie fazy przy przejściu od jednego okręgu do drugiego. Jak poruszałby się
pływający przedmiot?
ilości wody. Gdzie by się podziewała woda, jeżeli opadałaby na dół? Woda jest praktycznie
biorąc zupełnie nieściśliwa. Szybkość fali zgęszczeniowej w wodzie - tzn. dźwięku
w wodzie — jest o wiele większa i nie będziemy się nią tutaj zajmować. Jeżeli więc woda
jest aż tak nieściśliwa, to gdy grzbiet fali opada, woda musi uciekać z tego obszaru.
Zjawisko to polega na tym, że cząsteczki cieczy znajdujące się blisko jej powierzchni mają
ruch w przybliżeniu kołowy. Gdy zbliża się łagodne wzniesienie wody, ktoś unoszący się
na wodzie w kole gumowym stwierdzi, że sąsiednie przedmioty poruszają się po
okręgach. A więc mamy tu połączenie ruchów podłużnych i poprzecznych, co tylko
zwiększa trudność przy opisie tych fal. Na większej głębokości ruchy odbywają się po
mniejszych okręgach a jeszcze głębiej ustają zupełnie (rys. 51.9).
Znalezienie prędkości takich fal jest zadaniem dość interesującym. Prędkość ta musi
zależeć od gęstości wody, od przyspieszenia ziemskiego, które jest natężeniem siły
wywołującej fale, i prawdopodobnie od długości fali oraz od głębokości wody. Jeżeli zajmiemy
się przypadkiem nieskończonej głębokości, to prędkość nie będzie od niej zależała.
Każdy wzór na prędkość fazową tych fal musi zawierać taką kombinację różnych
czynników, która daje odpowiedni wymiar. Jeżeli spróbujemy wyprowadzić wzór na różne
sposoby, przekonamy się, że istnieje tylko jedno powiązanie, wielkości g i /, które daje
wymiar prędkości, mianowicie \j kg — nie zawiera ono w ogóle gęstości. W rzeczywistości
wzór ten nie jest zupełnie ścisły, ale z dokładnej analizy dynamicznej tego zjawiska,
w którą nie będziemy się tu wdawać, wynika, że wszystko się zgadza oprócz czynnika V 2n:
Vtmz = \gk/2n (dla fal na wodzie wywołanych grawitacją).
Ciekawe, że fale długie poruszają się szybciej od fal krótkich. Dlatego gdy pędząca
motorówka wytwarza fale, po chwili do brzegu dobiega fala z rzadkimi chlapnięciami, a dopiero
później z coraz częstszymi, ponieważ pierwsze dobiegające fale są falami długimi. Do
brzegu wraz z upływem czasu dobiegają fale coraz krótsze, ponieważ ich szybkości zależą
od pierwiastka kwadratowego z długości fali.
Ktoś mógłby zaprotestować: „To wszystko nieprawda, do opisu zjawiska musimy
użyć prędkości grupowej". Oczywiście miałby rację. Wzór na prędkość fazową nie mówi,
51-4. FALE POWIERZCHNIOWE
381
co przybędzie najpierw; możemy się o tym dowiedzieć tylko za pomocą prędkości grupowej.
Musimy więc ją obliczyć. Należy tylko udowodnić, co potraktujemy jako zadanie dla
czytelnika, że równa się ona połowie prędkości fazowej — wystarczy tylko przyjąć, że
prędkość fazowa zależy od pierwiastka kwadratowego z długości fali. Prędkość grupowa
także zmienia się jak pierwiastek kwadratowy z długości fali. Jak to się dzieje, że szybkość
grupowa jest dwa razy mniejsza od szybkości fazowej? Gdy patrzyrpy na szereg fal
powstałych za płynącym statkiem i zatrzymamy wzrok na wybranym grzbiecie fali, zauważymy,
że przesuwa się on do przodu wewnątrz grupy, stopniowo słabnie i na przodzie zanika.
Jednocześnie słaby początkowo grzbiet fali z tyłu cudownie i tajemniczo przesuwa się jego
śladem i staje się coraz mocniejszy. Krótko mówiąc, fale poruszają się wewnątrz grupy,
podczas gdy cała grupa biegnie z prędkością o połowę mniejszą od tej, z którą się fale
przesuwają..
Ponieważ prędkości grupowe i fazowe nie są równe, fale wytwarzane przez poruszający
się obiekt nie tworzą zwykłego stożka, lecz coś o wiele bardziej interesującego. Możemy to
zobaczyć na fot. 51.10, na której widać fale wytworzone przez jakieś ciało poruszające
się na wodzie. Zwróćmy uwagę, że wygląda to zupełnie inaczej niż w przypadku dźwięku,
kiedy prędkość nie zależy od długości fali i czoła fali tworzą stożki rozchodzące się na
boki. Tutaj mamy fale powstające za ciałem, z czołami, które są prostopadłe do ruchu
ciała, a także małe fale po bokach biegnące pod innymi kątami. Całe to zjawisko można
z powodzeniem zbadać korzystając tylko z tego, że prędkość fazowa jest proporcjonalna
do pierwiastka kwadratowego z długości fali. Sztuka polega na tym, że rozkład fal jest
stacjonarny względem (poruszającego się ze stałą prędkością) statku. Każdy inny rozkład
fal oderwałby się od statku.
Fale na wodzie, którymi zajmowaliśmy się do tej pory, były falami długimi, w których
siła wywołująca drgania pochodziła od przyciągania ziemskiego. Natomiast dla bardzo
krótkich fal na wodzie główną siłą wywołującą drgania jest włoskowatość, a więc istotną
rolę odgrywa tu energia powierzchniowa, napięcie powierzchniowe. Prędkość fazowa
fal wywołanych napięciem powierzchniowym
równa się
, 51.10. Ślad statku
l>fliZ = \2nT/Xp (dla zmarszczek na wodzie),
gdzie T oznacza napięcie powierzchniowe,
a p — gęstość. Mamy tu dokładnie odwrotne
zjawisko: w wypadku fal bardzo krótkich
prędkość fazowa się zwiększa, gdy długość fali
maleje. W ogólnie spotykanym wypadku,
gdy jednocześnie działa grawitacja i napięcie
powierzchniowe, otrzymujemy kombinację ■
obu tych prędkości:
vfliZ = yjTkip + glk,
gdzie k = 2n,Ji jest liczbą falową. Widzimy,
że Wzór na prędkość fal na wodzie jest rzeczy-
382
SI- FALE
X,cm
51.1). Wykres prędkości fazowej jako funkcji
długości fali dla fali na wodzie
wiście dość skomplikowany. Prędkość
fazową jako funkcję długości fali
pokazano na rys. 51.11. Dla bardzo
krótkich fal jest ona bardzo duża, podobnie
rzecz ma się dla fal bardzo długich
istnieje więc minimalna prędkość, z jaką
fale mogą się poruszać. Z naszego
wzoru można też obliczyć prędkość
grupową, która równa się f prędkości
fazowej zmarszczek na wodzie i i
fazowej prędkości fal wywołanych
przyciąganiem ziemskim. Na lewo od
minimum prędkość grupowa jest
większa od prędkości fazowej, na prawo
- mniejsza. Istnieje wiele
interesujących zjawisk związanych z tym faktem.
Przede wszystkim, ponieważ prędkość grupowa tak szybko rośnie, gdy długość fali maleje,
to po wywołaniu jakiegoś zaburzenia można zaobserwować jego najwolniejszy kraniec
poruszający się z minimalną prędkością odpowiadającą pewnej długości fali oraz czoło
złożone z fali krótkiej i bardzo długiej biegnące z większą szybkością. Bardzo trudno
dostrzec fale długie, ale w zbiorniku z wodą fale krótkie łatwo można obserwować.
Widzimy więc, że zmarszczki na wodzie tak często podawane jako przykład fal są bardzo
interesujące i bardzo złożone. Nie mają wcale wyraźnego czoła jak proste fale dźwiękowe
lub świetlne. Główna fala składa się z małych zmarszczek, które biegną na przodzie.
Ostre zaburzenie na wodzie nie wytwarza wyraźnego czoła fali ze względu na dyspersję.
Pierwsze zawsze biegną fale bardzo drobne. Nawiasem mówiąc, gdy jakiś obiekt porusza
się w wodzie z pewną szybkością, powstaje bardzo złożony układ fal, ponieważ wiele
różnych fal porusza się z różnymi szybkościami. Można to łatwo pokazać na przykładzie
półmiska z wodą. Widać wówczas, że
najszybsze są bardzo drobne fale wywołane
napięciem powierzchniowym. Istnieją
też fale najwolniejsze, biegnące na
końcu. Przechylając półmisek można
stwierdzić, że w płytszym miejscu szybkość
fali maleje. Gdy fala zbliża się pod pewnym
kątem do linii maksymalnego spadku,
załamuje się i dalej biegnie już zgodnie
z tą linią. W ten sposób można
pokazać różne rzeczy i przekonać się, że
fale na wodzie są znacznie bardziej
skomplikowane niż fale w powietrzu.
Szybkość długich fal na wodzie z
kołowym ruchem cząstek jest mniejsza w
51.12. Fale morskie
51-4. PALE POWIERZCHNIOWE
383
płytszej wodzie, a zwiększa się na wodzie głębokiej. Dlatego gdy fala zbliża się do plaży, gdzie
jest coraz płyciej, porusza się coraz wolniej. Natomiast na głębszej wodzie fale są szybsze,
obserwujemy więc zjawisko fal uderzeniowych. Teraz jednak, ponieważ fale są bardziej
złożone, zmienia się czoło fali uderzeniowej i fale ,.przełamują się" w znany sposób
pokazany na fot. 51.12. Tak właśnie wyglądają fale dobiegające do brzegu. W tych zjawiskach
doskonale widoczna jest cała złożoność przyrody. Nikomu dotychczas nie udało się opisać,
jaki kształt powinna mieć fala rozbijająca się o brzeg. Dość łatwo to zrobić dla fal małych,
ale gdy stają się duże i rozbijają się o brzeg, wszystko staje się bardziej skomplikowane.
Interesującą cechą fal wywołanych napięciem powierzchniowym można zaobserwować
w zaburzeniach wywołanych przez jakiś przedmiot poruszający się w wodzie. Z punktu
widzenia samego przedmiotu woda płynie do tyłu, a fale wokół niego mają po prostu
taką szybkość, że pozostają zawsze przy nim. Podobnie wokół przedmiotu tkwiącego
w strumieniu układ fal jest stacjonarny, a ich długości takie, że fale poruszają się z tą samą
szybkością jak opływająca woda. Ale gdy prędkość grupowa jest mniejsza od prędkości
fazowej, wówczas zaburzenia poruszają się w strumieniu do tyłu, ponieważ prędkość
grupowa jest za mała i zaburzenie nie nadąża za strumieniem. Gdy prędkość grupowa będzie
większa od prędkości fazowej, fale pojawią się przed przedmiotem. Gdy przyjrzymy się
uważnie przedmiotom tkwiącym w strumieniu, zauważymy delikatne zmarszczki z przodu
i długie fale za przedmiotem.
Podobnie interesujące zjawiska można zaobserwować przy lejących się cieczach.
Gdy na przykład dostatecznie szybko wylewa się mleko z butelki, to można zauważyć wiele
linii przecinających z dwóch stron wylewający się strumień. Są to fale wywołane
zaburzeniami na brzegu butelki i rozchodzące się w strudze mleka podobnie jak fale rozchodzące
się od przedmiotu tkwiącego w strumieniu. Teraz jednak zjawiska te występują z obu stron
strugi, co wytwarza krzyżujące się linie.
Zbadaliśmy pewne interesujące własności fal oraz różne komplikacje wynikłe z
zależności prędkości fazowej od długości fali, zależności szybkości fal od głębokości itd. Wszystko
to wywołuje naprawdę złożone i dlatego tak interesujące zjawiska przyrody.
52
symetria praw fizyki
52-1. Operacje symetrii
Tematem obecnego rozdziału jest symetria praw fizyki. Pewnymi cechami symetrii,
wykazywanymi przez prawa fizyki, zajmowaliśmy się już poprzednio. Odbywało się to
w związku z analizą wektorową (rozdz. 11), z teorią względności (rozdz. 16) i z obrotami
(rozdz. 20).
Dlaczego jednak mamy się zajmować symetrią? Przede wszystkim należy stwierdzić,
że symetria jest dla umysłu ludzkiego czymś urzekającym i każdy lubi przedmioty czy wzory,
które są symetryczne. Ciekawe, że wśród przedmiotów, które nas otaczają, często
natrafiamy na takie, w których przyroda ujawnia najrozmaitsze cechy symetrii.
Prawdopodobnie najbardziej symetrycznym obiektem, jaki można sobie wyobrazić, jest kula, i w
przyrodzie aż roi się od ciał o kształcie kulistym — są nimi gwiazdy, planety, kropelki wody
w chmurach. Kryształy znajdowane w skałach wykazują najrozmaitsze cechy symetrii.
Tabela 52.1. Operacje symetrii
przesunięcie w przestrzeni
przesunięcie w czasie
obrót o ustalony kąl
jednostajna prędkość wzdłuż linii prostej (przekształcenie Lorentza)
odwrócenie czasu
odbicie przestrzenne
wymiana jednakowych atomów
faza kwaniowo-mechaniczna
materia-antymateria (sprzężenie
lub jednakowych
ładunkowe)
cząstek
52-1. OPERACJE SYMETRII
385
których badanie pozwala na uzyskanie wielu ważnych informacji o budowie ciał stałych.
Nawet świat roślinny i zwierzęcy wykazuje pewien stopień symetrii, aczkolwiek symetria
kwiatu czy pszczoły nie jest ani tak doskonała, ani nie ma tak podstawowego charakteru
jak symetria kryształu.
Nie chodzi nam tu jednak o to, że obiekty, na które natrafiamy w przyrodzie, są często
symetryczne. Chcielibyśmy raczej zbadać jeszcze bardziej zadziwiające przykłady symetrii —
symetrie, jakie wykazują podstawowe prawa rządzące zachowaniem świata fizycznego.
Przede wszystkim, czym jest symetria? W jaki sposób prawo fizyki może być
„symetryczne"? Problem zdefiniowania symetrii jest bardzo interesujący i — jak już wspomnieliśmy —
Weyl podał dobrą definicję sprowadzającą się do tego, że jakaś rzecz jest symetryczna,
jeżeli możemy coś z nią zrobić, a mimo to będzie wyglądać tak samo jak poprzednio.
Symetryczną wazę, na przykład, możemy odbić w zwierciadle lub obrócić, a mimo to jej
wygląd się nie zmieni. Chcemy się obecnie zastanowić, co można zrobić z prawami fizyki
lub z sytuacją fizyczną, w jakiej dane doświadczenie się odbywa, aby wyniki pozostały
takie same. Przegląd znanych operacji, pod których wpływem różne zjawiska fizyczne
pozostają niezmienione, podano w tab. 52.1.
52-2. Symetria czasu i przestrzeni
Pierwszą rzeczą, jaką moglibyśmy na przykład spróbować zrobić, jest przesunięcie
zjawiska w przestrzeni. Gdy wykonamy doświadczenie w pewnym miejscu, a następnie
zbudujemy takie samo urządzenie, gdzie indziej (lub przesuniemy pierwsze), wówczas
cokolwiek zajdzie w pierwszym urządzeniu, powtórzy się w tym samym porządku
czasowym i w drugim urządzeniu, jeżeli tylko udało się nam odtworzyć te same warunki. Przy
tym, jak już wspomnieliśmy poprzednio, wszystkie cechy otoczenia, które mogłyby
spowodować inny przebieg zjawiska, muszą również zostać odtworzone na nowym miejscu.
Mówiliśmy już o tym, jak zdefiniować to, co należy uwzględnić w odtwarzanych
warunkach; nie będziemy więc już do tych szczegółów powracać.
Podobnie, obecnie uważamy, że przesunięcie w czasie nie będzie miało wpływu na
prawa fizyki (tzn. o ile nam obecnie wiadomo; wszystko, co tu omawiamy, jest słuszne
z zastrzeżeniem: „o ile nam obecnie wiadomo"!). Oznacza to, że jeżeli zbudujemy pewne
urządzenie i puścimy je w jakiejś chwili w ruch, powiedzmy w czwartek o godzinie 1000,
a następnie zbudujemy takie samo urządzenie i uruchomimy je w trzy dni później, lecz
w takich samych warunkach, wówczas ruch obu urządzeń jako funkcja czasu będzie taki
sam, niezależnie od czasu uruchomienia; oczywiście pod warunkiem, że istotne cechy
otoczenia również zostały odpowiednio zmodyfikowane w czasie. Symetria ta oznacza bez
wątpienia, że nie ma żadnej różnicy czy kupiliśmy akcje giełdowe obecnie, czy trzy miesiące
temu!
Musimy również uwzględnić różnice geograficzne, gdyż w różnych miejscach powierzchni
Ziemi pewne charakterystyki ulegają zmianie. Jeśli na przykład mierzymy pole
magnetyczne w pewnym obszarze, a następnie przesuniemy urządzenie w inne miejsce, może ono
nie pracować dokładnie tak samo, ponieważ pole magnetyczne jest obecnie inne.Wiemy i
386
32. SYMETRIA PRAW FIZYJcj
jednak, że dzieje się tak, ponieważ pole magnetyczne jest związane z Ziemią. Zdajemy
sobie sprawę, że gdybyśmy przesunęli wraz z całym urządzeniem i Ziemię, nie
spowodowałoby to żadnej różnicy w pracy przyrządów.
Inną sprawą, o której mówiliśmy już dość szczegółowo, były obroty w przestrzeni:
jeżeli przyrząd obrócimy o pewien kąt, będzie pracować tak jak poprzednio, pod
warunkiem, że wraz z nim obrócimy wszystko, co jest istotne. Problem symetrii względem obrotu
w przestrzeni omawialiśmy już właściwie w rozdz. 11. (t. I, cz. 1). Wprowadziliśmy
wówczas metodę matematyczną, zwaną analizą wektorową, pozwalającą na zgrabne
podejście do tych spraw.
Na wyższym szczeblu wtajemniczenia mamy jeszcze inny przykład symetrii — symetrię
względem prędkości jednostajnej, skierowanej wzdłuż linii prostej. To znaczy, mamy do
czynienia z dość niezwykłym faktem, gdy pracujące w pewien sposób urządzenie umieścimy
w pojeździe, który wraz z całym — mającym w tym wypadku znaczenie — otoczeniem
wprawimy następnie w ruch z prędkością jednostajną po linii prostej i obserwując wówczas
zjawiska zachodzące wewnątrz pojazdu, nie stwierdzimy żadnej różnicy; wszystkie prawa
fizyki będą miały swą poprzednią postać. Wiemy nawet, jak wypowiedzieć to fachowo,
mianowicie: wszystkie równania matematyczne wyrażające prawa fizyczne muszą pozostać
niezmienione pod wpływem przekształcenia Lorentza. Nawiasem mówiąc, właśnie studia
nad teorią względności zwróciły uwagę fizyków na problem symetrii praw fizycznych.
Wszystkie rozpatrywane powyżej przykłady symetrii miały charakter geometryczny;
czas i przestrzeń są mniej więcej tym samym. Istnieje jednak inny rodzaj symetrii. Mamy
na przykład symetrię opisującą możliwość zastąpienia jednego atomu przez drugi atom
tego samego typu; inaczej mówiąc, istnieją atomy tego samego typu. Istnieją grupy
atomów, wśród których można wymieniać dowolne pary miejscami, i nie spowoduje to żadnej
zmiany — atomy są jednakowe. Cokolwiek zrobi atom tlenu pewnego typu, to samo zrobi
atom tlenu tego samego typu. Mógłby ktoś powiedzieć: „To śmieszne, przecież to jest
właśnie definicja identyczności!" Można to traktować jedynie jako definicję, lecz wówczas
dalej nie będziemy wiedzieć, czy istnieją jakieś „atomy tego samego typu". Chodzi właśnie
o to, że jest ich wiele. A zatem powiedzenie, że nie ma żadnej różnicy, gdy zastąpimy
jeden atom innym atomem tego samego typu, ma sens. Tak zwane cząstki elementarne,
z których atomy są zbudowane, są również w powyższym sensie cząsteczkami ident>cz-
nymi - wszystkie elektrony są takie same; wszystkie protony są takie same; wszystkie
dodatnie jony są takie same; i tak dalej.
Po tak drugiej liście operacji, których można dokonać nie zmieniając zjawiska, mógłby
ktoś sądzić, że praktycznie można zrobić niemal wszystko; pokażmy więc na kilku prz>-
kładach, że tak nie jest. Przypuśćmy, że pytamy: „Czy prawa fizyki są symetryczne
względem zmiany skali?" Przyjmijmy, że budujemy jakieś urządzenie, a następnie jego
odpowiednik, którego każda część jest 5 razy większa i pytamy, czy nowe urządzenie będzie działać
dokładnie tak samo. Odpowiedź w tym przypadku brzmi: nie1. Tak na przykład długość
fali świetlnej emitowanej przez zajmujące pewien obszar atomy sodu nie jest 5 razy
mniejsza od długości fali świetlnej emitowanej przez atomy sodu, które zajmują obszar 5 razy
większy, lecz jest taka sama. Stosunek długości fali do rozmiarów urządzenia wys> łającego
zmienia się więc.
52-2. SYMETRIA CZASU 1 PRZESTRZENI
387
Inny przykład: od czasu do czasu widzimy w amerykańskich dziennikach zdjęcia
ogromnych katedr wykonanych z samych zapałek, wspaniałe dzieła sztuki, których
autorami są emerytowani faceci zajmujący się klejeniem. Katedry te są nawet bogatsze i
wspanialsze od prawdziwych. Jeżeli wyobrazimy sobie, że taką drewnianą katedrę wykonano
w prawdziwych rozmiarach, zaraz zobaczymy, na czym polega kłopot; konstrukcja nie
wytrzymałaby i wszystko by runęło, ponieważ powiększone zapałki nie byłyby
wystarczająco wytrzymałe. „No tak — mógłby ktoś powiedzieć — wiemy jednak również, że mamy
pewien wpływ z zewnątrz, należy więc i to odpowiednio zmienić!" Ponieważ chodzi nam o
odporność przedmiotu na ciążenie, trzeba najpierw rozpatrywać model katedry z
prawdziwych zapałek oraz prawdziwą Ziemię. To, jak wiemy, jest stabilne. Następnie powinniśmy
rozpatrywać większą katedrę i większą Ziemię. Jednak wówczas sytuacja się pogarsza,
ponieważ grawitacja wzrasta jeszcze bardziej!
Dzisiaj zdajemy sobie oczywiście sprawę, że zależność zjawiska od skali spowodowana
jest atomową budową materii. Z pewnością, jeżeli zbudujemy przyrząd tak mały, że
składający się tylko z 5 atomów, nie będziemy mogli go dowolnie zwiększać ani zmniejszać.
Skala pojedynczego atomu nie jest wcale dowolna — jest dobrze określona.
To, że prawa fizyki zmieniają się przy zmianie skali, odkrył już Galileusz. Zdawał on
sobie sprawę z tego, że wytrzymałość materiałów nie jest dokładnie proporcjonalna do
ich rozmiarów. Własność tę, o której właśnie mówiliśmy na przykładzie katedry z zapałek,
zilustrował rysując dwie kości: pierwsza z nich była kością psa, podaną z uwzględnieniem
właściwych proporcji pozwalających na wytrzymanie jego ciężaru, druga zaś była kością
„super-psa", powiedzmy 10-krotnie lub 100-krotnie większego. Kość ta była ogromna,
jednakże miała zupełnie inne proporcje. Nie wiemy, czy Galileusz wyciągnął ostateczny
wniosek, że prawa przyrody muszą mieć określoną skalę, jednakże był pod takim wrażeniem
swego odkrycia, że uważał je za równie ważne jak odkrycie praw ruchu, oba zamieścił
bowiem w tej samej książce zatytułowanej O dwóch nowych naukach.
A oto inny dobrze znany przykład braku symetrii praw fizyki: w obracającym się ze
stałą prędkością kątową układzie nie mamy tych samych praw co w układzie, który się
nie obraca. Jeśli wykonamy jakieś doświadczenie, a następnie zapakujemy cały
ekwipunek do pojazdu kosmicznego, który będzie wirował w pustej przestrzeni ze stałą
prędkością kątową, urządzenie nie będzie działało tak jak poprzednio. Jak wiemy, poszczególne
elementy ekwipunku zostaną wyrzucone na zewnątrz; spowodują to siły odśrodkowe, siły
Coriolisa itd. Używając na przykład wahadła Foucaulta możemy bez wyglądania na
zewnątrz stwierdzić, że Ziemia się obraca.
Z kolei wspomnimy o bardzo interesującej symetrii, która jest z pewnością fałszywa,
mianowicie o odwracalności w czasie. Prawa fizyki najwyraźniej nie mogą być odwracalne
w czasie, gdyż jak wiemy, wszelkie codzienne zjawiska odbywające się w dużej skali są
nieodwracalne. Obecnie jednak jesteśmy przekonani, że ta nieodwracalność jest związana
z dużą liczbą cząstek uczestniczących w zjawisku, i gdybyśmy mogli śledzić pojedyncze
cząsteczki, nie potrafilibyśmy powiedzieć, czy cały mechanizm porusza się do przodu, czy do
tyłu. Wypowiedzmy to bardziej precyzyjnie: budujemy mały przyrząd, w którym znamy
ruch każdego z atomów; możemy śledzić jak każdy z nich sobie drga. Następnie budujemy
drugi taki sam przyrząd, który jednak rozpoczyna swój ruch w warunkach, w których
JOB
52. SYMETRIA PRANV FIZYKI
skończył swój ruch pierwszy przyrząd, przy czym kierunek wszystkich prędkości został
zmieniony. Ruchy zachodzące w nowym przyrządzie będą wówczas takie same, lecz
dokładnie w kierunku przeciwnym. Ujmując to jeszcze inaczej, możemy powiedzieć, że jeżeli
zrobimy wystarczająco szczegółowy film pokazujący to, co się dzieje we wnętrzu jakiejś
substancji, i wyświetlimy go na ekranie w kierunku wstecznym, żaden fizyk nie będzie
mógł powiedzieć: „Tu jest coś nie w porządku, to jest niezgodne z prawami fizyki".
Oczywiście, jeżeli nie będziemy widzieli wszystkich szczegółów, sytuacja nie będzie budzić
żadnych wątpliwości. Gdy zobaczymy, że jajko spada na ziemię, jego skorupka rozbija
się itd., z pewnością powiemy: „To jest proces nieodwracalny, gdyż jeśli puścilibyśmy film
od końca, widzielibyśmy, jak wszystkie skorupki zlepiają się, dając znów całe jajko, a to
byłoby oczywiście śmieszne!" Gdy jednak rozważamy oddzielne atomy, prawa, którym
podlegają, wyglądają na całkowicie odwracalne. Odkryć tę symetrię było oczywiście
znacznie trudniej niż pozostałe, niemniej jednak prawdą jest, że podstawowe prawa fizyki
rządzące atomami i cząsteczkami są całkowicie odwracalne w czasie!
52-3. Symetria a zasady zachowania
Już teraz własność symetrii praw fizycznych wydaje się bardzo ciekawa, lecz jak się
okazuje, staje się ona jeszcze ciekawsza i porywająca, gdy przechodzimy do mechaniki
kwantowej. Z przyczyn, których na poziomie obecnych rozważań nie umiemy wystarczająco
jasno podać (większość fizyków uważa to zresztą wciąż za coś niezwykłego), w mechanice
kwantowej mamy do czynienia z niezwykle pięknym i doniosłym faktem: każdej zasadzie
symetrii odpowiada zasada zachowania; istnieje ściśle określony związek między zasadami
zachowania a symetriami praw fizyki. Obecnie możemy to jedynie stwierdzić bez
jakiejkolwiek próby wyjaśnienia.
Okazuje się, na przykład, że to, iż prawa fizyki są symetryczne względem przesunięcia
w przestrzeni, po dodaniu zasad mechaniki kwantowej jest równoważne zasadzie
zachowania pędu.
To zaś, że prawa są symetryczne względem przesunięcia w czasie, oznacza w mechanice
kwantowej, że zachowana jest energia.
Niezmienniczość względem obrotów przestrzennych o stały kąt odpowiada zasadzie
zachowania momentu pędu. Powiązania te są bardzo interesujące i piękne, jedne z
najpiękniejszych i mające najdonioślejsze znaczenie w całej fizyce.
W mechanice kwantowej występuje również wiele symetrii, które nie mają swojego
odpowiednika klasycznego i których nie można opisać za pomocą języka fizyki klasycznej.
Oto jedna z nich: Jeżeli y/ jest amplitudą dla pewnego procesu, to jak wiemy, kwadrat
modułu y/ jest prawdopodobieństwem zajścia tego procesu. Gdyby jednak ktoś inny
wykonywał swoje rachunki-nie z funkcją yi, lecz z y/' różniącą się jedynie fazą (niech A będzie
pewną stałą i pomnóżmy stare y/ przez e"1), wówczas kwadrat modułu y/', będący
prawdopodobieństwem zdarzenia, równałby się kwadratowi modułu yr.
¥' = Veu; H2 = H2-
(52.1)
52-3. SYMETRIA A ZASADY ZACHOWANIA
389
A zatem prawa fizyczne pozostają niezmienione, jeżeli faza funkcji falowej zostanie
przesunięta o dowolną stałą. To właśnie ta inna symetria. Prawa fizyki muszą mieć taki
charakter, aby przesunięcie kwantowomechanicznej fazy nie powodowało żadnej różnicy Jak
właśnie wspomnieliśmy, w mechanice kwantowej każdej symetrii odpowiadają zasady
zachowania. Wydaje się, że zasadą zachowania, która jest związana z kwantowomechanicz-
ną fazą, jest zasada zachowania ładunku elektrycznego. Wszystko to razem jest bardzo
ciekawe!
52-4. Odbicia zwierciadlane
Następnym zagadnieniem, którym będziemy się zajmować przez większą część tego
rozdziału, jest symetria względem odbicia przestrzennego. Pytamy: czy prawa fizyki są
symetryczne względem takiego odbicia? Możemy podejść do tego problemu w następujący
sposób. Przypuśćmy, że budujemy jakieś urządzenie, powiedzmy zegar ze wskazówkami,
cyframi i dużą liczbą kółek; zegar nasz tyka, chodzi, wszystko w nim działa sprawnie.
Następnie spójrzmy na nasz zegar w zwierciadle. Nie ograniczamy się jednak do samego
spojrzenia, lecz staramy się zbudować zegar, który wygląda dokładnie tak, jak odbicie
zwierciadlane pierwszego. Za każdym razem, gdy w zegarze pierwszym mamy śrubę
prawoskrętną, umieszczamy w odpowiednim miejscu drugiego zegara śrubę lewoskrętną;
tam, gdzie na tarczy jednego zegara mamy cyfrę VIII. umieszczamy HIV na tarczy drugiego;
każdą sprężynę skręconą w jedną stronę w pierwszym zegarze, skręcamy w przeciwną
w zegarze odbitym. Po skończeniu całej pracy mamy więc dwa zegary, oba fizyczne, które
pozostają w takim związku jak przedmiot i jego odbicie zwierciadlane, aczkolwiek, co
podkreślamy, oba są prawdziwymi, materialnymi obiektami. Pytamy obecnie: Czy jeżeli
oba zegary zostaną uruchomione w takich samych warunkach i ich sprężyny zostaną równie
mocno skręcone, zegary te będą odtąd chodzić tak, jakby jeden był dokładnym odbiciem
zwierciadlanym drugiego? (Jest to pytanie o charakterze fizycznym, a nie filozoficznym.)
Nasza intuicja dotycząca praw fizyki podpowiada nam odpowiedź twierdzącą.
Podejrzewamy, przynajmniej w przypadku tych zegarów, że odbicie przestrzenne jest
jedną z symetrii praw fizycznych, że jeżeli zmienimy wszystko z „prawego" na „lewe",
a poza tym pozostawimy takie samo, nie będziemy mogli stwierdzić różnicy. Przypuśćmy
więc na chwilę, że to prawda. Jeżeli to prawda, to przy pomocy żadnego zjawiska fizycznego
nie można rozróżnić „prawego" i „lewego", podobnie jak na przykład nie można przy
pomocy zjawiska fizycznego zdefiniować absolutnej prędkości. Nie powinno więc być
możliwe zdefiniowanie przy pomocy żadnego zjawiska fizycznego, co rozumiemy przez
„w prawo", a co przez „w lewo".
Oczywiście, świat nie musi być symetryczny. Posługując się na przykład tym, co
nazwiemy „geografią", z pewnością można zdefiniować stronę, prawą. Jeżeli znajdujemy się
w Nowym Orleanie i patrzymy w kierunku Chicago, Floryda jest po naszej prawej stronie
(gdy nasze stopy są na ziemi!). Przy pomocy pojęć geograficznych możemy więc zdefiniować
„w prawo" i „w lewo". Rzecz jasna, dowolny układ nie musi wykazywać symetrii, o której
tu mówimy; chodzi o to, czy prawa rządzące tym układem są symetryczne; innymi słowy,
390
52. SYMETRIA PRAW FIZYKI
czy byłoby sprzeczne z prawami fizyki, gdybyśmy mieli kulę w rodzaju Ziemi, na niej
„lewą powierzchnię" i kogoś podobnego do nas, patrzącego w kierunku miasta w rodzaju
Chicago z miejsca w rodzaju Nowego Orleanu, lecz wszystko byłoby odwrócone: Floryda
znalazłaby się więc po lewej stronie. Najwyraźniej nie wydaje się to niemożliwe ani sprzeczne
z prawami fizyki.
Nasza definicja „prawego" i „lewego" nie powinna być również zależna od historii.
Łatwy bowiem sposób rozróżnienia między kierunkiem prawym a lewym polega na wejściu
do sklepu z artykułami metalowymi i wybraniu na chybił trafił jakiejś śruby. Wszystko
przemawia za tym, że będzie to śruba prawoskrętna (nie musi tak oczywiście być, lecz
prawdopodobieństwo znalezienia śruby lewoskrętnej jest znacznie mniejsze). Związane to
jest z historią, konwencjami, z obecnym wyglądem poszczególnych przedmiotów. I znów
nie mamy tu do czynienia z podstawowymi prawami. Jak sobie dobrze zdajemy sprawę,
każdy mógłby się zabrać do produkowania śrub lewoskrętnych!
Musimy więc spróbować znaleźć jakieś zjawisko, w którym kierunek „prawy" występuje
w sposób zasadniczy. Następna możliwość, jaką rozważymy, to skręcanie płaszczyzny
polaryzacji światła po przejściu przez roztwory wodne cukru. Jak się dowiedzieliśmy z rozdz.
33, płaszczyzna ta zostaje skręcona w prawo w pewnym roztworze. Jest to więc sposób
zdefiniowania strony prawej, gdyż możemy rozpuścić trochę cukru w wodzie i płaszczyzna
polaryzacji przesunie się w prawo. Lecz użyty przez nas cukier jest pochodzenia roślinnego,
a gdybyśmy spróbowali wyprodukować cukier sztucznie, stwierdzilibyśmy, że nie skręca
on płaszczyzny polaryzacji! Gdybyśmy jednak do tego wyprodukowanego sztucznie cukru,
który nie skręcał płaszczyzny polaryzacji, wpuścili bakterie (żywią się one niektórymi
rodzajami cukru), a następnie odsączyli je, stwierdzilibyśmy, że trochę cukru pozostało
(prawie połowa tego, co było poprzednio) i że obecnie skręca on płaszczyznę polaryzacji,
lecz w stronę przeciwną] Wydaje się to bardzo tajemnicze, lecz jest łatwe do wyjaśnienia.
Weźmy inny przykład. Jedną z substancji wspólnych wszystkim istotom żywym i
odgrywających zasadniczą rolę w procesach życiowych są białka. Składają się one z łańcuchów
aminokwasów. Model takiego aminokwasu pokazuje fot. 52.1. Aminokwas ten nosi
nazwę alaniny i jego cząsteczka jest zbudowana tak jak przedstawia to fot. 52. la, jeżeli
cząsteczka ta jest wydzielona z białka materii żywej. Gdybyśmy natomiast spróbowali
wyprodukować alaninę z dwutlenku węgla, etanu i amoniaku {można ją zbudować, nie jest
to skomplikowana cząsteczka), stwier-
c, , , , , . ..._,,- dzilibyśmy, że otrzymaliśmy w równej
52.1. a) L-alamna i b) D-alamna ' J J ,
ilości cząsteczki, których modele
przedstawia fot. 52.la i fot. 52.Ib! Pierwszą
cząsteczkę, tę, którą wydzielono z
materii żywej, nazywamy L-alaniną. Druga,
-^ która jest chemicznie taka sama, w tym
""* sensie, że ma takie same i tak samo
połączone atomy, jest cząsteczką „pra"
wą" w porównaniu z „lewą" L-alaniną
i nazywamy ją D-alaniną. Gdy
produkujemy alaninę w laboratorium uży-
52-4. ODBICIA ZWIERCIADLANE
391
wając prostych gazów, otrzymujemy mieszankę obu cząsteczek występujących w równych
ilościach. Jednakże istoty żywe spożytkowują jedynie L-alaninę. (Nie jest to całkiem
zgodne z prawdą. Gdzieniegdzie istoty żywe robią specjalny użytek z D-alaniny,
jest to jednak bardzo rzadkie. Wszystkie białka wykorzystują wyłącznie L-alaninę.) Jeżeli
więc wyprodukujemy oba rodzaje cząsteczek i tą mieszanką nakarmimy jakieś zwierzę,
które lubi „jeść" lub jakoś wykorzystywać alaninę, nie będzie mogło ono użyć D-alaniny,
użyje więc wyłącznie L-alaninę. To właśnie stało się z naszym cukrem — gdy bakterie
spożyły cukier, który im odpowiadał, pozostał tylko cukier „nieodpowiedni" („lewy"
cukier jest słodki, ale inaczej niż „prawy")!
Wygląda więc na to, jak gdyby zjawiska życiowe pozwalały na rozróżnienie między
„prawym" a-„lewym" lub jak gdyby chemia pozwalała na to rozróżnienie, gdyż obie
cząsteczki są pod względem chemicznym różne. Tak jednak nie jest! Wszelkie pomiary
fizyczne, które można wykonać, np. pomiar energii, szybkości reakcji chemicznych itd.,
dają takie same wyniki dla obu cząsteczek, jeżeli tylko wszystko inne jest również odbiciem
zwierciadlanym. Jedna cząsteczka będzie obracać światło w prawo, a druga będzie obracać
je w lewo, przy czym odchylenie będzie dokładnie takie samo. Jeśli więc chodzi o fizykę, oba
aminokwasy są równoprawne. Tak jak rozumiemy te sprawy obecnie, podstawy równania
Schródingera zapewniają, że obie cząsteczki będą się zachowywać w ściśle odpowiedni
sposób i jedna będzie „prawa", a druga „lewa". Niemniej jednak w zjawiskach życiowych
tylko jedna z nich występuje!
Przyjmuje się, że przyczyna tego jest następująca. Przypuśćmy, że w jakiś
sposób życie znalazło się w pewnej chwili w takim stanie, że wszystkie białka
pewnych istot żywych mają „lewe" aminokwasy, podobnie „lewe" są enzymy, jak
i każda inna ich substancja. Gdy więc enzymy trawienne starają się zmienić substancje
chemiczne na pożywienie, niektóre z tych substancji „pasują" do enzymów, a inne nie
(jak w bajce o Kopciuszku i pantofelku, z tym że to, co obecnie sprawdzamy, jest „stopą
lewą"). O ile nam wiadomo, możemy w zasadzie zbudować żabę, w której każda cząsteczka
jest „odwrócona": wygląda wszystko jak w „lewym", zwierciadlanym obrazie prawdziwej
żaby; mamy więc „lewą" żabę. Ta „lewa" żaba przez jakiś czas będzie się miała zupełnie
dobrze, następnie jednak nie znajdzie niczego do jedzenia, jej enzymy bowiem są tak
zbudowane, że gdy połknie muchę, nie będzie mogła jej strawić. Mucha ma dla niej
nieodpowiedni „rodzaj" aminokwasów (chyba, że damy żabie „lewą" muchę). O ile nam
wiadomo, procesy chemiczne i życiowe przebiegałyby w ten sam sposób, gdyby wszystko
zostało odwrócone.
Jeżeli życie jest zjawiskiem całkowicie fizycznym i chemicznym, to możemy
zrozumieć, że wszystkie białka są zbudowane tylko w jeden sposób, przyjmując jedynie, że
na samym początku powstało przypadkowo trochę żywych cząsteczek i kilka z nich nie
uległo zniszczeniu. Gdzieś, kiedyś jakaś cząsteczka organiczna była skręcona w pewien
sposób i począwszy od tego momentu kierunek „prawy" zaczął się rozwijać w naszym
zakątku Wszechświata. Szczególny przypadek historyczny, o którym mowa, nie miał
charakteru symetrycznego i od tego czasu ta jednostronność wciąż się odtwarzała i
rozszerzała. Doszedłszy do obecnego stanu nie może już oczywiście ulec zmianie wszystkie
enzymy trawią tylko pewne substancje i wytwarzaj;} jedynie pewne: gdy dwutlenek węgla.
392
52. SYMETRIA PRAW FIZYKI
para wodna itd. dostają się do liści roślin, enzymy, które wytwarzają cukier,
wyprodukują go skręcony w jedną stronę, ponieważ same są skręcone. Jeżeli pojawiłby się jakiś
nowy rodzaj wirusa czy czegoś żywego, przetrwałby, jeżeli mógłby „spożywać" już
istniejącą żywą materię. Musiałby więc być taki sam jak ona.
Liczba „prawych" cząsteczek nie musi być zachowana, możemy ją stale zwiększać.
Wnioskujemy więc, że zjawiska życiowe nie wskazują na brak symetrii praw fizycznych,
wskazują natomiast na wspólnotę i jednakowy początek, w sensie opisanym powyżej,
wszystkich istot żywych na Ziemi.
52-5. Wektory i pseudowektory
Idziemy obecnie dalej. W fizyce spotykamy się często z regułami „prawej" lub „lewej"
ręki. Gdy na przykład zajmowaliśmy się analizą wektorową, trzeba było uwzględnić
pojęcie prawoskrętności, aby otrzymać właściwy kierunek momentu pędu, momentu siły,
pola magnetycznego itd. Siła działająca na poruszający się w polu magnetycznym ładunek
równa się np. F=q\xB. Czy jednak w określonej sytuacji, w której znamy wielkości F,
v i B już samo to równanie nie wystarcza do zdefiniowania prawoskrętności? Gdy cofniemy
się trochę i spojrzymy, skąd się brały nasze wektory, zobaczymy, że „reguła prawej ręki"
była po prostu konwencją; był to jedynie pewien chwyt. Wielkości w rodzaju momentu
pędu czy prędkości kątowej nie były wcale wektorami! Wszystkie one są w jakiś sposób
związane z pewną płaszczyzną i tylko dlatego, że przestrzeń ma trzy wymiary, możemy
je powiązać z kierunkiem prostopadłym do tej płaszczyzny. Z dwu możliwych kierunków
wybieramy kierunek prawy.
Jeśli więc prawa fizyki są symetryczne, powinniśmy stwierdzić, że gdyby jakiś demon
zakradł się do wszystkich fizycznych laboratoriów i zastąpił słowo „prawy" przez „lewy"
we wszystkich książkach, w których dane są „reguły prawej ręki", i musielibyśmy używać
„reguł lewej ręki", nie spowodowałoby to jakiejkolwiek różnicy w prawach fizycznych.
Dostarczmy jakiejś ilustracji. Mamy dwa rodzaje wektorów. Pierwsze z nich to
„uczciwe" wektory, np. przesunięcie Ar w przestrzeni. Jeśli w naszym urządzeniu mamy jakiś
element tu, a coś innego tam, to w urządzeniu zwierciadlanym będziemy mieli obraz
tego elementu i obraz czegoś innego i jeżeli narysujemy wektor od „elementu" do czegoś
52.2. Wektor położenia i jego odbicie zwierciadlane
52-5. WEKTORY 1 PSEUDOWEKTORY
393
U)
Al
m
52.3. Obracające się koło i jego odbicie zwierciadlane. Jak widzimy, „wektor" prędkości kątowej nie
zmienia swego kierunku
innego, jeden wektor będzie odbiciem zwierciadlanym drugiego (rys. 52.2). Strzałka
wektorowa zmienia swój kierunek, podobnie odwraca się cała przestrzeń; takie wektory
nazywamy wektorami biegunowymi.
Jednak drugi rodzaj wektorów, które są związane z obrotami, ma inny charakter.
Przypuśćmy na przykład, że w przestrzeni trójwymiarowej obraca się jakieś ciało, jak to
widzimy na rys. 52.3. Jeśli teraz spojrzymy na to w zwierciadle, obrót będzie wyglądał
tak jak to pokazano, mianowicie jak odbicie zwierciadlane pierwszego obrotu.
Ponieważ zgodziliśmy się opisywać obrót zwierciadlany przy pomocy tych samych praw, mamy
„wektor", który przy odbiciu się nie zmienia, lecz jest odwrócony względem wektorów
biegunowych i względem osi współrzędnych. Taki wektor nazywamy pseudowektorem
lub wektorem osiowym.
Jeśli więc prawo symetrii względem odbicia jest w fizyce słuszne, to wszelkie równania
muszą mieć taki charakter, że gdy zmienimy znak każdego wektora osiowego i każdego
iloczynu wektorowego dwu wektorów biegunowych — to właśnie odpowiada odbiciu
— nic się nie stanie. Gdy na przykład piszemy wzór mówiący, że moment pędu równa
się L = rxp, równanie to jest w porządku, ponieważ gdy przejdziemy do układu lewo-
skrętnego, musimy zmienić znak L, lecz r i p pozostaną takie same; znak iloczynu
wektorowego zostaje zmieniony, ponieważ musimy przejść od reguł prawoskrętnych do lewo-
skrętnych. Weźmy inny przykład. Wiemy, że siła działająca na ładunek poruszający się
w polu magnetycznym równa się F=cvxB. Jeśli przejdziemy z układu prawoskrętnego
do lewoskrętnego, to ponieważ v i F są wektorami biegunowymi, zmiana znaku iloczynu
wektorowego musi być skompensowana przez zmianę znaku B, co oznacza, że B musi
być pseudowektorem. Innymi słowy, jeśli dokonamy takiego odbicia, B musi przejść
w — B. Jeśli więc zmienimy skrętność naszego układu współrzędnych, musimy również
zmienić bieguny magnesu.
Zobaczmy na przykładzie, dlaczego tak się dzieje. Przypuśćmy, że mamy dwa
magnesy, jak to pokazano na rys. 52.4. W pierwszym magnesie cewka jest nawinięta w
pewien sposób i prąd biegnie w określonym kierunku. Drugi magnes wygląda jak odbicie
pierwszego w zwierciadle — cewka jest nawinięta w odwrotnym kierunku, wszystko co
w niej zachodzi jest dokładnie odwrócone, a prąd biegnie tak, jak to pokazano na
rysunku. Z praw dotyczących powstawania pola magnetycznego, których jeszcze oficjalnie
nie znamy, ale których z pewnością uczyliście się w szkole średniej, wynika więc, że pole
394
52. SYMETRIA PRAW FIZYKI
__
<
<
<
■ )
■ )
* )
s
< -
)
< )
N
B'
a'
52.4. Magnes i jego odbicie zwierciadlane
magnetyczne jest takie, jak to pokazano. W jednym przypadku biegun jest biegunem
południowym, w drugim natomiast prąd biegnie w przeciwnym kierunku i kierunek pola
magnetycznego jest odwrócony — mamy biegun północny. Widzimy więc, że przy
przejściu od prawego do lewego musimy rzeczywiście zmienić północ na południe!
Nie przejmujemy się jednak zmianą północy na południe; to przecież tylko konwencja.
Mówmy o zjawiskach. Przypuśćmy na przykład, że w pierwszym polu mamy elektron
wchodzący pod kątem prostym w stronicę książki. Jeżeli użyjemy wzoru na siłę, v x B
(pamiętajmy, że ładunek jest ujemny), stwierdzimy, że zgodnie z prawami fizycznymi
elektron będzie zbaczał w zaznaczonym kierunku. Zjawisko polega więc na tym, że w
pobliżu cewki z płynącym w określonym kierunku prądem elektron biegnie w pewien
sposób — to jest fizyka, niezależnie od tego, jakich nazw użyjemy.
Zróbmy teraz takie samo doświadczenie w zwierciadle: wysyłamy elektron w tym
samym kierunku i jeśli użyjemy teraz tych samych praw, siła będzie odwrócona, ale to
właśnie bardzo dobrze, ponieważ wówczas jeden ruch jest odbiciem zwierciadlanym dru-
giego\
52-6. Która ręka jest prawa?
Okazuje się więc, że przy badaniu dowolnego zjawiska mamy zawsze do czynienia
z dwiema regułami prawej ręki lub z ich parzystą liczbą. Ostateczny wynik jest więc taki,
że zjawisko zawsze przebiega symetrycznie. Krótko mówiąc, nie możemy odróżnić
prawego od lewego, jeżeli nie umiemy odróżnić północy od południa. Mogłoby się jednak
wydawać, że umiemy rozpoznać północny biegun magnesu. I tak na przykład, północny
biegun igły kompasowej to ten, który skierowany jest na północ. Lecz oczywiście jest to
znów własność lokalna związana z geografią Ziemi; jest to coś podobnego do mówienia,
w jakim kierunku jest Chicago, tak że to się nie liczy. Jeżeli przyglądaliśmy się igłom
kompasowym, mogliśmy zauważyć, że biegun wskazujący północ ma pewien niebieski
52-6. KTÓRA RĘKA JEST PRAWA?
395
odcień. Lecz jest tak po prostu dlatego, że ktoś go tak pomalował. Wszystko to są
lokalne, konwencjonalne kryteria.
Gdyby jednak magnes miał takie własności, że po uważnym przyjrzeniu się
moglibyśmy dostrzec na przykład wyrastające z bieguna północnego maleńkie wąsiki, których
nie byłoby na biegunie południowym, i byłoby to zawsze słuszne, lub gdyby istniał jakiś
inny jednoznaczny sposób odróżnienia bieguna północnego magnesu od bieguna
południowego, wówczas moglibyśmy powiedzieć, z którym z dwu przypadków mamy do
czynienia i byłby to koniec prawa głoszącego symetrię względem odbicia.
Aby zilustrować cały problem jeszcze jaśniej, wyobraźmy sobie, że rozmawiamy przez
telefon z Marsjaninem lub z kimś innym bardzo od nas oddalonym. Nie wolno nam
posłać mu jakiejkolwiek próbki do zbadania. Gdybyśmy na przykład mogli przesłać
światło, moglibyśmy wybrać światło spolaryzowane w kierunku prawym i powiedzieć:
„To jest światło spolaryzowane w kierunku prawym — wystarczy, jeśli mu się dobrze
przyjrzysz". Jednak nie możemy mu niczego przekazać, możemy z nim jedynie rozmawiać.
Znajduje się on poza tym bardzo daleko lub w jakimś dziwnym miejscu i nie jest w stanie
zobaczyć niczego, co my widzimy. Nie możemy na przykład powiedzieć: „Spójrz na
Wielką Niedźwiedzicę i przyjrzyj się jak poszczególne gwiazdy są ustawione. Przez
kierunek „prawy" rozumiemy..." Wolno nam tylko do niego telefonować.
Przypuśćmy, że chcemy naszemu rozmówcy opowiedzieć o nas jak najwięcej.
Oczywiście zaczynamy od zdefiniowania liczb i mówimy: „Tik, tik — dwa, tik, tik, tik — trzy...",
tak że stopniowo zaczyna on rozumieć wiele słów. Po jakimś czasie możemy się z nim
nieźle zaznajomić i prawdopodobnie spyta nas: „Jak też wyglądacie chłopcy"?
Zaczynamy więc opis i mówimy: „No cóż, mamy 1 metr 80 wzrostu" Na to on: „Chwileczkę,
co to jest 1 metr 80"? Czy można mu to wyjaśnić? Oczywiście! Mówimy: „Znasz średnicę
atomu wodoru - mamy 17 000 000 000 atomów wodoru wzrostu!". Jest to możliwe,
ponieważ prawa fizyczne nie są niezmiennicze względem zmiany skali, a zatem możemy
zdefiniować absolutną długość. Określamy więc rozmiary naszego ciała i opisujemy jegc
ogólny kształt: ma ono długie wyrostki, na których końcach znajduje się 5 guzów itd
Kończymy wreszcie nasz opis zewnętrzny, prawdopodobnie bez natrafienia na jakie:
szczególne trudności. Nasz rozmówca w miarę naszego opisu sporządza sobie nawel
odpowiedni modeł i mówi: „No, no, przystojni z was chłopcy; powiedzcie teraz co tei
macie w środku"? Zaczynamy więc opisywać nasze różne organa wewnętrzne, docho
dzimy do serca, starannie opisujemy jego kształt i mówimy: „Umieść serce z lewej strony"
Na to on: „Hm, z lewej strony"? Nasz problem polega więc obecnie na wyjaśnieniu mi
gdzie ma umieścić serce; wiemy przy tym, że nie może on zobaczyć czegokolwiek, co rrrj
widzimy, i -nie możemy mu posłać jakiejkolwiek próbki czegoś, co uważamy za „prawe'
— żadnego standardowego prawego obiektu. Czy można to zrobić?
52-7. Parzystość nie jest zachowana!
Okazuje się, że prawa grawitacji, prawa elektryczności i magnetyzmu, jak równie;
prawa sił jądrowych spełniają bez wyjątku zasadę symetrii względem odbicia, praw tyci
396
52 SYMETRIA PRAW FIZYKI
52.5. Schematyczny rysunek pokazujący rozpady cząstek z* i 6*
więc, ani jakiegokolwiek wniosku z nich uzyskanego nie można użyć. Lecz z wieloma
cząstkami, na które natrafiamy w przyrodzie, wiążą się zjawiska zwane rozpadem beta
i rozpadami słabymi. Jeden z słabych rozpadów, związany z cząstką odkrytą około roku
1954, stanowił dużą zagadkę..Istniała pewna naładowana cząstka, która rozpadała się
na trzy mezony n, jak to pokazano schematycznie na rys. 52.5. Cząstka ta została nazwana
wówczas mezonem t. Na rysunku 52.5 widzimy jednak również i inną cząstkę, która
rozpada się na dwa mezony; jeden z nich musi być neutralny na podstawie zasady
zachowania ładunku. Ta cząstka została nazwana mezonem 6. Mamy więc cząstkę t, która
rozpada się na trzy mezony n, oraz cząstkę 6 rozpadającą się na dwa mezony 71. Dość
szybko przekonano się, że cząstki t i 0 mają niemal jednakową masę; z dokładnością
do błędów doświadczalnych obie masy są równe. Z kolei stwierdzono, że czas, jaki
zajmowało im rozpadniecie się na trzy mezony n i dwa mezony n był niemal dokładnie taki sam;
żyją one równie długo. Wreszcie, zawsze gdy cząstki te były produkowane, stwierdzano
taki sam ich stosunek, powiedzmy 14% cząstek z wobec 86% cząstek 6.
Każdy przy zdrowych zmysłach uświadamia sobie natychmiast, że muszą to być te
same cząstki, że po prostu produkujemy obiekt mogący się rozpadać na dwa sposoby,
a nie dwie różne cząstki. Obiekt ten ma zatem jeden czas życia, a stosunek, w jakim
zachodzi produkcja, jest zawsze taki sam (ponieważ jest to stosunek prawdopodobieństw
obu rodzajów rozpadu).
Można było jednakże udowodnić (i nie możemy w ogóle tu wyjaśnić, w jaki sposób)
wychodząc z zasady symetrii względem odbicia w mechanice kwantowej, że ta sama
cząstka nie może się rozpadać na oba podane sposoby. Zasada zachowania,
odpowiadająca zasadzie symetrii względem odbicia, jest czymś nie mającym klasycznego
odpowiednika, nazwano więc tę kwantowomechaniczną zasadę zachowania zasadą zachowania
parzystości. Z zachowania parzystości lub dokładniej — z symetrii względem odbić
równań kwantowomechanicznych opisujących słabe rozpady wynikało, że ta sama cząstka
nie może się rozpadać na oba sposoby, musimy więc mieć do czynienia z pewną
przypadkową zgodnością mas, czasów życia itd. Lecz im bardziej się tym zajmowano, tym bardziej
zdumiewająca była ta zgodność i stopniowo narastało podejrzenie, że prawdopodobnie
prawo symetrii przyrody względem odbicia jest fakzywe.
Biorąc za punkt wyjścia widoczne w tym przypadku załamanie tego prawa, fizycy Lee
i Yang zaproponowali, aby przeprowadzić dalsze doświadczenia z podobnymi rozpadami
i spróbować stwierdzić, czy prawo to jest słuszne w innych przypadkach. Pierwsze z tych
52-7 PARZYSTOŚĆ NIE JEST ZACHOWANA!
397
doświadczeń przeprowadziła pani Wu z Uniwersytetu Columbia. Zostało ono wykonane
w następujący sposób. Gdy użyjemy bardzo silnego magnesu w bardzo niskiej
temperaturze, okaże się, że pewien izotop kobaltu, który rozpada się emitując elektron, jest
magnetyczny i jeżeli temperatura jest wystarczająco niska, aby drgania termiczne nie mogły
za bardzo wstrząsać atomowymi magnesami, ułożą się one wszystkie wzdłuż pola
magnetycznego. Wszystkie atomy kobaltu ustawiają się więc w tym silnym polu w jednym
kierunku. Następnie rozpadają się emitując elektron. Jak stwierdzono, gdy atomy były
ustawione w polu, którego wektor B wskazywał ku górze, większość elektronów była
emitowana ku dołowi.
Jeśli ktoś nie jest wprowadzony w tajniki otaczającego go świata, tego rodzaju
spostrzeżenie nie brzmi dla niego jak coś ważnego; dla kogoś jednak, kto rozumie problemy
i interesujące sprawy przyrody, jest to najbardziej dramatyczne odkrycie: Gdy umieścimy
atomy kobaltu w niezwykle silnym polu magnetycznym, więcej elektronów rozpadu
biegnie w dół niż w górę. Gdybyśmy zatem przeprowadzili odpowiednie doświadczenie
„w zwierciadle", gdzie atomy kobaltu byłyby ustawione w przeciwnym kierunku,
wyrzucałyby swoje elektrony do góry, a nie w dół; proces byłby niesymetryczny. Magnesowi
urosły wąsy] Południowy biegun magnesu ma taki charakter, że elektrony w rozpadzie
P starają się go unikać: odróżnia to w sposób fizyczny biegun północny od
południowego.
Przeprowadzono następnie wiele innych doświadczeń, zbadano rozpad mezonu n
na n i v, mezonu // na elektron i dwa neutrina, obecnie, A na proton i mezon n\ rozpad L
i wiele innych rozpadów. 1 rzeczywiście, niemal we wszystkich przypadkach, w których
można było tego oczekiwać, stwierdzono niezachodzenie symetrii względem odbicia!
Prawo symetrii względem odbicia na tym szczeblu fizyki nie jest więc słuszne.
Krótko mówiąc, możemy wyjaśnić naszemu Marsjaninowi, gdzie ma umieścić serce.
Mówimy: „Posłuchaj, zbuduj sobie magnes, nawiń drut i puść w nim prąd, następnie
weź kobalt i obniż temperaturę. Przygotuj doświadczenie w ten sposób, aby elektrony
biegły od stóp do głowy; wówczas kierunek, w jakim biegnie prąd przez cewkę, to
kierunek, który nazywamy z prawa na lewo". Wykonując więc eksperyment tego rodzaju
można zdefiniować stronę prawą i lewą.
Przewidziano również inne zjawiska. Okazuje się, na przykład, że spin czyli moment
pędu jądra kobaltu wynosi przed rozpadem 5 jednostek h, a po rozpadzie 4 takie
jednostki. Elektron ma spinowy moment pędu i występuje również neutrino. Łatwo stąd
dostrzec, że spinowy moment pędu elektronu musi być ustawiony wzdłuż jego kierunku
ruchu, podobnie dla neutrina. Wygląda więc jak gdyby elektron wirował w lewo i to
również zostało sprawdzone. Faktycznie, właśnie tu w Kalifornijskim Instytucie
Techniki Boehm i Wapstra sprawdzili, że elektrony wirują głównie w lewo. (Pewne inne
doświadczenia dały odpowiedź przeciwną, ale były one błędne!)
Następny problem polegał oczywiście na znalezieniu prawa opisującego fakt łamania
parzystości. Jak brzmi prawo określające siłę tego łamania? Brzmi ono następująco:
łamanie zachodzi jedynie w tych bardzo powolnych reakcjach, które nazywamy słabymi
rozpadami, a gdy zachodzi, cząstki rozpadu, które mają spin, takie jak elektron, neutrino
itd. starają się wirować w lewo. Nie jest to reguła symetryczna; wiąże ona wektor pręd-
398
52. SYMETRIA PRAW FIZYKI
kości z pseudowektorem momentu pędu i mówi, że jest bardziej prawdopodobne, iż
moment pędu będzie skierowany przeciwnie do prędkości niż zgodnie z nią.
Tak brzmi to prawo, lecz dziś nie rozumiemy jeszcze wszystkich „dlaczego" i „skąd",
które się z nim wiążą. Dlaczego prawo to brzmi właśnie tak? Jaka kryje się za nim
podstawowa przyczyna? Jak wiąże się ono z innymi sprawami? Chwilowo jesteśmy tak
oszołomieni samym faktem niesymetryczności, że nie otrząsnęliśmy się jeszcze dostatecznie,
aby móc zrozumieć, co ono oznacza w stosunku do innych praw. Jednakże sam problem
jest interesujący, aktualny i wciąż nie rozwiązany, wydaje się więc słuszne rozważenie
kilku związanych z nim zagadnień.
52-8. Antymateria
Gdy któraś z symetrii zostaje złamana, pierwsza rzecz, jaką należy zrobić, to przebiec
jeszcze raz listę znanych lub zakładanych symetrii i sprawdzić, czy tak samo nie dzieje
się z' którąś z nich. Nie wspominaliśmy dotychczas o jednej z występujących na naszej
liście operacji, która z konieczności musi być zakwestionowana — o przejściu od materii
do antymaterii. Jak przewidział Dirac, obok elektronów musi występować jeszcze inna
cząstka, zwana pozytronem (odkrył ją w Kalifornijskim Instytucie Techniki Anderson),
związana ściśle z elektronem. Wszystkie własności tych dwóch cząstek są wzajemnie
powiązane: energie są jednakowe; masy są jednakowe; ładunki są przeciwne. Lecz co
najważniejsze, gdy obie się spotkają, anihilują, uwalniając w postaci energii, powiedzmy
kwantów y, całą swą masę. Pozytron nazywamy antycząst^ą elektronu i powyżej podaliśmy
właśnie własności cząstki i jej antycząstki. Z argumentu Diraca było widoczne, że również
wszystkie inne spotykane cząstki powinny mieć swoje antycząstki. Tak na przykład obok
protonu powinien istnieć antyproton, który obecnie oznacza się przez p. p będzie miało
ujemny ładunek elektryczny, taką samą masę jak proton itd. Najważniejszą jednak cechą jest
to, że gdy proton i antyproton zetkną się, nastąpi ich anihilacja. Podkreślamy to dlatego,
że ludzie zwykle nie rozumieją, że istnieje zarówno neutron, jak i antyneutron, i mówią:
„Przecież neutron jest nienaładowany, jak więc możliwy jest ładunek przeciwny"? Przepis
tworzenia antycząstek nakazuje odwrócić nie tylko ładunek, lecz również wiele innych
własności. Antyneutron można odróżnić od neutronu w następujący sposób: jeżeli
złączymy dwa neutrony, będą one dalej istnieć jako neutrony, jeśli jednak zetkniemy neutron
i antyneutron, nastąpi ich anihilacja i wyzwolenie ogromnej ilości energii, z pojawieniem
się mezonów n, kwantów y, itd., itd.
Jeżeli więc mamy antyneutrony, antyprotony i antyelektrony, możemy w zasadzie
utworzyć antyatomy. Nie zostały one jeszcze zbudowane, lecz w zasadzie jest to możliwe.
Tak na przykład atom wodoru ma w środku proton i elektron, który go obiega.
Wyobraźmy więc sobie, że teraz mamy antyproton i obiegający go pozytron; czy jest to możliwe?
Antyproton jest elektrycznie ujemny, antyelektron elektrycznie dodatni, przyciągają się
więc tak samo — masy są takie same, wszystko jest takie same. Jest to jedna z zasad
symetrii fizyki. Równania wydają się wskazywać, że jeżeli na przykład zbudujemy zegar
z materii a nastecnie taki sam zeear z antymaterii, oba będą chodziły tak samo. (Oczy-
.'2-8. ANTYMATERIA
399
wiście, jeżeli zetkniemy ze sobą oba te zegary, to nastąpi ich anihilacja, ale to już jest inna
sprawa.)
Nasuwa się natychmiast pewien problem. Z materii możemy zbudować dwa zegary:
jeden — „lewy", drugi - „prawy". Możemy na przykład zbudować zegar, który nie
ma prostej konstrukcji, lecz zawiera kobalt, magnesy, detektory elektronów, które
wykrywają obecność elektronów z rozpadu fi i liczą je. Za każdym razem, gdy elektron
zostanie zarejestrowany, wskazówka sekundowa będzie się przesuwać. Zegar
zwierciadlany rejestrujący mniej elektronów będzie więc chodził wolniej. Możemy więc zbudować
dwa zegary, z których lewy nie jest zgodny z prawym. Zbudujemy więc z materii zegar,
który będziemy nazywać zegarem standardowym lub zegarem prawym. Zbudujemy też,
również z materii, zegar, który będziemy nazywać zegarem lewym. Stwierdziliśmy
właśnie, że ogólnie biorąc oba te zegary nie będą chodzić tak samo; przed odkryciem
niezachowania parzystości uważano, że będą. Poprzednio zakładano jednak również, że materia
i antymateria są równoważne, czyli jeśli zbudujemy z antymaterii zegar prawy, będzie
chodził tak samo jak zegar prawy z materii, a jeśli zbudujemy zegar lewy, też będzie
chodził tak samo. Innymi słowy, początkowo uważano, że te wszystkie cztery zegary są takie
same. Obecnie oczywiście wiemy, że materia prawa i materia lewa nie są takie same.
Prawdopodobnie więc antymateria prawa i antymateria lewa też nie będą takie same.
Nasuwa się więc oczywiste pytanie: co pasuje do czego, jeśli w ogóle coś pasuje?
Innymi słowy, czy materia prawa zachowuje się tak samo jak antymateria prawa, czy też
prawa materia zachowuje się tak samo jak antymateria lewa? Doświadczenia nad
rozpadami /?. w których zamiast elektronów mamy pozytrony, wskazują, że prawdziwe jest
drugie powiązanie: materia „w prawo" działa tak samo jak antymateria „w lewo"
A zatem ostatecznie symetria między „prawym" a „lewym" jest dalej zachowana!
Jeżeli zbudujemy zegar lewy, lecz zrobimy go z innego rodzaju materii, z antymaterii
zamiast materii, będzie chodził tak samo. Zamiast dwóch niezależnych zasad na naszej
liście symetrii mamy obecnie jedną nową, którą otrzymaliśmy z połączenia poprzednich
i która głosi, że materia prawa i antymateria lewa są symetryczne.
Jeśli więc Marsjanin, z którym rozmawiamy przez telefon, jest zbudowany z
antymaterii i na podstawie otrzymanych instrukcji zbuduje nasz model, wszystko w nim
będzie umieszczone odwrotnie. Co się stanie, jeżeli po długich konwersacjach, w których
trakcie nauczyliśmy się nawzajem budować pojazdy kosmiczne, spotykamy się w połowie
drogi w przestrzeni? Przekazaliśmy sobie nawzajem nasze tradycje itd. i obaj wybiegamy
naprzeciw, aby uścisnąć sobie dłonie. No cóż, jeśli wyciągnie lewą rękę, miejmy się na
baczności!
52-9. Naruszone symetrie
Oto następny problem, nad którym się zastanowimy: co można odczytać z praw, które
są niemal symetryczne? To zdumiewająca rzecz, że dla tak szerokiego zakresu ważnych
„silnych" zjawisk, jak siły jądrowe i zjawiska elektryczne, a nawet dla „słabych" zjawisk
w rodzaju grawitacji — dla niemal całej fizyki prawa wyglądają na symetryczne. A mimo
to ten mały dodatkowy człon związany ze słabymi rozpadami powiada, że „jednak tak
400
52. SYMETRIA PRAW EIZYK1
nie jest, prawa nie są symetryczne!". Dlaczego tak się dzieje, że przyroda może być
prawie symetryczna, ale nie symetryczna dokładnie? Czy można to zrozumieć? Przede
wszystkim, czy mamy i inne przykłady? Odpowiedź brzmi: tak. Istotnie, mamy kilka innych
przykładów. Oto jeden z nich. Części jądrowe sił między protonem a protonem,
neutronem a neutronem i protonem a neutronem są dokładnie takie same. Mamy pewną nową
symetrię dotyczącą sił jądrowych, polegającą na tym, że możemy wymieniać proton z
neutronem. Z pewnością nie jest to jednak ogólna symetria, gdyż odpychanie elektryczne,
które ma miejsce dla protonów, nie istnieje dla neutronów. Nie jest więc prawdą, że
możemy zawsze zastąpić proton neutronem, jest to jedynie słuszne w dobrym przybliżeniu
Dlaczego w dobrym? Ponieważ siły jądrowe są silniejsze niż elektryczne. Jest to więc
również „prawie" symetria. Mamy więc przykłady i gdzie indziej.
Umysł nasz ma tendencję do akceptowania symetrii jako swojego rodzaju
doskonałości. Już Grecy uważali koła za coś doskonałego i wydawało się czymś strasznym
uważać, że orbity planet nie są kołami, lecz prawie kołami. Różnica między kołem a prawie
kołem nie jest mała, dla umysłu jest to zasadnicza zmiana. Koło ma w sobie symetrię
i doskonałość, która znika, gdy tylko lekko je zniekształcimy. Oczywiście, nasuwa się
wówczas pytanie: dlaczego mamy tylko w przybliżeniu koło? To już znacznie trudniejszy
problem. Ruchy planet powinny się w ogólności odbywać po elipsach, lecz występowanie
najrozmaitszych sił zaburzających spowodowało, że ruchy te są niernal symetryczne.
Chodzi teraz o to, czy i my mamy do czynienia z podobnym problemem. Jeśli chodzi
o koła, to gdy mamy do czynienia z doskonałymi kołami, nie ma czego wyjaśniać. Ale
ponieważ są one jedynie w przybliżeniu kołami, pozostaje wiele do wyjaśnienia i jak się
okazuje, otrzymujemy skomplikowany problem dynamiczny, w którym patrząc na sił\
zaburzające trzeba wyjaśnić przybliżoną symetrię.
Nasz problem polega więc na wyjaśnieniu, skąd się bierze symetria. Dlaczego
przyroda jest niemal symetryczna? Tego nikt nie wie. Możemy jedynie zaproponować coś
takiego: W Japonii w miejscowości Neiko znajduje się brama nazywana niekiedy
najpiękniejszą bramą w całej Japonii. Została ona zbudowana w czasach dużych wpływów
sztuki chińskiej. Brama ta wykonana jest niezwykle kunsztownie, pełno tam
najrozmaitszych rzeźb, kolumn, głów smoków i książąt rytych na filarach itd. Jeżeli jednak
przyjrzeć się dokładnie kunsztownemu i skomplikowanemu rysunkowi na jednym z filarów,
można stwierdzić, że jeden element został wyryty „do góry nogami", poza tym wszystko
jest całkowicie symetryczne. Jeżeli spytać się, dlaczego tak się stało, słyszy się, że uczyniono
tak dlatego, aby bogowie nie byli zazdrośni o bezbłędność ludzką. Umieszczono celowo
błąd, aby bogowie kierowani zazdrością nie rozzłościli się na człowieka.
Myśl tę możemy odwrócić i uważać, że prawdziwe wyjaśnienie przybliżonej symetrii
przyrody jest następujące: bogowie uczynili prawa jedynie w przybliżeniu symetryczne,
abyśmy nie byli zazdrośni o ich doskonałość!
zadania**
Rozdział 26
26.1. Mężczyzna idzie po chodniku z prędkością 2 m/s, natomiast po „równomiernie
wyboistym" polu może iść z prędkością równą najwyżej 1,2 m/s. Wyrusza on z punktu
A oddalonego o 56 m od ściany (patrz rysunek) i idzie
do punktu B, leżącego przy ścianie, 48 m na południe
od chodnika.
a. Jaką trasę AKB powinien wybrać, aby dojść do
punktu B w najkrótszym czasie?
Uwaga. Można przyjąć, że do problemu tego slosuje się
„prawo załamania". Niemniej jednak, jeśli czytelnik ma dość
odwagi, może spróbować rozwiązać zadanie bez takiego
założenia!
b. Jaki jest ten najkrótszy czas?
c. Ile czasu zabiera przejście tras ACB i ACB,
jeżeli CK=4m = KC">
26.2. Źródło S wysyła wąską wiązkę światła
prostopadłą do ekranu oddalonego o 1,0 m. Promień pada
na ekran w punkcie P. Na drodze wiązki umieszczono
płytkę lucytową o grubości 0,20 m i o współczynniku
załamania 1,50. Przyjmując, że kąt padania wiązki na
powierzchnię płytki wynosi 30°, oblicz:
*» Autorem zadań oznaczonych przy numerze gwiazdką (*) jest Foster Strong.
A^
Pf>
26 Feynmana wykłady z fizyki
W2 ZADA NU
a) poprzeczne przesunięcie promienia, PP',
b) procentowy przyrost czasu potrzebnego na przebycie drogi SP' w porównaniu
z pierwotną drogą w powietrzu SP.
26.3. 5 jest punktowym źródłem światła, P — jego obrazem utworzonym przez
soczewkę. SC=CP= 1,00 m. Grubość soczewki mierzona przy jej krawędzi wynosi 3,0 mm.
Wiedząc, że droga optyczna promienia SCP jest taka sama jak promieni SAP i SBP,
oblicz, jaka jest grubość soczewki w pobliżu punktu C? (Przyjmij, że współczynnik
załamania szkła jest równy 1,60.)
26.4. Gdy stoimy przed zwierciadłem płaskim, wydaje się nam, że zamienia ono
prawą stronę na lewą i odwrotnie, tzn. obraz naszej prawej ręki wygląda jak lewa ręka
„osoby" w lustrze. Dlaczego zwierciadło nie zamienia również góry na dół? Jaka jest
naprawdę rola zwierciadła?
26.5. Dwa zwierciadła płaskie przecinają się w ten sposób, że kąt utworzony przez
nie jest kątem prostym. Linia przecięcia zwierciadeł jest pionowa. Wyjaśnij, dlaczego
w takim lustrze „widzimy siebie tak, jak nas widzą inni"?
26.6. Trzy wzajemnie prostopadłe zwierciadła przecinają się tworząc narożnik o
prostych kątach wewnętrznych. Promień świetlny pada na jedno ze zwierciadeł, a po odbiciu
na drugie lub kolejno na oba pozostałe zwierciadła. Pokaż, że po wszystkich odbiciach
promień jest jedynie przesunięty i biegnie w kierunku dokładnie przeciwnym do kierunku
pierwotnego (zakładamy, że rozmiary zwierciadeł są bardzo duże). Czy znane jest
praktyczne zastosowanie takiego układu zwierciadeł?
26.7. Wiadomo, że przy przechodzeniu światła z jednego przezroczystego ośrodka
do innego światło częściowo się załamuje, częściowo ulega odbiciu, a bardzo mała jego
część zostaje pochłonięta lub rozproszona. Co się dzieje, gdy wiązka światła biegnąca
pierwotnie w ośrodku optycznie gęstszym, pod dużym kątem względem normalnej do
powierzchni, pada na powierzchnię oddzielającą dwa ośrodki?
Rozdział 27
27.1. Biegnąca w powietrzu równoległa wiązka
światła zostaje skupiona w jednym punkcie
(ognisku) przez pojedynczą powierzchnię załamującą,
oddzielającą obszar o współczynniku załamania n. Jaki
jest kształt tej powierzchni?
powietrze / ~- ^' szkło
ZADANIA DO ROZDZIAŁU 27
403
27.2. Zbieżna wiązka światła skupia się w
punkcie P. W punkcie Q leżącym na osi wiązki chcemy
umieścić zwierciadło, które skupiałoby promienie
tej wiązki w innym punkcie P'. Znajdź kształt
powierzchni tego zwierciadła, wiedząc, że QP' = D,
a QP = d.
27.3. Zewnętrzna średnica szklanej rurki kapilarnej wynosi D, a jej współczynnik
załamania jest równy n. Jeżeli patrzymy na kapilarę z boku wydaje się nam, że jej
wewnętrzna średnica ma długość d. Jaka jest prawdziwa długość tej średnicy?
27.4. Soczewka o ogniskowej F daje obraz rzeczywisty odległego przedmiotu. Obraz
ten jest następnie oglądany przez szkło powiększające o ogniskowej /. Znajdź kątowe
powiększenie układu, gdy oko patrzącego jest nastawione na nieskończoność.
27.5. Akomodacja przeciętnego oka ludzkiego pozwala na ostre oglądanie
przedmiotów leżących w odległości między 25 cm i nieskończonością od oka. Bezpośrednio
przed okiem zostało umieszczone cienkie szkło powiększające o ogniskowej /= + 5 cm.
a. W jakim przedziale odległości należy teraz umieszczać przedmiot, aby można go
było widzieć ostro?
b. Określ powiększenie kątowe dla obu położeń granicznych w tym przedziale.
27.6. Układ optyczny teleobiektywu składa się z soczewki skupiającej o ogniskowej
/i = +30cm oraz soczewki rozpraszającej o ogniskowej f2= —lOcm. Odległość po-
K 27,5^. płyta
cm^ fotograficzna
ł i£« iJL _!_*.?_]
J przedmiot \YJ J\ \
między tymi soczewkami wynosi 27,5 cm. Gdzie powinna być umieszczona płyta
fotograficzna, aby można było sfotografować przedmiot leżący w odległości 10 m przed
pierwszą soczewką? Wykonaj staranny rysunek biegu promieni.
27.7. Ogniskowa 5-metrowego teleskopu Hale'a jest równa 163 m. Jaka będzie
odległość między płaszczyznami ogniskowania światła pochodzącego z odległej gwiazdy
oraz
a) Księżyca,
b) sztucznego satelity ziemskiego odległego od punktu obserwacji o 320 km?
27.8. Dwie cienkie soczewki S i 5" o ogniskowych fi f są ustawione w odległości
D od siebie. Znajdź ogniskową całego układu oraz odległości płaszczyzn głównych,
A i A', od odpowiednich soczewek S i S'.
404
ZADANIA
Rozdział 28 i 29
28.1. Podaj interpretację geometryczną dwóch wielkości opisanych podanymi
liczbami zespolonymi, a następnie oblicz wartości bezwzględne A w obydwu przypadkach:
a) A = reie'1 + re-""2,
b)A=£reM
n = 0
29.1. Drgania w dwu równoległych antenach umieszczonych w odległości A/2 od
siebie (rys. 29.5a) odbywają się w zgodnych fazach. Gdyby w każdej z anten drgania były
wzbudzane oddzielnie, natężenie promieniowania wysyłanego przez jedną z nich we
wszystkich kierunkach poziomych byłoby równe 70, a przez drugą — 2/0. Jakie będą
natężenia promieniowania wysyłanego przez układ obu anten w kierunkach zaznaczonych
na rysunku?
29.2. Cztery identyczne dipole promieniujące są ułożone równolegle obok siebie
w odstępach 2,50 cm tak, że środki ich leżą na linii prostopadłej do osi dipoli. Są one
pobudzane do drgań z częstością 3,00-10' Hz, przy czym fazy kolejnych dipoli są
opóźnione względem siebie o 90°. Znajdź rozkład natężeń promieniowania w dużej odległości
od dipoli, w płaszczyźnie równikowej (prostopadłej do osi dipoli i przechodzącej przez
ich środki). Zrób wykres otrzymanej funkcji we współrzędnych biegunowych.
29.3. Dwa paraboidalne „talerze" radioteleskopu obserwatorium Kalifornijskiego
Instytutu Techniki w Owens Valley mogą być odsuwane od siebie na odległość500 m. Każdy
talerz skupia przychodzące promieniowanie na małym odbiorniku umieszczonym w
ognisku paraboloidy, a następnie oba sygnały są przekazywane do „miksera" umieszczonego
w połowie drogi między talerzami. Mikser dodaje te sygnały i wylicza średni kwadrat
amplitudy sygnału wypadkowego. Z jaką dokładnością można określać położenia kątowe
odległych źródeł punktowych za pomocą tego układu, jeżeli pozwala on mierzyć
fluktuacje o wartości 10% w sygnale wyjściowym. Przyjmij, że długość fali jest równa 50 cm.
29.4. Ładunek ą porusza się po torze kołowym o promieniu a z prędkością kątową
w. Oblicz natężenie pola elektrycznego w dużej odległości R od ładunku, pod kątem
6 względem osi toru. Znajdź natężenie promieniowania w płaszczyźnie koła i na jego osi,
w dużej odległości R.
29.5. Na rysunku poniżej widzimy dwa szeregi zawierające po N równomiernie
rozmieszczonych, drgających dipoli. Wszystkie dipole w szeregu A drgają w tych samych fazach.
fi o o o oooooo o—*-
A O O O OOOOOO o r
natomiast wszystkie dipole w szeregu B mają fazy opóźnione o 90° w stosunku do dipoli
z szeregu A. Naszkicuj rozkład promieniowania w płaszczyźnie równikowej układu
(patrz zad. 29.2) w dużej odległości od dipoli.
ZADANIA DO ROZDZIAŁU 29
405
29.6. Elektrony długiego, prostego, cienkiego drutu o długości L drgają wzdłuż tego
drutu z częstością kołową w i małą amplitudą a, wszystkie w tej samej fazie. Znajdź
natężenie pola elektrycznego w dużej odległości R(R^>L)
od drutu, pod kątem 6 względem osi związanej z dru-
tem- dipol
29.7. Moc na jednostkę powierzchni przenoszona
przez falę elektromagnetyczną jest proporcjonalna do
średniego kwadratu natężenia pola elektrycznego. Określ,
jaka część całkowitej mocy emitowanej przez drgający
ładunek pada na jednostkową powierzchnię prostopadłą
do promienia o długości R, łączącego ją z ładunkiem
i tworzącego kąt 0 z osią drgań. Oblicz tę moc
(w W/m2) dla pionowo zorientowanego dipola
zawieszonego na balonie-radiosondzie, używanym do badania promieniowania kosmicznego,
znajdującym się na wysokości 25 km, w odległości poziomej 25 km od odbiornika, jeśli
całkowita moc promieniowana przez nadajnik wynosi 0,5 W.
25 km
Z5km odbiornik
Rozdział 30
30.1. Długości fal linii D widma sodu są odpowiednio równe 5889,95 A oraz 5895,92 A.
Jakie rozmiary powinna mieć siatka dyfrakcyjna, mająca 600 szczelin na mm, aby mogła
ona rozszczepić te linie w widmie pierwszego rzędu?
30.2. Samochód z zapalonymi światłami przednimi (traktowanymi jako źródła
punktowe) zbliża się po prostej drodze. Światła są umieszczone w odległości 120 cm od siebie.
Jak daleko od obserwatora znajdował się samochód w momencie, gdy obserwator
zorientował się, że widzi dwa światła, a nie jedno? Przyjmij, że źrenica oka ma średnicę równą
0,5 cm, a efektywna długość fali światła wynosi 5500 A. Czy fakt, że światło jest białe
(mieszanina różnych długości fal) ułatwia, czy utrudnia rozdzielane widzenie obu
świateł?
30.3. Na rysunku pokazano schemat konstrukcji często spotykanego typu
spektrografu siatkowego. Światło ze źródła Z przechodzi przez wąską szczelinę 5, a następnie
przez soczewkę (lub zwierciadło) kolimatora K,, który przekształca je w wiązkę równo-
406
ZADANIA
ległą (tak, że pada ono na siatkę dyfrakcyjną G jako płaska fala biegnąca z
nieskończoności;. Po ugięciu na siatce G światło, rozchodzące się znowu w różnych kierunkach, pada
na drugą soczewkę Kz (obiektyw komory fotograficznej) i jest ogniskowane w płaszczyźnie
P, gdzie tworzy (na ogół) pasmo z szeregiem nałożonych na nie wąskich linii spektralnych.
Załóżmy, że szczelina ma długość h oraz szerokość w, ogniskowe soczewki Kt i K2
wynoszą Ft i F2, kąty między normalną do siatki a osiami soczewek Ky i K2 są odpowiednio
równe 0t i 62 oraz że siatka ma N linii na jednym mm.
a. Jaka jest szerokość pasma na płaszczyźnie PI
b. Jaka długość fali pojawi się na płaszczyźnie P w punkcie leżącym na osi soczewki
K21
c. Jaka będzie wzajemna odległość na płaszczyźnie ogniskowej P dwóch linii
widmowych, których długości fali różnią się o 1,00 A? Wielkość ta często nazywana jest dyspersją
przyrządu.
d. Jaka będzie szerokość linii widmowej na płaszczyźnie P, jeżeli szerokość szczeliny
w jest znacznie większa niż zdolność rozdzielcza soczewki kolimatora, równa 1,22 XFlIAl,
gdzie Ai jest źrenicą wejściową układu.
30.4. Na rysunku pokazano schematycznie spektrograf 50-metrowego słonecznego
teleskopu wieżowego obserwatorium na Mount Wilson. Jest to spektrograf typu Littrowa,
w którym pojedyncza soczewka działa równocześnie jako kolimator i jako obiektyw
komory fotograficznej, a kąt 0L = — 62 (w przybliżeniu) i obraz powstaje obok szczeliny.
Ogniskowa soczewki spektrografu na Mont Wilson wynosi F= 23 m, a część powierzchni
siatki pokryta rysami jest równa 15 cm x 25 cm, przy czym na jednym milimetrze znajduje
się 600 linii. Na ogół korzysta się z widma piątego rzędu.
a. Jaki powinien być kąt nachylenia siatki 6, żeby położenie linii 5250,218 A obojętnego
żelaza w widmie piątego rzędu pokrywało się ze szczeliną wejściową?
b. Dla jakich innych długości fal w zakresie od 3600 do 7000 A linie widma również
pokrywają się ze szczeliną?
c. Zaproponować prostą metodę usunięcia niepożądanych rzędów widma z
zachowaniem jedynie widma piątego rzędu.
d. Jaka jest wartość dyspersji przyrządu dla długości fali 5250 A w widmie piątego
rzędu?
e. Jaki jest przedział AX określający najmniejszą odległość linii widmowych, które
(teoretycznie) można rozdzielić za pomocą tego przyrządu, dla długości fali 5250 A w
widmie piątego rzędu?
30.5. Długości fal linii widmowych mierzy się zwykle z dokładnością do 0,001 A przy
użyciu spektrografów, których zdolność rozdzielcza może sięgać tylko 0,010 A. Czy to
postępowanie narusza jakieś podstawowe prawa fizyki?
ZADANIA DO ROZDZIAŁU 30
407
30.6. Gdy rowki siatki dyfrakcyjnej mają taki kształt, że większość padającego
promieniowania zostaje ugięta w jakimś określonym kierunku, o siatce mówimy, że jest
„rozjaśniona" dla tego kierunku. Przypuśćmy, że rowkom można idealnie nadać kształt podobny do
kształtu zębów piły (patrz rysunek), taki że nachylone powierzchnie zębów tworzą kąt 8b
z poziomem.
U-l
a. Posługując się modelem przedstawiającym wiązkę ugiętą jako promieniowanie
emitowane przez zbiór oscylatorów drgających w fazie zgodnej z fazą padającego
promieniowania określ, dla jakiego kierunku wiązka ugięta będzie miała największe natężenie, jeżeli
kąt padania 0pad=O.
b. Oszacuj przybliżony zakres kątów, dla których wystąpi rozjaśnienie.
30.7. Interferometr Fabry'ego-Perota składa się z dwóch idealnie gładkich płytek
umieszczonych w odległości D od siebie. Wewnętrzne powierzchnie płytek, wzajemnie
równoległe, pokryte są warstwami, które odbijają część R2 światła padającego
prostopadle, a przepuszczają część T2. Przypuśćmy, że wiązka światła o natężeniu I0 i długości
fali X pada na jedną z tych powierzchni z lewej strony
(patrz rysunek). Część wiązki przechodzi bezpośrednio
przez układ, a część doznaje wielokrotnych odbić od
obu powierzchni i dopiero wtedy przechodzi na
zewnątrz. Ostatecznie wiązka wychodząca składa się
z światła, które zostało odbite 0, 2, 4, 6, ...-krotnie
i przeszło przez dwie warstwy. Znajdź zależność
natężenia przepuszczonego światła od D, X, R i Tl
Uwaga. Na tej samej zasadzie działają wąskopasmowe filtry optyczne nazywane filtrami
interferencyjnymi. Powierzchnie odbijające wykonuje się w tym przypadku metodą pokrywania płytek ze
szkła, w warunkach wysokiej próżni, kilkoma warstwami (o dokładnie kontrolowanej grubości)
przezroczystych substancji mających różne współczynniki załamania.
1
1
"*"-—-^_^
p
y4
yĄ \
'<%>, »■
1
Rozdział 31
31.1. Znajdź współczynnik załamania glinu dla promieni Róntgena o długości fali
1,56-10 ~8 cm. Załóż, że częstości własne elektronów w glinie są znacznie mniejsze od
częstości promieni Róntgena.
31.2. Współczynnik załamania jonosfery dla fal radiowych o częstości 100 MHz wynosi
w = 0,90. Oblicz gęstość elektronów (na cm3) w jonosferze
408
ZADANIA
31.3. Natężenie pola elektrycznego fali świetlnej przechodzącej przez ośrodek o
współczynniku załamania n jest dane wzorem
gdzie tu jest częstością kołową fali, z — odległością przebytą przez falę.
a. Pokaż, że jeśli n = ri — in", to
p_c -n"<ui/c iwU-n i/c)
Nq2 1
b. Korzystając z równania w —1 = 5 j , gdzie A'jest gęstością ładunku,
2e0m co0—co +iya>
a y współczynnikiem tłumienia, znajdź zależność natężenia wiązki promieniowania od
odległości przebytej przez falę (z) dla przypadku, gdy częstość promieniowania to jest
dokładnie równa częstości własnej atomu w0.
31.4. Jak wiadomo, gęstość strumienia energii niesionej przez falę wynosi S=e0cEz
W/m2.
a. Oblicz, z jaką szybkością jest wypromieniowana energia przez elektron drgający
z amplitudą x0 i z częstością kołową w.
b. Porównaj energię wypromieniowywaną w ciągu jednego cyklu ze zmagazynowaną
energią \mco2Xo i znajdź współczynnik tłumienia yR.
c. Wzbudzony atom wysyła promieniowanie o pewnej długości fali X. Oblicz
teoretycznie oczekiwaną szerokość A\ linii widmowej, związaną wyłącznie z tłumieniem
promieniowania. (Potraktuj atom jako mały oscylator tłumiony, o dużym Q.)
Rozdział 32
32.1. Pokaż, że jeżeli równanie ruchu naładowanego oscylatora ma postać
(m d2x/dł2) + a>lx-(2e2/3c3) d3xldt3 = F(t),
to człon zawierający trzecią pochodną opisuje szybkość strat energii na promieniowanie
(związaną z oporem promieniowania) dla dowolnej częstości.
Wskazówka. Przyjmij, że FU) = A cos cot, i oblicz moc pobieraną ze źródła wymuszającego
drgania.
32.2. Wiązka światła przechodzi przez obszar zawierający w jednostce objętości A'
centrów rozpraszających o przekroju czynnym na rozpraszanie światła równym a. Pokaż,
że natężenie światła, jako funkcja przebytej drogi .y, dane jest wzorem
/=/0e-"".
32.3. Posługując się wzorem określającym przekrój czynny na rozpraszanie światła
: to4
(co2-to20y
3 wv
ZADANIA DO ROZDZIAŁU J2
409
oraz wzorem na współczynnik załamania dla gazów
Ne2 t
n = 1 + j ,
2e0 meoj0 — a)
wykaż, że wielkość Na można zapisać w postaci
3n N \ X /
(Na pomiarach rozpraszania światła przez atmosferę oparto jedną z pierwszych metod
oszacowania liczby Avogadry.)
32.4. O ile zostaje osłabione natężenie niebieskiego światła (A=4500 A) słonecznego
podczas przechodzenia przez atmosferę, gdy słońce znajduje się
a) w zenicie?
b) 10c powyżej horyzontu?
32.5. Obserwujemy rozpraszanie na elektronach nowo odkrytego promieniowania
(nazwanego ze względu na jego nowość i tajemniczość, promieniowaniem X). Przypuszcza
się, że promieniowanie to, podobnie jak światło, jest falą poprzeczną. W jaki sposób można
by udowodnić, że jest to rzeczywiście fala poprzeczna i że można ją spolaryzować?
32.6. Światło słoneczne rozproszone przez swobodne elektrony tworzy wewnętrzną
koronę słoneczną (nazywaną koroną K). Jasność tej korony obserwowana w odległości
jednego promienia Słońca od brzegu tarczy słonecznej jest 10 ~8 razy mniejsza niż jasność
samej tarczy (na jednostkę powierzchni). Oceń w przybliżeniu, jaka jest gęstość elektronów
w pobliżu Słońca?
32.7. Pokaż, że wielkość l/e0c ma wymiar oporu, i oblicz wartość liczbową tej
wielkości.
32.8. Przestrzeń międzygwiezdna jest wypełniona chmurami drobnych ziarenek pyłu,
składających się z węgla, lodu oraz z małych ilości innych pierwiastków. Ocenić w
przybliżeniu, jaka minimalna masa tego pyłu przypadająca na jednostkę powierzchni (g/cm2)
mogłaby zmniejszyć obserwowaną przez nas jasność gwiazd, znajdujących się poza
chmurami pyłu, o czynnik równy np. 100 (tzn. o 5,0 w skali jasności gwiazdowych). Trzeba
pamiętać, że ziarenka pyłu mogą zarówno rozpraszać, jak i pochłaniać światło gwiazd.
32.9. Krótki, prosty kawałek miedzianego drutu umieszczony na drodze wiązki fal
elektromagnetycznych wysyłanej przez antenę radarową „rozprasza" część tych fal. Pole
elektryczne fali zmusza elektrony, do drgań, w czasie których emitują one promieniowanie
„rozproszone". Dla krótkiego kawałka drutu (o długości «:/) możemy przyjąć, że
elektrony drgają wzdłuż jego osi i że ich średnie przesunięcie jest proporcjonalne do składowej
natężenia pola elektrycznego równoległej do drutu. Jeżeli więc w drucie znajduje się A^
elektronów i d jest ich średnim chwilowym przemieszczeniem, to d=xE,., gdzie £|i jest
składową pola elektrycznego fali równoległą do drutu. Znajdź (w funkcji x i N)
410
ZADANIA
a) maksymalny przekrój czynny drutu na rozpraszanie,
b) zależność tego przekroju czynnego od orientacji drutu.
Rozdział 33
33.1. Między dwa polaroidy o wzajemnie prostopadłych osiach wsunięto trzeci
polaroid o osi tworzącej kąt 6 z osią pierwszego polaroidu. Jakie jest natężenie światła
przepuszczonego przez ten układ? (Zakładamy, że polaroidy są idealne i straty pomijamy.)
33.2. Załóżmy, że na polaroid pada wiązka światła spolaryzowanego liniowo. W
przypadku gdy oś polaroidu jest równoległa do osi polaryzacji, zostaje przepuszczona część a2
natężenia, natomiast gdy kąt między tymi osiami jest prosty — część e2. (Dla idealnego
polaroidu a2 = 1, e2 = 0.) Jakie będzie natężenie przepuszczonego światła, jeżeli na parę
polaroidów, których osie tworzą kąt 6, pada prostopadle światło niespolaryzowane o
natężeniu /0? (Odbicia pomijamy.)
33.3. Pokaż, że dla kąta Brewstera (tzn. takiego kąta padania 0B, przy którym promień
odbity jest spolaryzowany liniowo) tg0B=«.
33.4. Jakie będą natężenie i polaryzacja promieniowania wysyłanego przez elektron
poruszający się ze stałą prędkością po torze kołowym
a) na osi koła,
b) w płaszczyźnie koła?
33.5. Współczynniki załamania krystalicznego kwarcu dla światła o długości fali 600 mu
wynoszą odpowiednio «0= 1,544 dla promienia zwyczajnego oraz nt = 1,553, dla
promienia nadzwyczajnego. Największą różnicę prędkości rozchodzenia się promienia zwyczajnego
i nadzwyczajnego w krysztale uzyskujemy przy prostopadłym padaniu światła na kryształ
kwarcu wycięty równolegle do osi optycznej. Jaka musi być grubość kryształu dla światła
o omawianej długości fali, aby przesunął względną fazę tych dwu promieni o 90°?
33.6. Przebywający na wakacjach student pierwszego roku Ca Itech-u spacerując ze
swoją dziewczyną patrzy na Księżyc (znajdujący się 10° ponad horyzontem) odbity w
spokojnej wodzie jeziora. Przypominając sobie wiadomości z rozdz. 33 student
próbuje obliczyć, jaka powinna być jasność obrazu w porównaniu z jasnością samego Księżyca.
Zakłada on, że światło Księżyca jest (prawie) niespolaryzowane. Jaki wynik powinien
otrzymać? Pokaż, że gdy promienie padają stycznie do powierzchni wody, natężenie
światła odbitego zbliża się do 100%.
33.7. a. Jaka część padającego promieniowania zostaje odbita, gdy światło pada
prostopadle na płaską ściankę kryształu diamentu?
b. Jaka jest wielkość kąta Brewstera dla diamentu?
33.8. Wracając do zad. 33.5, przypuśćmy, że współczynniki załamania kwarcu dla
światła o długości fali 410 mu są odpowiednio równe «D= 1,557 oraz ne= 1,567 i że z kryształu
kwarcu została wycięta płytka ćwierćfalowa dla światła o długości fali 600 mu Opisz stan
ZADANIA DO ROZDZIAŁU 33
411
polaryzacji światła o podanej, krótszej długości fali, wychodzącego z tej płytki, jeżeli
przed wejściem do kryształu było ono spolaryzowane liniowo.
33.9. Trzeba zmierzyć współczynnik załamania czarnego obsydianu mając do
dyspozycji wypolerowaną płytkę tego minerału. W jaki sposób wykona się pomiar i jaka będzie
jego dokładność?
Rozdział 34
34.1. Krążek o promieniu A toczy się bez poślizgu po poziomej płaszczyźnie. Napisz
parametryczne równania linii zakreślonej przez punkt odległy o R<s:A od środka krążka,
w zależności od A, R oraz od kąta obrotu krążka 0. Wybierz układ współrzędnych o osi x
skierowanej pionowo i o osi z skierowanej poziomo.
34.2. Zakładając, że z = ct, znajdź poprzeczne przyspieszenie d2x dt2 punktu, o którym
była mowa w poprzednim zadaniu. Jest to przyspieszenie retardowane, wykorzystywane
przy obliczaniu promieniowania ładunku poruszającego się po kole o promieniu R. Wyraź
otrzymany wynik przez wielkości obserwowane: R, v (prędkość cząstki wzdłuż jej toru)
oraz v (poprzeczne przesunięcie cząstki w chwili obserwacji).
34.3. Oblicz stosunek obserwowanych natężeń promieniowania, gdy naładowana
cząstka porusza się po drodze kołowej w kierunku „od" i „do" obserwatora (patrz zad.
34.2).
34.4. Posługując się przekształceniem Lorentza i korzystając ze wskazówek podanych
na str. 135, pokaż, że sin 8=v/c.
34.5. Wykaż, że prędkość elektronu o energii 1 GeV różni się od prędkości światła
c o 1/8-10".
34.6. Linia D sodu (laboratoryjna długość fali równa 589,0 mu) w widmie pewnej
gwiazdy ma długość równą 588,0 mu. Jaka jest prędkość tej gwiazdy względem
obserwatora? Czy trzeba tu uwzględnić poprawkę relatywistyczną?
34.7. Astronom z Kalifornijskiego Instytutu Techniki, R. Minkowski, stwierdził,
że najbardziej odległa mgławica, jaką obserwował, oddala się od Ziemi z prędkością 0,6 c.
Jakie przesunięcie dopplerowskie powstanie w świetle tej mgławicy? Znajdź obserwowaną
długość fali linii widmowej, dla której długość fali zmierzona w warunkach
laboratoryjnych wynosi 300 mu.
34.8. W 1728 roku Bradley zauważył, że na skutek ruchu Ziemi po orbicie okołosło-
necznej obserwowane położenia gwiazd na kuli niebieskiej są przesunięte względem ich
położeń rzeczywistych. Zjawisko to nazywamy aberracją światła. Przy obserwacji gwiazd
położonych w pobliżu bieguna ekliptyki teleskop należy pochylić w kierunku ruchu o kąt
20°5". Jaka jest długość promienia orbity ziemskiej obliczona na podstawie tych
obserwacji? Przyjmij, że prędkość światła jest równa 3,00-108 m/s.
34.9. Załóżmy, że przestrzeń międzyplanetarna jest wypełniona drobnymi cząstkami
412
ZADANIA
„pyłu", o kształcie w przybliżeniu kulistym, o średnim ciężarze właściwym p i o
promieniu R.
a. Pokaż, że dla każdej takiej cząstki (o dowolnych rozmiarach), stosunek siły
grawitacyjnego przyciągania przez Słońce do ciśnienia padającego promieniowania słonecznego
nie zależy od odległości tej cząstki od Słońca.
b. Wiedząc, że promieniowanie słoneczne na orbicie Ziemi ma natężenie 1374 W/m2
oraz przyjmując, że przekrój czynny cząstek na pochłanianie wynosi nR2. oblicz, dla
jakiej wartości R ciśnienie promieniowania i przyciąganie grawitacyjne się równoważą?
c. Czy efektywny przekrój czynny cząstek pyłu może być znacznie większy od nR2?
Skorzystaj z wiadomości zawartych w rozdz. 32.
34.10. W jednym z rozwiązań napędu pojazdów kosmicznych miano użyć cienkiej,
bardzo dobrze odbijającej błony ze sztucznego tworzywa, jako „żagla" pchanego ciśnieniem
promieniowania. Przypuśćmy, że na statku kosmicznym o masie I03 kg umieszczono
żagiel o powierzchni 100 m2. Opisz, w jaki sposób należy posługiwać się żaglem w celu
zwiększenia średniego promienia orbity statku, przyjmując, że początkowo porusza się
on po kołowej orbicie okołosłonecznej o średnim promieniu 1 A.U. Oblicz, jaka będzie
szybkość zmian promienia tej orbity.
Rozdział 38
38.1. Ogrodnik zauważył, że łatwo jest zasadzić 2 drzewka w linii prostej, natomiast
znacznie trudniej zasadzić 3 Niemniej jednak, dzięki dużemu doświadczeniu i starannym
pomiarom, udało się mu wysadzić 64 małe drzewka w kwadratową sieć o kierunkach
E-W i N-S: 8 rzędów po 8 drzewek w rzędzie. Podstawowa komórka sieci miała wymiary
6m x 6m. Stając w narożniku swojego sadu mógł on widzieć 3 proste z ośmioma drzewami
w każdej, wliczając w to drzewko w narożniku, z którego patrzył, 2 proste po 4 drzewka
w każdej i 4 proste po 3 drzewka.
a. Jaki był najmniejszy kąt pomiędzy dwiema sąsiednimi spośród tych dziewięciu
prostych?
b. Jaka była największa odległość między dwoma kolejnymi drzewkami z tych prostych?
c. Gdyby w podobny sposób zasadzono „nieskończony sad", patrząc z powietrza
zamiast każdej z tych prostych widzielibyśmy rodzinę równoległych prostych, jednakowo
zagęszczonych drzewkami. Odległości pomiędzy sąsiednimi prostymi jednej rodziny można
traktować jako „stałe sieci". Znaleźć wartości tych stałych dla kolejnych rodzin prostych
między kierunkiem E-W i kierunkiem tworzącym z nim kąt 45°
38.2. W krysztale NaCI atomy sodu i chloru są rozmieszczone na przemian w
narożnikach sześciennych komórek kryształu, przy czym najmniejsza odległość atomu Na od
atomu Cl wynosi d=2,S2 A. Znajdź 5 największych odległości międzypłaszczyznowych
dla kryształu NaCI i oblicz, dla jakich kątów wystąpi odbicie Bragga pierwszego rzędu
od odpowiadających im zespołów płaszczyzn, jeżeli użyje się promieni Róntgena o długości
fali 1,50 A.
ZADANIA DO ROZDZIAŁU J8
413
38.3. W rozdziale 32 (str. 97) stwierdziliśmy, że wzbudzony atom wypromieniowuje
z pewną szybkością otrzymaną energię. Wynikiem tego jest ograniczenie „czasu życia"
stanu wzbudzonego i równocześnie pojawienie się skończonej szerokości odpowiedniej
linii widmowej. Wykaż, że efekty te, interpretowane jako niepewności pomiaru czasu
i energii (albo pędu i położenia) fotonu, są zgodne z zasadą nieoznaczoności.
38.4. a. Posługując się analizą wymiarową wyprowadź wzór na „promień Bohra"
atomu wodoru.
b. Wykaż, korzystając z zasady nieoznaczoności, że energia niezbędna do uwolnienia
elektronu z atomu wodoru jest rzędu kilku elektronowoltów.
38.5. W nadfioletowym obszarze widma obserwuje się serię linii widmowych znanych
jako seria Lymana. Trzy największe długości fali dla trzech prążków z tej serii wynoszą
w angstremach: 1216, 1026 i 973. Oblicz, na podstawie tych informacji oraz zasady
kombinacji Ritza, przewidywane długości fal trzech innych możliwych linii widmowych wodoru.
Dwie z tych linii leżą w obszarze widzialnym widma (seria Balmera), a jedna w podczerwieni
(pierwsza linia serii Paschena)
Rozdział 39
39.1. Gdy gaz doskonały sprężamy adiabatycznie, iloczyn PKy = const. Z drugiej strony
dla dowolnej przemiany zachodzi związek PVIT= const. Wyprowadź na podstawie
tych wzorów związki pomiędzy P i T oraz V i T, zachodzące podczas sprężania
adiabatycznego.
39.2. Dętka rowerowa jest napełniona powietrzem do ciśnienia 4,4 atm za pomocą
pompki pobierającej powietrze pod ciśnieniem atmosferycznym (I atm), w temperaturze
20°C (2933K). Jaką temperaturę w skali Celsjusza ma powietrze opuszczające pompkę,
jeżeli y=l,40. Pomiń straty ciepła na ogrzanie ścianek pompki.
39.3. W połowie objętości każdego z dwu identycznych pojemników znajduje się hel,
a druga połowa jest pusta. Obie części każdego pojemnika są oddzielone tłokiem,
zaopatrzonym w mały zawór. Przeprowadzamy dwa następujące doświadczenia:
a. W jednym tłoku otwieramy zawór i gaz przepływa do pustej części pojemnika, dopóki
nie zostanie osiągnięty stan równowagi. Wówczas tłok bardzo wolno przesuwamy do końca
pojemnika.
b. Drugi tłok najpierw bardzo wolno przesuwamy do końca pustej części pojemnika,
a następnie otwieramy zawór. Porównaj jakościowo końcowe stany gazu w obydwu
pojemnikach. (Pomiń tarcie oraz przepływ ciepła przez ścianki pojemników.)
ZE
'AV'A.-i:A'^
Trrrr
JL.
I*
i:.v.:w.v.vw,,,"sy-;,V.si
stan początkowy
stan końcowy
414
ZADANIA
39.4. a. Wyobraź sobie wysoki słup gazu lub cieczy, których gęstość p(h) zmienia się
z wysokością. Wykaż, że ciśnienie P wewnątrz tego słupa, jako funkcja wysokości h,
spełnia równanie różniczkowe dP/dh= —p(h)g.
b. Rozwiąż to równanie różniczkowe dla gazu o ciężarze cząsteczkowym u, zakładając
że temperatura gazu nie zależy od wysokości.
39.5. Atmosfera, której ciśnienie i gęstość rozpatrywane jako funkcje wysokości
spełniają równanie Pp ' = const, nazywana jest atmosferą adiabatyczną.
a. Pokaż, że temperatura takiej atmosfery spada liniowo z wysokością i znajdź
współczynnik proporcjonalności. Współczynnik ten nazywamy adiabatycznym gradientem
temperatury. Oblicz wartość tego gradientu temperatury dla atmosfery ziemskiej.
b. Na podstawie rozważań energetycznych pokaż, że atmosfera mająca mniejszy
(lub większy) gradient temperatury niż atmosfera adiabatyczna będzie stabilna (lub
niestabilna) ze względu na konwencję.
39.6. Cylinder zamknięty szczelnym, poruszającym się bez tarcia tłokiem, zawiera 1 m3
gazu jednoatomowego(x = |) pod ciśnieniem 2 atm(2,02-105 N/m2). Gaz ten zostaje
powoli sprężony w stałej temperaturze, tak że końcowa objętość wynosi tylko 0,4 m3. Jaką pracę
należy wykonać przy sprężaniu?
39.7. Dwa gazy, A i B, zajmujące takie same początkowe objętości V0 i mające takie
same początkowe ciśnienie P0 zostały gwałtownie sprężone adiabatycznie, każdy do
połowy swojej początkowej objętości. Jakie będą stosunki ich ciśnień końcowych do ciśnienia
początkowego, jeżeli yA jest równe § (gaz jednoatomowy), a yB — | (gaz dwuatomowy)?
39.8. Znajdź stosunek prac niezbędnych do przeprowadzenia sprężeń opisanych
w zad. 39.7.
39.9.* Dwie bańki o pojemnościach równych odpowiednio 200 cm3 oraz 100 cm3
są połączone krótką rurką, w której znajduje się izolujący, porowaty korek. Korek
umożliwia wyrównywanie ciśnień w obu bańkach, ale nie dopuszcza do wyrównania temperatur.
Układ został zalutowany w temperaturze 27°C, gdy znajdował
się w nim tlen pod ciśnieniem 760 mm Hg. Następnie mniejszą
bańkę zanurzono w mieszaninie wody z lodem, a większą
umieszczono w kąpieli parowej o temperaturze 100°C. Jakie
jest końcowe ciśnienie w bańkach? Pomiń przepływ ciepła
pomiędzy bańkami.
39.10.* 50-litrowy zbiornik jest połączony krótką rurą ze zbiornikiem 15-Iitrowym.
Rura jest zaopatrzona w zawór ciśnieniowy, umożliwiający przepływ gazu wyłącznie z
większego zbiornika do mniejszego, jeśli ciśnienie w większym zbiorniku przewyższa ciśnienie
w mniejszym zbiorniku o 88 cm Hg. Jakie będzie ciśnienie w mniejszym zbiorniku, gdy
w obydwu zbiornikach temperatura wyniesie 162°C, jeżeli w temperaturze 17°C większy
zbiornik był wypełniony powietrzem pod ciśnieniem atmosferycznym, a mniejszy był
opróżniony?
Oo
ZADANIA OO ROZDZIAŁU 59
415
39.11.* W temperaturze pokojowej czterotlenek azotu jest częściowo zdysocjowany
na dwutlenek azotu, według reakcji
N,04~*2N02.
Do kolby o pojemności 250 cm3, opróżnionej z powietrza, nalano 0,90 g ciekłego N204
o temperaturze 0°C. Gdy temperatura w kolbie wzrosła do 27CC, cała ciecz wyparowała,
a ciśnienie pary osiągnęło 960 mm Hg. Jaki procent czterotlenku azotu uległ dysocjacji?
39.12.* Gramocząsteczka jednoatomowego gazu doskonałego zamknięta jest w
mogącym przewodzić ciepło pojemniku, zaopatrzonym w ruchomy tłok. W chwili początkowej
parametry gazu wynoszą F,, F, oraz 7, = 27DC. Następnie gaz zostaje powoli podgrzany,
przy czym całkowita dostarczona energia wynosi 8,31 Wh a równocześnie rozszerza
się on pod stałym ciśnieniem. W stanie końcowym ciśnienie wynosi Px, objętość V2.
a temperatura T2. Obliczając końcową energię wewnętrzną gazu oraz pracę wykonaną
przez gaz podczas rozprężania znajdź:
a) 7-,,
b) V2/Vt.
Rozdział 40
40.1. W mierniku promieniowania cząsteczki rozrzedzonego gazu bombardują zespół
cienkich, lekkich łopatek poczernionych po jednej a błyszczących po drugiej stronie. Gdy
na łopatki pada promieniowanie, pochłaniają one energię, która następnie jest unoszona
(głównie) przez cząsteczki uderzające w poczernione strony łopatek. W wyniku tego na
łopatki zaczynają działać niezrównoważone siły, które powodują ich ruch obrotowy.
Rozważmy naczynie, w którym, w jednostce objętości, znajduje się « cząstek gazu, każda
o masie m. Temperatura gazu w skali bezwzględnej wynosi T. Cienka łopatka o
jednostkowej powierzchni pochłania w jednostce czasu energię promienistą równą I1W, a
następnie energia ta jest unoszona (izotropowo) przez cząsteczki uderzające w jedną ze stron
łopatki. Oszacuj w przybliżeniu wielkość niezrównoważonej siły działającej na łopatkę
umieszczoną w powietrzu o temperaturze pokojowej.
40.2. Jaka część cząsteczek uderzających w powierzchnię naczynia ma energię: a)
większą niż przeciętna, b) 3 razy większą niż przeciętna, jeżeli gaz znajduje się w stanie
równowagi cieplnej?
40.3. Ciepłem molowym substancji w stałej objętości, CY, nazywamy ilość energii
potrzebną do podniesienia temperatury jednego mola tej substancji o jeden stopień, przy
zachowaniu stałej objętości. Jakie jest ciepło molowe w stałej objętości
a) jednoatomowego gazu doskonałego,
b) dwuatomowego gazu doskonałego?
40.4. Przez gładką rurę o stałym przekroju poprzecznym A przepływa powietrze z
prędkością v, w normalnych warunkach ciśnienia i temperatury. Po drodze jest ono ogrzewane
416
ZADANIA
za pomocą grzałki stawiającej mu mały opór, możliwy do pominięcia, i opuszcza rurę
z prędkością v'. Moc grzałki jest równa PW Napisz równanie zachowania masy, energii
i pędu dla powietrza przechodzącego przez rurę, a następnie oblicz:
a) p',
b) końcową temperaturę gazu T'
c) siłę ciągu *> F.
40.5. Oszacuj w przybliżeniu, w świetle powyższego zadania, siłę ciągu lotniczego
silnika odrzutowego zużywającego 100 kg powietrza i 2 kg nafty w ciągu sekundy. Ciepło
spalania nafty wynosi około 4,65-107 J'kg. Jakie czynniki mogłyby unieważnić otrzymany
wynik?
40.6. Maxwellowskie prawo rozkładu prędkości opisane jest wzorem dNldv = Av2t~bvl.
"Wzór ten można przekształcić w równanie y = x2e~* .
a. Zrób wykres tego równania dla 0^x^3,0, aby zobaczyć, jak rosnąca krzywa
v = x2 zostaje wygaszona przez czynnik wykładniczy.
b. Znajdź maksymalną wartość rzędnej.
c. Sprawdź, że powierzchnia pod krzywą bardzo mało różni się od wartości całki
]x2e~x2dx.
o
40.7. Wyrażenie kTjmg = RT'ng=h0, gdzie fu jest masą jednego mola; występującą
we wzorze barometrycznym wielkość n = n0e~m9hlkT można przyjąć za jednostkę skali
wysokości. Oblicz wartość h0 dla atmosfery ziemskiej oraz atmosfery słonecznej,
przyjmując, że ^, = 29 g/mol, rs = 300°K, Juj = ł,5 g'mol, T =5500 °K, g = 2,7102 m/s2.
Rozdział 41
41.1. Oblicz i zapamiętaj wartości liczbowe następujących wielkości:
a) temperatury T, dla której iloczyn kT jest równy I eV;
b) wartości kT w elektronowoltach w temperaturze pokojowej;
c) długości fali fotonu odpowiadającej przeskokowi kwantowemu ze zmianą energii
o 1 eV. '
41.2. Prawo rozkładu promieniowania ciała doskonale czarnego raa postać
hw3 dw
I(co) dw= -7-5—j—ji= .
rc2cV -1)
Dokonując zamiany zmiennych x=htojkT, pokaż, że:
a) całkowite natężenie promieniowania (scałkowane po wszystkich częstościach) jest
proporcjonalne do czwartej potęgi temperatury w skali bezwzględnej;
b) częstość tom, dla której I(lo) przyjmuje wartość maksymalną, jest proporcjonaina
do temperatury w skali bezwzględnej.
*' Urządzenie to stanowi w zasadzie silnik odrzutowy.
ZADANIA DO ROZDZIAŁU 41
417
41.3. Znajdź względne natężenie światła o długości fali 0,31 u, wysyłanego przez dwa
doskonale czarne źródła o temperaturach 2000 °K i 4000 °K.
Rozdział 42
42.1. Energię aktywacji, ciepło parowania, ciepło dysocjacji itp. wyraża się zwykle
w J/m lub eV/atom. Ilu J/mol równy jest 1 eV/atom?
Uwaga. Chemicy używają jednostki energii zwanej kilokalorią. 1 kcal = 4186 J.
42.2. a. Wykonaj na papierze półlogarytmicznym wykres zależności gęstości pary
nasyconej rtęci od l/T (niezbędne dane zaczerpnij z odpowiednich tablic fizyko-chemicznych),
a następnie na podstawie tego wykresu znajdź ciepło parowania rtęci. Porównaj otrzymany
wynik z wartością wziętą z tablic.
b. Zrób to samo dla wody.
42.3. W zakresie temperatur od 0° do
300 CC ciepło parowania rtęci zmienia się
tylko o 3 % i wynosi przeciętnie 0,61 eV/atom.
Jak duży błąd można popełnić przy
obliczaniu gęstości pary rtęci w temperaturze
0°, jeżeli zamiast ciepła parowania w tej
temperaturze przyjmie się odpowiednią
wartość w temperaturze 300 CC.
Morał. Mały, procentowo, błąd popełniony
w dużym wykładniku potęgi może spowodować
duży błąd tej potęgi.
42.4. Na rysunku obok przedstawiono
zależność oporu właściwego niemal czystego
krzemu od temperatury. Wyciągnij jakościowe
wnioski dotyczące przepływu prądu w tej
substancji w temperaturach powyżej i
poniżej 300 °C.
10'
10
e
o
a
10
Si J
t\~
>fy
■""przewodnictwo
domieszkowe
fi
I przewodnictwo
/ samoistne
I 1
if
500 301
/
/
200100
1 '
ot
-100
- -
0,001 0002 0,003 0,004 0,005 0,006 0,007
i,(K°)-'
Rozdział 43
43.1. Średnica cząsteczki tlenu jest równa w przybliżeniu 3 A. Oszacuj brednią drogę
swobodną oraz średni odstęp czasu między kolejnymi zderzeniami cząsteczek tlenu,
w warunkach normalnych.
43.2. Pewne naczynie zawiera 1024 cząsteczek gazu. Średnia droga swobodna
cząsteczek jest równa k. Dla jakiej długości drogi Z. istnieje mniej niż 50°/ szans, że którakolwiek
418
ZADANIA
z cząsteczek znajdujących się w naczyniu przebiegnie do chwili następnego zderzenia drogę
dłuższą niż LI
43.3. Jeżeli w jakimś ciele istnieją różnice temperatur, płynie w nim strumień energii
proporcjonalny do gradientu temperatury (pomijamy konwekcję). Współczynnik
proporcjonalności, równy energii przepływającej przez jednostkową powierzchnię w jednostce czasu,
jest nazywany współczynnkiem przewodnictwa cieplnego K. Tak więc dEjdt = KA dT/dx.
Pokaż, że gdy nie ma konwekcji, współczynnik przewodnictwa cieplnego gazu wyraża
się wzorem
K = kn0 vkj(y -1) = kvj{y -1) a,
gdzie k jest stałą Boltzmanna, n0 — liczbą cząsteczek w jednostce objętości, v — średnią
prędkością cząsteczki, A — średnią drogą swobodną cząsteczek, y — stosunkiem cpjcv,
a — przekrojem czynnym cząsteczki.
Wskazówka. Przewodnictwo ciepine należy traktować jako transport energii wewnętrznej (cie-
pinej) U przez jakąś płaszczyznę, z obszarów ograniczonych płaszczyznami leżącymi po obu stronach
tej płaszczyzny w odległości średniej drogi swobodnej od niej, podobnie jak to się robi przy liczeniu
współczynnika dyfuzji.
43.4. Jeżeli wewnątrz płynu istnieje gradient prędkości, taki że prędkość zmienia się
wraz z odległością mierzoną poprzecznie do kierunku przepływu płynu, pojawiają się
efekty hamujące, zwane lepkością. W gazie efekty te związane są z przenoszeniem pędu
przez pewną płaszczyznę, z obszarów leżących po obu jej stronach i ograniczonych
płaszczyznami leżącymi w odległości, mniej więcej, średniej drogi swobodnej od niej. Jeżeli
kierunek przepływu pokrywa się z kierunkiem osi x i istnieje gradient prędkości vx
w kierunku osi y, to wówczas siła hamująca, na jednostkę powierzchni prostopadłej
do y, wynosi
F[A = rj dvjdy .
Wykaż, że dla gazu współczynnik lepkości tj jest w przybliżeniu równy
r] = n0vmk = vmja,
gdzie «0 jest liczbą cząsteczek gazu w jednostce objętości, v — średnią prędkością
cząsteczek, m — masą jednej cząsteczki, k — średnią drogą swobodną cząsteczek, a — przekrojem
czynnym cząsteczki.
43.5. Zwróć uwagę na to, że ani współczynnik przewodnictwa cieplnego gazu, ani
jego współczynnik lepkości, nie zależą od ciśnienia. Wprowadź odpowiednie
modyfikacje do wzorów na przepływ energii między dwiema powierzchniami, których temperatury
wynoszą Ti T+AT, oddalonymi od siebie o D, jeżeli D<śL To samo zrób z wzorem
opisującym przenoszenie pędu między dwiema powierzchniami poruszającymi się z prędkościami
U oraz U+AU (patrz zad. 43.3 i 43.4).
43.6. Dwa gazy, A i B, mają w temperaturze T0 gęstości pA i pB. Obserwuje się, że
pewien wybrany jon ma w gazie A ruchliwość fiA, a w gazie B ma ruchliwość fiB. Jaka będzie
ruchliwość tego jonu w mieszaninie tych gazów mającej gęstość pa + Pb ' temperaturę 7~0?
ZADANIA DO ROZDZIAŁU 44
419
Rozdział 44
44.1. Pewna ilość gazu doskonałego o współczynniku y = * została dwukrotnie
przeprowadzona ze stanu A (ciśnienie 1 atm, objętość 22,4 1, temperaturze 300 °K) do stanu
C (2 atm, 33,61, 900 °K), raz po drodze ABC, a drugi raz
po drodze ADC (patrz rysunek). P(atrnj
a. Wykaż, że zmiana entropii w obu przypadkach 2" I I
jest taka sama.
b. Oblicz wielkość tej zmiany. * D
44.2. Dany jest wykres idealnego cyklu Carnota, ' 55 j^ /g *"
abcd, na płaszczyźnie p-V, między temperaturami T, v/22/u
i T2 oraz punktami (pa, V„) i (pc, Vc). Wykonaj wykres
entropowy tego cyklu (na płaszczyźnie T-S) między odpowiednimi punktami ABCD
(patrz rys. 44.6).
44.3. W nowoczesnej elektrowni parowej pracującej z parą przegrzaną, temperatura
wewnątrz urządzenia wytwarzającego parę (wytwornicy pary) wynosi 600 °C. Woda
rzeczna, używana do chłodzenia skraplacza, ma temperaturę 20 °C. Jaką największą sprawność
może mieć ta elektrownia?
44.4. Idealna maszyna odwracalna, w której substancją roboczą jest 28 g azotu (y=|),
pracuje cyklicznie, zgodnie z cyklem pokazanym na rys. 44.6. Temperatura źródła ciepła
wynosi 400 K, a chłodnicy 300 °K. W punkcie początkowym a gaz zajmował objętość
6,01, a w punkcie c miał objętość 18,01.
a. Przy jakiej objętości Vb cylinder powinien zostać izolowany od źródła ciepła
(koniec rozprężania izotermicznego) w celu umożliwienia rozprężania adiabatycznego
(od Vb do Vc)7 Przy jakiej objętości Vd zaczyna się sprężanie adiabatyczne?
b. Jaka ilość ciepła jest dostarczana do maszyny na odcinku Va-> Vbl
c. Jaka ilość ciepła zostaje oddana przez maszynę na odcinku Vc^Vp.
d. Jaka jest sprawność maszyny?
e. O ile zmieni się entropia 1 g substancji roboczej podczas przemiany a->bl c^dl
Wskazówka. Udowodnij, że w cyklu Carnota dla gazu doskonałego wyrażenia VtIV, oraz
Ki V{ są sobie równe.
44.5. Nieuważny eksperymentator, wyjeżdżając na weekend, pozostawił niedomknięty
zawór zbiornika helu. Gaz, którego początkowe ciśnienie wynosiło 200 atm, powoli
ulatniał się ze zbiornika. Proces przebiegał izotermicznie w temperaturze 20°C. O ile
zmieniła się entropia 1 kg gazu?
Rozdział 45
45.1. Słońce promieniuje, w przybliżeniu, jak ciało czarne o temperaturze 5700 °K.
Jaką temperaturę w stanie równowagi będzie miała poczerniona kula miedziana, oświetlona
promieniami Słońca, od którego jest oddalona o 1 A.U.? Kąt, pod jakim widać z Ziemi
średnicę Słońca, wynosi 0,50°.
420 ZADANIA
45.2. Światło słoneczne pada prostopadle na wielki, pokryty czarną nawierzchnią plac
w Afryce Równikowej. Jaką najwyższą temperaturę osiągnie nawierzchnia placu, jeżeli
promieniuje ona jak ciało doskonale czarne? Stała słoneczna wynosi 1395 W/m2.
45.3. Kuliste ciało czarne o promieniu r i o temperaturze T jest otoczone cienką osłoną
o promieniu R, poczernioną po obu stronach. Oblicz, w jakim stopniu taka osłona
promieniowania zmniejsza szybkość stygnięcia ciała.
(Przyjmij, że przestrzeń między kulami jest opróżniona, a więc nie ma strat na
przewodnictwo cieplne.)
45.4. Gęstość materii (gazowej) w pobliżu środka Słońca wynosi około 80 g/cm3,
a temperatura około 13106°K. Materia składa się tam prawie wyłącznie z protonów
i elektronów. Oblicz ciśnienie gazu i ciśnienie promieniowania w centrum Słońca.
45.5. Ciepło parowania wody wynosi około 2,44-106 J/kg, a gęstość pary nasyconej
w temperaturze 100 °C jest równa 0,598 kg/m3. Posługując się równaniem Clausiusa-
-Clapeyrona oblicz szybkość zmian temperatury wrzenia wody w funkcji wysokości,
w pobliżu poziomu morza (w °C/km). Przyjmij, że temperatura powietrza wynosi 300° K.
45.6. Pokaż, że różnica między ciepłem molowym przy stałym ciśnieniu, a ciepłem
molowym w stałej objętości, dla gazu doskonałego, którego energia wewnętrzna zależy
wyłącznie od T, jest równa stałej gazowej R: CP — CV=R.
45.7. Objętość właściwa nasyconej pary wodnej w temperaturze 0 °C jest równa
206 m3/kg. Jakie jest (w J/kg) ciepło parowania wody w tej temperaturze? (Znajdź w
tablicach wartość dp/dT, oblicz L i porównaj otrzymany wynik z wartością wziętą z tablic.)
45.8. Wykaż, że jeżeli pewien przedmiot pochłania ustaloną część A całkowitego
promieniowania padającego na jego powierzchnię, a odbija resztę, to po ogrzaniu do
temperatury obędzie on emitował energię AoT* na jednostkę powierzchni (oT* — energia
emitowana przez jednostkę powierzchni ciała doskonale czarnego).
45.9. a. Wykaż na podstawie rozważań termodynamicznych, że jeżeli substancja
rozszerza się podczas krzepnięcia, to jej temperatura krzepnięcia musi maleć ze wzrostem
ciśnienia.
b. Oszacuj, przy jakiej .najniższej temperaturze lodu na ślizgawce jest jeszcze możliwa
jazda na łyżwach.
Rozdział 47
47.1. Znajdź stosunek prędkości dźwięku w helu do prędkości dźwięku w wodorze
przy tej samej temperaturze.
47.2. Z dwóch gwizdków o tej samej długości jest wydobywany dźwięk przy użyciu
a) powietrza oziębionego do temperatury skraplania ( — 180 CC) oraz b) powietrza
ogrzanego. Dźwięk jednego gwizdka jest dokładnie o oktawę wyższy niż dźwięk drugiego (częstość
drgań dwa razy większa). Jaka musi być temperatura powietrza wdmuchiwanego do
gwizdka omawianego w punkcie b)?
ZADANIA DO ROZDZIAŁU 47
421
47.3. Jeśli ktoś mówi wdychając hel, jego głos brzmi nienaturalnie i wyżej niż zwykle.
O jaki mniej więcej czynnik wzrosłaby każda częstość rezonansowa, gdyby wszystkie,
spełniające rolę wnęk rezonansowych, „puste miejsca w głowie" były wypełnione helem zamiast
powietrza? Jaki byłby wpływ helu, gdyby ktoś śpiewał jakąś melodię, na tonację, w której
śpiewał? Przedyskutuj to.
47.4. Rozważ stacjonarną płaską falę akustyczną o częstości 1000 Hz, w której
największe odchylenia ciśnienia od panującego ciśnienia atmosferycznego (1-106 dyna/cm2)
wynoszą +1 dyna/cm2.
a. Jakie zmiany gęstości towarzyszą takiej fali?
b. Jakie są maksymalne przemieszczenia xm cząsteczek?
c. Jakie jest natężenie fali?
Przyjmij, że prędkość dźwięku wynosi 340 m/s.
47.5. Zaobserwuj wysokości dźwięku, jakie można wydobyć brząkając na kawałku
paska gumowego o długości około 5 cm, trzymanym między paznokciami obu rąk i
rozciąganym 2, 3, 4 i 5-krotnie w porównaniu z długością pierwotną, bez zmiany masy drgającej
części paska. Rozważ zaobserwowane wyniki doświadczenia. Dlaczego struna skrzypiec
nie zachowuje się tak samo?
47.6. Jednorodna, doskonale sprężysta struna o gęstości liniowej a kg/fli, została
naciągnięta tak, że jej naprężenie wynosi T. Wyprowadź równanie falowe opisujące poprzeczne
wychylenie struny, y, i znajdź prędkość rozchodzenia się zaburzeń wzdłuż struny. Załóż,
że dla wszystkich punktów i w dowolnej chwili czasu dy/Bx^il. Składowa naprężenia
w kierunku poprzecznym względem struny jest bardzo bliska T (dy/dx). Rozważ jedynie
drgania odbywające się w pewnej płaszczyźnie.
47.7. Pokaż, że wielkość u=Ae'(a>t~kx) spełnia równanie falowe
d2u 1 d2u
przy założeniu, że w i k związane są zależnością co=vk.
Rozdział 48
48.1. Prędkość fazowa fal o długości A, rozchodzących się na powierzchni wody, przy
pominięciu napięcia powierzchniowego i efektów związanych ze skończoną głębokością
wody, wyraża się wzorem
vf=\fgXJ2n.
Wykaż, że prędkość grupowa tej fali równa jest połowie jej prędkości fazowej. Oblicz
prędkość grupową i fazową fali o długości 1000 m.
48.2. Przy uwzględnieniu napięcia powierzchniowego prędkość fazowa fali na
powierzchni cieczy o gęstości p i o napięciu powierzchniowym T wynosi
422
ZADANIA
(2nT gX\'2
jeżeli tylko głębokość cieczy jest dostatecznie duża. Znajdź prędkość grupową takiej
fali.
48.3. Oblicz prędkość fazową „zmarszczek" o długości fali 1 cm rozchodzących się
na powierzchni a) wody (napięcie powierzchniowe 70 dyna/cm), b) alkoholu (napięcie
powierzchniowe 26 dyna/cm).
48.4. Znajdź długość fali i częstość „zmarszczek" na wodzie rozchodzących się
z najmniejszą prędkością.
48.5. Długi pociąg towarowy, ciągnięty przez lokomotywę motorową, jedzie pod górę
z prędkością 5,0 m/s, po prostych szynach. Gdy pociąg zbliża się do tunelu przebitego
w pionowej ścianie, maszynista daje długi, jednostajny sygnał syreną, o częstości
podstawowej 340 Hz. Zarówno dźwięk syreny, jak i jej echo, po odbiciu od ściany, są słyszane
a) przez maszynistę, b) przez stojącą na ziemi osobę, koło której przejeżdża lokomotywa.
Ile dudnień w ciągu sekundy słyszy każda z tych osób?
Rozdział 49
49.1. Dwie masy, mogące ślizgać się bez tarcia po powierzchni, na której leżą, są
przymocowane do dwóch przeciwległych ścian za pomocą sprężyn o stałych sprężystości
równych odpowiednio kt i k2, a równocześnie połączone ze sobą sprężyną o stałej sprężystości k
(patrz rysunek). Napisz równanie obu mas. Niech kllml=k2lm2~co0.
49.2. Podstaw do równań wyprowadzonych w poprzednim zadaniu x=A e'°* oraz
y=Be'°" i oblicz częstości oraz amplitudy dwóch podstawowych rodzajów drgań.
49.3. Wykaż, że funkcja f(x,y, z, t)=A e'°" sin/rcx/asin mny/b sin nKzjc, gdzie
co2=v2n2[(l2/a2) + (m2lb2) + (n2/c2)], a /, m, n są dodatnimi liczbami całkowitymi
a) spełnia trójwymiarowe równanie falowe (z prędkością propagacji v),
b) jest równa zeru dla x=0 i x = a, y=0 i y=b oraz z=0 i z = c,
c) oscyluje sinusoidalnie w czasie.
49.4. Przyjmij, że w poprzednim zadaniu stosunek a:b:c= 1:2:3 i oblicz 10
najmniejszych częstości drgań, wyrażając je przez najniższą częstość <u0. Ułóż je w kolejności
rosnących częstości, a następnie odłóż odpowiadające im wartości na pionowej osi
liczbowej.
49.5. Posługując się pojęciem nieskończenie długich, okresowych ciągów falowych
ZADANIA DO ROZDZIAŁU 49
423
poruszających się w przeciwnych kierunkach wywnioskuj, co się stanie, gdy środek
idealnej, równomiernie napiętej sprężyny o długości L zostanie odchylony od położenia
równowagi o odcinek A, a następnie puszczony swobodnie. Naszkicuj wygląd sprężyny
w kilku różnych chwilach czasu w ciągu połowy okresu ruchu.
Rozdział 50
50.1. Posługując się fourierowskim rozkładem funkcji opisującej falę prostokątną
I
/(*) =
¥-*
= 4/rc (sin x +-i sin 3x +~ sin 5x+...),
wykaż, że
a> l-£ + i + !+...=*/4,
b) l + 4+^ + 4^ + ...=ir2/8,
50.2. Rozłóż funkcję
»(*) =
na składowe fourierowskie i wykaż, że ten wynik pokrywa się z wynikiem otrzymanym
przez scałkowanie funkcji z poprzedniego zadania.
50.3. Korzystając z wyników poprzedniego zadania, wykaż, że
a) l + l/3*+l/5*+ł/7* + ... = rt*/96,
00
b) £ l/n* = P*/(24-l)]( 1 + 1/3* +1/5*+ ...) = rt*/90.
n=l
50.4. Spróbuj obliczyć wartość całki
f x3dx
mnożąc licznik i mianownik przez
e i rozwijając
1-e"
w szereg
1-e"
- = l+e-"+e-2*+...
a następnie całkując wyraz po wyrazie. Postępując w ten sposób powinno się otrzymać
424 ZADANIA
I XX_X=\ w3e""f/«[1+1/2*+1/3* + ...] = 6rc4/90=rc*/15.
o o
50.5. Znajdź szereg Fouriera przedstawiający funkcję piłową wykorzystywaną w
obwodzie odchylania poziomego w oscyloskopie:
1
/"(*) =
2jr 4jt 6ji
50.6. Prostownik dwupołówkowy jest urządzeniem, które przekształca sinusoidalne
napięcie o amplitudzie V0 w napięcie pulsujące o postaci:
"A
a. Oblicz wartość średnią napięcia V(t). Będzie ona równa składowej stałej
napięcia wyjściowego.
b. Znajdź amplitudę drugiej składowej harmonicznej napięcia wyjściowego.
50.7. Pewien transformator wytwarza napięcie wyjściowe dane wzorem
V =V ■ + e• V3
wyi wej T wej *
Zanalizuj wpływ drugiego składnika sumy (zawierającego trzecią potęgę) na
a) sinusoidalny sygnał wejściowy,
b) sygnał wejściowy składający się z dwóch lub większej liczby fal sinusoidalnych
o różnych częstościach.
odpowiedzi do zadań
Rozdział 26
26.1. AK=20m,
f = 60,0s,
ACB, ACB; 60,1 s.
26.2. PP' =0,0425 m,
T„. = \,\0T„.
26.3. 2,0 cm .
Rozdział 27
27.1. y = ±y/2(l-lln)F'x-(l-lln2)x2.
27.3. d' =d/n.
27.4. M=F/f.
27.5. a) 4 1/6 cm-5 cm.
27.7. a) 6,86-10-* cm,
b) 8,13 cm.
27.8. F=ff'l(f+f'-D) albo
llF=Uf+llf'-Dlff';
* =fDKf+f'-D)
od 5 w kierunku S',
S=f'D/(f+f'-D)
od S' w kierunku 5.
Rozdział 28
28.1. a) \A\=2rcos6/2,
r sin (N+1)6/2
b) \A\-
sin0/2
Rozdział 29
29.1. S: 7=0,17 /„,
S 60°W: 7=3,0 /„,
W: 7=5,8 /„.
426
ODPOWIEDZI DO ZADAŃ
29.2.
/(0)=/o sin1 In(l-coiO)}
sin2(ir(l-cos0)/4]
29.3. ax2\",5.
32.9. a. o
6nclc* \E0J
b. -L'=cos0.
■|sinS|— sin0*| A.
Rozdział 30
30.1. Z. = 1,6 mm.
30.2. 9,1 km.
30.3. a. hF2/Ft.
107
nN
c. D = H>-7nNF2/cos0«.
d. w'= wFz cos 6,1 Ft cos 0,.
30.4. a. 0=51,9°.
b. 3750, 4370, 6560.
d. 5,6 mm/A.
e. 0,007 A.
T1
30.7. /,//„=
1-rV
2 l*nD/X
Rozdział 31
31.1. Mierzony współczynnik wynosi
(1-») = 8,410-6.
31.2. Rzędu 107 na cm3.
31.3. /= /o exp( — Afy2z\e0 myc).
31.4. a. P=q3to*xl/\2m0c3.
b. 7n = q w2/6tt£0mc .
2nc , .
c. AX=—j-yM=0,74-10 3A.
w
Rozdział 32
i-»« *r ~1(V» cm-3.
Rozdział 33
33.2. /,//„=i(a*+e4) cos2 0+aV sin* 0.
33.5. l,67-10-2mm.
33.6. 34,5%, a dziewczyna opuszcza go
zawiedziona.
33.7. a) 17%,
b) 67,4°.
Rozdział 34
34.1. Z=A0 + R sin 0,
x=-Rcos0.
-v2x 1 —vR/cx
34.2. x =
R2 (l-vx/cR)3
34.3. /m«/Vn,i„ =(1 +v/cf/U -vjcf .
34.6. Zbliża się z prędkością 510 km/s.
34.7. 600 mu.
34.8. 150-106 kro.
34.9. K=0,585//>u.
34.10. dR\dt=360 m/s.
Rozdział 38
38.1. a. 6°8'.
b. 21,6 m.
c. 1,9; 2,7; 3,3; 4,3 m.
ODPOWIEDZI DO ZADAŃ
38.2. 15°44', 22°13\ 27024', 32°13', 36°31'.
38.5. 6560, 4860, 18800.
Rozdział 39
39.1. Pł",/T,,=const,
r^'"'=const.
39.2. 173°C.
39.4. P=P0e~',<*"'T.
39.6. 1,82-105J.
39.7. P. = 3,17P0,
P* = 2,64/>0.
39.9. 842 mm Hg.
39.10. 20 cm Hg.
39.11. 31.
39.12. a) 1740°K,
b) 5.8.
Rozdział 40
40.1. F=jt/3v/*77'wa;l,210-3itNm-2.
40.2. 0,366; 0,050.
40.3. a) i*,
40.6. b. 0,368.
c. V"/4-
Rozdział 41
41.1. a. 11,600°K,
b. 1/40 eV.
c. 1,24 u, czyli 12400 A.
41.3. fl~e-l,-6«10-'.
427
Rozdział 42
42.1. 1 eV/atom = 96520 J/mol.
42.3. Zmiana prawie dwukrotna.
Rozdział 43
43.1. ^=10"7m,
T=10"9S.
43.2. L = 56A( = X]n2N).
43.5. dEldt=nQvkJTI(y-\),
FI A = tiovm A U.
Rozdział 44
44.3. 66,3%.
44.5. 11•103 J/°K.
Rozdział 45
45.1. 7"x;270oK.
45.2. 122°C.
45.3. F=R2l(R2 + r2).
45.4. P,= l,7 1016 N/m2,
J', = 7,2-10'2 N/m2.
45.5. dTtdh = 3,l°C/km.
45.7. 2490-103 J/kg.
Rozdział 47
47.1. 0,78.
47.2. 99°C.
428
ODPOWIEDZI DO ZADAŃ
47.3. 2,9; nie ulegnie zmianie tonacja,
natomiast zmieni się bardzo jakość (barwa)
dźwięku.
47.6. diyldx^iolDd^yldt2,
skąd v2 — Tlo.
Rozdział 48
48.3. 24,4 cm/s; 1,78 cm/s.
Rozdział 49
49.1. d^/dS+colx + kix-yym^O,
d yjdt +tooy-k-k(y — x)jm% = 0.
49.2. o*=io%; A/B= + l,
<oI=(o0+k/ml+k/m2 ;
AjB= -m2/nil.
Rozdział 50
50.5. h{x)=i (l/jt)(sinA:+isin2jc +
+ isin3x + ...).
skorowidz
Aberracja 135
aberracje (sferyczna i chromatyczna) 35
absorpcja 88, 259
adiabatyczność 209
akomodacja oka 157
aksony 156
aktywność optyczna 113
amplituda prawdopodobieństwa 186. 189.
339
analiza wektorowa 386
Anderson C. D. 398
antena 52, 93. 244
— paraboliczna 68
antymateria 398
Barwa 140 i nast.
- tonu 357, 360
błądzenie przypadkowe 244
Boehm 397
Boltzmann L. 234
Born N. 173, 201. 258
Brown R. 233
Carnot 278
cieplik 279
ciepło 278
właściwe 297
— gazów 227
ciśnienie
ciśnienie gazu 205
— pary nasyconej 303
- światła 136
Clausius 278
cykl Carnota 282, 297, 303
cykłoida 124
cząstka 190
częstość
kątowa 50
— rezonansowa oscylatora 83
własna 347
czopki 139
cztero wektor k,io 133
Ćwierćfalówka 109
D-alanina 390
dichromaty 149
dipol promieniujący 43
—, dwa dipole 51
Dirac P. A. M. 398
długość fali II, 22, 50, 190
drgania własne 342
dudnienia 99, 319, 330
dwójłomność 109
dyfrakcja (ugięcie) 59
- na kryształach 194
— na nieprzezroczystych ekranach 70, 90
— światła 63
dyfuzja 262
— cząsteczkowa 271
dyspersja 85
— normalna i anomalna 87
dźwięk 322
Efekt interferencyjny 57
Einstein A. 233, 258, 274
ekwipartycja 241
elektrodynamika kwantowa 41
elektronowolt 125
emisja 259
energia
— aktywacji 256
— fali elektrycznej 89
— gazu 208, 301
— wewnętrzna 295
entalpia 301
entropia 290, 315
Fala
— nośna 334
— zmodulowana 334
fale 319
— czołowe 370
— dwuwymiarowe 349
— elektromagnetyczne 47 321
— krótkie 11
430
fale milimetrowe 11
— powierzchniowe 379
— radarowe 11
— radiowe 11, 85, 126
— sinusoidalne 50
— stojące 345
— trójwymiarowe 341
— uderzeniowe 371, 372
— w ciałach stałych 375
falowody 120
fasetki 163
faza 50, 86, 107
Fermat P. 14
figura Haidingera 163
filtry 111
fizjologia oka 157
fluktuacje 235, 245, 317
fotony 137, 183
Frank 371
Galileusz 387
gaz
— doskonały 215
gaz dwuatomowy 229
— jednoatomowy 208, 228
Hamilton 25
harmonia dźwięku 360
Heisenberg W. 173, 201
Helmholtz H. 148
Heron z Aleksandrii 15
Huygens Ch. 12, 117
Impedancja próżni 95
indcterminizm mechaniki kwantowej 201
interferencja 45, 55, 100, 177, 319
— destruktywna i konstruktywna 57
— fal elektronowych 179
Jeans J. 230, 241
jon 254
jonizacja termiczna 253
Katalizator 257
kąt Brewstera 112
klasyczna teoria promieniowania
elektromagnetycznego 12
klasyczny promień elektronu 98
komórka
— Kerra 111
— podstawowa 195
komórki pręcikowe 139, 160
skorowidz
kryterium Rayleigha 67
krzywa wrażliwości świetlnej 148
L-alanina 390
Land 153
laser 100, 369
Lee 396
Leonardo da Vinci 156
liczba
— Avogadry 247
— falowa 50
linie absorpcyjne 88
Ładunki drgające 73
Maxwell J. C. 38, 213, 230, 243
mechanika
— kwantowa 172, 185
— statystyczna 218
mechanizm
— widzenia 153
— zapadkowy 307
mezony (rozpad) 397
mgławica Krab 129, 141
Miller W. C. 140
miraże 18
modulacja 333, 368
— amplitudy 334
modulator 369
mol 215, 247
moment pędu światła 119, 137
Nadfiolet 11, 163
naruszenie symetrii 399
natężenie
— fali 89, 176
— tonu 359
neurologia widzenia 166
Newton I. 173
nieodwracalność 313
nocna ślepota 161
Obraz (pozorny i rzeczywisty) 29
odbicie 13, 15, 114
fal 345
— od siatki dyfrakcyjnej 65
— zwierciadlane 389
odwracalnośc 312, 387
odwracalny przepływ ciepła 281
ognisko 19
ogniskowa
— powierzchni załamującej 26
SKOROWIDZ
ogniskowa soczewki 30
oko
- ludzkie 138
— ośmiornicy 166
skrzypłocza 167
— złożone (owadzie) 162
- żaby 169
okres 50
Iommatidia 163
operacje symetrii 384
Sopór promieniowania 93, 244
optyka geometryczna 12, 25
oscylator
- harmoniczny 228, 231, 237, 241, 319
— kwantowy 241
oś optyczna 109
1
Paczki falowe 336, 340
parowanie 221, 248
1 parzystość 395
pasma poboczne 334
perpetuum mobile 299
pęd światła 136
Pitagoras 356
plamka żółta 139
Planck M. 232, 242
płaszczyzny główne 34
podczerwień 11
polaroid 109
1 polaryzacja 106
— światła rozproszonego 105, 108
polaryzatory 111
powierzchnia załamująca (kulista) 26
powiększenie 32
r poziomy energetyczne 199
prawa promieniowania Einsteina 258
[ prawo
— Boltzmanna 220
— Coułomba 40
— odbicia 13
— Rayleigha 241
— załamania (Snella) 14, 80, 118
prądy konwekcyjne 271
pręciki J39, 160
prędkość
— dźwięku 328
— fazowa 337
— grupowa 338, 380
promienie
— y 11
promienie przyosiowe (paraksjalne) 27
— rentgenowskie 11, 85, 127, 337
promieniowanie
— ciała doskonale czarnego 240, 305
— Czerenkowa 371
— elektromagnetyczne 11, 39
— hamowania 129
— synchrotronowe 124
— — kosmiczne 128
promień
— Bohra 197
— nadzwyczajny 118
— zwyczajny 117
prostownik 311
przekrój czynny
— na rozpraszanie 102, 238
— rozpraszanie Thomsona 103
przekształcenie Lorentza 135, 386
przewodnictwo
— cieplne 275
— jonowe 270
pseudowektor 392
Ptolemeusz Klaudiusz 13
purpura wzrokowa 150
Reakcje chemiczne 256
retardacja 40
rctincn 161
rezonatory wnękowe 120
rodopsyna 161
rogówka 138, 157
rozkład prędkości cząsteczek 223
rozmiary atomu 196
rozpraszanie światła 100, 238
równanie
— Clausiusa-Clapeyrona 302
— dyspersyjne 85
— falowe 323, 326
— jonizacji Sahy 255
ruch unoszenia 268
ruchliwość 268
ruchy Browna 233, 244, 309, 313
Rushton 151
rydberg 198
Schródinger fc. 145, 173, 201
siatka dyfrakcyjna 63
siatkówka 139, 156
sieć krystaliczna 195
silniki cieplne 276
— odwracalne 281
składanie barw 145
432
skok ciśnienia 372
Snell Willebrord 14
soczewka 19, 30
- cienka 31
oka 157
— złożona 33
sprawność silnika 285
stała Bo/tzmanna 247
stopień
— KeKina 215
swobody 217
strefa Talowa 51
sygnał 85
— nośny 334
symetria czasu / przestrzeni 385
szereg Fouriera 358
szerokość linii widmowych 98
szumy Johnsona 236, 243
szybkość unoszenia 267
Ściśliwość promieniowania 209
średni czas między zderzeniami 263
średnia droga swobodna 265
światło 11
— niespolaryzowane 108
— polaryzacja podczas rozpraszania 105, 108
— spolaryzowane 108, 118, 127, 163
Tamm 371
temperatura 211
— bezwzględna 215
— kinetyczna 302
— termodynamiczna 288
termodynamiczna równowaga promieniowania
237
skala temperatur 302
termodynamika 201, 276
termoemisja 252
tęczówka 157
tłumienie promieniowania 97
tony muzyczne 356
trichromaty 150
twierdzenie
— Nernsia 292
— o energii 366
Ukladv liniowe 354
Wahadła sprzężone 353
Wapstra 397
wektor
— biegunowy 393
— falowy 190
SKOROWIDZ
wektor osiowy 393
węzły fali 85, 347
widzenie barwne 138
witamina A 161
włókna osiowe 156
współczynnik
— dyfu/ji 273
— pochłaniania 88
za/amania 21. 77, 88, 337
współczynniki Fouriera 362
Wu 397
wykres barwności 146
wysokość tonu 357
wzory
— de Broglie'a 137
— Fresnela 117
wzór
— barometryczny 220
— soczewkowy 33
Young 148, 396
Vustova 150
Załamanie 13, 16, 79
— anomalne 117
zasada
— ekwipartycji energii 217
— Fermata (najkrótszego czasu) 14 - 24
— kombinacja Ritza 199
— nieoznaczoności 184, 187, 192
— superpozycji 321
— wzajemności 17, 28, 68
zasady
— termodynamiki 276
druga 279, 293, 294, 307
pierwsza 276, 293, 294
zasady zachowania 388
zdolność rozdzielcza 37
— siatki dyfrakcyjnej 67
zjawiska nieliniowe 367
zjawisko
— Dopplera 130
— Purkinjego 141
zwierciadło 13, 15
— elipsoidalne 19
— kuliste 29
— paraboloidalne 20
Źródła
— niezależne 99
— ruchome 120
do nabycia w KSIĘGARNIACH
H. Abramczyk
Wstęp do spektroskopii laserowej
H. Haken, H.Ch. Wolf
Fizyka molekularna z elementami chemii kwantowej
B.M. Jaworski, A.A. Dietłaf
Fizyka. Poradnik encyklopedyczny
Z. Kęcki
Podstawy spektroskopii molekularnej
R Kowalczyk
Fizyka cząsteczek. Energie i widma
H. Szydłowski
Pracownia fizyczna
J.R. Taylor
Wstęp do analizy btędu pomiarowego
Książki PWN są do nabycia w księgarniach własnych PWN:
Warszawa, ul. Miodowa 10, tel. (22) 635 80 88;
Gdańsk, ul. Korzenna 33/35, tel. (58) 305 24 50;
Katowice, al. Korfantego 51, tel. (32) 58 32 26;
Kraków, ul. Św. Tomasza 30, tel. (12) 421 75 64;
Łódź, ul. Więckowskiego 13, tel. (42) 630 67 69;
Poznań, ul. Wodna 8/9, tel. (61) 85174 94;
Wrocław, ul. Kuźnicza 56, tel. (71) 343 54 52.
Zamówienia telefoniczne i pisemne przyjmuje:
Dział Dystrybucji Wysyłkowej i Prenumerat,
ul. Miodowa 10, 00-251 Warszawa,
infolinia 0-801 351 929; fax 69 54 179
Zapraszamy do księgarni PWN w Internecie www.pwn.com.pl