La relativité lumineuse même sans lumière

Ordinairement pour expliquer la relativité on commence par des histoires de lumière: comment au XIXeme, on est d’abord arrivé à mesurer sa vitesse dans le vide, puis son drôle de comportement: qu’elle provienne d’une étoile s’approchant de la Terre ou s’en éloignant, la vitesse apparente de la lumière est toujours exactement la même. Cette violation patente de la loi de composition des vitesses (qui exprime simplement le fait que quand vous marchez dans un train, votre vitesse par rapport au sol est la somme de la vitesse du train et de votre vitesse par rapport au train) a bien entendu plongé les scientifiques dans la perplexité. C’est principalement pour expliquer ce phénomène qu’Einstein a reconstruit les bases de la mécanique relativiste, en prenant pour postulat de base que la vitesse de la lumière dans le vide est une constante.

Bien sûr, cette loi a été vérifiée maintes fois expérimentalement et la théorie de la relativité est maintenant totalement admise en dehors de quelques hurluberlus; il y a pourtant dans cette démarche quelque chose qui me laisse sur ma faim: admettre comme postulat une propriété aussi bizarroïde m’a toujours semblé un peu gênant intellectuellement . Certes, cela ne m’empêche pas de dormir la nuit, mais ne peut-on donc retrouver par le seul jeu de l’esprit et des expériences imaginaires la logique de la relativité restreinte? Faut-il vraiment avoir connaissance de l’expérience de Michelson (mettant en évidence pour la première fois l’invariance de la vitesse de la lumière) ou les équations de Maxwell (qui font appel implicitement à cette vitesse constante, sans pour autant la justifier) pour envisager une alternative aux lois de la mécanique Galiléenne?

J’ai fini par trouver mon bonheur dans le livre de Jean Hladik (pour comprendre simplement la théorie de la relativité)*. Remontant aux publications de Poincaré (de 1904!), Hladik décortique son raisonnement et montre comment Poincaré avait trouvé les équations de la relativité restreinte dès 1904, sans devoir faire appel à l’hypothèse bizarre de l’invariance de la vitesse de la lumière. Je ne peux résister au plaisir de vous livrer une version simplifiée du raisonnement, tant pis si c’est un peu technique, mon prochain billet le sera moins, promis.

Recette de la transformation de Lorentz (préparation: 5 minutes, cuisson:10 minutes):
[Edit du 22/9/2008: je remercie Michel Chrysos, professeur de Physique à l’Université d’Angers et co-inventeur de cette recette, de m’en avoir proposé une amélioration considérable (en rouge dans le texte), permettant de se passer du 4eme postulat.]
Prenez quatre trois postulats tout à fait raisonnables, sur lesquels l’honnête homme ne fera pas (trop) de débat:
1) On postule que les lois de la physique sont les mêmes dans tous les référentiels en translation uniforme les uns par rapport aux autres (=se déplaçant à vitesse constante l’un par rapport à l’autre). C’est le bon vieux principe de la relativité galiléenne qu’on reprend, car c’est dans les vieilles casseroles qu’on fait les meilleures sauces;
2) Ensuite, pour rester dans le classique, on suppose que l’espace est homogène dans toutes les directions: pas de direction privilégiée.
3) Plus original: on postule que l’on sait synchroniser toutes les horloges d’un même référentiel: à un instant donné elles indiquent toutes la même heure.
4) La touche du chef: « La cause d’un événement précède son effet » dans tous les référentiels. Ce qui signifie que si un événement a lieu avant un autre dans un référentiel, l’ordre des deux événements sera le même dans tous les référentiels. Cela revient finalement à dire qu’on ne peut remonter le temps sous peine de tomber dans les paradoxes classiques du type « je tue mon arrière-grand-père, donc je ne peux naitre, donc je ne peux l’avoir tué etc ».
Voilà, c’est tout ce qu’il faut postuler.

Pas d’histoire de lumière là-dedans, ni d’invariance de quoique ce soit, vous remarquez? Et pourtant rien qu’en faisant bouillir à feux doux ces quatre petits ingrédients de rien du tout, on a la recette de la relativité. C’est parti pour une petite gymnastique mathématico-culinaire, n’hésitez pas à m’interrompre si je dis une bêtise!

Comme plan de travail, on considère deux référentiels R et R’ plans justement, d’origine O et O’ et dont les axes Ox et O’x’ coïncident. On ne raisonne que sur cet axe, les deux autres directions de l’espace sont supposées communes pour simplifier. Leurs horloges marquent respectivement un temps t et t’ et O’ s’éloigne de O à la vitesse V constante (vue de O): nos deux référentiels sont bien en translation uniforme l’un par rapport à l’autre.

Le but est d’exprimer x’ et t’ en fonction de x et de t et de (re)trouver la fameuse transformation de Lorentz assez simplement.

1) Linéarité de la transformation cherchée

Comme l’espace et le temps sont homogènes, la loi reliant ces variables est linéaire et ne peut dépendre que de V:

x’=a(V)x + b(V)t (1)
t’=c(V)t+ d(V)x (2)

où a(V), b(V), c(V) et d(V) sont des fonctions de V uniquement.

2) O’ a une vitesse V par rapport à O:

O’ a pour coordonnées x’=0 et t’=0 dans son référentiel R’, et x=Vt dans le référentiel R. En remplaçant tout ça dans l’équation (1) on obtient V=-b(V)/a(V)
En mettant a(V) en facteur et en changeant le nom des fonctions dans (2), les équations ci-dessus deviennent:

x’= a(V)[x-Vt]
t’= a(V)[C(V)t+D(V)x]

3) Invariance par réflexion dans un miroir:

Le postulat d’homogénéité de l’espace suppose que si l’on gradue Ox et Ox’ en sens inverse, on passe des coordonnées (-x’) aux coordonnées (-x) par les mêmes équations. V devient -V mais t et t’ ne changent pas. On obtient ainsi:
-x’=a(-V)[-x+Vt]
t’=a(-V)[C(-V)t-D(-V)x]

On en conclut que a(-V)=a(V); C(-V)=C(V) et D(-V)=-D(V)

4) Transformation inverse:

Les lois étant les mêmes dans tous les référentiels en translation uniforme, on doit retrouver x et t en appliquant nos formules à x’ et t’
x=a(-V)[x’+Vt’]=a(V)[x’+Vt’]
t=a(-V)[C(-V)t’+D(-V)x’]=a(V)[C(V)t’-D(V)x’]
En remplaçant x’ et t’ par leur expressions en fonction de x et t on obtient (j’omets les « (V) » pour alléger):
x=a²[x-Vt+VCt+VDx]=a²[(1+VD)x+V(C-1)t]
t=a²[C²t+CDx-Dx+DVt]=a²[(C-1)Dx+(C²+DV)t]

On en déduit que C(V)=1 et que a²[1+VD(V)]=1

Nos équations deviennent:

x’=a[x-Vt]
t’=a[t+Dx]

5) Composition des transformations (au passage on note que toutes ces hypothèses ne font que traduire l’appartenance de la transformation cherchée à un « groupe », notion chère à Poincarré)

On considère maintenant un troisième référentiel R », d’axe 0″x » aligné sur O’x’, mais dont l’origine O » se déplace à la vitesse U par rapport à 0′.
x »=a(U)[x’-Ut’]=a(U)a(V)[(1-UD(V))x-(U+V)t]=a(U)a(V)(1-UD(V))[x-(U+V)/(1-UD(V))t]
t »=a(U)[t’+D(U)x’]=a(U)a(V)[(1-VD(U))t+(D(U)+D(V))x]

Mais si W est la vitesse de O » par rapport à O, on doit avoir x »=a(W)(x-Wt) et t »=a(W)(t+D(W)x)
En ordonnant et en identifiant terme à terme, on vérifie que l’on a nécessairement

D(V)=kV où k est une constante
et que W=(U+V)/(1-kUV) (3)


Ce qui traduit une loi de composition des vitesses beaucoup plus complexe que celle que nous connaissons en mécanique classique où W=U+V!
Du coup on en déduit que a²(V)=1/(1+kV²) en retenant pour a la valeur positive car a(0)=1
Nos équations deviennent:

x’=a[x-Vt]
t’=a[t+kVx]

6) Quel signe pour k? C’est là qu’intervient le principe du « respect de la causalité »
La constante k à la dimension de l’inverse du carré d’une vitesse. Intéressons nous à son signe.

  • Si k=0, D(V)=0 et a(V)=1 Les équations que l’on obtient sont tout simplement x’=(x-Vt) et t’=t.
    On retrouve les lois galiléennes de passage d’un référentiel à l’autre. Ces lois sont UNE des solutions de notre problème, qui fonctionne pour les petites vitesses. Mais si nous sommes actuellement en train de faire tous ces calculs, c’est pour trouver une formule qui marche aussi pour les grandes vitesses!
  • si k >0,
    Cela signifie que la vitesse composée W de deux vitesses U et V toutes deux positives , est plus grande que la somme des deux vitesses puisque W=(U+V)/(1-kUV). W n’a pas de limite si U et V sont très grands.
    Montrons que dans ce cas, on ne respecte plus le principe de causalité [ceci est une démonstration de mon cru, goûtez-la pour voir si elle vous convainc, je suis preneur de recettes alternatives!].
    Soit deux événements E’1 et E’2, associés respectivement aux coordonnées (x’1, t’1) et (x’2,t’2) dans R’ (respectivement sans les ‘ dans R).
    Si E’1 est la cause de E’2 dans R’, alors il lui est antérieur et Δt’=t’2-t’1 est positif dans R’. On suppose que Δx’ est également positif.
    Le principe de causalité impose que
    Δt>0 également. Dans le référentiel R, Δt=a(V)(Δt’-kVΔx’) avec a(V) positif.
    Or si V est très grand, rien n’empêche V d’être supérieur à
    Δt’/(kΔx’) ce qui entrainerait dans ce cas que Δt
    La somme de deux vitesses U et V s’écrit toujours W=(U+V)/(1-kUV).
    Si k>0, cette égalité implique que deux vitesses U et V toutes deux positives et très grandes, peuvent s’additionner pour donner une vitesse négative: il suffit pour cela que UV>1/k… Résultat absurde.
    Pour éviter cette impossibilité, on peut imaginer que l’on ne puisse jamais avoir UV>1/k, en faisant l’hypothèse qu’il existe une vitesse limite V
    max telle que Vmax²
    Mais dans ce cas, pour U et V=Vmax, W=2Vmax/(1-kVmax²) max
    En simplifiant on obtient kVmax<-1 ce qui est impossible puisque Vmax et k sont positifs.
    Conclusion: k ne peut pas être positif…
  • Donc k est nécessairement négatif, comme il a la dimension inverse du carré d’une vitesse, on peut écrire k=-1/c², c étant une constante ayant la dimension d’une vitesse.Voilà, c’est fini! les équations s’écrivent maintenant:
x’=g(x-Vt)
t’=g(t-V/c²x)
avec g=(1/(1-V²/c)

La loi de composition des vitesses (3) s’écrit W=(U+V)/(1+UV/c²) et donc W est toujours plus petit que U et V. Dans cette formule, on voit que c est la vitesse limite de tout référentiel par rapport à un autre.

Il ne reste qu’à trouver la valeur de c. La vitesse de la lumière est une bonne candidate à cette valeur, car justement, on n’a jamais trouvé jusqu’ici de particule dépassant cette vitesse et elle ne change pas, quelque soit le référentiel.

Vous pouvez servir: on retrouve avec ces valeurs, la fameuse transformation de Lorentz, dont découle toute les équations de la relativité restreinte, et notamment celle de E=mc².

La démonstration de Poincaré permet ainsi assez facilement de trouver les équations relativistes:
1) sans avoir à postuler a priori l’invariance de la vitesse de la lumière dans le vide. Si un jour on découvrait que cette invariance n’était pas vraie, cela ne remettrait pas en cause ce modèle;
2) en postulant le respect de la causalité (toute cause précède son effet dans le temps);
3) elle permet d’expliquer pourquoi les très grandes vitesses ne s’additionnent pas « classiquement » mais tendent vers une limite indépassable qui semble bien être celle de la lumière dans le vide. La transformation de Lorentz permet de comprendre pourquoi la vitesse de la lumière ne change pas par changement de référentiel sans postuler cette propriété au départ.

La relativité retrouvée par la pure expérience de pensée, je trouve ça bluffant!

* Post Scriptum de janvier 2012: j’ai découvert après coup que Jean-Marie Levy-Leblond avait formulé cette démonstration ébouriffante en 1975 (ici pour une version pdf), ce qui l’amène dans cet article à proposer que l’on rebaptise en « chronogéométrie » la théorie de la « relativité », puisqu’elle établit justement qu’il existe une limite absolue à toute vitesse d’objet matériel.

16 comments for “La relativité lumineuse même sans lumière

  1. Tom Roud
    13/09/2008 at 22:51

    >Salut,très intéressant, je ne connaissais pas, et on sent bien la patte du matheux. Nénamoins la différence entre les maths et la physique est aussi que la physique se base sur une réalité expérimentale. Il y a une différence d’approche épistémologique : on peut imaginer beaucoup de théories mathématiques pour le monde physique (et c’est ce qui continue aujourd’hui avec les supercordes, etc …) mais à la fin, seule l’observation expérimentale est relevante, et peut servir de base à la théorie. Je pense en particulier que l’invariance de c observée expérimentalement implique plus ou moins ce que tu postules en 1. On me dira que si le résultat est le meme, il n’y a pas de différence, mais le fait de se placer dans un cadre purement physique dès le départ a aussi donné plus de « souffle » je pense à la théorie d’Einstein, car il y a immédiatement des interprétations physiques supplémentaires qui ouvrent d’autres perspectives. Par exemple, je pense qu’Einstein a probablement rapidement pensé à l’équivalence entre accélération et gravité de par sa formation de physicien pour généraliser la relativité restreinte et obtenir in fine la relativité générale.En France, de part notre formation assez matheuse – mieme en physique-, je pense qu’on a un peu trop tendance à privilégier les démarches purement mathématiques, en mettant sous le tapis tout l’esprit physique (exemple typique, ce billet où tu préfères postuler un principe fondamentalement mathématique plutot que la réalité physique – ce n’est pas un reproche 😉 ); d’où les polémiques vaines sur l’antériorité sur la relativité restreinte entre Einstein et Poincaré.

  2. Xochipilli
    14/09/2008 at 10:20

    >Salut TomBien vu: j’avoue être sensible aux démonstrations qui ne font appel qu’aux pures spéculations intellectuelles et aux expériences imaginaires (comme celle de l’ascenseur avec un rayon de lumière dedans qui met en évidence l’équivalence entre gravité et accélération, base de la relativité générale), plutôt qu’aux mesures compliquées inaccessibles à l’homme de la rue.Cela dit je ne suis pas tout à fait d’accord avec l’interprétation « toute mathématique » que tu donnes à ces quatre postulats (mais je ne rentrerai pas dans la polémique de qui précède qui dans la découverte de la relativité ;-)- D’une part toutes les démonstrations classiques postulant l’invariance de la vitesse de la lumière dans le vide sont tout aussi compliquées et matheuses que celle-ci (il suffit de jeter un oeil sur les deux ou trois références en bas du billet pour s’en convaincre);- D’autre part l’hypothèse « l’effet précède la cause dans tout référentiel galiléen » me semble véritablement physique et surtout beaucoup moins « tombée du ciel » que « l’invariance de la vitesse de la lumière dans le vide ». Elle me paraît du coup une candidate plus naturelle à devenir un postulat fondamental. D’ailleurs si tu fais une petite recherche sur internet dans les forums, aux questions « pourquoi ne peut on aller plus vite que la lumière? », ou « que se passe-t-il si on va plus vite que c? » les réponses sont souvent tarabiscotées en se terminant par « c’est impossible par hypothèse »: pas très satisfaisant pour celui qui pose la question. Avec cette approche, on voit directement qu’aller plus vite que la lumière permet de remonter dans le temps ce qui est inadmissible pour l’esprit.

  3. Tom Roud
    14/09/2008 at 15:34

    >Oui et non : je trouve personnellement que l’hypothèse forte est « les lois de la physique sont invariantes dans tous les référentiels galiléens ». Tout postulat de ce type sera toujours plus fort que la réalité expérimentale. Cela paraît « normal » mais cela ne va pas de soi : cf les expériences de test sur l’intrication quantique, où les gens ont explicitement vérifié que les lois de la physique étaient indépendante du référentiel.Sinon, il faudrait que je vérifie, mais je pense qu’il y a une raison physique pour laquelle la vitesse maximum est la vitesse de la lumière : c’est celle des particules de masse nulle.(Avertissement anti-crackpot : rien ne montre que les lois de la physique dépendent du référentiel, la relativité restreinte est parfaitement démontrée; on parle ici de limites extrêmes de la théorie, à l’intersection de la relativité et de la mécanique quantique)

  4. Xochipilli
    23/09/2008 at 07:34

    >Michel Chrysos, le co-auteur de la démonstration originale (in « Introduction à la relativité restreinte » – Dunod, 2001) m’a très aimablement indiqué comment on pouvait se passer de l’hypothèse du « respect de la causalité » pour prouver les équations de la relativité restreinte, qui du coup coulent de source à partir de postulats extrêmement simples! Le raisonnement est limpide et j’ai bien sûr actualisé le billet en ce sens.Tom, tu as raison: le postulat très fort est bien l’invariance des lois dans tous les référentiels Galiléens… A moins que ce ne soit celui de l’isotropie de l’univers, comme l’envisagent certains chercheurs (cf le dernier numéro de La Recherche).

  5. Anonymous
    03/09/2010 at 04:27

    >Very Interesting! Thank You!

  6. sciencetonnante
    05/01/2011 at 13:34

    >Ouf, j'ai eu très peur en lisant l'intro de ton billet. J'ai bien cru qu'en effet on pouvait "démontrer" la relativité restreinte sans le moindre résultat expérimental. Si ça marchait j'étais près à abandonner la physique et à me faire moine mathématicien. Mais l'honneur de la physique est sauf. Oui car il y a quand même un passage très important où tu utilises un résultat expérimental : le moment où on "exclut" le cas k=0 qui est la relativité galiléenne. Et là on a quand même besoin d'une manip pour le faire.Ce qui me troublait c'était de pouvoir réfuter la relativité galiléenne sans manips !Mais ce calcul laisse les 2 portes ouvertes : il n'y a que 2 lois de composition des vitesses admissibles : la galiléenne est la transfo de Lorentz. Et pour discriminer entre les deux il faut au moins une expérience (Michelson-Morley par exemple)C'est bon, je ne deviendrai pas moine mathématicien.

  7. Xochipilli
    05/01/2011 at 21:15

    >@sciencetonnante: je n'ai effectivement pas trouvé d'expérience de pensée ou d'argument théorique très clair pour suggérer que la vitesse de la lumière est indépassable, les physiciens sont saufs! Sauf peut-être si l'on prouve que le principe de causalité est violé si de l'information voyage plus vite que la lumière?

  8. Ch
    30/08/2014 at 14:41

    Bonjour et merci pour cet article très intéressant.

    Je suis très très novice et je décroche dès le 2).
    Si on admet x=Vt dès le départ pour en déduire une proportionnalité à V entre a et b, comment peut-on poursuivre les équations avec x-Vt en facteur ?

    Désolé pour cette remarque de bas niveau… mais j’aimerais comprendre le principe, du coup.

    • Ch
      30/08/2014 at 15:19

      Oubliez ma remarque… il s’agit de la vitesse de ce point O’ particulier (vérifiant x=Vt) et non pas des autres points x (c’est ça ?)

      • 30/08/2014 at 15:25

        @Ch: exactement, vous avez été plus rapide que moi pour vous répondre à vous-même 😉

        • Ch
          30/08/2014 at 15:31

          Merci Xochipilli pour ces réponses rapides et pour cette article qui continue à me faire réfléchir (et peut être comprendre !)

  9. 30/08/2014 at 15:23

    @Ch: merci de votre question!
    Pour vous répondre: x=Vt n’est vraie que pour le point O’ (j’aurais dû écrire x(O’)=Vt(O’)).
    Comme on sait que x'(O’)=0, l’équation x’=ax+bt appliquée au point O’ devient 0=aVt(O’)+bt(O’).
    On simplifie par t(O’) et ça donne b=-a/V.
    C’est plus clair?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *