Théorème de Pythagore

Table des matières

1.1 INTRODUCTION
1.2 COURS
1.3 EXEMPLES
1.4 ILLUSTRATION
- 1.4.1 Horizons infinis en mathématiques
EXERCICES

1.1 INTRODUCTION

1.1.1 Exploration du théorème de Pythagore : son histoire et sa signification

Dans ce premier cours, nous examinons l'un des théorèmes les plus importants des mathématiques, le théorème de Pythagore. Les racines historiques du théorème sont fascinantes : les premiers exemples d'identités comme $5^{2} + 12^{2} = 13^{2}$ sont déjà apparus dans les mathématiques sumériennes. Les triplets de nombres comme $(5, 12, 13)$ sont appelés triplets pythagoriciens. Le théorème lui-même est bien plus que cela. Le théorème ne se contente pas de donner quelques exemples à titre de preuve, mais il énonce et prouve que pour tous les triangles, la relation $a^{2} + b^{2} = c^{2}$ est vraie si et seulement si le triangle est un triangle rectangle. Sans exagération, le théorème de Pythagore est l'un des théorèmes les plus beaux et les plus importants. Il apparaît dans divers autres domaines des mathématiques. En analyse harmonique par exemple, il dit que le carré de la longueur d'une fonction périodique est la somme des carrés de ses coefficients de Fourier. En théorie des probabilités, il dit que si deux variables aléatoires $X, Y$ sont non corrélées, alors la variance de $X + Y$ est la somme de la variance de $X$ et de la variance de $Y$ .

**Figure 1.** L'image apparaît dans « The story of the greatest nations », (1910) et montre Pythagore enseignant les mathématiques.

1.1.2 Redéfinir les vecteurs

Nous utilisons ici également le théorème tout en introduisant les vecteurs et les espaces linéaires. Le langage des matrices n'est pas seulement une question de notation, mais permet également une approche légèrement plus sophistiquée du calcul vectoriel dans laquelle on distingue les vecteurs colonnes des vecteurs lignes. Contrairement aux cours d'analyse vectorielle standard, cela est possible lorsque l'on travaille plus près de l'algèbre linéaire. Traditionnellement, de nombreuses sources définissent un vecteur comme une quantité ayant une « grandeur » et une « direction ». Cela est très problématique car un « film » répond à cette notion : il a une durée et a un réalisateur. Mais nous n'avons pas besoin de nous moquer avec un jeu de mots : le vecteur nul $0$ est une quantité qui ne pourrait pas être qualifiée de vecteur car le vecteur nul n'a pas de direction. En raison de ces problèmes, on définit généralement un vecteur comme une quantité définie par deux points $A, B$ dans l'espace, on note $\vec{A B}$ et on pense au vecteur comme à une translation de $A$ à $B$ ou comme une « flèche » partant de $A$ et se terminant en $B$ . Or, on a la difficulté que deux vecteurs parallèles de même longueur sont identifiés. On utilise en fait des classes d'équivalence pour passer de l'espace affine à l'espace linéaire. Le point de vue moderne est que l'on peut attacher un espace linéaire de vecteurs en chaque point et considérer $\vec{A B}$ comme un vecteur attaché au point $A$ . Nous verrons par exemple le concept de champ de gradient, qui attache en chaque point un vecteur ligne. Les champs de forces en sont des exemples.

1.1.3 Fondements matriciels en analyse de données

En tout cas, introduire les espaces de matrices tôt présente des avantages également à une époque où l'analyse de données est reconnue comme un outil important. Les bases de données relationnelles sont fondées sur le concept de matrices. Les plus familières sont les feuilles de calcul qui sont des tableaux bidimensionnels dans lesquels les données sont organisées. Plus récemment, de tels concepts sont également supplantés par des structures de données plus sophistiquées comme les bases de données graphes. Néanmoins, un graphe peut aussi être décrit par des matrices. Étant donné deux nœuds $x, y$ du réseau, l'entrée de la matrice $A_{x y}$ indique comment ils sont liés. Dans le cas le plus simple, on met un $1$ si les nœuds sont connectés et $0$ s'ils ne le sont pas. En tout cas, les données sont toujours des tableaux de quantités plus élémentaires. La structure de la mémoire d'un ordinateur est organisée comme un tableau. Comme l'a montré Alan Turing, tous les calculs que nous avons formalisés peuvent être effectués sur une bande unidimensionnelle avec des entrées $0$ et $1$ . Les dispositifs de stockage informatiques modernes sont essentiellement de telles bandes de Turing, mais organisés de manière plus sophistiquée, en utilisant des partitions ou des secteurs de la même manière que les matrices sont organisées en lignes et en colonnes.

1.2 COURS

1.2.1 Notions essentielles sur les matrices

Un tableau rectangulaire fini $A$ de nombres réels est appelé une matrice. S'il y a $n$ lignes et $m$ colonnes dans $A$ , on l'appelle une matrice $n \times m$ . On désigne l'entrée de la $i$ -ème ligne et de la $j$ -ème colonne par $A_{i j}$ . Une matrice $n \times 1$ est un vecteur colonne, une matrice $1 \times n$ est un vecteur ligne. Une matrice $1 \times 1$ est appelée un scalaire. Étant donné une matrice $n \times p$ $A$ et une matrice $p \times m$ $B$ , la matrice $n \times m$ $A B$ est définie par $(A B)_{i j} = \sum_{k = 1}^{p} A_{i k} B_{k j} .$ On l'appelle le produit matriciel. La transposée d'une matrice $n \times m$ $A$ est la matrice $m \times n$ $A_{i j}^{T} = A_{j i}$ . La transposée d'un vecteur colonne est un vecteur ligne.

1.2.2 Espace vectoriel des matrices

On note $M (n, m)$ l'ensemble des matrices $n \times m$ . Il contient la matrice nulle $O$ avec $O_{i j} = 0$ . Dans le cas $m = 1$ , c'est le vecteur nul. L'addition $A + B$ de deux matrices dans $M (n, m)$ est définie par $(A + B)_{i j} = A_{i j} + B_{i j} .$ La multiplication scalaire $λ A$ est définie par $(λ A)_{i j} = λ A_{i j}$ si $λ$ est un nombre réel. Ces opérations font de $M (n, m)$ un espace vectoriel $=$ espace linéaire : l'addition est associative, commutative avec un unique inverse additif $- A$ vérifiant $A - A = 0.$ Les multiplications sont distributives : $A (B + C) = A B + A C$ et $λ (A + B) = λ A + λ B$ et $λ (μ A) = (λ μ) A .$

1.2.3 Espaces euclidiens, produit scalaire et longueur

L'espace $M (n, 1)$ est aussi appelé $ℝ^{n}$ . C'est l'espace euclidien de dimension $𝒏$ . L'espace vectoriel $ℝ^{2}$ est le plan et $ℝ^{3}$ est l'espace physique. Ces espaces nous sont chers car nous dessinons sur du papier et vivons dans l'espace. Le produit scalaire entre deux vecteurs colonnes $v, w \in ℝ^{n}$ est le produit matriciel $v \cdot w = v^{T} w .$ Puisque le produit scalaire est un scalaire, le produit est aussi appelé produit scalaire. Dans le produit matriciel de deux matrices $A, B$ , l'entrée à la position $(i, j)$ est le produit scalaire de la $i$ -ème ligne de $A$ avec la $j$ -ème colonne de $B$ . Plus généralement, le produit scalaire entre deux matrices $n \times m$ quelconques peut être défini par $A \cdot B = tr (A^{T} B),$ où la trace d'une matrice est la somme de ses entrées diagonales. Cela signifie $tr (A^{T} B) = \sum_{i, j} A_{i j} B_{i j} .$ On prend simplement le produit sur toutes les entrées de la matrice et on les additionne. Le produit scalaire est distributif $(u + v) \cdot w = u \cdot w + v \cdot w$ et commutatif $v \cdot w = w \cdot v .$ On peut l'utiliser pour définir la longueur $| v | = \sqrt{v \cdot v}$ d'un vecteur ou la longueur $| A |$ d'une matrice, en prenant la racine carrée positive. La somme des carrés est nulle exactement si toutes les composantes sont nulles. Le seul vecteur vérifiant $| v | = 0$ est donc $v = 0$ .

1.2.4 Inégalité de Cauchy-Schwarz

Un résultat clé important est l'inégalité de Cauchy-Schwarz.

Théorème 1. $| v \cdot w | \leq | v | | w |$

Preuve. Si $w = 0$ , il n'y a rien à prouver car les deux côtés sont nuls. Si $w \neq 0$ , alors on peut diviser les deux côtés de l'équation par $| w |$ et ainsi obtenir $| w | = 1$ . Définissons $a = v \cdot w$ . Maintenant, \begin{aligned} 0 \leq(v-a w) \cdot(v-a w)&=|v|^{2}-2 a v \cdot w+a^{2}|w|^{2}\\ &=|v|^{2}-2 a^{2}+a^{2}\\ &=|v|^{2}-a^{2} \end{aligned} ce qui signifie $a^{2} \leq | v |^{2}$ ou $v \cdot w \leq | v | = | v | | w |$ . ◻

1.2.5 Angle entre deux vecteurs

Il découle de l'inégalité de Cauchy-Schwarz que pour deux vecteurs non nuls quelconques $v, w$ , le nombre $(v \cdot w) / (| v | | w |)$ est dans l'intervalle fermé $[- 1, 1]$ : $- 1 \leq \frac{u \cdot w}{| v | | w |} \leq 1.$ Il existe donc un unique angle $α \in [0, π]$ tel que $\cos (α) = \frac{v \cdot w}{| v | | w |}$ Si cet angle entre $v$ et $w$ est égal à $α = π / 2$ , les deux vecteurs sont orthogonaux. Si $α = 0$ ou $π$ les deux vecteurs sont dits parallèles. Il existe alors un nombre réel $λ$ tel que $v = λ w$ . Le vecteur nul est considéré à la fois orthogonal et parallèle à tout autre vecteur.

1.2.6 Loi des cosinus

Deux vecteurs $v, w$ définissent un triangle (éventuellement dégénéré) ${0, v, w}$ dans l'espace euclidien $ℝ^{n}$ . La formule ci-dessus définit un angle $α$ au point $0$ (qui pourrait être l'angle nul). Les longueurs des côtés $a = | v |, b = | w |, c = | v - w |$ du triangle vérifient la formule cos suivante. On l'appelle aussi l'identité d'Al-Kashi.

Corollaire 1. $c^{2} = a^{2} + b^{2} - 2 a b \cos (α)$

Preuve. Nous utilisons les définitions ainsi que la propriété distributive (développer) : \begin{aligned} c^{2}&=|v-w|^{2}\\ &=(v-w) \cdot(v-w)\\ &=v \cdot v+w \cdot w-2 v \cdot w\\ &=a^{2}+b^{2}-2 a b \cos (\alpha) \end{aligned} ◻

1.2.7 Comprendre le théorème de Pythagore : un cas particulier de la loi des cosinus

Le cas $α = π / 2$ est particulièrement important. C'est le théorème de Pythagore :

Théorème 2. Dans un triangle rectangle, on a $c^{2} = a^{2} + b^{2}$ .

1.3 EXEMPLES

Exemple 1. Le produit scalaire $[\begin{array}{l} 1 \\ 3 \\ 1 \end{array}] \cdot [\begin{matrix} 1 \\ - 2 \\ - 1 \end{matrix}]$ est $[1, 3, 1] [\begin{matrix} 1 \\ - 2 \\ - 1 \end{matrix}] = 1 - 6 - 1 = - 6.$ On a $| v | = \sqrt{11}, | w | = \sqrt{6}$ et l'angle $α = \arccos (- 6 / \sqrt{66})$ .

Exemple 2. Le produit scalaire de $A = [\begin{array}{ll} 3 & 1 \\ 2 & 1 \end{array}]$ et $B = [\begin{array}{cc} 2 & 2 \\ 4 & - 1 \end{array}]$ est $tr (A^{T} B) = 6 + 2 + 8 + (- 1) = 15.$ La longueur de $A$ est $\sqrt{tr (A^{T} A)} = \sqrt{12}$ , la longueur de $B$ est $\sqrt{tr (B^{T} B)} = 5$ . L'angle entre $A$ et $B$ est $α = \arccos \frac{15}{5 \sqrt{12}} = \arccos \frac{\sqrt{3}}{2} = \frac{π}{6} .$

Exemple 3. $A = [\begin{array}{ll} 1 & 2 \\ 1 & 2 \end{array}]$ et $B = [\begin{array}{cc} 1 & - 1 \\ - 1 & 1 \end{array}]$ sont perpendiculaires car $tr (A^{T} B) = 0.$ L'angle entre eux est $\frac{π}{2}$ . La longueur de $A$ est $a = \sqrt{10}$ . La longueur de $B$ est $b = \sqrt{4} = 2$ . La longueur de $A + B = [\begin{array}{ll} 2 & 1 \\ 0 & 3 \end{array}]$ est $c = \sqrt{14}$ . On confirme $a^{2} + b^{2} = c^{2} .$ Notez que $A B \neq B A$ . La multiplication n'est pas commutative.

Exemple 4. Trouver les angles dans un triangle de longueurs $a = 4, b = 5$ et $c = 6$ .

Réponse : Al-Kashi donne $2 \cdot 4 \cdot 5 \cos (γ) = 4^{2} + 5^{2} - 6^{2} = 5$ d'où $γ = \arccos (5 / 40) .$ De même $2 \cdot 4 \cdot 6 \cos (β) = 27$ d'où $γ = \arccos (27 / 48)$ et $2 \cdot 5 \cdot 6 \cos (α) = 45$ d'où $α = \arccos (45 / 60) .$

1.4 ILLUSTRATION

**Figure 2.** Un cuboïde de côtés de longueurs entières $a, b$ et $c$ tels que $a^{2} +$ $b^{2}, a^{2} + c^{2}, b^{2} + c^{2}$ sont des carrés est une brique d'Euler. Ses diagonales de face sont alors entières. La plus petite $(a, b, c) = (44, 117, 24)$ a été trouvée en 1719. Si de plus $a^{2} + b^{2} + c^{2}$ est un carré, ce qui signifie que la diagonale de l'espace est également entière, nous avons une brique d'Euler parfaite. Personne n'en a trouvé une. C'est un célèbre problème ouvert dû à Euler, celui de savoir s'il en existe une.

**Figure 3.** Cette **scène Povray** a été générée par une méthode qui implique beaucoup de calcul vectoriel et d'algèbre linéaire : ce **lanceur de rayons** open source fait rebondir la lumière dans la scène virtuelle et calcule les réflexions. Une caméra capture ensuite les photons, de manière similaire à un appareil photo réel. Les textures sont implémentées par des images, ici une carte postale de Harvard square de 1930. C'est un fichier image encodant trois matrices $1688 \times 1104$ R, V, B, les valeurs de rouge, vert et bleu à chaque pixel. La scène est un "hommage" au roman "On Time and the River" de Thomas Wolfe qui était étudiant de premier cycle à Harvard ici de 1920 à 1922 (remarquez le 22 !)

1.4.1 Horizons infinis en mathématiques

Les mathématiques ne sont pas seulement éternelles, mais aussi infinies. Pour illustrer cela, examinons le problème des "Éternels".¹ Définissons le graphe babylonien $B$ dans lequel les entiers positifs sont les sommets et où $(a, b)$ sont connectés si $a^{2} + b^{2}$ est un carré parfait. Chaque arête de $B$ appartient à un triplet pythagoricien $a^{2} + b^{2} = c^{2}$ . On peut se demander quels types de sous-graphes apparaissent, combien de composantes connexes il y a, si le diamètre est infini, ou quelle taille peuvent atteindre les boucles fermées. Des centaines de questions pourraient être posées. Les triangles intégrés $K_{3}$ dans $B$ par exemple sont des briques d'Euler ! Existe-t-il des tétraèdres intégrés $K_{4}$ , des cliques de nombres $(a, b, c, d)$ pour lesquels chaque paire est un triplet pythagoricien ? Ce serait un tesseract eulérien. Y en a-t-il un ? Avant de prouver quoi que ce soit, nous avons un problème de données. Expérimentons !

**Figure 4.** À gauche, nous voyons la plus grande composante $B_{1000}$ . Une expérience comme `ListPlot[Table[GraphDiameter[Babylonian[n]],n,1000]]` donne le diamètre de la plus grande composante $B_{1} (n)$ de $B (n)$ . Nous avons $Diam (B_{1} (5000)) = 18, Diam (B_{1} (10000)) = 29$ .

EXERCICES

Exercice 1. Utilisez les définitions pour trouver l'angle $α$ entre le vecteur $v = [1, 1, 0, - 3, 2, 1]^{T}$ et $w = [1, 1, 9, - 3, - 5, - 3]^{T}$ dans $ℝ^{6}$ . Si nous considérons $v, w$ comme des données, la valeur $\cos (α)$ est la corrélation entre les deux points de données $v$ et $w$ . Si le cosinus est positif, les données ont une corrélation positive. S'il est négatif, elles ont une corrélation négative.

Exercice 2. Étant donnée la matrice $A = [\begin{array}{lll} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array}]$ .

Trouvez $A^{T}$ , puis construisez $B = A + A^{T}$ et $C = A - A^{T}$ . La première matrice est dite symétrique, la seconde est dite antisymétrique.
Calculez $A A^{T}$ et $A^{T} A$ . Évaluez ensuite $tr (A^{T} A)$ et $tr (A A^{T})$ .
Pourquoi ces deux nombres calculés en b) sont-ils identiques ? Est-ce vrai en général pour deux matrices $n \times m$ que $tr (A^{T} B) = tr (B^{T} A)$ ? (Il y a une courte vérification utilisant la notation de somme).

Exercice 3.

Vérifiez l'identité triangulaire $| v - w | \leq | v | + | w |$ en général en développant $(v - w) \cdot (v - w)$ , puis générez un exemple de deux vecteurs avec des coordonnées entières dans le plan $ℝ^{2}$ , où l'on peut appliquer cela. Dessinez la situation.
Vérifiez que si $v$ et $w$ ont la même longueur, alors $(v - w)$ et $(v + w)$ sont perpendiculaires. Décrivez la situation en b) géométriquement en une phrase.

Exercice 4. Écrivez le vecteur $F = [2, 3, 4]^{T}$ comme la somme d'un vecteur parallèle à $v = [1, 1, 1]^{T}$ et d'un vecteur perpendiculaire à $v$ . Si nous interprétons $F$ comme une force agissant sur un cerf-volant de masse $1$ et $v$ comme la vitesse, alors $F \cdot v$ a une interprétation comme puissance, le taux de variation de l'énergie du cerf-volant. Le vecteur parallèle à $v$ serait, selon Newton, l'accélération du cerf-volant.

Exercice 5.

Trouvez deux vecteurs dans $ℝ^{2}$ dont toutes les coordonnées sont $1$ ou $- 1$ et qui sont tous deux perpendiculaires l'un à l'autre.
Concevez quatre vecteurs dans $ℝ^{4}$ dont toutes les coordonnées sont $1$ ou $- 1$ et qui sont tous perpendiculaires les uns aux autres.

Optionnel : pouvez-vous inventer une stratégie qui vous permette par exemple de trouver $16$ vecteurs dans $ℝ^{16}$ qui sont tous perpendiculaires les uns aux autres et qui ont encore des entrées dans ${- 1, 1}$ ?

Ce problème nous a été communiqué par Ajak, qui connaît des milliers d'années de mathématiques↩︎