Traitement de l'Information Numérique (TIN) - Cours PDF

Ch1 : Coder l'information : les chiffres. ========================================= Ceci n'est pas un scoop, mais tu auras remarqué que ton ordinateur fonctionne à l'électricité, d'où le terme « électronique » appliqué à toute une série de « machines » diverses ayant pour caractéristique commune de nécessiter une alimentation électrique, alimentation pouvant prendre diverses formes : prise sur le réseau, pile, batterie ou encore énergie solaire. L'électricité a pour caractéristique de ne pouvoir utiliser que 2 informations :. ouvert ou fermé (en terme de circuit). 0 ou 1 (en terme mathématique).. OUI ou NON (en d'autres termes) Figure 1 source : visatice D'où l'expression BINAIRE. Numériser une information est la traduire en une suite de 0 et de 1. **Ce sont les chiffres binaires, en anglais BInarydigiT, communément appelés « bit ».** C'est là l'information de base de tout système numérique. Comment dès lors traduire un chiffre, par exemple : 18 en une suite de 0 et de 1 ? L'opération de codage des chiffres va consister à transformer des informations données - - Voir vidéo : « TUTO : Apprendre le binaire en 3 minutes » [[https://www.youtube.com/watch?v=\_kpAWHDsVzA]](https://www.youtube.com/watch?v=_kpAWHDsVzA) *Remarque1 : nous expliquerons rapidement pourquoi la vidéo travaille sur une suite de 8 informations, et donne donc des possibilités de coder 256 nombres allant de 0 à 255.* *Remarque 2 : un 3° système existe aux côtés des systèmes décimal et binaire : le système hexadécimal qui utilise les 10 chiffres et les 6 premières lettres de l'alphabet, soit 16 informations de base. Nous y reviendrons en étudiant l'image.* 128 64 32 16 8 4 2 1 ----- ---- ---- ---- --- --- --- --- - 11111111 = soit 2EXP8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- - 49 = -- -- -- -- -- -- -- -- -- -- -- -- -- -- - 120 = -- -- -- -- -- -- -- -- -- -- -- -- -- -- **En résumé Qu\'est-ce que la numérisation ?(résumé du VisaTice)** Les nombreux appareils électroniques que nous utilisons sont composés de circuits électroniques. Si on considère que l\'absence ou la présence de courant dans chacun de ces circuits peut être symbolisée par 0 ou 1, **pour être traitable** par un de ces appareils, **une information doit être transformable en une suite de 0 et de 1.** Un système n\'utilisant que deux symboles est appelé « système binaire », alors que notre système à dix chiffres est appelé « système décimal ». **Numériser, c\'est transformer en binaire.** On peut compter en binaire comme en décimal. Une correspondance est facile à établir. Un même nombre s\'écrit plus longuement dans le système binaire que dans le système décimal. **Un chiffre binaire est appelé bit** (contraction de « binary digit »). Ch 2 : Coder l'information : les lettres. ========================================= 1.1 Un peu d'histoire : Premiers pas vers le binaire ---------------------------------------------------- Le code Baudot est un des premiers codes binaires. Inventé par Émile Baudot en 1874, il était utilisé en télégraphie au moyen d\'un clavier à cinq touches. Par conséquent, on pourrait dire que chaque caractère était codé sur cinq bits. ![](media/image2.png)Depuis sa création, l\'alphabet de Baudot a énormément évolué. Dans une de ses versions les plus simplistes, chiffres, lettres et signes de ponctuation se partageaient un code constitué de moins de 30 caractères. [[http://www.techno-science.net]](http://www.techno-science.net/) Grâce à des codes informatifs : les codes 11111 (**Lettre**) et 11011 (**Chiffre**). Ceux-ci indiquaient la colonne à laquelle se référer pour décoder les autres codes. Ainsi, la présence du code 11111 informe que c\'est dans la colonne « Lettre » qu\'il faut trouver les caractères correspondant aux codes qui suivent, et ce jusqu\'à l\'apparition du code 11011. À l'aide du tableau ci-dessus, essayez de décoder la citation de J. Renard. Pour ne pas (trop) vous prendre la tête, tenez compte des quelques recommandations suivantes : - La lecture de la bande se fait de gauche à droite. - Une ligne verticale de cinq cases correspond à un caractère. - La lecture d\'un caractère se fait du bas vers le haut. Pour chaque caractère, le premier bit se situe donc en bas de la ligne verticale. - Le premier caractère est une lettre. Les caractères peuvent être facilement associés à des nombres. **Les textes peuvent** donc aussi **être numérisés.** Toute information doit être numérisée, y compris l\'espace entre deux mots. Pour un système numérique, **l\'espace est** donc **un caractère comme les autres.** 1.2 La réflexion de base ------------------------ - 10 chiffres - 26 lettres minuscules, 26 Majuscules - Quelques caractères spéciaux - Quelques signes de ponctuation Soit 10 + 52 + une vingtaine = +/- 80 signes Le système binaire permet de travailler sur les exposants de 2 : 2\^1 = 2\^2 = 2\^3 = 2\^4 = 2\^5 = 2\^6 = c'est trop court 2\^7 = ok...mais c'est un nombre premier...pas top en math 2\^8 = C'est la solution choisie : toute information numérique s'écrira désormais sur 8 informations binaires. Cette succession s'appellera un **[octet]** ou **[byte]** en anglais. Elle offrira 256 possibilités. Pour en apprendre plus : voir vidéo : « Introduction au langage binaire » 1.3 Le codage de référence -------------------------- - - - 128 = 2\^7 - A = 65 B = 66 - - Comment un ordinateur peut-il classer des informations alphabétiques ? Pense à l'alphabet mais aussi aux minuscules/Majuscules. 3° bit - - - - Les autres caractères #### Le huitième bit[^1^](#fn1){#fnref1.footnote-ref} {#le-huitième-bit} Dans les pays d\'Europe, particulièrement, les alphabets incluent de nombreux caractères accentués, problème auquel les américains ne se sont pas intéressés. Comment s\'en est-on sorti pour coder ces nouveaux caractères ? Pour sauver la situation, il a fallu faire appel à un huitième bit. Notez que, pour des raisons techniques, les ordinateurs travaillaient déjà par paquets de huit bits, le huitième bit n\'étant pas utilisé ou utilisé à d\'autres fins. Il était donc disponible. L\'usage de huit bits a permis de **doubler** le nombre de combinaisons possibles. ------- ---- ---- ---- ---- ---- ---- ---- **0** \* \* \* \* \* \* \* ------- ---- ---- ---- ---- ---- ---- ---- ------- ---- ---- ---- ---- ---- ---- ---- **1** \* \* \* \* \* \* \* ------- ---- ---- ---- ---- ---- ---- ---- ![](media/image4.png) On passe ainsi de 128 à 256 combinaisons. Plus qu\'il n\'en faut pour coder les caractères spéciaux ? Pas sûr, comme nous le verrons plus loin. Mais dans un premier temps, le passage à huit bits a autorisé le codage des caractères accentués d\'un alphabet donné (celui des langues latines, par exemple). #### Le code ISO-8859-1 L\'ASCII huit bits est encore appelé ASCII étendu. Les 128 caractères supplémentaires constituent donc une extension variable selon les langues, les pays dans lesquels elle est utilisée. Le code ISO-8859-1, encore appelé Latin-1, et toujours assez répandu sur le Web, tente de remettre de l\'ordre dans les différentes extensions adoptées dans les pays d\'Europe de l\'ouest. 1.4 S'ouvrir au monde : l'UNICODE ou UTF-8 ========================================== Ces solutions ont permis de progresser dans les pays utilisant l'alphabet latin...mais restaient insuffisantes pour énormément d'autres écritures. Que signifie la phrase suivante sachant qu'elle a été écrite en japonais ? 私はあなたの価格オファーを受け取りました, それは私に合っています, ありがとう, 良い一日を L'unicode permet à tous de s'exprimer ! Il utilise un code de 1 à 4 octets qui permet toutes les écritures reconnues, mais a aussi permis de conserver les documents édités en code d'un octet...à quelques détails près. Nous avons déjà tous rencontré le problème suivant : Comment peux-tu expliquer ce phénomène ? \- les caractères ont été codés sur octet(s) \- puis décodés sur octet(s). Si tu observes le code-source de la plupart des pages web, le terme UTF-8 apparait/ Où ? Montre ci-dessous un « copié-collé » : Tu peux passer aux exercices. 1.5 L\'octet, une unité de mesure --------------------------------- - L\'ensemble des huit bits nécessaires au codage d\'un caractère porte le nom d\'**octet**. - La capacité des différents types de mémoires est exprimée en. octets (o). kilo-octets (Ko ou mille octets) soit 10\^. méga-octets (Mo soit un million d\'octets) soit 10\^. Giga-octets (Go soit un milliard d\'octets) soit 10\^. Tera-octets (To soit un billion d\'octets) soit 10\^ Et après ?. soit 10\^. soit 10\^. soit 10\^ *Rappel : En anglais, **octet** se dit **byte**. Les unités de capacité sont donc KB, MB, GB...* - Insère ici 3 images liées à l'évolution du stockage des données et commente-les. Suite dans les exercices. **En résumé**[^2^](#fn2){#fnref2.footnote-ref} **Le code ASCII à sept bits permet de coder les 128 principaux caractères** : lettres majuscules et minuscules, chiffres, signes de ponctuation... **utilisés en langue anglaise.** Les caractères accentués ne sont pas pris en compte. **Les codes des lettres majuscules sont des nombres inférieurs à ceux des codes des lettres minuscules**, ce qui est important en ce qui concerne l\'ordre alphabétique et donc les tris. **Les codes binaires d\'une lettre majuscule et de sa correspondante en minuscule ne diffèrent que par le troisième bit.** Comme points de repère, le code décimal de la lettre A est 65 et celui de la lettre a est 97. **Le code ASCII étendu à huit bits permet de coder deux fois plus de caractères**, soit 256. Les 128 caractères supplémentaires servent à coder les caractères spéciaux, mais ceux-ci variant d\'une langue à l\'autre, il existe plusieurs extensions. Pour nous, **l\'extension la plus connue et la plus utile est celle du code ISO-8859-1** appelé aussi latin-1 ou Europe occidentale. **Les 256 caractères peuvent être disposés dans un tableau dont les colonnes et les lignes peuvent être numérotées** de 0 à 15 ou, pour ne travailler qu\'avec un seul symbole, numérotées **de 0 à F.** Cette façon de repérer les caractères nous donne une idée de la manière d\'écrire les nombres dans un système hexadécimal (16 symboles). ###### Octet **Un groupe de huit bits porte le nom d\'octet.** Comme l\'octet représente le nombre de bits nécessaires pour coder un caractère, on a pris l\'habitude de mesure la taille des supports d\'information numérique en nombre d\'octets. **On parle de Kilo-octets (Ko), de Méga-octets (Mo), de Giga-octets (Go) ou encore de Terra-octets (To) pour désigner les milliers, millions, milliards ou billions d\'octets.** ###### Unicode Parce que l\'usage d\'Internet et du Web l\'ont rendu nécessaire, **Unicode a la capacité de coder**, non seulement les caractères d\'une langue, mais **tous les caractères de toutes les langues et dialectes écrits de la planète.** **L\'Unicode inclut trois techniques de codage interchangeables dont le plus courant sur le Web et dans l\'usage du courrier électronique est l\'UTF-8.** UTF-8 utilise de un à quatre octets pour coder un caractère. En UTF-8, les caractères de l\'ASCII sept bits sont toujours codés sur un octet, ce qui assure la compatibilité avec une partie très importante de l\'information produite dans le passé. Ch 3 : Le fonctionnement du système. ==================================== 3.1 Architecture générale d'un ordinateur ----------------------------------------- ![](media/image6.png) #### 1. Les périphériques d\'entrée[^3^](#fn3){#fnref3.footnote-ref} {#les-périphériques-dentrée} C\'est sur ces périphériques que l\'unité centrale (2) vient **lire** les informations, autrement dit, les saisir pour les traiter. N\'oublions pas que c\'est le système qui travaille, même si c\'est sous nos ordres. #### 2. L\'unité centrale L\'unité centrale est celle qui communique avec toutes les autres parties du schéma. Si, lorsqu\'elle communique avec les périphériques d\'entrée, on parle de lecture (des informations), lorsqu\'elle communique avec les périphériques de sortie, on parle d\'écriture. #### 3. Les périphériques de sortie C\'est sur ces périphériques que l\'unité centrale va **écrire** les informations, autrement dit, nous les restituer sur un support qui nous permet de les lire. #### 4. Les périphériques d\'entrée/sortie (stockage) Ils permettent de stocker (conserver) l\'information sur un support ou de la récupérer. La différence avec les périphériques qui précèdent, c\'est que l\'information est conservée **sous une forme numérique**, autrement dit pas lisible pour un humain. 3.2 L'unité centrale -------------------- Voici les principaux éléments : donne leur [utilité], une idée de leur [capacité] aujourd'hui ainsi que le nom de l'un ou l'autre [fabricant], ajoute pour chacun une [photo] pour pouvoir identifier le composant : a. Le processeur : b. La carte-mère : c. La mémoire vive ou RAM : d. Le disque dur : e. La carte graphique : f. La carte son : 3.3 Les périphériques --------------------- - Effectue le test : [[http://techno-flash.com/quiz/peripheriques/index.html]](http://techno-flash.com/quiz/peripheriques/index.html) C'est facile ! Mais cela lance la réflexion ! Note ton score : - Sur le site suivant : [[https://www.laptopspirit.fr/guide-des-principaux-ports-presents-sur-votre-pc]](https://www.laptopspirit.fr/guide-des-principaux-ports-presents-sur-votre-pc) , identifie au minimum 6 ports, leur [nom], leur [utilité], une [photo] - Tu peux jeter un coup d'œil aux autres onglets si cela t'intéresse **En résumé Schéma fonctionnel (issu du Visatice)** Le fonctionnement d\'un système informatique peut être décrit comme une suite d\'interactions entre quatre parties importantes : - les**périphériques d\'entrées** via lesquels s\'effectue la numérisation ; - l\'**unité de traitement**, qui contient le processeur et la mémoire centrale que celui-ci exploite pour réaliser les traitements ; - les**périphériques de sortie** via lesquels s\'effectue la conversion analogique ; - les**périphériques d\'entrée/sortie** via lesquels s\'effectuent le stockage, la récupération et la communication de l\'information sous forme numérique. Tout composant d\'un système informatique peut être associé à une de ces quatre parties. L\'unité de traitement est au centre du schéma. Les actions s\'expriment donc par rapport à elle. **On parle de lecture lorsque l\'information transite via les périphériques d\'entrée et d\'écriture lorsque l\'information transite via les périphériques de sortie**. **Les mémoires sont les supports de l\'information numérique. On distingue la mémoire interne**, volatile qui est une mémoire de travail, **des mémoires externes**, non volatiles, et qui sont des mémoires de stockage. La capacité des mémoires s\'exprime le plus couramment en Méga-octets (Mo) ou en Giga-octets (Go). **Le processeur** est le cœur du système. Il **travaille au rythme d\'une horloge qui donne la cadence des centaines de millions**, voire des milliards **de fois par seconde.** La fréquence de **cette horloge s\'exprime donc en Gigahertz (GHz)** ::: {.section.footnotes} ------------------------------------------------------------------------ 1. ::: {#fn1} Source : VISATICE, programme développé par l'Université de Liège[↩](#fnref1){.footnote-back} ::: 2. ::: {#fn2} Ce résumé et les exercices qui suivent sont issus du cours « Traitement de l'information numérique » du programme Visatice.[↩](#fnref2){.footnote-back} ::: 3. ::: {#fn3} Ce résumé est issu du cours de traitement numérique des données du Visatice[↩](#fnref3){.footnote-back} ::: :::

Traitement de l'Information Numérique (TIN) - Cours PDF

Document Details

Tags

Related

Summary

Full Transcript