RŽponses Exam Codage PDF
Document Details
Uploaded by PrivilegedChrysoprase9763
Université Libre de Bruxelles
Raya Younoussova
Tags
Summary
Ce document contient les rŽponses ˆ un examen de codage, et aux questions dÕintroduction aux humanitŽs numŽriques de l'UniversitŽ Libre de Bruxelles. Il contient des questions sur des sujets comme les codes ASCII et les donnŽes RDF.
Full Transcript
lOMoARcPSD|20640423 Reponses exam codage Introduction aux humanités numériques (Université Libre de Bruxelles) Scanne pour ouvrir sur Studocu Studocu n'est pas sponsorisé ou supporté par une université ou un lycée...
lOMoARcPSD|20640423 Reponses exam codage Introduction aux humanités numériques (Université Libre de Bruxelles) Scanne pour ouvrir sur Studocu Studocu n'est pas sponsorisé ou supporté par une université ou un lycée Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Questions dÕexams en info - rŽponses 1. ASCII ne permet pas de coder plus de 128 caract res. 2. ASCII ne permet pas de coder les lettres accentuŽes du fran ais. 3. Encoder une chaine de caract res avec ASCII revient ˆ concat nera les codages binaires de chacun des caract res. 4. Il est possible dÕŽcrire nÕimporte quel nombre entier en binaire. 5. ASCII est code sur 7 bits et ÇbricolŽÈ en 8 bits par lÕajout dÕun 0. 6. Dans le mod le tabulaire par ex, les enregistrements ne re oivent pas forcŽment dÕidentiÞants 7. Un triplet RDF valide doit tre de la forme (sujet, prŽdicat, objet), et ÇbleuÈ nÕest pas un prŽdicat. 8. Le mod le des donnŽes utilisŽ par un ensemble de donnŽes est un choix rŽversible, il est toujours possible de passer dÕun modele de donnŽes ˆ lÕautre. 9. Si le but est de publier les donnŽes sur le Web, RDF nÕest pas idŽal. 10. Certains graphes (au sens de lÕobjet mathŽmatique constituŽ de sommets et dÕar tes) ne peuvent pas tre utilisŽs pour reprŽsenter une base de donnŽes organisŽe selon le mod le hiŽrarchique. 11. Les images scannes utilisent le plus souvent des formats matriciels pour numŽriser leurs documents. 12. Une image vectorielle nÕest pas constituŽe de pixels. 13. Il y a 2 12(exposant)=4096 fois plus de couleur dans le codage RGB 24 bits 14. La double opŽration qui consiste 1. En la conversion dÕune image TIFF en image JPEG, puis 2. En la re-conversion de lÕimage rŽsultante JPEG en image TIFF fait perdre de la qualitŽ ˆ lÕimage ˆ laquelle elle est appliquŽe. 15. Dans le logiciel WYSIWYM, cÕest possible de faire en sorte que le titre dÕun document apparaisse en italique soulignŽ. 16. La fa on dont un XML est produit est propre au logiciel et ˆ sa version. 17. Un utilisateur de LaTeX se concentre sur le markup et pas le make-up. 18. Dans un logiciel WYSIWYM, tous les titres des sections dÕun document ont a priori la m me apparence. 19. Pour Žcrire une th se de doctorat, il est conseillŽ dÕutiliser un logiciel WYSIWYM plut™t quÕun logiciel WYSIWYG. 20. UF: used for - NT: narrower term 21. Certaines recettes de cuisines contiennent des instructions imprŽcises comme Çajoutez tel ingredients ˆ lÕenviÈ donc ce nÕest pas toujours des algorithmes. 22. Nous avons vu plusieurs fa ons dÕattŽnuer les effets lors dÕune recherche dÕinfo. 23. Un language de balisage peut tout ˆ fait faire usage dÕune telle balise (compter parmi ses balises une balise signalŽe par la chaine de caract re Et), mais cÕest Žvidemment une catastrophe sÕil sÕagit de modŽliser du texte pouvant contenir cette chaine de caract re. Si on image un language de balisage appliquŽ ˆ des ensemble de chiffres par ex, ne pose aucun probl me. 24. Si elles sont bien rŽdigŽes, les instructions de montage dÕun meuble IKEA forment un algorithme. Concernant la paternitŽ des oeuvres de Moli re: 1. LÕoutput de lÕalgorithme de partitionment est en plusieurs partitionment. 2. LÕordre des mots nÕest pas utilisŽ par les auteurs. 3. Si les auteurs avaient travaillŽ sur des traductions des pi ces de thŽ‰tre de Moli re en anglais, ils nÕauraient pas obtenu exactement les m mes rŽsultats. 4. Dans un dendogramme, le placement des ŽlŽments sous les racines de lÕarbre (c-a-d lÕordre dans lequel les pi ces de thŽ‰tre apparaissent, dans les graphiques de lÕarticle) est seulement esthŽtique (il vise ˆ amŽliorer la lisibilitŽ du graphique), et ne signiÞe rien en soi. 5. Pour fonctionner, lÕalgorithme de partitionment hiŽrarchique a seulement besoin des distances entre les objets quÕon lui demande de regrouper. Concernant le th me de lÕEurope dans les discours prŽsidentiels: 1. Aucune info sur les dates des discours, et donc sur lÕordre au sein des mandats nÕest utilisŽe. 2. Un indice de Lafon positif signiÞe que le mot apparait plus chez ce prŽsident-lˆ que chez les autres, il nÕest donc pas possible quÕil soit positif pour tous les prŽsidents. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 3. Les co-occurents ne dŽpendent que des textes du prŽsident en question. 4. LÕindice de Lafon indique si le ot apparait plus chez ce prŽsident-lˆ que chez les autres, donc la modiÞcation de ce que Çles autresÈ signiÞe a un impact. 5. Ces deux indicateurs signiÞent la m me chose: Mitterand utilise beaucoup le mot (biplot) par rapport aux autres prŽsidents. Concernant lÕidentiÞcation des scribes des manuscrits mŽdiŽvaux: 1. Dans le contexte de cet article, la procŽdure de validation croisŽe a pour objectif dÕestimer lÕefficacitŽ de la mŽthodologie en ÇsimulantÈ lÕexistence de fragments orphelins. 2. La mŽthodologie dÕattribution automatique attribue dÕabord les manuscrits, les lettres puis les pages. 3. Toute la mŽthodologie est basŽe sur la reprŽsentation des ÇlettresÈ par des matrices en divisant les rectangles de pixels correspondants en des matrices dont les dimensions sont toujours les m mes. 4. cÕest pcq la mŽthode mise en oeuvre pour reconnaitre les scribes est trop compliquŽe pour que les humains se forgent une intuition ˆ propos de ses rŽsultats que lÕauteur de lÕarticle a produit des pages html prŽsentant les couples de lettres les plus proches lÕune de lÕautre. ------- Concernant lÕanalyse spatiale des citŽs Žtrusques: 1. Il existe des zones tampons. 2. La courbe rang-taille est signiÞcativement convexe. 3. Chaque point est situŽ dans une et une seule cellule, et les points-bases sont Žvidemment situŽs dans la leur. 4. Si la mŽtrique A=Aexposant1 - Aexposant2 dÕune courbe rang-taille est positive, on sÕattend ˆ ce quÕil y ait un nombre important de sites de grande taille. 5. B vaut 0 si la rŽpartition est uniforme. Concernant lÕarticle de lÕanalyse des valeurs morales: 1. Partitionner signiÞe regrouper les sommets. 2. Si la position des sommets ne transporte gŽnŽralement pas dÕinformation en soi, elle permet de visualiser le graphe dÕune certaine fa on, et donc de capter certains phŽnom nes. 3. CÕest principalement pour visualisŽ les relations entre les valeurs morales que les auteurs de lÕarticle ont recours ˆ lÕanalyse des rŽseaux. 4. Il a fallu que les chercheurs extraient manuellement les mots qui dŽsignent les valeurs, etc. 5. Les auteurs ont dŽcidŽs quÕune ar te relierait les valeurs A et B si celles-ci sont mentionnŽes dans la m me notice nŽcrologique. 1. Certaines licences libres sont payantes. 2. Certaines licenses, par exemple CC0, permettent tout (mais certaines interdisent dÕen faire un usage commercial). 3. Shakespeare est mort depuis suffisamment longtemps pour que son oeuvre soit dans le domaine publique. (Donc ses oeuvres ne sont pas soumises ˆ des droits dÕauteurs). 4. Il existe certaines exceptions au droit ˆ lÕimage. 5. Quand il sÕagit dÕun personnage publique pas de proc s aux biographes depuis lÕentrŽe en vigueur du RGPD. 6. Lors de la confection dÕun thesaurus sur le th me des fruits comestibles et sur base des mots {lŽgumes, aliment, pomme, sucre}, quelles lignes parmi les suivantes pourraient faire partie du dictionnaire? - RT : lŽgumes - BT : aliment 1. LÕabsence de schŽma dans un document XML le rend ptt difficile ˆ interpreter par un humain, mais ne le rend pas invalide pour un ordinateur. 2. Dans un language balisŽ, la balise fermante doit obligatoirement tre Žgale ˆ la balise ouvrante, avec un caract re Ô/Ô FAUX car ce nÕest pas le cas pour LaTeX. 3. LÕhypoth se du monde clos est propres aux mod les tabulaire, relationnel et hiŽrarchique. 4. A la difference de XML, RDF nÕest gŽnŽralement pas utilisŽ pour Žditer des documents historiques. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 5. Le plus souvent, encoder des donnŽes selon le mod le relationnel prend moins dÕespace disque quÕencoder les m mes donnŽes selon le mod le tabulaire. 6. Pour les musŽes: les photos et scans sont des images matricielles. 7. Pas impossible dÕencoder la couleur rose dans le mod le de couleur RGB car le rose peut sÕobtenir par un mŽlange trois couleurs. 8. Le format docx est un format propriŽtaire, qui nÕest devenu un standard que parce que Microsoft Office est tr s rŽpandu. 9. Certaines images peuvent tre compressŽes plus efficacement que dÕautres. 10. La rŽsolution nÕa pas de sens pour une image vectorielle. Téléchargé par Raya Younoussova ([email protected])