TRAN B300 Exam Humanités Numérique PDF
Document Details
![PrivilegedChrysoprase9763](https://quizgecko.com/images/avatars/avatar-12.webp)
Uploaded by PrivilegedChrysoprase9763
Université Libre de Bruxelles
Raya Younoussova
Tags
Related
- Theme 5: Opportunities and Challenges of Data in Repositories PDF
- Introduction to Digital Humanities PDF
- Introduction to Digital Humanities PDF
- Postgraduales Fernstudium Elektronisches Publizieren und Open Access PDF
- Tranb 300 Synthèse - January 2024 Exam - PDF
- Antwoorden Vragen Inleiding tot de Digitale Tekstanalyse PDF
Summary
This document is a past paper for a TRAN B300 course on digital humanities at Université Libre de Bruxelles. It includes questions on database design, particularly for archaeological data and digital humanities topics. The summary highlights the topics of data models like RDF, relational models and potential uses for museums and academic research.
Full Transcript
lOMoARcPSD|20640423 TRAN B300 prépa exam humanité numérique Introduction aux Humanités Numériques (Université Libre de Bruxelles) Scanne pour ouvrir sur Studocu Studocu n'est pas sponsorisé ou supporté par une université ou un lycée...
lOMoARcPSD|20640423 TRAN B300 prépa exam humanité numérique Introduction aux Humanités Numériques (Université Libre de Bruxelles) Scanne pour ouvrir sur Studocu Studocu n'est pas sponsorisé ou supporté par une université ou un lycée Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Examen d’Introduction aux Humanités numérique Q1 : Vous êtes chargé de mettre au point une base de données archéologique destinée à être publiée sur le Web à destination des chercheurs. Elle reprend des données qui décrivent un ensemble de campagnes de fouilles effectuées sur des sites différents, où ont été mises à jour des objets variés analysés sous des angles très divers (dimension, datation, matériau, usage, etc.) Parmi les quatre modèles de données vu au cours, quels sont les deux qui vous semblent les plus appropriés ? Justifiez en détails votre choix, et expliquez sous quels points de vue chacun de ces deux modèles est mieux adapté. Eléments composant une réponse correcte - RDF et schéma relationnel Pour chaque modèle choisi : Description/fonctionnement Avantages et inconvénients par rapport à différents paramètres : o Partage/interopérabilité o Solidité/maturité o Notion de monde clos/monde ouvert Notion de monde clos/monde ouvert explicitée et appliquée aux modèles Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Q1 : Une base de données contenant les particularités des patois parlés par la communauté germanophone de la Belgique est créée par un linguiste. Elle décrit un certain nombre de caractéristiques de ces langues, mais est amenée à recueillir d’autres propriétés de celle-ci dans les années à venir, lorsque les recherches du linguiste auront progressé. Parmi les quatre modèles de données vus au cours, quels sont les deux qui vous semblent les plus appropriés ? Justifiez en détails votre choix, et expliquez sous quels points de vue chacun de ces deux modèles est mieux adapté. Eléments composant une réponse correcte - RDF et modèle hiérarchique Pour chaque modèle choisi : Description/fonctionnement Avantages et inconvénients par rapport à différents paramètres : o Partage/interopérabilité o Solidité/maturité o Adaptabilité : Notion de monde clos/monde ouvert Notion de monde clos/monde ouvert explicitée et appliquée aux modèles Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Q1 : Vous êtes directeur d’un musée et décidez de construire une base de données reprenant les renseignements liés aux dons effectués à votre institution ? Les informations qui y seront stockées sont bien circonscrites : identité du donateur, moyens de contact, structure légale, type de don (unique ou régulier), montant, date et degré d’anonymat désiré par le donateur. Votre collaboration propose d’utiliser le modèle RDF pour ce faire. Est-ce une bonne idée ? Existe-t-il un modèle de données mieux adapté. Justifiez complètement votre réponse. Eléments composant une réponse correcte - Par rapport à RDF : o Description/fonctionnement du modèle, en quoi consiste-t-il ? o RDF pourrait convenir mais peut sembler superflu / trop complexe à mettre en œuvre dans la mesure ou la masse de donnée à traiter est réduite. o RDF présente néanmoins au moins un avantage principal : monde ouvert par rapport au monde fermé des bases de données. - Suggestion de solution plus adaptée : Solution préférentielle : modèle entité-relations : o Description/fonctionnement nécessaire o Avantage principal : facilite la gestion des moyens et grands volumes de données et adaptabilité dans le temps o Désavantage : complexité de la définition du modèle sous-jacent et monde fermé. - Suggestion de solution plus adaptée : Solution préférentielle : modèle entité-relations : o Description/fonctionnement nécessaire o Avantage : simplicité pour de petits volumes de données non complexes o Désavantage : monde fermé et difficulté de mise à jour en présence de masse de données plus importante. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Q2 : Vous êtes conservateur du département « manuscrits » d’une bibliothèque nationale, et chargé de définir les grandes lignes d’un projet de numérisation qui vient de recevoir un financement. Expliquez en détails comment vous sélectionnez les manuscrits à numériser, en parlant de l’origine possible des fonds obtenus (pv, publique) des objectifs d’une telle institution culturelle et des éventuelles contraintes légales qui doivent être respectées. Eléments composant une réponse correcte : Objectif poursuivis par une telle institution : conservatrice + partage Critère de choix o Scan on demand o En fonction du projet de recherche o En fonction de l’état des ouvrages Mode de financement : o Enoncer les trois possibilités : privé, public, hybride o Mentionner que si l’institution est en Europe, ce seront sans doute des fonds publics (mais pas forcément/obligatoirement) o Développer l’impact du mode de financement sur le choix des ouvrages à numériser Cadre légal : o Lois/règlements concernés : droit d’auteur, vie pv, etc. o Pour chaque loi/règlement, quels sont les points d’attention Pour les meilleures copies : grandes étapes du projet de numérisation (+sous-traitance : avantages/inconvénients pour aller plus loin). Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Q2 : Un nouveau fonds vient d’être créé au sein d’un centre d’archive, à la suite du renversement par les autorités russes d’un nombre important de document (écrits et photographiques) relatifs à la Belgique produits à la fin de la Guerre Froide (années 1980). Un financement est obtenu pour numériser et publier ces archives sur le Web. Expliquez en détails comment vous sélectionnez les documents à numériser, en parlant de l’origine possible du financement obtenu (pv, et publique) des objectifs d’une telle institution culturelle et des éventuelles contraintes légales qui doivent être respectées. Eléments composant une réponse correcte : Objectif poursuivis par une telle institution : conservatrice (du patrimoine) + mise à disposition Critère de choix o Scan on demand o Utilité directe des documents en fonction du projet de recherche o L’état des ouvrages/documents (matériau ?) o Evoquer les biais que cela peut introduire Mode de financement : o Enoncer les trois possibilités : privé, public, hybride o Mentionner que si l’institution est en Europe, ce seront sans doute des fonds publics (mais pas forcément/obligatoirement) o Développer l’impact du mode de financement sur le choix des ouvrages à numériser o Lien entre l’origine du financement et la sélection des documents Cadre légal : o Lois/règlements concernés : droit d’auteur, vie pv, etc. o Pour chaque loi/règlement, quels sont les points d’attention Pour les meilleures copies : grandes étapes du projet de numérisation (+sous-traitance : avantages/inconvénients pour aller plus loin). Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Q2 : Vous êtes linguistes, et ramener d’une mission de recherche de l’autre côté de la planète une série d’enregistrements que vous avez effectués de conversation dans des langues que vous étudiez. Il s’agit de témoignages essentiels de la façon dont sont prononcés ces langues encore très mal connues, peu répandues et qui disparaîtront peut-être un jour. Vous décidez donc de publier ces enregistrements sur Internet. Comment vous y prenez-vous ? A quels éléments faut-il faire attention ? De quelles informations les accompagnez- vous ? Quelles conventions suivez-vous sur cet aspect ? Expliquez en détails pourquoi. Eléments composant une réponse correcte : Cadre légal : o La question des droits (protection des données à caractères personnels, auteur, etc…) o La question de la gestion des droits d’accès / téléchargement en mettant en balance les droits d’auteurs/vie pv et la nécessité du libre accès pour des données patrimoniales. Accompagner les données de métadonnées : o Proposer un standard existant opportun pour les fichiers audios ou, à défaut, o Proposer le Dublin Core Qualité des fichiers → compression ? L’endroit de stockage qui nécessite un accès pérenne (données patrimoniales). Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 1. Parmi les propositions suivantes, lesquelles sont vraies ? - Le présent questionnaire est encodé en utilisant ASCIL FAUX : par exemple ASCII ne permet pas de coder les lettres accentuées du français. - Encoder une chaîne de caractères avec ASCII revient à sommer les codes ASCII de chacun des caractères. FAUX : cela revient à concaténer (mettre côte à côte) les codages binaires de chacun des caractères. - Le caractère A a reçu la place n°65 dans la liste des codages ASCII parce qu’il n’est pas possible d’écrire un nombre plus petit que 65 en binaire. FAUX : il est possible d’écrire n’importe quel nombre entier en binaire - ASCII ne permet pas de coder plus de 128 caractères VRAI : ASCII est codé sur 7 bits (et 2^7 = 128), et « bricolé » en 8 bits par l’ajout d’un 0. - Lorsqu’un ordinateur lit un fichier ASCII, il regroupe les bits par « paquets » de huit. VRAI : ASCII est codé sur 7 bits (et 2^7 = 128) et « bricolé » en 8 bits par l’ajout d’un 0. Qu’est-ce que l’ASCII ? - Un logiciel de rédaction WYSIWYM – FAUX - Un algorithme d’apprentissage supervisé qui est souvent utilisé en HN FAUX - Un protocole de communication FAUX - Un type de processeur FAUX - Une norme de codage de caractères VRAI Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 2. Parmi les propositions suivantes, lesquelles sont vraies ? - Dans tous les modèles de données, il est requis que chaque enregistrement reçoive un identifiant unique. FAUX : dans le modèle tabulaire par exemple, les enregistrements ne reçoivent pas forcément d’identifiant. - Le triplet {vélo ; bleu ; pratique} est un exemple de triplet RDF valide. FAUX : un triplet RDF valide doit être de la forme (sujet, prédicat, objet) et « bleu » n’est pas un prédicat. - Pour un même ensemble de données, il est toujours possible de passer d’un modèle de données à l’autre VRAI : le modèle de données utilisé pour un ensemble de données est un choix réversible. - Si le but est de publier les données sur le Web, RDF n’est pas toujours le meilleur choix. VRAI : il existe des contextes dans lesquels RDF n’est pas idéal : ensembles de données très simples, secteurs à haut risque, … - Certains graphes (au sens de l’objet mathématique constitué de sommet et d’arêtes) ne peuvent pas être utilisés pour représenter une base de données organisée selon le modèle hiérarchique. VRAI : certains graphes possèdent des cycles, c-a-d des chemins d’arêtes partant d’un sommet et revenant à ce sommet ; ceux-là ne peuvent pas représenter des données dans le modèle hiérarchique. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Quels triplets parmi les suivants sont des triplets RDF valides (cad obéissant aux règles de définition/composition des triplets RDF) ? - {Beethoven ; a composé ; la chanson Alors on danse} VRAI - {mon chien ; gentil ; obéissant} FAUX - {Mona Lisa ; a été peinte par ; Léonard de Vinci} VRAI - {Léonard de Vinci ; a peint ; Mona Lisa} VRAI - {Mona Lisa ; est une peinture ; est conservée au Louvre} FAUX Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 3. Parmi les propositions suivantes, lesquelles sont vraies ? - Les centres d’archives utilisent le plus souvent des formats vectoriels pour numériser leurs documents FAUX : les images scannées utilisent le plus souvent des formats matriciels. - Une image vectorielle est constituée de beaucoup plus de pixels qu’une image matricielle. FAUX : une image vectorielle n’est pas constituée de pixels. - Il y a deux fois plus de couleurs différentes dans le codage RGB 24 bits que dans le codage RGB 12 bits. FAUX : il y a 2^12 = 4096 fois plus de couleurs - La place occupée sur le disque par n’importe quelle image peut être réduite en utilisant une méthode de compression. FAUX - La double opération qui consiste 1. en la conversion d’une image TIFF en image JPEG, puis 2. en la reconversion de l’image résultante JPEG en image TIFF fait perdre la qualité à l’image à laquelle est appliquée. VRAI : la compression du format JPEG se fait avec perte. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 Parmi les propriétés suivantes, lesquelles sont des avantages du modèle hiérarchiques ? - Il rend les données faciles à partager sur le Web - Il ne pose aucun problème de comptabilité technique - Il rend efficace la recherche au sein des données. - Il permet toujours d’adapter facilement la base de données lorsqu’apparaissent de nouvelles variables à intégrer. - L’offre de logiciels pour le mettre en œuvre est très satisfaisante en termes d’efficacité. (Toutes les réponses sont discutables) Parmi les propositions suivantes, lesquelles sont vraies ? - Les musées d’art ont généralement tendance à utiliser des images vectorielles pour présenter des reproductions de leurs collections en ligne FAUX : les photos et les scans sont des images matricielles - Comme il ne s’agit pas d’un mélange de rouge, de vert et de bleu, il n’est pas possible d’encoder du rose sur le modèle RGB. FAUX : le rose peut s’obtenir comme un mélange des trois couleurs (ajouter le même nombre aux codes des trois couleurs éclaircit une couleur donnée). - Le modèle docx est un format propriétaire, qui n’est devenu un standard que parce que Microsoft Office est répandu. VRAI - Si A et B sont deux fichiers images quelconques, alors l’application d’une méthode de compression sur A et B fera forcément diminuer les tailles de A et de B dans les mêmes proportions. FAUX : certaines images peuvent être compressées plus efficacement que d’autres. - Toutes les images vectorielles ont une résolution de 300 dpi. FAUX : la résolution n’a pas de sens pour une image vectorielle. Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 A quoi servent les espaces de noms (namespace) en XML ? - Ils stockent tous les noms propres de la base de données. FAUX - Ils permettent de générer très facilement un index des données. FAUX - Ils facilitent l’utilisation de balises créées par d’autres utilisateurs. VRAI - Ils permettent d’utiliser des balises ayant a priori des noms identiques mais provenant de schémas différents. VRAI - Ils permettent de créer des contraintes très flexibles sur la forme des données qui peuvent figurer dans la base. FAUX Parmi les propositions suivantes, lesquelles sont vraies ? - L’absence de schéma dans un document XML le rend peut-être difficile à interpréter par un humain, mais ne le rend pas invalide pour un ordinateur. VRAI - Dans un langage balisé, la balise fermante doit obligatoirement être égale à la balise ouvrante avec un caractère « / » en plus. FAUX : ce n’est pas le cas e.g. de LaTeX - L’hypothèse du monde clos est propre au modèle tabulaire et relationnel. FAUX : c’est aussi le cas du modèle hiérarchique - A la différence de XML, RDF n’est généralement pas utiliser pour éditer des documents historiques. VRAI - Le plus souvent, encoder des données selon le modèle relationnel prend moins d’espace disque qu’encoder les mêmes données selon le modèle tabulaire. VRAI : moins de redondances Téléchargé par Raya Younoussova ([email protected]) lOMoARcPSD|20640423 4. En partant de la définition du prédicat RDF donnés ci-dessous, quels triplets parmi les suivants peuvent être inférés par l’ordinateur ? Définition : @prefix ex :. @prefix rdf :