Bases de données NoSQL et Moteur de Recherche

FeatureRichStatueOfLiberty avatar
FeatureRichStatueOfLiberty
·
·
Download

Start Quiz

Study Flashcards

30 Questions

Quel est l'objectif principal d'Elasticsearch ?

De fournir une recherche rapide et une analyse de données à grande échelle

Quel est le nom du créateur d'Elasticsearch ?

Shay Banon

Quel est le nom du stack qui comprend Elasticsearch, Logstash et Kibana ?

ELK Stack

Quel est le rôle des nœuds dans Elasticsearch ?

De participer au stockage et au traitement des données

Qu'est-ce qu'un index dans Elasticsearch ?

Une collection de documents qui partagent une structure similaire

Quel est le type de licence d'Elasticsearch ?

Licence open-source

Quel est le mcanisme utilis par Lucene pour identifier les documents qui contiennent les termes de la requte ?

Index invers

Quel est le but de la classement des rsultats dans Lucene ?

Classer les rsultats en fonction de leur pertinence

Quel est le format des articles de blog indexs dans Elasticsearch ?

Documents JSON

Quel est le rle des mtriques de similarit dans Lucene ?

Classer les rsultats en fonction de leur pertinence

Quel est le composant sous-jacent d'un shard dans Elasticsearch ?

Index Lucene

Dans quel tape est cr l'index dans Elasticsearch ?

tape 1 : Indexation des donnes

Pourquoi les shards sont-ils utilisés dans Elasticsearch?

Pour permettre une répartition équilibrée des données à travers les nœuds d'un cluster

Quel est l'un des cas d'utilisation d'Elasticsearch?

La recherche textuelle

Qu'est-ce que Elasticsearch permet de faire sur un grand volume de données?

Des recherches rapides et flexibles

Quel est l'avantage d'Elasticsearch pour l'analyse de données?

Sa capacité à traiter des ensembles de données massifs

Quel est l'un des domaines d'application d'Elasticsearch pour le stockage et l'analyse de données?

Le stockage et l'analyse de logs (journaux) et de données de monitoring

Comment sont traités les indexes lors d'une recherche dans Elasticsearch?

En les divisant en fragments appelés shards

Quel format de données sont renvoyés à l'utilisateur en tant que résultats pertinents?

JSON

Quel est le moteur de recherche intégré à Elasticsearch pour effectuer l'indexation et la recherche?

Lucene

Quel est le type de propriété définie lors de la création d'index dans Elasticsearch?

Utilisateurs

Quel est le moyen d'augmenter la pondération d'une propriété lors d'une recherche dans Elasticsearch?

En augmentant la pondération d'une propriété (x3)

Quel est le but des agrégations dans Elasticsearch?

D'extraire des informations récapitulatives et statistiques

Quel est le moyen d'interroger les données dans Elasticsearch lors d'une recherche multiple?

En utilisant l'opérateur OR

Quel est l'objectif principal des agrégations dans les bases de données NoSQL?

D'obtenir des insights approfondis sur les données

Quel type d'agrégation est utilisée pour regrouper les données en fonction d'intervalles de temps spécifiés?

Agrégation de type Date Histogram

Quel est le but de l'agrégation de type Terms?

De compter les occurrences des termes dans un champ

Quel est le but de l'agrégation de type Significant Terms?

De identifier les termes significatifs dans un ensemble de données

Quel est le but de l'agrégation de type Avg?

De calculer la moyenne d'une valeur numérique

Quel est le type d'agrégation qui permet d'obtenir le nombre de films sortis par année?

Agrégation de type Date Histogram

Study Notes

Recherche dans l'Index Inversé

  • Lucene utilise l'index inversé pour identifier les documents qui contiennent les termes de la requête
  • La similarité des documents par rapport à la requête est calculée, souvent en utilisant des modèles de similarité préconfigurés

Les Mécanismes de Recherche

  • Classement des résultats : les résultats de la recherche sont classés en fonction de leur pertinence par rapport à la requête
  • Les métriques de similarité, telles que la fréquence d'apparition des termes, sont utilisées pour déterminer l'ordre des résultats

Fonctionnement d'Apache Lucene

  • Étape 1 : Indexation des données
  • Création de l'index : création d'un index dans Elasticsearch pour stocker les données
  • Indexation des documents : indexation des données en tant que documents JSON dans l'index

Elasticsearch

  • Définition : un moteur de recherche distribué créé en 2010 par Shay Banon
  • Objectif : fournir une recherche rapide et une analyse de données à grande échelle
  • Composants principaux :
    • Noeuds (Nodes) : les instances individuelles d'Elasticsearch qui forment un cluster
    • Index : une collection de documents qui partagent une structure similaire
    • Shards : les index sont divisés en fragments appelés shards, qui sont des unités de base de distribution des données

Cas d'Utilisation

  • Recherche textuelle : Elasticsearch excelle dans la recherche textuelle en permettant des recherches rapides et flexibles sur un grand volume de données
  • Analyse de données : Elasticsearch est largement utilisé pour l'analyse de données en raison de sa capacité à traiter des ensembles de données massifs et de sa structure distribuée
  • Logging et monitoring : Elasticsearch est également un choix privilégié pour le stockage et l'analyse de logs (journaux) et de données de monitoring

Passage à l'Échelle

  • Lorsqu'on fait une recherche sur un index, on le fait sur chaque shard
  • Retour des résultats à l'utilisateur : les résultats pertinents sont renvoyés à l'utilisateur sous la forme de documents JSON

Agrégations

  • Les agrégations dans Elasticsearch permettent d'extraire des informations récapitulatives et statistiques à partir des données stockées
  • Exemples d'agrégations :
    • Agrégation de type Date Histogram
    • Agrégation de type Terms
    • Agrégation de type Significant Terms
    • Agrégation de type Avg
    • Agrégation de type Range

Découvrez les bases de données NoSQL et leur contexte de création, ainsi que les différents types de BD NoSQL tels que Redis, Cassandra et MongoDB. Apprenez également sur les moteurs de recherche distribués comme Elasticsearch.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Use Quizgecko on...
Browser
Browser