Machine Learning en Sentiment Analyse
48 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Waarvoor wordt Sentiment Analyse voornamelijk gebruikt?

  • Het voorspellen van toekomstige gebeurtenissen
  • Het bepalen van de emotionele toon van tekst (correct)
  • Het identificeren van trends in sociale media
  • Het analyseren van websitebezoekers
  • LDA is een techniek die gebruikt kan worden om de frequentie van termen zoals "Cristiano Ronaldo" in een bepaald onderwerp te meten.

    True (A)

    Wat is een belangrijke eigenschap van KNN die het geschikt maakt voor kleine datasets?

    Eenvoud & intuïtief

    Naïve Bayes is een ______ classificatie-algoritme dat ervan uitgaat dat alle kenmerken onafhankelijk van elkaar zijn.

    <p>probabilistisch</p> Signup and view all the answers

    Match de volgende Machine Learning technieken met hun beschrijving:

    <p>KNN = Classificatie van een nieuw datapunt door te kijken naar de k dichtstbijzijnde datapunten in de dataset. Naïve Bayes = Een probabilistisch algoritme met de aanname dat alle kenmerken onafhankelijk van elkaar zijn. Decision Tree = Een boomachtige structuur die beslissingen neemt op basis van inputs om tot eindvoorspellingen te komen.</p> Signup and view all the answers

    Welke van de volgende is NIET een voordeel van neurale netwerken?

    <p>Eenvoud &amp; intuïtie (D)</p> Signup and view all the answers

    Neutrale netwerken zijn ideaal voor kleine datasets en real-time applicaties.

    <p>False (B)</p> Signup and view all the answers

    Wat is een belangrijk nadeel van Deep Learning modellen?

    <p>Black-box model</p> Signup and view all the answers

    Welke techniek is bedoeld voor het verminderen van het aantal kenmerken in data?

    <p>Dimensiereductie (D)</p> Signup and view all the answers

    Classificatie werkt alleen met continue doelvariabelen.

    <p>False (B)</p> Signup and view all the answers

    Wat zijn de 4 V's van big data?

    <p>Volume, Variety, Velocity, Veracity</p> Signup and view all the answers

    Een __________ vermindert de kans dat resultaten door toeval zijn ontstaan.

    <p>statistisch significante uitkomst</p> Signup and view all the answers

    Wat is een voorbeeld van regressie?

    <p>Voorspellen van de prijs van een huis (B)</p> Signup and view all the answers

    Koppel de volgende technieken aan hun beschrijvingen:

    <p>K-Means Clustering = Verdeelt data in k-clusters op basis van gelijkenis Hiërarchische Clustering = Bouwt een boomstructuur van clusters PCA = Projecteert data in lagere dimensies t-SNE = Visualisatie van data in 2D/3D</p> Signup and view all the answers

    Uniforme verdeling betekent dat enkele uitkomsten waarschijnlijker zijn dan andere.

    <p>False (B)</p> Signup and view all the answers

    Hoe verschilt praktische significantie van statistische significantie?

    <p>Praktische significantie beoordeelt de betekenis in de echte context, terwijl statistische significantie aantoont dat resultaten waarschijnlijk niet door toeval komen.</p> Signup and view all the answers

    Wat meet skewness in een verdeling?

    <p>De mate van asymmetrie in de verdeling (D)</p> Signup and view all the answers

    MCAR staat voor 'Missing Completely At Random'.

    <p>True (A)</p> Signup and view all the answers

    Wat is de F1-score?

    <p>Een metric die de afweging tussen precision en recall in balans brengt.</p> Signup and view all the answers

    One-Hot Encoding voorkomt dat het model ten onrechte een __ aan de categorieën toekent.

    <p>rangorde</p> Signup and view all the answers

    Koppel de soorten ontbrekende waarden aan hun beschrijvingen:

    <p>MCAR = Ontbrekende waarde is onafhankelijk van geobserveerde en ontbrekende data MAR = Ontbrekende waarde hangt samen met geobserveerde data MNAR = Ontbrekende waarde is gerelateerd aan de ontbrekende waarden zelf</p> Signup and view all the answers

    Wat doen Label Encoding en One-Hot Encoding?

    <p>Ze transformeren categorische gegevens naar een numeriek formaat (D)</p> Signup and view all the answers

    Spurious Correlation verwijst naar een echte relatie tussen twee variabelen.

    <p>False (B)</p> Signup and view all the answers

    Wat geeft een ROC-curve weer?

    <p>De prestaties van een classificatiemodel bij verschillende drempelwaarden.</p> Signup and view all the answers

    Wat is de primaire functie van een Convolutional Neural Network (CNN)?

    <p>Beeldherkenning en -verwerking (D)</p> Signup and view all the answers

    Recommender Systems (RecSys) kunnen alleen content-gebaseerde aanbevelingen doen.

    <p>False (B)</p> Signup and view all the answers

    Wat zijn de twee soorten relaties die in Machine Learning worden onderscheiden?

    <p>Sequentiële en semantische relaties</p> Signup and view all the answers

    Natural Language Processing (NLP) analyseert menselijke __________ data.

    <p>tekstuele</p> Signup and view all the answers

    Koppel de volgende technieken van Natural Language Processing aan hun beschrijvingen:

    <p>Sentimentanalyse = Bepalen van emoties in teksten Topic modelling = Identificeren van thema's in tekst Tekstclassificatie = Categoriseren van tekstuele data Entiteitenherkenning = Herkennen van naamwoorden en entiteiten</p> Signup and view all the answers

    Welk voorbeeld past bij een hybride recommender system?

    <p>Een gebruiker leest een artikel en krijgt aanbevolen wat populaire gebruikers lezen. (C)</p> Signup and view all the answers

    Large Language Models (LLM) kunnen alleen antwoorden geven op directe vragen.

    <p>False (B)</p> Signup and view all the answers

    Wat is het doel van Machine Learning?

    <p>Patronen en relaties herkennen in data om beslissingen of voorspellingen te maken.</p> Signup and view all the answers

    Wat is de belangrijkste eigenschap van de normale verdeling?

    <p>Het is symmetrisch en gecentreerd rond het gemiddelde. (C)</p> Signup and view all the answers

    De Poisson-verdeling modelleert de frequentie van een gebeurtenis in een vaste tijdsperiode.

    <p>True (A)</p> Signup and view all the answers

    Wat is de functie van K-mean clustering?

    <p>K-mean clustering groepeert data en minimaliseert variantie.</p> Signup and view all the answers

    De standaarddeviatie is de __________ van de variantie.

    <p>vierkantswortel</p> Signup and view all the answers

    Match elke verdeling met hun beschrijving:

    <p>Normale verdeling = Symmetrisch en centraal rond het gemiddelde Bernoulli-verdeling = Binaire uitkomsten zoals 0 of 1 Binomiale verdeling = Meerdere Bernoulli-proeven Exponentiële verdeling = Tijd tussen gebeurtenissen</p> Signup and view all the answers

    Wat beschrijft het doel van cross-validatie in machine learning?

    <p>Het minimaliseren van overfitting en evalueren van modelprestaties. (D)</p> Signup and view all the answers

    K-Fold Cross-Validation valt onder de technieken om overfitting te reduceren.

    <p>True (A)</p> Signup and view all the answers

    Wat is de rol van Latent Dirichlet Allocation (LDA)?

    <p>LDA modelleert automatisch onderwerpen in een tekstverzameling.</p> Signup and view all the answers

    Welke van de volgende technieken wordt vaak gebruikt voor binaire classificatieproblemen?

    <p>Logistische regressie (A)</p> Signup and view all the answers

    Unsupervised Learning gebruikt gelabelde data om patronen te vinden.

    <p>False (B)</p> Signup and view all the answers

    Noem twee belangrijke stappen die je onderneemt in het voorbewerkingsproces van data.

    <p>Opschonen van data en normaliseren van data.</p> Signup and view all the answers

    ____-learning is het paradigma waarbij een model leert van gelabelde data.

    <p>Supervised</p> Signup and view all the answers

    Koppel de volgende termen aan hun beschrijvingen:

    <p>Lineaire regressie = Voorspelt een continue output Logistische regressie = Gebruikt voor binaire classificatie Support Vector Machines = Vindt de optimale grens tussen klassen Neurale netwerken = Complexe modellen voor grote datasets</p> Signup and view all the answers

    Wat is het doel van Exploratory Data Analysis (EDA)?

    <p>Patronen en trends in datasets begrijpen (B)</p> Signup and view all the answers

    Neurale netwerken zijn niet geschikt voor complexe datasets.

    <p>False (B)</p> Signup and view all the answers

    Wat is een voorbeeld van een evaluatiemetric die gebruikt kan worden bij modelevaluatie?

    <p>F1-score</p> Signup and view all the answers

    Study Notes

    Praktische vragen - Exploratieve data-analyse

    • Vraag 1: Leg uit waarom specifieke variabelen zijn gekozen voor het maken van grafieken, tabellen en statistieken. Beschrijf de onderlinge relaties tussen de variabelen.
    • Vraag 2: Beschrijf problemen die zijn opgetreden bij het gebruik van een CSV dataframe. Geef gedetailleerd aan wat er is gedaan om die problemen op te lossen.
    • Vraag 3: Kies twee paren van twee variabelen die mogelijk gerelateerd zijn aan beroertes. Leg uit waarom deze paren zijn gekozen en hoe de resultaten zijn berekend. Geef gedetailleerde uitleg.
    • Vraag 4: Benoem extra variabelen die in overweging zijn genomen. Leg uit wat criteria is gebruikt en hoe de andere drie variabelen (buiten het gekozen paar) verder zijn geanalyseerd. Interpreteer de resultaten.

    Training en evaluatie van modellen

    • Vraag 5: Beschrijf de stappen die zijn gezet om een model te trainen en evalueren. Geef de gebruikte aanpak en de redenen voor modelkeuzes. Geef ook de gebruikte evaluatiemethoden aan en leg uit waarom ze zijn gekozen.
    • Vraag 6: Geef gedetailleerde aanwijzingen voor de stappen van voorbewerking, verwerking en nabewerking. Licht toe waarom deze stappen zijn uitgevoerd.
    • Vraag 7: Beschrijf wat er gebeurt in elke stap van de bewerkingsprocessen met de code. Leg ook de verwachte uitvoer van die processen uit.

    Theorie vragen

    • Welke soorten data bestaan er?
    • Numerieke data: Numerieke waarden
    • Discreet: Data die geteld kan worden
    • Continu: Data die gemeten kan worden
    • Categorische data: Kwalitatieve data (categorieën)
    • Nominaal: Data met labels die geen volgorde hebben (bijvoorbeeld man/vrouw)
    • Ordinaal: Data met labels die wel een volgorde hebben (bijvoorbeeld laag/medium/hoog)
    • Wat is data-analyse (DA)?
    • Begrijpen van patronen en trends in gegevenssets (datasets).
    • Gebruikt voor diverse doelen, bijvoorbeeld menselijk gedrag, marketing, auto-verkoop etc.
    • Kun je Supervised Learning uitleggen, inclusief voorbeelden en algemene technieken?
    • Kun je Unsupervised Learning uitleggen, inclusief voorbeelden en algemene technieken?
    • Hoe kunnen input en outputs tot nieuwe, ongeziene data geleid worden voor predicties en wat zijn de voorbeelden.

    Vragen over het gebruik van specificieke technieken

    • Vraag 8: Wat is de conclusie van het onderzoek en wat is de kans op beroerte?
    • Bepaal wat Classificatie & Regressie is voor Supervised Learning.
    • Uitleg over wat een continue en discrete doelvariabele is.
    • Uitleg over wat Lineaire Regressie is, wat het doet en wat de Voorbeelden zijn.
    • Uitleg over wat een t-test is en wat de toepassingen zijn.
    • Uitleg over de verschillende typen verdelingen (inclusief uniforme, normale, poisson, exponentiële, Bernoulli, binomiale verdelingen) en de verschillen daartussen.
    • Uitleg over het begrip Statistical significantie en praktische significantie, inclusief een voorbeeld.
    • K-means clustering uitleggen en voorbeeld geven.
    • Uitleg over t-SNE, Association Rule Mining, Autoencoders.
    • Uitleg over MAD (Mean Absolute Deviation), Variance, en Standard Deviation.
    • Uitleg over Cross-validatie, Leave-One-Out cross-validation.
    • Uitleg over LDA (Latent Dirichlet Allocation).
    • Uitleg over Sentimentanalyse en voorbeelden hiervan.
    • KNN (K-Nearest Neighbor) uitleggen.
    • Naïve Bayes uitleggen.
    • Bespreking van Train, Validation en Test modellen: uitleggen van het gebruik van deze modellen in Machine Learning.
    • Uitleg over Decision Tree's
    • Uitleg over Neural Networks, inclusief voor- en nadelen, verschillende soorten neural networks en de context voor hun gebruik.
    • Uitleg over Graph Neural Networks.
    • Uitleg over Natural Language Processing (NLP), incluis de technieken.
    • Uitleg over Recommender Systems (RecSys), inclusief de verschillende typen.
    • Uitleg hoe sequentieel en semantische relaties verwant zijn.
    • Uitleg over logististische regressie.
    • Uitleg over Random Forest Algorithmen.
    • Uitleg over statistische significantie en p-waarden.
    • Uitleg over Hypothesetoets.
    • Uitleg over Support Vector Machines (SVMs).
    • Uitleg over de verschillende typen ontbrekende gegevens met voorbeelden.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Exam Practice DAML PDF

    Description

    Test je kennis over de toepassingen van sentiment analyse en verschillende machine learning technieken. Dit quiz omvat belangrijke algoritmen zoals KNN en Naïve Bayes, en behandelt de voor- en nadelen van neurale netwerken. Ontdek ook de concepten van big data en classificatie.

    Use Quizgecko on...
    Browser
    Browser