Supervised Learning Quiz

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

ఎలాంటి dataset ను labelled dataset అంటారు?

  • మాత్రం ప్రవేశం పారామీటర్లను కలిగి ఉన్న dataset
  • మాత్రం అవుట్‌పుట్ పారామీటర్లను కలిగి ఉన్న dataset
  • ఊహాప్రాయం డేటాసెట్
  • ప్రవేశం మరియు అవుట్‌పుట్ పారామీటర్లను కలిగి ఉన్న dataset (correct)

Supervised learning లో, మోడల్ నేర్పించడానికి డేటా అవసరం లేదు.

False (B)

సూపర్వైజడ్ లెర్నింగ్ లో నొక్కి చెప్పడానికి కొద్ది ఉదాహరణలు ఇవ్వండి.

చిత్ర కాగితం, మోసాన్ని గుర్తించడం, స్పామ్ ఫిల్టరింగ్.

డేటాను సాధారణంగా ________గా విభజిస్తారు, 80% ట్రైనింగ్ డేటా మరియు 20% టెస్టింగ్ డేటా.

<p>80:20</p> Signup and view all the answers

చిత్రం A యొక్క అవుట్‌పుట్ ఏమిటి?

<p>వాడుకరుడు కొనడని అంచనా (B)</p> Signup and view all the answers

ఈ డేటా పారామీటర్లతో వాటిని సరిపోల్చండి:

<p>Gender, Age, Salary = Single customer purchase prediction Dew Point, Temperature, Pressure = Wind Speed prediction Shape sides = Shape classification 80:20 = Data splitting ratio</p> Signup and view all the answers

మోడల్ నేర్పించటంటే డేటాలో ఉన్న చారిత్రాన్ని విశ్లేషించడం.

<p>True (A)</p> Signup and view all the answers

మోడల్ రెడీ అయితే, దానిని ________ చేయవచ్చు.

<p>పరీక్షించాలి</p> Signup and view all the answers

R ప్రోగ్రామింగ్‌ను కింద పేర్కొనబడిన వాటిలో ఏది ఉపయోగించి ఇన్‌స్టాల్ చేయాలి?

<p>RStudio (C)</p> Signup and view all the answers

నిమ్న వాక్యంలో ఏది కచ్చితంగా సరైనది?
"యంత్రాన్ని స్వయంగా నేర్పడం కోసం అల్గోరిథమ్స్ అభివృద్ధి చేయడానికి సంబంధించినది."

<p>యంత్రశిక్షణ (B)</p> Signup and view all the answers

R ను Windows‌లో కేవలం రెండు దశల్లో ఇన్‌స్టాల్ చేయవచ్చు.

<p>False (B)</p> Signup and view all the answers

RStudio IDE లో మొదటి సారి తెరిచినప్పుడు మూడింటిని చూడాల్సిన విండోస్ ఏమిటి?

<p>అవును, మూడింటిని చూడాలి: పాయిజీ, స్క్రిప్ట్ మరియు కన్సోల్.</p> Signup and view all the answers

యంత్రాన్ని వాడటానికి ఎవరికీ కచ్చితమైన కోడ్ రాయడాలసిన అవసరం లేదు.

<p>True (A)</p> Signup and view all the answers

ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ యొక్క అర్థం ఏమిటి?

<p>మానవ స్పందనకు అనుగుణంగా యంత్రాలు పని చేయడం.</p> Signup and view all the answers

R ను Linux లో ఇన్‌స్టాల్ చేయడానికి, మొదట _______ ఆదేశాన్ని ఉపయోగించి అవసరమైన ఫైల్స్‌ను నవీకరించాలి.

<p>sudo apt-get update</p> Signup and view all the answers

సూపర్‌వైజ్డ్ మెషిన్ లెర్నింగ్ అంటే __________ డేటాను ఉపయోగించి శిక్షణ పొందిన యంత్రాలు.

<p>లేబుల్డ్</p> Signup and view all the answers

R మరియు RStudio యొక్క వాడుకలు క siguiente్ధిశిగా జోరు చేయండి:

<p>R = డేటా విశ్లేషణ RStudio = ఐడీఈ, R తో పని చేయడానికి</p> Signup and view all the answers

R ని Windows లో డౌన్‌లోడ్ చేయడానికి క్రింది నిజమైన వెబ్‌సైట్ ఏది?

<p><a href="https://cloud.r-project.org">https://cloud.r-project.org</a> (A)</p> Signup and view all the answers

క్రింది పదాలను అందించబడిన వివరణలతో జత చేయండి:

<p>ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ = మానవ మేధస్సును అనుకరించగల యంత్రాలు యంత్ర శిక్షణ = డేటా నుండి స్వయంగా నేర్చుకోవడం సూపర్‌వైజ్డ్ లెర్నింగ్ = లేబుల్డ్ డేటాతో శిక్షణ అల్గోరిథమ్స్ = సమస్యల మ్యాపింగ్ క్రమం</p> Signup and view all the answers

ఈ క్రింది పద్ధతులలో ఏది యాంత్రిక విద్యావంతులలో భాగంగా వస్తుంది?

<p>సూపర్‌వైజ్డ్ కంప్యూటింగ్ (D)</p> Signup and view all the answers

RStudio అనేది R ప్రోగ్రామింగ్‌కు సంబంధించిన ఒక వాడుకలో సాధారణమైన పరిసరాన్ని అందిస్తుంది.

<p>True (A)</p> Signup and view all the answers

R ను స్థానిక కంప్యూటర్ లో అమర్చడానికి అవసరమైన రెండు అంశాలు ఏమిటి?

<p>R మరియు RStudio.</p> Signup and view all the answers

యంత్రమైన అనుభవం తీసుకోకుండా ఇది వాస్తవం కాదు.

<p>False (B)</p> Signup and view all the answers

యంత్రానికి డేటాfeed చేస్తున్నప్పుడు ఏమి జరుగుతుంది?

<p>యంత్రం కొత్త డేటాకు అంచనా వేస్తుంది.</p> Signup and view all the answers

లైనియర్ రిగ్రెషన్ లో ఆధారిత మరియు స్వతంత్రమైన అంకెల మధ్య సంబంధం ఏమిటి?

<p>లీనియర్ సంబంధం (D)</p> Signup and view all the answers

ఒకే స్వతంత్రమైన అంకెని ఉపయోగించి రిగ్రెషన్ కాన్సెప్ట్ ని సులభంగా రాసుకోవడంతో 'సాధారణ లైనియర్ రిగ్రెషన్' అంటారు.

<p>True (A)</p> Signup and view all the answers

లీనియర్ రిగ్రెషన్ లో Y అంటే ఏమిటి?

<p>ఆధారిత అంకె (లక్ష్యం అంకె)</p> Signup and view all the answers

లైనియర్ రిగ్రెషన్ లో Y = aX + ______ అనే సమీకరణంలో 'b' అంటే ____.

<p>బైజ్ కేటగిరి</p> Signup and view all the answers

ఈ క్రింది అప్లికేషన్లను వాటి వివరణలతో సరిపోల్చండి:

<p>ట్రెండ్ మరియు సేల్స్ అంచనాల విశ్లేషణ = లీనియర్ రిగ్రెషన్ ఉపయోగించేందుకు సాలరీ అంచనా = స్వతంత్ర మరియు ఆధారిత అంకెల మధ్య సంబంధం రియల్ ఎస్టేట్ ప్రిడక్షన్ = ప్రొడక్ట్ అమ్మకాల అంచనాల కోసం నిర్ణయ పత్రం రిగ్రెషన్ = వర్గీకరణ మరియు రిగ్రెషన్ సమస్యలకు</p> Signup and view all the answers

డిసిషన్ ట్రీ రిగ్రెషన్ లో ప్రతి అంతర సాధనము ఏమిటి?

<p>యొక్క పరీక్షకు అట్రిప్యూట్ (B)</p> Signup and view all the answers

రెగ్రెషన్ విశ్లేషణ యొక్క ప్రధాన ఉద్దేశం ఏమిటి?

<p>ఒక నిరంతర మార్చుని అంచనా వేయడం (D)</p> Signup and view all the answers

రెగ్రెషన్ ఆల్గోరిథం క్రమంలో వాడే పాయింట్‌లు ఆధారిత మరియు స్వతంత్ర అంకెల మధ్య సంబంధాలను కనుగొనడంకోసం ఉపయోగించబడుతుంది.

<p>True (A)</p> Signup and view all the answers

డిసిషన్ ట్రీ రిగ్రెషన్ కేటగిరిక యంత్రం ప్రాసెస్ లో ఉపయోగించబడదు.

<p>False (B)</p> Signup and view all the answers

డిసిషన్ ట్రీ లో ప్రతి ఆకాషి _____ ను నిలుపుతుంది.

<p>తీర్పు లేదా ఫలితం</p> Signup and view all the answers

రెగ్రెషన్ అంచనాలు ఎందుకు ఉపయోగిస్తారు?

<p>అది నిరంతర మార్చును అంచనా వేయడానికి మరియు ఇతర విభాగాల మధ్య సంబంధాలను విశ్లేషించడానికి ఉపయోగిస్తారు.</p> Signup and view all the answers

రెగ్రెషన్ ఆల్గోరిథం యొక్క ప్రధాన ఉద్దేశ్యం x కి y కు ___ మ్యాప్ చేయడం.

<p>సంబంధాన్ని</p> Signup and view all the answers

ఈ క్రింది వాటిలో ఏది రెగ్రెషన్ యొక్క ఒక రూపం కాదు?

<p>లీనియర్ కోణీ కచ్చితత్వం (C)</p> Signup and view all the answers

రెగ్రెషన్ కేంద్రంగా మొత్తం వికర్త వ్యవస్ధను వగ్రత్తిరించి, అనేక క్షేత్రాల్లో దాని ఉపయోగాలతో సహా, వికర్షను అంచనా వేయడంలో మాత్రమే ఉపయోగిస్తారు.

<p>False (B)</p> Signup and view all the answers

రెగ్రెషన్ అల్గోరిథం ఎంత ముఖ్యమైందో అంచనా వేయండి?

<p>రెగ్రెషన్ ఆర్థిక, సామాజిక మరియు ఇతర విభాగాలలో త్రోస్ట్ అంచనాలను సాధించడంలో చాలా ముఖ్యమైంది.</p> Signup and view all the answers

కింది రెగ్రెషన్ శ్రేణులను వాటి ప్రత్యేకమైన ఉపయోగాల‌తో సరిపోల్చండి:

<p>సాధారణ లీనియర్ రెగ్రెషన్ = ఒక స్వతంత్ర చారానికి ఒక అవలోకనం బహు లీనియర్ రెగ్రెషన్ = అనేక స్వతంత్ర పార్టులకు సంబంధం పోల్యూమినల్ రెగ్రెషన్ = సరళమైన చిహ్నాలపై ఆధారపడి ఉంటుంది డిసిషన్ ట్రీ రెగ్రెషన్ = నాన్-లీనియర్ డేటాను అంచనా వేయడం</p> Signup and view all the answers

ఓవర్‌ఫిట్టింగ్ అంటే ఏమిటి?

<p>మోడల్ శబ్దాన్ని గుర్తించడం మరియు సంబంధించిన సమాచారాన్ని లెక్కించడం. (B)</p> Signup and view all the answers

ఎదురుగా ఉన్న డేటాకు బాగా పనితీరు ఇచ్చే మోడల్ అంటే అనేది సరైనది.

<p>False (B)</p> Signup and view all the answers

ఓవర్‌ఫిట్టింగ్ నివారించడానికి ఉపయోగించే విధానములు ఏమిటి?

<p>ఎర్లీ స్టాప్పింగ్, మరింత డేటాతో శిక్షణ, డేటా ఆగ్మెంటేషన్, రెగులరైజేషన్.</p> Signup and view all the answers

ఓవర్‌ఫిట్టింగ్ కలిగి ఉండే మోడల్ _____ ప్రక్రియను సరిగ్గా నిర్వహించలేడు.

<p>శ్రేణీకరణ</p> Signup and view all the answers

కు కచ్చితమైన విధానం ఈ క్రింది వాటిని సరిపోల్చండి:

<p>ఎర్లీ స్టాప్ = పరీక్ష డ్రైవ్ ఆపడం డేటా ఆగ్మెంటేషన్ = నూతన డేటా సృష్టించడం రెగులరైజేషన్ = గుణాలు తగ్గించు L1 రెగులరైజేషన్ = లాస్సో రెగులరైజేషన్</p> Signup and view all the answers

ఓవర్‌ఫిట్టింగ్ నివారించే విధానాలలో ఏది ఉపయోగించబడదు?

<p>రోగులపై ప్రవేశించడం (D)</p> Signup and view all the answers

తక్కువ శ్రేణీ లోపం ఉన్న శిక్షణ డేటా, అధిక శ్రేణీ లోపం ఉన్న పరీక్ష డేటాను సూచిస్తుంది అనే ప్రకటన సరైనది.

<p>True (A)</p> Signup and view all the answers

మోడల్ శబ్దాన్ని ఎలా గుర్తిస్తుంది?

<p>అది శిక్షణ సమయంలో ఇష్టమైన డేటా ఆధారంగా అలవాటు పడుతుంది.</p> Signup and view all the answers

Flashcards

అనుమాన గణితం

నమూనా డేటా నుండి గణాంకాలను ఉపయోగించి జనాభా పారామిటర్ గురించి అంచనాలు కనుగొనే ప్రక్రియ.

కృత్రిమ మేధస్సు (AI)

మానవుల మాదిరిగా ఆలోచించగల మరియు నిర్ణయాలు తీసుకోగల మెషీన్‌లను సృష్టించే కంప్యూటర్ సైన్స్ శాఖ.

మెషిన్ లెర్నింగ్

డేటా మరియు అనుభవాల నుండి స్వతంత్రంగా నేర్చుకునే అల్గోరిథంలను అభివృద్ధి చేయడంపై దృష్టి సారిస్తుంది.

పర్యవేక్షిత లెర్నింగ్

శిక్షణ డేటా నుండి శిక్షణ పొందిన మరియు అవుట్‌పుట్‌ను అంచనా వేసే మెషిన్ లెర్నింగ్ రకం.

Signup and view all the flashcards

లేబుల్ చేయబడిన డేటాసెట్

ఇన్‌పుట్ మరియు అవుట్‌పుట్ పారామిటర్లు రెండూ ఉన్న డేటాసెట్.

Signup and view all the flashcards

శిక్షణ డేటాసెట్

డేటాను శిక్షణ ఇవ్వడానికి మరియు పరీక్షించడానికి ఉపయోగించే డేటాసెట్.

Signup and view all the flashcards

పరీక్ష డేటాసెట్

డేటాను శిక్షణ ఇవ్వడానికి మరియు పరీక్షించడానికి ఉపయోగించే డేటాసెట్.

Signup and view all the flashcards

పర్యవేక్షిత అభ్యాసం

మోడల్‌కు సరైన ఉత్పత్తులను అంచనా వేయడానికి నేర్పుతుంది.

Signup and view all the flashcards

ఇన్‌పుట్

డేటా సెట్ సరైన ఉత్పత్తులను గుర్తించడానికి ఉపయోగించబడుతుంది.

Signup and view all the flashcards

అవుట్‌పుట్

మోడల్ గుర్తించే డేటా.

Signup and view all the flashcards

లేబుల్ చేయబడిన డేటా

మోడల్ సరైన ఉత్పత్తులను అంచనా వేయడానికి నేర్చుకునే డేటాపై సరైన సమాధానాలు ఉన్నాయి.

Signup and view all the flashcards

పరీక్ష డేటాసెట్

మోడల్ ప్రదర్శనను పరీక్షించడానికి ఉపయోగపడే డేటా సరైన సమాధానాలను కలిగి ఉంటుంది.

Signup and view all the flashcards

R మరియు RStudio

R మరియు RStudio కలిసి పనిచేసి ఒక R ప్రాజెక్ట్‌ను సృష్టించగలవు.

Signup and view all the flashcards

R పర్యావరణం

R ప్రోగ్రామింగ్ లాంగ్వేజ్‌ను ఉపయోగించి అంకితమైన సాఫ్ట్‌వేర్ పర్యావరణం.

Signup and view all the flashcards

R ఇన్‌స్టాలేషన్

స్థానిక కంప్యూటర్‌లో R ఇన్‌స్టాల్ చేయడం.

Signup and view all the flashcards

వివిధ ఆపరేటింగ్ సిస్టమ్‌లకు కలిగి ఉన్న R ఇన్‌స్టాలేషన్ ఫైల్‌లను అందించే వెబ్‌సైట్.

Signup and view all the flashcards

టెర్మినల్‌లో R ను ప్రారంభించడం

Linux లోని టెర్మినల్‌లో R ప్రోగ్రామింగ్‌ను ప్రారంభించండి.

Signup and view all the flashcards

R లోని అన్ని భాగాలు

మీ కంప్యూటర్‌లో R ను ఇన్‌స్టాల్ చేయడానికి అదనపు ఫైల్‌లు.

Signup and view all the flashcards

RStudio

డేటా విశ్లేషణకు R ని ఉపయోగించడం సులభం చేసే ఇంటర్‌గ్రేటెడ్ డెవలప్‌మెంట్ పర్యావరణం.

Signup and view all the flashcards

RStudio పోలిక

విలువైన GUI ఇంటర్‌ఫేస్ తో RStudio R తో పోల్చబడుతుంది.

Signup and view all the flashcards

రిగ్రెషన్ అంటే ఏమిటి?

స్వతంత్ర మరియు ఆధారపడే వేరియబుల్స్ మధ్య సంబంధాన్ని కనుగొనే ప్రక్రియ. మార్కెట్ ట్రెండ్లు, గృహ ధరలు వంటి నిరంతర వేరియబుల్స్‌ను అంచనా వేయడంలో ఇది సహాయపడుతుంది.

Signup and view all the flashcards

రిగ్రెషన్ అల్గోరిథం యొక్క లక్ష్యం ఏమిటి?

ఇన్‌పుట్ వేరియబుల్ (x) నుండి నిరంతర అవుట్‌పుట్ వేరియబుల్ (y) కి మ్యాపింగ్ ఫంక్షన్‌ను కనుగొనడం

Signup and view all the flashcards

రిగ్రెషన్ అల్గోరిథం వాతావరణ అంచనా వేయడానికి ఎలా ఉపయోగపడుతుంది?

రిగ్రెషన్ మోడల్‌ను గత డేటాపై శిక్షణ ఇవ్వడం మరియు అది పూర్తయిన తర్వాత భవిష్యత్తు రోజులకు వాతావరణాన్ని ఖచ్చితంగా అంచనా వేయగలదు.

Signup and view all the flashcards

సింపుల్ లీనియర్ రిగ్రెషన్ అంటే ఏమిటి?

స్వతంత్ర వేరియబుల్‌కు ఒకే ఆధారపడే వేరియబుల్ ఉండే రిగ్రెషన్ రకం

Signup and view all the flashcards

మల్టిపుల్ లీనియర్ రిగ్రెషన్ అంటే ఏమిటి?

స్వతంత్ర వేరియబుల్స్ యొక్క అనేక ఇన్‌పుట్‌లను ఉపయోగించి ఆధారపడే వేరియబుల్‌ను అంచనా వేయడం

Signup and view all the flashcards

పాలినోమియల్ రిగ్రెషన్ అంటే ఏమిటి?

వక్రరేఖాత్మక సంబంధం ఉన్న డేటాను అంచనా వేయడానికి ఉపయోగించే రిగ్రెషన్ టెక్నిక్

Signup and view all the flashcards

సపోర్ట్ వెక్టర్ రిగ్రెషన్ అంటే ఏమిటి?

డేటా పాయింట్‌ల మధ్య ఖచ్చితమైన సరిహద్దును కనుగొనడానికి ఉపయోగించే ఒక పద్ధతి

Signup and view all the flashcards

ఓవర్‌ఫిట్టింగ్ అంటే ఏమిటి?

ఒక మోడల్‌ను శిక్షణ పొందించడానికి ఉపయోగించే డేటాసెట్‌లోని అతి ముఖ్యమైన లక్షణాలను మోడల్‌ గుర్తుంచుకోవడం వల్ల, కొత్త డేటాకు అనుగుణంగా పనిచేయకపోవడంతో కలిగే సమస్యను ఇలా అంటారు.

Signup and view all the flashcards

ఎర్లీ స్టాపింగ్ అంటే ఏమిటి?

ఓవర్‌ఫిట్టింగ్‌ను నివారించడానికి సహాయపడే ఒక పద్ధతి, దీనిలో మోడల్‌ శిక్షణను నిలిపివేయబడుతుంది, తద్వారా డేటాసెట్‌లోని శబ్దాన్ని నేర్చుకోకుండా ఉంటుంది.

Signup and view all the flashcards

మోడల్లకు మరింత డేటాను ఎలా జోడించాలి?

ఓవర్‌ఫిట్టింగ్‌ను నివారించడానికి సహాయపడే ఒక పద్ధతి, ఇది శిక్షణ డేటాసెట్‌లోని డేటాను పెంచడం ద్వారా కొత్త డేటాకు మోడల్‌ సాధారణీకరణను మెరుగుపరుస్తుంది.

Signup and view all the flashcards

డేటా ఆగ్మెంటేషన్ అంటే ఏమిటి?

ఓవర్‌ఫిట్టింగ్‌ను నివారించడానికి సహాయపడే ఒక పద్ధతి, ఇది కొత్త డేటాను సృష్టించడం లేదా వినియోగించబడిన డేటాను మార్చడం ద్వారా శిక్షణ డేటాసెట్‌ను పెంచుతుంది.

Signup and view all the flashcards

రెగ్యులరైజేషన్ అంటే ఏమిటి?

ఓవర్‌ఫిట్టింగ్‌ను నివారించడానికి సహాయపడే ఒక పద్ధతి, ఇది శిక్షణ సమయంలో మోడల్‌ యొక్క స్థిరత్వాన్ని పెంచడానికి ఉపయోగించే ఒక పద్ధతి.

Signup and view all the flashcards

L1 రెగ్యులరైజేషన్ (లాసో రెగ్యులరైజేషన్) అంటే ఏమిటి?

ఒక రకమైన రెగ్యులరైజేషన్ పద్ధతి, ఇది శబ్దం లేని డేటాపై మోడళ్లను విశ్వసనీయంగా చేయడానికి సహాయపడుతుంది.

Signup and view all the flashcards

స్టాటిస్టికల్ మోడలింగ్ అంటే ఏమిటి?

డేటాను ఉపయోగించి గణిత లేదా అల్గోరిథమిక్ పరికరాలను రూపొందించి, ఒక పరిశీలన యొక్క సంభావ్యతను కొలవడం ద్వారా డేటా గురించి అవగాహన పొందే ప్రక్రియ ఇది.

Signup and view all the flashcards

లీనియర్ రెగ్రెషన్ అంటే ఏమిటి?

రెగ్రెషన్ అనేది ఒక స్టాటిస్టికల్ మెథడ్ దీని ద్వారా నిర్దిష్ట విలువలను బట్టి వేరే విలువలను అంచనా వేయవచ్చు. లీనియర్ రెగ్రెషన్ ఒక సూపర్వైజ్డ్ లెర్నింగ్ అల్గోరిథం దీని ద్వారా డేటాను పరిశీలించి మరియు గ్రహించి ఎదురుగా ఉన్న విలువలను అంచనా వేయవచ్చు.

Signup and view all the flashcards

లినియర్ రెగ్రెషన్ ఎలా పనిచేస్తుంది?

లినియర్ రెగ్రెషన్ అనేది డేటా పాయింట్ల మధ్య సంబంధాన్ని సూచించే ఒక సూపర్వైజ్డ్ లెర్నింగ్ అల్గోరిథం. డేటా పాయింట్లు సరళ రేఖ ద్వారా తెలియజేస్తాయి.

Signup and view all the flashcards

లినియర్ రెగ్రెషన్ లో 'లినియర్' అనేది ఏమిటీ?

లీనియర్ రెగ్రెషన్ లో, డేటా పాయింట్లు స్ట్రెయిట్ లైన్ ద్వారా కనెక్ట్ అవుతాయి. డేటా పాయింట్లు స్ట్రెయిట్ లైన్ ద్వారా కనెక్ట్ అవుతాయి కాబట్టి దీన్ని లినియర్ అని కూడా అంటారు.

Signup and view all the flashcards

సింపుల్ లినియర్ రెగ్రెషన్ మరియు మల్టిపుల్ లినియర్ రెగ్రెషన్ మధ్య తేడా ఏమిటి?

ఒకే ఇన్పుట్ వేరియబుల్ తో లినియర్ రెగ్రెషన్ మోడల్ ని సింపుల్ లినియర్ రెగ్రెషన్ అంటారు. ఎక్కువ ఇన్పుట్ వేరియబుల్స్ తో ఉన్న లినియర్ రెగ్రెషన్ మోడల్ ని మల్టిపుల్ లినియర్ రెగ్రెషన్ అంటారు.

Signup and view all the flashcards

డిసిషన్ ట్రీ అంటే ఏమిటి?

డిసిషన్ ట్రీ అనేది ఒక సూపర్వైజ్డ్ లెర్నింగ్ అల్గోరిథం దీని ద్వారా క్లాసిఫికేషన్ మరియు రెగ్రెషన్ సమస్యలను సాధించవచ్చు. డిసిషన్ ట్రీ లో ప్రతి నోడ్ ఒక లక్షణాన్ని పరీక్షిస్తుంది, ప్రతి బ్రాంచ్ ఆ పరీక్ష ఫలితాన్ని సూచిస్తుంది మరియు ప్రతి లీఫ్ నోడ్ చివరి పరిష్కారం సూచిస్తుంది.

Signup and view all the flashcards

డిసిషన్ ట్రీ వినియోగం ఏమిటి?

డిసిషన్ ట్రీ అనేది ఒక సూపర్వైజ్డ్ లెర్నింగ్ అల్గోరిథం దీని ద్వారా క్లాసిఫికేషన్ మరియు రెగ్రెషన్ సమస్యలను సాధించవచ్చు.

Signup and view all the flashcards

లినియర్ రెగ్రెషన్ సమీకరణం ఏమిటి?

లీనియర్ రెగ్రెషన్ Y=aX+b అనే సమీకరణం ద్వారా నిర్వహించబడుతుంది.

Signup and view all the flashcards

లీనియర్ రెగ్రెషన్ సమీకరణం లో Y , X , a మరియు b అంటే ఏమిటి?

లీనియర్ రెగ్రెషన్ లో Y అనేది బట్టి తేలిపోయే వేరియబుల్ మరియు X అనేది వెనుక ఒక వేరియబుల్, a మరియు b లీనియర్ గుణకాలు.

Signup and view all the flashcards

Study Notes

Introduction to Data Science

  • Data science is an interdisciplinary field focused on extracting knowledge from datasets, often massive in size.
  • It involves data analysis, data preparation for analysis, and presenting findings to inform high-level decisions.
  • Data science incorporates skills from computer science, mathematics, statistics, information visualization, and business.
  • It's a deep study of extracting meaningful insights from raw, structured, and unstructured data using the scientific method, different technologies, and algorithms.
  • Data science uses powerful hardware, programming systems, and efficient algorithms to solve data-related problems and is the future of artificial intelligence.

Definition of Data science

  • Data science is an interdisciplinary field focused on extracting knowledge from vast datasets.
  • It encompasses data analysis, preparation, and presentation of findings to inform organizational decisions.
  • Data science combines skills from computer science, mathematics, statistics, information visualization, and business.
  • It profoundly studies data to produce significant insights from unstructured or structured data.

Big Data and Data Science hype

  • Big data refers to large volumes of complex, varied data formatted data generated at a fast pace, which cannot be processed by traditional systems.
  • It's often formatted in a manner that traditional applications can't process efficiently. Big data involves processing raw data, which isn't aggregated previously.
  • Big data is used to analyze insights, leading to better business decisions and strategic moves.
  • Social media, sensor data, customer feedback, IoT devices are crucial sources of big data.

IoT Appliances

  • Internet-connected devices (IoT appliances) create data for smart functionality.
  • Examples include smart TVs, washing machines, coffee machines, and air conditioners, which create data by using sensors located in them.
  • Data transfer between these connected devices generates data.

E-commerce

  • E-commerce transactions, including payments via credit/debit cards etc., create significant data.
  • Business transactions, banking, and stock markets are crucial sources of big data.

Global Positioning System (GPS)

  • GPS technology in vehicles monitors vehicle movement to shorten routes, minimize fuel consumption, and optimize time.
  • GPS systems produce vast amounts of data on vehicle location and movement.

Applications of Big Data

  • Big data is used in financial services for customer analytics, compliance, and fraud prevention.
  • Credit card companies, banks, and insurance firms use big data to improve services, prevent risks, and make informed decisions.

Big Data in Communications

  • Telecommunication companies use big data to increase subscriber base and retain customers.
  • Companies analyze customer-generated and machine-generated data for solutions to subscriber challenges.

Big Data for Retail

  • Retailers (brick-and-mortar and online) analyze disparate data sources (weblogs, transactions, social media, and loyalty programs) for improved customer understanding.

Data Science

  • Data science is an area that deals with the collection, processing, analysis, and utilization of data used in multiple fields of operation.
  • Focuses on a detailed study and understanding of the process of Data.

Big Data

  • Big data is a technique to collect, maintain, and process massive amounts of information, extracting valuable insights.

Getting Past the Hype

  • Rachel's experience illustrates that data science skills are practical and crucial to job success.

Datafication

  • Datafication transforms social behavior into quantified data, enabling real-time tracking and predictive analysis.
  • This translates everyday actions into digital (numeric) data, for analysis.

The Data Science Landscape

  • Data science encompasses the disciplines of analytics, statistics, and machine learning.
  • Analytics generates insights from data through visualization tools, calculations, and manipulations.

Statistics.

  • Statistics is a mathematical branch for organizing, interpreting numerical data in precise ways, known as descriptive statistics.
  • It's also used for making predictions from limited sample information about larger populations, called inferential statistics.
  • Descriptive statistics summarize data characteristics using measures like mean, median, mode, variance, and standard deviation.
  • Inferential statistics uses sample data to draw conclusions about a population.

Artificial Intelligence (AI)

  • A field of computer science focusing on creating intelligent machines capable of mimicking human-like thinking and decision-making.
  • Knowledge and skills gained through experience enable making decisions.
  • AI is about mimicking human intelligence and building machines that can think and act like humans.

Machine Learning

  • Machine learning is a subset of AI focused on developing algorithms that allow computers to learn from data and past experiences, without explicit programming.
  • Models are built from historical data to predict outputs. Model accuracy is affected by data size.
  • Machine learning systems can learn from data and make predictions.

Supervised Learning

  • In supervised learning, machines are trained using labeled data where input data is already tagged with the correct output.
  • These models learn to predict outputs correctly given new data.
  • Image classification, fraud detection, and spam filtering are example applications of supervised learning.

Unsupervised Learning

  • Unsupervised learning trains models on unlabeled data that isn't categorized/classified beforehand.
  • The model identifies hidden patterns, similarities, and differences in the data, and then categorizes/classifies data based on its characteristics.
  • Unsupervised techniques used for grouping similar data points include k-means clustering.

Statistical inference

  • Statistics is a branch of mathematics used for the collection, analysis, interpretation, and presentation of numerical data.
  • The goal is to make accurate conclusions about larger populations using a smaller sample set of data.

Population and Samples

  • The complete collection of all objects or measurements is the population.
  • A sample is a subset of the population selected for a specific study.

Overfitting

  • Overfitting is a modeling issue where a statistical model is overly accurate/consistent/fitted to the training data but doesn't generalize/perform well on new, unseen data.

Statistical Modeling

  • Construction and evaluation of mathematical models that use data.

Types of Probability Distribution

  • Probability distribution is a function assigning probabilities to different outcomes.
  • Discrete probability distributions deal with variables with countable values and probabilities e.g., flipping a coin.
  • Continuous probability distributions deal with variables with values in a continuous range, such as time duration.

Basics of R

  • R is an open-source programming language used for statistical computing and data visualization.
  • It has a vast range of libraries (packages) and is highly extensible allowing users to perform diverse tasks.

Why R Programming Language

  • R is an open-source statistical software and programming language frequently used for data analysis and statistical computing.
  • Features include a vast community, easy installation, and integration with other computing languages.

Data Types in R

  • Integer, logical, numeric, character, complex, and raw are the basic data types in R programming.
  • Using the class() function, one can determine the data type of a variable.

R Commands

  • The readline() function in R allows users to input values from the keyboard in the console. The inputted value is stored as a string.
  • Using as.integer() function, raw string inputs can be converted into integer data type.

R Installation

  • There are steps involved to install R and RStudio on Windows and Linux operating systems.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser