Untitled Quiz

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

اگر در یک مسئله طبقه بندی باینری از یک شبکه MLP با یک لایه خروجی سیگموئید استفاده شود، کدام تابع هزینه (Cost Function) مناسب تر است؟

  • Binary Cross-Entropy (correct)
  • Categorical Cross-Entropy
  • MSE
  • Hinge Loss
  • MAE

روش منظم سازی L2 در شبکه های عصبی چه تأثیری دارد؟

  • دودویی کردن خروجی
  • حذف نورون‌های غیرضروری با تنظیم خروجی آن‌ها به صفر
  • نرمال‌سازی خروجی
  • اعمال جریمه (penalty) برای بزرگ بودن مقادیر وزن‌ها (correct)
  • اضافه کردن نویز نرمال به ورودی‌ها

کدام یک از عوامل زیر می‌تواند باعث بروز مشکل Vanishing Gradient در شبکه‌های عصبی عمیق شود؟

  • وزن‌های مدل در طول فرایند یادگیری به سمت بی‌نهایت میل کنند.
  • کاهش سرعت یادگیری در وزن‌ها و بایاس‌های مدل. (correct)
  • توقف یادگیری در نورون‌های خروجی.
  • وزن‌های مدل در طول فرایند یادگیری به سمت صفر میل کنند.
  • Overfitting مدل بر روی داده‌های آموزش.

در یک شبکه multi-class classification، کدام تابع فعال‌سازی معمولاً در لایه خروجی استفاده می‌شود؟

<p>Softmax (D)</p> Signup and view all the answers

در یک شبکه عصبی با تابع فعال‌سازی سیگموئید و تابع هزینه Cross-Entropy، اگر مقدار خروجی نورون برابر 0.6 و مقدار برچسب واقعی 1 باشد، مقدار به روزرسانی بایاس این نورون را بعد از یک دور یادگیری محاسبه کنید.

<p>0.16</p> Signup and view all the answers

در یک مجموعه داده بسیار نامتوازن که نمونه‌های مثبت به ندرت یافت می‌شوند، دو مدل A و B آموزش داده شده‌اند. مدل A دارای recall بالا و precision نسبتاً پایین است، در حالی که مدل B دارای نمودار ROC با AUC=0.95 است، اما نمودار precision-recall آن پایین‌تر از مدل A است. کدام مدل برای این مسئله مناسب‌تر است و چرا؟

<p>مدل A، به دلیل recall بالاتر. (B)</p> Signup and view all the answers

جدول زیر نتایج اعتبارسنجی متقابل 10-fold یک مدل یادگیری ماشین را نشان می‌دهد. کدام تفسیر برای این نتایج صحیح‌تر است؟

<p>گزینه‌های ۱ و ۳ محتمل هستند. (A)</p> Signup and view all the answers

یک مدل رگرسیون خطی برای پیش‌بینی احتمال درخواست وام بر اساس ویژگی‌های سن (بین 20 تا 70) و درآمد (بین 20k تا 100k) طراحی شده است. کدام روش مهندسی ویژگی (Feature Engineering) می‌تواند عملکرد مدل را به طور قابل توجهی افزایش دهد؟

<p>اضافه کردن ضرب سن در درآمد به عنوان یک ویژگی جدید. (E)</p> Signup and view all the answers

در یک مجموعه داده شامل 2000 نمونه، که در سه دسته مثبت (800 نمونه)، نامشخص (700 نمونه) و منفی (500 نمونه) قرار دارند، از دو درخت تصمیم‌گیری برای دسته‌بندی استفاده شده است. در اولین سطح تقسیم (عمق اول)، توزیع نمونه‌ها در گره‌های فرزند به شرح زیر است:

  • درخت ۱:
    • گره راست: مثبت 600، نامشخص 200، منفی 200
    • گره چپ: مثبت 200، نامشخص 500، منفی 300
  • درخت ۲:
    • گره راست: مثبت 500، نامشخص 400، منفی 300
    • گره چپ: مثبت 300، نامشخص 300، منفی 200

با توجه به توضیحات داده شده، کدام گزینه صحیح است؟

<p>درخت ۱ هم در Gini Index و هم در Entropy بهتر است. (B)</p> Signup and view all the answers

در یک مسئله طبقه بندی (classification) با داده‌های نامتوازن (۵٪ مثبت)، ماتریس درهم‌ریختگی (confusion matrix) به صورت زیر بدست آمده است:

Predicted 1 Predicted 0
Actual 1 10 5
Actual 0 20 1000

کدام معیار ارزیابی برای این مدل ارجحیت دارد؟

<p>F1-Score (D)</p> Signup and view all the answers

با توجه به اطلاعات ماتریس درهم ریختگی سوال قبل، مقدار عددی F1-Score مناسب برای ارزیابی مدل چند است؟

<p>0.44</p> Signup and view all the answers

کدام گزاره در مورد معیارهای تقسیم گره (node splitting criteria) در یک درخت تصمیم (Decision Tree) برای مسائل رگرسیون (Regression) صحیح است؟

<p>از معیار کاهش واریانس یا کاهش SSR (Sum of Squared Residuals) استفاده می‌شود. (B)</p> Signup and view all the answers

کدام گزاره در مورد Gini Index و Entropy در درخت تصمیم (Decision Tree Classifier) صحیح است؟

<p>وقتی توزیع کلاس‌ها کاملاً متوازن باشد، مقدار Entropy برابر ۱ است. (B)</p> Signup and view all the answers

یک مدل رگرسیون خطی روی مجموعه داده اعتبارسنجی، نتایج زیر را نشان می‌دهد:

# True Value Predicted Value
1 200 210
2 150 160
3 300 280
4 250 240
5 100 130

مقدار ضریب تعیین ($R^2$) برای این مدل چقدر است؟

<p>0.53</p> Signup and view all the answers

در آموزش یک مدل Logistic Regression، جدول زیر شامل مقادیر واقعی و احتمالات پیش‌بینی شده برای هر نمونه است:

# True Label Predicted Probability
1 1 0.9
2 0 0.3
3 1 0.6

مقدار میانگین Log Loss را محاسبه کنید.

<p>0.32</p> Signup and view all the answers

در یک الگوریتم یادگیری تقویتی (Reinforcement Learning)، تابع ارزش (Value Function) نشان دهنده تخمینی از مجموع پاداش‌های دریافتی در آینده بر اساس دنبال کردن یک سیاست خاص از یک حالت خاص است.

<p>True (A)</p> Signup and view all the answers

در یادگیری ماشین، فرآیند انتخاب زیرمجموعه‌ای از ویژگی‌های موجود در داده‌ها به منظور کاهش ابعاد و بهبود عملکرد مدل، به عنوان __________ شناخته می‌شود.

<p>انتخاب ویژگی</p> Signup and view all the answers

هر یک از الگوریتم‌های یادگیری ماشین زیر را با نوع مسئله‌ای که بیشتر برای حل آن مناسب است، مطابقت دهید:

<p>رگرسیون خطی (Linear Regression) = مسائل پیش‌بینی مقادیر پیوسته ماشین بردار پشتیبان (Support Vector Machine) = مسائل طبقه‌بندی و رگرسیون با ابعاد بالا خوشه‌بندی K-میانگین (K-Means Clustering) = مسائل گروه‌بندی داده‌ها بدون برچسب شبکه‌های عصبی کانولوشن (Convolutional Neural Networks) = مسائل پردازش تصویر و ویدیو</p> Signup and view all the answers

کدام یک از روش‌های زیر برای مقابله با مشکل عدم تعادل کلاس‌ها (class imbalance) در یک مجموعه داده مناسب‌تر است، اگر هدف اصلی، حفظ دقت (precision) بالا در کلاس اقلیت باشد؟

<p>استفاده از یک آستانه (threshold) بالاتر برای طبقه‌بندی نمونه‌ها به کلاس اقلیت. (D)</p> Signup and view all the answers

در یک مسئله یادگیری نیمه‌نظارتی (semi-supervised learning)، کدام یک از روش‌های زیر می‌تواند به بهبود عملکرد مدل کمک کند، اگر اطلاعات بدون برچسب (unlabeled data) دارای ساختار خوشه‌بندی مشخصی باشند؟

<p>استفاده از روش pseudo-labeling برای تولید برچسب‌های مصنوعی برای داده‌های بدون برچسب (E)</p> Signup and view all the answers

در روش انتقال یادگیری (Transfer Learning)، فریز کردن لایه‌های ابتدایی یک شبکه عصبی از پیش آموزش‌دیده (pre-trained network) و آموزش تنها لایه‌های انتهایی، به منظور انتقال دانش از یک مسئله به مسئله دیگر، همیشه منجر به بهبود عملکرد مدل می‌شود.

<p>False (B)</p> Signup and view all the answers

در یادگیری عمیق، به فرایند تنظیم دقیق (fine-tuning) یک مدل از پیش آموزش‌دیده (pre-trained model) بر روی یک مجموعه داده جدید، با هدف انطباق مدل با ویژگی‌های خاص آن مجموعه داده، __________ گفته می‌شود.

<p>انتقال یادگیری</p> Signup and view all the answers

هر یک از مفاهیم زیر در یادگیری عمیق را با تعریف مربوط به آن مطابقت دهید:

<p>Dropout = یک تکنیک منظم‌سازی که با حذف تصادفی برخی از نورون‌ها در طول آموزش، از overfitting جلوگیری می‌کند. Batch Normalization = یک تکنیک که با نرمال‌سازی ورودی هر لایه، سرعت آموزش را افزایش می‌دهد و به مدل اجازه می‌دهد که از نرخ یادگیری بالاتری استفاده کند. Residual Connection = یک اتصال مستقیم بین لایه‌های غیر مجاور که به گرادیان‌ها اجازه می‌دهد به طور مستقیم به لایه‌های قبلی منتقل شوند و مشکل vanishing gradient را کاهش می‌دهد. Attention Mechanism = یک روشی است که به مدل اجازه می‌دهد تمرکز خود را بر روی بخش‌های مهم‌تر ورودی‌ها در یک توالی گذاشته و آن ها را با اهمیت بیشتری در نظر بگیرد.</p> Signup and view all the answers

Flashcards

Binary Cross-Entropy

تابع هزینه ای که برای طبقه بندی دودویی با MLP و لایه خروجی Sigmoid مناسب تر است.

روش همگن سازی L2

روش همگن سازی L2 روی شبکه های عصبی، روی بزرگی وزن های مدل پنالتی می گذارد.

Vanishing Gradient

پدیده vanishing gradient موجب می شود فرایند یادگیری در وزن ها و بایاس های مدل کُند شود.

Softmax

تابع فعال سازی Softmax اغلب در لایه خروجی شبکه های عصبی برای multi-class classification استفاده می شود.

Signup and view all the flashcards

به روز رسانی بایاس نورون

اگر در یک شبکه عصبی با تابع فعال سازی Sigmoid و تابع هزینه Cross-Entropy، مقدار نورون خروجی 0.6 و مقدار لیبل واقعی 1 باشد، باید بایاس نورون خروجی را 0.16 تغییر دهیم.

Signup and view all the flashcards

مدل مطلوب با داده نامتوازن

در شرایط داده های نامتوازن، مدل A با recall بالا و precision پایین، عملکرد مطلوب تری نسبت به مدل B با AUC بالاتر دارد، زیرا بیشینه کردن recall مهم تر است.

Signup and view all the flashcards

بایاس کم و واریانس زیاد

اگر مدل دارای بایاس کم و واریانس زیاد باشد، احتمالاً دچار overfitting شده است.

Signup and view all the flashcards

بهبود عملکرد مدل رگرسیون

اضافه کردن مقدار درآمد ضرب در سن به عنوان ویژگی سوم در مدل رگرسیون خطی، عملکرد را به احتمال زیاد افزایش می دهد.

Signup and view all the flashcards

بهترین درخت با Gini/Entropy

با توجه به توضیحات داده شده، درخت ۲ هم در Gini Index و هم در Entropy بهتر است.

Signup and view all the flashcards

ارزیابی مدل با داده نامتوازن

در آموزش یک classifier بر روی یک مجموعه داده شدیدا نامتوازن (۵٪ مثبت)، Specificity متر بهتری برای ارزیابی مدل است.

Signup and view all the flashcards

مقدار عددی متر مناسب

در سوال قبل مقدار عددی متر مناسب 0.97 است.

Signup and view all the flashcards

معیار جداسازی نود در رگرسیون

در تسک رگرسیون، از معیار کاهش واریانس یا کاهش SSR برای جداسازی نودها در Decision Tree استفاده می کنند.

Signup and view all the flashcards

Entropy

وقتی توزیع کلاسها کاملا متوازن باشد مقدار Entropy برابر ۱ است.

Signup and view all the flashcards

محاسبه R^۲

با توجه به داده های ارائه شده، مقدار R^۲ (ضریب تعیین مدل) 0.53 است.

Signup and view all the flashcards

میانگین Log Loss

با استفاده از اطلاعات جدول، مقدار میانگین Log Loss برابر 0.45 است.

Signup and view all the flashcards

Study Notes

تابع هزینه (Cost Function)

  • برای انجام دسته بندی باینری (Binary Classification) با استفاده از یک MLP با لایه خروجی Sigmoid، تابع هزینه Binary Cross-Entropy مناسب تر است.

همگن سازی L2 در شبکه های عصبی

  • روش همگن سازی L2 روی شبکه های عصبی، پنالتی روی بزرگی وزن های مدل اعمال می کند.

علت پدیده Vanishing Gradient در شبکه های عصبی

  • دلیل وقوع vanishing gradient در شبکه های عصبی، کند شدن فرایند یادگیری در وزن ها و بایاس های مدل است.

تابع فعال سازی در شبکه طبقه بندی چند کلاسه (Multi-Class)

  • برای لایه خروجی یک شبکه طبقه بندی چند کلاسه، تابع فعال سازی Softmax بیشتر از بقیه توابع استفاده می شود.

به روز رسانی بایاس نورون خروجی

  • در یک شبکه عصبی با تابع فعال سازی Sigmoid و تابع هزینه Cross-Entropy، اگر مقدار نورون خروجی 0.6 و مقدار برچسب واقعی 1 باشد، برای به روز رسانی بایاس نورون خروجی، باید آن را به اندازه 0.16 تغییر داد.

مقایسه مدل ها با داده های نامتوازن

  • برای مجموعه داده های نامتوازن، مدل A با مقدار recall بالا و precision نسبتا پایین نسبت به مدل B با نمودار precision-recall پایین تر و AUC=0.95 مناسب‌تر است.

تفسیر نتایج اعتبارسنجی متقابل (Cross-Validation)

  • اگر بعد از انجام 10-fold cross validation خطای آموزش کم و خطای آزمون متنوع باشد، مدل احتمالاً دچار overfitting شده است.

افزایش عملکرد مدل رگرسیون خطی

  • در مدل رگرسیون خطی با ویژگی های سن و درآمد، افزودن مقدار درآمد ضرب در سن به عنوان ویژگی سوم می تواند عملکرد مدل را بهبود بخشد.

دسته بندی دیتاست با درخت تصمیم

  • در یک دیتاست با 2000 سمپل و سه دسته (800، 700، 500) با دو درخت تصمیم، نحوه تقسیم نمونه ها در عمق اول درخت ها مهم است.

انتخاب درخت تصمیم مناسب

  • با توجه به توضیحات داده شده، باید بررسی شود کدام درخت در هر دو معیار Gini Index و Entropy عملکرد بهتری دارد.

ارزیابی مدل با داده های نامتوازن

  • در آموزش یک طبقه بند با داده های نامتوازن (5% مثبت)، متر Specificity برای ارزیابی مدل مناسب‌تر است.

معیار مناسب در رگرسیون

  • در سوال قبل، مقدار عددی متر مناسب برای ارزیابی مدل در رگرسیون 0.97 است.

معیار جداسازی نود در درخت تصمیم رگرسیون

  • در درخت تصمیم برای رگرسیون، از معیار کاهش واریانس یا کاهش SSR برای جداسازی نودها استفاده می شود.

گزاره صحیح درباره Gini Index و Entropy در درخت تصمیم

  • وقتی توزیع کلاس ها کاملاً متوازن باشد مقدار Entropy برابر 1 است.

محاسبه ضریب تعیین مدل

  • برای محاسبه ضریب تعیین (R²) مدل رگرسیون خطی با نتایج داده شده، به محاسبات آماری نیاز داریم.

محاسبه میانگین Log Loss

  • برای محاسبه مقدار میانگین Log Loss با توجه به جدول داده شده، باید از فرمول Log Loss استفاده و میانگین مقادیر را محاسبه کرد.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team
Use Quizgecko on...
Browser
Browser