Podcast
Questions and Answers
اگر در یک مسئله طبقه بندی باینری از یک شبکه MLP با یک لایه خروجی سیگموئید استفاده شود، کدام تابع هزینه (Cost Function) مناسب تر است؟
اگر در یک مسئله طبقه بندی باینری از یک شبکه MLP با یک لایه خروجی سیگموئید استفاده شود، کدام تابع هزینه (Cost Function) مناسب تر است؟
- Binary Cross-Entropy (correct)
- Categorical Cross-Entropy
- MSE
- Hinge Loss
- MAE
روش منظم سازی L2 در شبکه های عصبی چه تأثیری دارد؟
روش منظم سازی L2 در شبکه های عصبی چه تأثیری دارد؟
- دودویی کردن خروجی
- حذف نورونهای غیرضروری با تنظیم خروجی آنها به صفر
- نرمالسازی خروجی
- اعمال جریمه (penalty) برای بزرگ بودن مقادیر وزنها (correct)
- اضافه کردن نویز نرمال به ورودیها
کدام یک از عوامل زیر میتواند باعث بروز مشکل Vanishing Gradient در شبکههای عصبی عمیق شود؟
کدام یک از عوامل زیر میتواند باعث بروز مشکل Vanishing Gradient در شبکههای عصبی عمیق شود؟
- وزنهای مدل در طول فرایند یادگیری به سمت بینهایت میل کنند.
- کاهش سرعت یادگیری در وزنها و بایاسهای مدل. (correct)
- توقف یادگیری در نورونهای خروجی.
- وزنهای مدل در طول فرایند یادگیری به سمت صفر میل کنند.
- Overfitting مدل بر روی دادههای آموزش.
در یک شبکه multi-class classification، کدام تابع فعالسازی معمولاً در لایه خروجی استفاده میشود؟
در یک شبکه multi-class classification، کدام تابع فعالسازی معمولاً در لایه خروجی استفاده میشود؟
در یک شبکه عصبی با تابع فعالسازی سیگموئید و تابع هزینه Cross-Entropy، اگر مقدار خروجی نورون برابر 0.6 و مقدار برچسب واقعی 1 باشد، مقدار به روزرسانی بایاس این نورون را بعد از یک دور یادگیری محاسبه کنید.
در یک شبکه عصبی با تابع فعالسازی سیگموئید و تابع هزینه Cross-Entropy، اگر مقدار خروجی نورون برابر 0.6 و مقدار برچسب واقعی 1 باشد، مقدار به روزرسانی بایاس این نورون را بعد از یک دور یادگیری محاسبه کنید.
در یک مجموعه داده بسیار نامتوازن که نمونههای مثبت به ندرت یافت میشوند، دو مدل A و B آموزش داده شدهاند. مدل A دارای recall بالا و precision نسبتاً پایین است، در حالی که مدل B دارای نمودار ROC با AUC=0.95 است، اما نمودار precision-recall آن پایینتر از مدل A است. کدام مدل برای این مسئله مناسبتر است و چرا؟
در یک مجموعه داده بسیار نامتوازن که نمونههای مثبت به ندرت یافت میشوند، دو مدل A و B آموزش داده شدهاند. مدل A دارای recall بالا و precision نسبتاً پایین است، در حالی که مدل B دارای نمودار ROC با AUC=0.95 است، اما نمودار precision-recall آن پایینتر از مدل A است. کدام مدل برای این مسئله مناسبتر است و چرا؟
جدول زیر نتایج اعتبارسنجی متقابل 10-fold یک مدل یادگیری ماشین را نشان میدهد. کدام تفسیر برای این نتایج صحیحتر است؟
جدول زیر نتایج اعتبارسنجی متقابل 10-fold یک مدل یادگیری ماشین را نشان میدهد. کدام تفسیر برای این نتایج صحیحتر است؟
یک مدل رگرسیون خطی برای پیشبینی احتمال درخواست وام بر اساس ویژگیهای سن (بین 20 تا 70) و درآمد (بین 20k تا 100k) طراحی شده است. کدام روش مهندسی ویژگی (Feature Engineering) میتواند عملکرد مدل را به طور قابل توجهی افزایش دهد؟
یک مدل رگرسیون خطی برای پیشبینی احتمال درخواست وام بر اساس ویژگیهای سن (بین 20 تا 70) و درآمد (بین 20k تا 100k) طراحی شده است. کدام روش مهندسی ویژگی (Feature Engineering) میتواند عملکرد مدل را به طور قابل توجهی افزایش دهد؟
در یک مجموعه داده شامل 2000 نمونه، که در سه دسته مثبت (800 نمونه)، نامشخص (700 نمونه) و منفی (500 نمونه) قرار دارند، از دو درخت تصمیمگیری برای دستهبندی استفاده شده است. در اولین سطح تقسیم (عمق اول)، توزیع نمونهها در گرههای فرزند به شرح زیر است:
- درخت ۱:
- گره راست: مثبت 600، نامشخص 200، منفی 200
- گره چپ: مثبت 200، نامشخص 500، منفی 300
- درخت ۲:
- گره راست: مثبت 500، نامشخص 400، منفی 300
- گره چپ: مثبت 300، نامشخص 300، منفی 200
با توجه به توضیحات داده شده، کدام گزینه صحیح است؟
در یک مجموعه داده شامل 2000 نمونه، که در سه دسته مثبت (800 نمونه)، نامشخص (700 نمونه) و منفی (500 نمونه) قرار دارند، از دو درخت تصمیمگیری برای دستهبندی استفاده شده است. در اولین سطح تقسیم (عمق اول)، توزیع نمونهها در گرههای فرزند به شرح زیر است:
- درخت ۱:
- گره راست: مثبت 600، نامشخص 200، منفی 200
- گره چپ: مثبت 200، نامشخص 500، منفی 300
- درخت ۲:
- گره راست: مثبت 500، نامشخص 400، منفی 300
- گره چپ: مثبت 300، نامشخص 300، منفی 200
با توجه به توضیحات داده شده، کدام گزینه صحیح است؟
در یک مسئله طبقه بندی (classification) با دادههای نامتوازن (۵٪ مثبت)، ماتریس درهمریختگی (confusion matrix) به صورت زیر بدست آمده است:
Predicted 1
Predicted 0
Actual 1
10
5
Actual 0
20
1000
کدام معیار ارزیابی برای این مدل ارجحیت دارد؟
در یک مسئله طبقه بندی (classification) با دادههای نامتوازن (۵٪ مثبت)، ماتریس درهمریختگی (confusion matrix) به صورت زیر بدست آمده است:
Predicted 1 | Predicted 0 | |
---|---|---|
Actual 1 | 10 | 5 |
Actual 0 | 20 | 1000 |
کدام معیار ارزیابی برای این مدل ارجحیت دارد؟
با توجه به اطلاعات ماتریس درهم ریختگی سوال قبل، مقدار عددی F1-Score مناسب برای ارزیابی مدل چند است؟
با توجه به اطلاعات ماتریس درهم ریختگی سوال قبل، مقدار عددی F1-Score مناسب برای ارزیابی مدل چند است؟
کدام گزاره در مورد معیارهای تقسیم گره (node splitting criteria) در یک درخت تصمیم (Decision Tree) برای مسائل رگرسیون (Regression) صحیح است؟
کدام گزاره در مورد معیارهای تقسیم گره (node splitting criteria) در یک درخت تصمیم (Decision Tree) برای مسائل رگرسیون (Regression) صحیح است؟
کدام گزاره در مورد Gini Index و Entropy در درخت تصمیم (Decision Tree Classifier) صحیح است؟
کدام گزاره در مورد Gini Index و Entropy در درخت تصمیم (Decision Tree Classifier) صحیح است؟
یک مدل رگرسیون خطی روی مجموعه داده اعتبارسنجی، نتایج زیر را نشان میدهد:
#
True Value
Predicted Value
1
200
210
2
150
160
3
300
280
4
250
240
5
100
130
مقدار ضریب تعیین ($R^2$) برای این مدل چقدر است؟
یک مدل رگرسیون خطی روی مجموعه داده اعتبارسنجی، نتایج زیر را نشان میدهد:
# | True Value | Predicted Value |
---|---|---|
1 | 200 | 210 |
2 | 150 | 160 |
3 | 300 | 280 |
4 | 250 | 240 |
5 | 100 | 130 |
مقدار ضریب تعیین ($R^2$) برای این مدل چقدر است؟
در آموزش یک مدل Logistic Regression، جدول زیر شامل مقادیر واقعی و احتمالات پیشبینی شده برای هر نمونه است:
#
True Label
Predicted Probability
1
1
0.9
2
0
0.3
3
1
0.6
مقدار میانگین Log Loss را محاسبه کنید.
در آموزش یک مدل Logistic Regression، جدول زیر شامل مقادیر واقعی و احتمالات پیشبینی شده برای هر نمونه است:
# | True Label | Predicted Probability |
---|---|---|
1 | 1 | 0.9 |
2 | 0 | 0.3 |
3 | 1 | 0.6 |
مقدار میانگین Log Loss را محاسبه کنید.
در یک الگوریتم یادگیری تقویتی (Reinforcement Learning)، تابع ارزش (Value Function) نشان دهنده تخمینی از مجموع پاداشهای دریافتی در آینده بر اساس دنبال کردن یک سیاست خاص از یک حالت خاص است.
در یک الگوریتم یادگیری تقویتی (Reinforcement Learning)، تابع ارزش (Value Function) نشان دهنده تخمینی از مجموع پاداشهای دریافتی در آینده بر اساس دنبال کردن یک سیاست خاص از یک حالت خاص است.
در یادگیری ماشین، فرآیند انتخاب زیرمجموعهای از ویژگیهای موجود در دادهها به منظور کاهش ابعاد و بهبود عملکرد مدل، به عنوان __________ شناخته میشود.
در یادگیری ماشین، فرآیند انتخاب زیرمجموعهای از ویژگیهای موجود در دادهها به منظور کاهش ابعاد و بهبود عملکرد مدل، به عنوان __________ شناخته میشود.
هر یک از الگوریتمهای یادگیری ماشین زیر را با نوع مسئلهای که بیشتر برای حل آن مناسب است، مطابقت دهید:
هر یک از الگوریتمهای یادگیری ماشین زیر را با نوع مسئلهای که بیشتر برای حل آن مناسب است، مطابقت دهید:
کدام یک از روشهای زیر برای مقابله با مشکل عدم تعادل کلاسها (class imbalance) در یک مجموعه داده مناسبتر است، اگر هدف اصلی، حفظ دقت (precision) بالا در کلاس اقلیت باشد؟
کدام یک از روشهای زیر برای مقابله با مشکل عدم تعادل کلاسها (class imbalance) در یک مجموعه داده مناسبتر است، اگر هدف اصلی، حفظ دقت (precision) بالا در کلاس اقلیت باشد؟
در یک مسئله یادگیری نیمهنظارتی (semi-supervised learning)، کدام یک از روشهای زیر میتواند به بهبود عملکرد مدل کمک کند، اگر اطلاعات بدون برچسب (unlabeled data) دارای ساختار خوشهبندی مشخصی باشند؟
در یک مسئله یادگیری نیمهنظارتی (semi-supervised learning)، کدام یک از روشهای زیر میتواند به بهبود عملکرد مدل کمک کند، اگر اطلاعات بدون برچسب (unlabeled data) دارای ساختار خوشهبندی مشخصی باشند؟
در روش انتقال یادگیری (Transfer Learning)، فریز کردن لایههای ابتدایی یک شبکه عصبی از پیش آموزشدیده (pre-trained network) و آموزش تنها لایههای انتهایی، به منظور انتقال دانش از یک مسئله به مسئله دیگر، همیشه منجر به بهبود عملکرد مدل میشود.
در روش انتقال یادگیری (Transfer Learning)، فریز کردن لایههای ابتدایی یک شبکه عصبی از پیش آموزشدیده (pre-trained network) و آموزش تنها لایههای انتهایی، به منظور انتقال دانش از یک مسئله به مسئله دیگر، همیشه منجر به بهبود عملکرد مدل میشود.
در یادگیری عمیق، به فرایند تنظیم دقیق (fine-tuning) یک مدل از پیش آموزشدیده (pre-trained model) بر روی یک مجموعه داده جدید، با هدف انطباق مدل با ویژگیهای خاص آن مجموعه داده، __________ گفته میشود.
در یادگیری عمیق، به فرایند تنظیم دقیق (fine-tuning) یک مدل از پیش آموزشدیده (pre-trained model) بر روی یک مجموعه داده جدید، با هدف انطباق مدل با ویژگیهای خاص آن مجموعه داده، __________ گفته میشود.
هر یک از مفاهیم زیر در یادگیری عمیق را با تعریف مربوط به آن مطابقت دهید:
هر یک از مفاهیم زیر در یادگیری عمیق را با تعریف مربوط به آن مطابقت دهید:
Flashcards
Binary Cross-Entropy
Binary Cross-Entropy
تابع هزینه ای که برای طبقه بندی دودویی با MLP و لایه خروجی Sigmoid مناسب تر است.
روش همگن سازی L2
روش همگن سازی L2
روش همگن سازی L2 روی شبکه های عصبی، روی بزرگی وزن های مدل پنالتی می گذارد.
Vanishing Gradient
Vanishing Gradient
پدیده vanishing gradient موجب می شود فرایند یادگیری در وزن ها و بایاس های مدل کُند شود.
Softmax
Softmax
Signup and view all the flashcards
به روز رسانی بایاس نورون
به روز رسانی بایاس نورون
Signup and view all the flashcards
مدل مطلوب با داده نامتوازن
مدل مطلوب با داده نامتوازن
Signup and view all the flashcards
بایاس کم و واریانس زیاد
بایاس کم و واریانس زیاد
Signup and view all the flashcards
بهبود عملکرد مدل رگرسیون
بهبود عملکرد مدل رگرسیون
Signup and view all the flashcards
بهترین درخت با Gini/Entropy
بهترین درخت با Gini/Entropy
Signup and view all the flashcards
ارزیابی مدل با داده نامتوازن
ارزیابی مدل با داده نامتوازن
Signup and view all the flashcards
مقدار عددی متر مناسب
مقدار عددی متر مناسب
Signup and view all the flashcards
معیار جداسازی نود در رگرسیون
معیار جداسازی نود در رگرسیون
Signup and view all the flashcards
Entropy
Entropy
Signup and view all the flashcards
محاسبه R^۲
محاسبه R^۲
Signup and view all the flashcards
میانگین Log Loss
میانگین Log Loss
Signup and view all the flashcards
Study Notes
تابع هزینه (Cost Function)
- برای انجام دسته بندی باینری (Binary Classification) با استفاده از یک MLP با لایه خروجی Sigmoid، تابع هزینه Binary Cross-Entropy مناسب تر است.
همگن سازی L2 در شبکه های عصبی
- روش همگن سازی L2 روی شبکه های عصبی، پنالتی روی بزرگی وزن های مدل اعمال می کند.
علت پدیده Vanishing Gradient در شبکه های عصبی
- دلیل وقوع vanishing gradient در شبکه های عصبی، کند شدن فرایند یادگیری در وزن ها و بایاس های مدل است.
تابع فعال سازی در شبکه طبقه بندی چند کلاسه (Multi-Class)
- برای لایه خروجی یک شبکه طبقه بندی چند کلاسه، تابع فعال سازی Softmax بیشتر از بقیه توابع استفاده می شود.
به روز رسانی بایاس نورون خروجی
- در یک شبکه عصبی با تابع فعال سازی Sigmoid و تابع هزینه Cross-Entropy، اگر مقدار نورون خروجی 0.6 و مقدار برچسب واقعی 1 باشد، برای به روز رسانی بایاس نورون خروجی، باید آن را به اندازه 0.16 تغییر داد.
مقایسه مدل ها با داده های نامتوازن
- برای مجموعه داده های نامتوازن، مدل A با مقدار recall بالا و precision نسبتا پایین نسبت به مدل B با نمودار precision-recall پایین تر و AUC=0.95 مناسبتر است.
تفسیر نتایج اعتبارسنجی متقابل (Cross-Validation)
- اگر بعد از انجام 10-fold cross validation خطای آموزش کم و خطای آزمون متنوع باشد، مدل احتمالاً دچار overfitting شده است.
افزایش عملکرد مدل رگرسیون خطی
- در مدل رگرسیون خطی با ویژگی های سن و درآمد، افزودن مقدار درآمد ضرب در سن به عنوان ویژگی سوم می تواند عملکرد مدل را بهبود بخشد.
دسته بندی دیتاست با درخت تصمیم
- در یک دیتاست با 2000 سمپل و سه دسته (800، 700، 500) با دو درخت تصمیم، نحوه تقسیم نمونه ها در عمق اول درخت ها مهم است.
انتخاب درخت تصمیم مناسب
- با توجه به توضیحات داده شده، باید بررسی شود کدام درخت در هر دو معیار Gini Index و Entropy عملکرد بهتری دارد.
ارزیابی مدل با داده های نامتوازن
- در آموزش یک طبقه بند با داده های نامتوازن (5% مثبت)، متر Specificity برای ارزیابی مدل مناسبتر است.
معیار مناسب در رگرسیون
- در سوال قبل، مقدار عددی متر مناسب برای ارزیابی مدل در رگرسیون 0.97 است.
معیار جداسازی نود در درخت تصمیم رگرسیون
- در درخت تصمیم برای رگرسیون، از معیار کاهش واریانس یا کاهش SSR برای جداسازی نودها استفاده می شود.
گزاره صحیح درباره Gini Index و Entropy در درخت تصمیم
- وقتی توزیع کلاس ها کاملاً متوازن باشد مقدار Entropy برابر 1 است.
محاسبه ضریب تعیین مدل
- برای محاسبه ضریب تعیین (R²) مدل رگرسیون خطی با نتایج داده شده، به محاسبات آماری نیاز داریم.
محاسبه میانگین Log Loss
- برای محاسبه مقدار میانگین Log Loss با توجه به جدول داده شده، باید از فرمول Log Loss استفاده و میانگین مقادیر را محاسبه کرد.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.