آزمون شبیه ساز هوش مصنوعی گرینولی (تستی) PDF

Summary

این یک آزمون تستی هوش مصنوعی گرینولی است. این آزمون شامل تعدادی سوالات چند گزینه ای در مورد یادگیری ماشین و شبکه های عصبی است.

Full Transcript

‫آزمون شبیهساز مرحله دوم هوش مصنوعی گرینولی )تستی(‬ ‫*جدول مقادیر لگاریتم در آخرین صفحه هست*‬ ‫‪.۱‬کدام ‪ Cost Function‬برای انجام ‪ Binary Classi cation‬با استفاده از یک ‪MLP‬‬ ‫با الیه خروجی ‪ Sigmoid‬مناسبتر است ؟‬...

‫آزمون شبیهساز مرحله دوم هوش مصنوعی گرینولی )تستی(‬ ‫*جدول مقادیر لگاریتم در آخرین صفحه هست*‬ ‫‪.۱‬کدام ‪ Cost Function‬برای انجام ‪ Binary Classi cation‬با استفاده از یک ‪MLP‬‬ ‫با الیه خروجی ‪ Sigmoid‬مناسبتر است ؟‬ ‫‪MSE (۱‬‬ ‫‪MAE (۲‬‬ ‫‪Categorical Cross-Entropy (۳‬‬ ‫‪Hinge Loss (۴‬‬ ‫‪Binary Cross-Entropy (۵‬‬ ‫‪.۲‬روش همگنسازی ‪ L2‬چه کاری بر روی شبکههای عصبی انجام میدهد؟‬ ‫‪ (۱‬اضافه کردن نویز نرمال به ورودیها‬ ‫‪ (۲‬پنالتی گذاشنت روی بزرگی وزنهای مدل‬ ‫‪ (۳‬هرس نورونهای بدون استفاده )خروجی صفر(‬ ‫‪ (۴‬دودویی کردن خروجی‬ ‫‪ (۵‬نرمال کردن خروجی‬ ‫‪fi‬‬ ‫‪.۳‬کدام یک از موارد زیر معلول پدیده ‪ vanishing gradient‬در شبکههای عصبی است؟‬ ‫‪ (۱‬در فرایند یادگیری وزنهای مدل به صفر میل میکنند‪.‬‬ ‫‪ (۲‬در فرایند یادگیری وزنهای مدل به بینهایت میل میکنند‪.‬‬ ‫‪ (۳‬توقف یادگیری در نورونهای خروجی‪.‬‬ ‫‪ (۴‬کند شدن فرایند یادگیری در وزنها و بایاسهای مدل‪.‬‬ ‫‪ (۵‬مدل روی ‪ training data‬دچار ‪ over tting‬میشود‪.‬‬ ‫‪.۴‬کدام تابع فعالسازی در الیه خروجی یک ‪multi-class classi cation network‬‬ ‫بیشتر مورد استفاده قرار میگیرد؟‬ ‫‪Softmax (۱‬‬ ‫‪Sigmoid (۲‬‬ ‫‪ReLU (۳‬‬ ‫‪Tanh (۴‬‬ ‫‪SoftPlus (۵‬‬ ‫‪fi‬‬ ‫‪fi‬‬ ‫‪.۵‬اگر در یک شبکه عصبی با تابع فعال سازی ‪ Sigmoid‬و تابع هزینه ‪Cross-Entropy‬‬ ‫مقدار نورون خروجی برابر با ‪ 0.6‬و مقدار لیبل واقعی برابر با ‪ 1‬باشد‪ ،‬در یک دور به روز‬ ‫رسانی بایاس نورون خروجی چقدر باید آن را تغییر بدهیم ؟‬ ‫‪0.4 (۱‬‬ ‫‪0.6 (۲‬‬ ‫‪0.16 (۳‬‬ ‫‪0.6 (۴‬‬ ‫‪0.4 (۵‬‬ ‫‪.۶‬برای بررسی و پیشبینی یک مجموعه داده شدیدا نامتوازن که نمونههای مثبت بسیار‬ ‫کمیاب هستند دو مدل ‪ A‬و ‪ B‬را ساختهایم‪.‬‬ ‫در مدل ‪ A‬مشاهده ما ‪ recall‬باال و ‪ precision‬نسبتا پایین است‪.‬‬ ‫در مدل ‪ B‬نمودار ‪ ROC‬با ‪ AUC = 0.95‬مشاهده شده اما نمودار ‪precision-recall‬‬ ‫پایینتر از نمودار مدل ‪ A‬است‪.‬‬ ‫عملکرد کدام مدل مطلوبتر است و چرا ؟‬ ‫‪ (۱‬مدل ‪ A‬به خاطر بیشینه کردن ‪recall‬‬ ‫‪ (۲‬مدل ‪ A‬به خاطر ‪ AUC‬باالتر‬ ‫‪ (۳‬مدل ‪ B‬به خاطر بیشینه کردن ‪precision‬‬ ‫‪ (۴‬مدل ‪ B‬به خاطر ‪ AUC‬باالتر‬ ‫‪ (۵‬اطالعات کافی برای مقایسه دو مدل وجود ندارد‪.‬‬ ‫‪-‎‬‬ ‫‪-‎‬‬ ‫‪.۷‬روی یک مدل یادگیری ماشین ‪ 10-fold cross validation‬انجام دادیم و جدول نتایج‬ ‫زیر بدست آمده‪.‬‬ ‫‪Fold‬‬ ‫‪Train Error‬‬ ‫‪Test Error‬‬ ‫‪1‬‬ ‫‪0.20‬‬ ‫‪0.25‬‬ ‫‪2‬‬ ‫‪0.19‬‬ ‫‪0.24‬‬ ‫‪3‬‬ ‫‪0.18‬‬ ‫‪0.27‬‬ ‫‪4‬‬ ‫‪0.21‬‬ ‫‪0.26‬‬ ‫‪5‬‬ ‫‪0.19‬‬ ‫‪0.22‬‬ ‫‪6‬‬ ‫‪0.20‬‬ ‫‪0.23‬‬ ‫‪7‬‬ ‫‪0.20‬‬ ‫‪0.25‬‬ ‫‪8‬‬ ‫‪0.19‬‬ ‫‪0.26‬‬ ‫‪9‬‬ ‫‪0.18‬‬ ‫‪0.28‬‬ ‫‪10‬‬ ‫‪0.21‬‬ ‫‪0.31‬‬ ‫کدام یک تفسیرهای زیر درستتر است ؟‬ ‫‪ (۱‬مدل دارای بایاس کم و واریانس زیاد است‪.‬‬ ‫‪ (۲‬مدل دارای بایاس کم و واریانس کم است‪.‬‬ ‫‪ (۳‬مدل احتماال دچار ‪ over tting‬شده است‪.‬‬ ‫‪ (۴‬گزینههای ‪ ۲‬و ‪ ۳‬محتمل هستند‪.‬‬ ‫‪ (۵‬گزینههای ‪ ۱‬و ‪ ۳‬محتمل هستند‪.‬‬ ‫‪fi‬‬ ‫‪.۸‬یک مدل ‪ linear regression‬برای پیشبینی احتمال درخواست وام افراد بر اساس دو‬ ‫ویژگی سن )مقدار پیوسته عددی بین ‪ 20‬تا ‪ (70‬و درامد )مقدار پیوسته عددی بین ‪ 20k‬تا‬ ‫‪ (100k‬طراحی کرده ایم‪.‬‬ ‫کدام یک از روشهای مهندسی ویژگی محتملتر است عملکرد مدل را بیشتر افزایش دهد؟‬ ‫‪ (۱‬استفاده از سن و درامد به عنوان ویژگیهای مستقل )بدون هیچ تبدیلی(‬ ‫‪ (۲‬اضافه کردن مقدار درامد ضرب در سن به عنوان ویژگی سوم‪.‬‬ ‫‪ (۳‬نرمال سازی ویژگیها با استفاده از روش ‪min-max scaling‬‬ ‫‪ (۴‬کاهش ابعاد با استفاده از روش ‪PCA‬‬ ‫‪ (۵‬استاندارد کردن ویژگیها‪.‬‬ ‫‪.۹‬در یک دیتاست شامل ‪ ۲۰۰۰‬سمپل که در سه دستهی مختلف مثبت‪ ،‬نامشخص و منفی و‬ ‫به ترتیب از راست به چپ به صورت )‪ ۸۰۰‬و ‪ ۷۰۰‬و ‪ ،(۵۰۰‬ما به کمک دو درخت تصمیم‬ ‫مختلف دیتا رو دسته بندی کردیم‪.‬در عمق اول از این شکست‪ ،‬سمپلها در بچهها به صورت‬ ‫زیر تقسیم شدهاند‪:‬‬ ‫درخت ‪ ۱‬بچه راست‪ ۶۰۰) :‬و ‪ ۲۰۰‬و ‪(۲۰۰‬‬ ‫درخت ‪ ۱‬بچه چپ‪ ۲۰۰) :‬و ‪ ۵۰۰‬و ‪(۳۰۰‬‬ ‫درخت ‪ ۲‬بچه راست‪ ۵۰۰) :‬و ‪ ۴۰۰‬و ‪(۳۰۰‬‬ ‫درخت ‪ ۲‬بچه چپ‪ ۳۰۰) :‬و ‪ ۳۰۰‬و ‪(۲۰۰‬‬ ‫با توجه به توضیحات داده شده کدام یک از گزینههای زیر درست است؟‬ ‫‪ (۱‬درخت ‪ ۱‬هم در ‪ Gini Index‬و هم در ‪ Entropy‬بهتر است‬ ‫‪ (۲‬درخت ‪ ۱‬در ‪ Gini Index‬و درخت ‪ ۲‬در ‪ Entropy‬بهترند‬ ‫‪ (۳‬درخت ‪ ۲‬در ‪ Gini Index‬و درخت ‪ ۱‬در ‪ Entropy‬بهترند‬ ‫‪ (۴‬درخت ‪ ۲‬هم در ‪ Gini Index‬و هم در ‪ Entropy‬بهتر است‬ ‫‪ (۵‬جفت درختها ‪ Information Gain‬یکسانی دارند‪.‬‬ ‫‪.۱۰‬در آموزش یک ‪ classi er‬بر روی یک مجموعه داده شدیدا نامتوازن )‪ ۵٪‬مثبت(‬ ‫ماتریس ‪ confusion‬زیر بدست آمده‪.‬‬ ‫‪Predicted 1‬‬ ‫‪Predicted 0‬‬ ‫‪Actual 1‬‬ ‫‪10‬‬ ‫‪5‬‬ ‫‪Actual 0‬‬ ‫‪20‬‬ ‫‪1000‬‬ ‫کدام یک از موارد زیر متر بهتری برای ارزیابی مدل است؟‬ ‫‪Accuracy (۱‬‬ ‫‪Precision (۲‬‬ ‫‪Recall (۳‬‬ ‫‪F1 (۴‬‬ ‫‪Speci city (۵‬‬ ‫‪fi‬‬ ‫‪fi‬‬ ‫‪.۱۱‬در سوال قبل مقدار عددی متر مناسب چیست ؟‬ ‫‪0.44 (۱‬‬ ‫‪0.50 (۲‬‬ ‫‪0.66 (۳‬‬ ‫‪0.33 (۴‬‬ ‫‪0.97 (۵‬‬ ‫‪.۱۲‬کدام یک از گزارههای زیر در مورد معیار جداسازی ‪ node‬های ‪ Decision Tree‬در‬ ‫تسک ‪ Regression‬درست است ؟‬ ‫‪ (۱‬از معیار کاهش ‪ Entropy‬استفاده میکنند‪.‬‬ ‫‪ (۲‬از معیار کاهش واریانس یا کاهش ‪ SSR‬استفاده میکنند‪.‬‬ ‫‪ (۳‬از معیار کاهش ‪ Gini Impurity‬یا افزایش ‪ Information Gain‬استفاده میکنند‪.‬‬ ‫‪ (۴‬از معیار کاهش واریانس یا افزایش ‪ SSR‬استفاده میکنند‪.‬‬ ‫‪ (۵‬گزینههای ‪ ۱‬و ‪ ۳‬صحیح هستند‪.‬‬ ‫‪.۱۳‬گزاره صحیح در مورد ‪ Gini Index‬و ‪ Entropy‬در ‪ Decision Tree Classi er‬ها‬ ‫کدام است ؟‬ ‫‪ (۱‬به ازای هر توزیعی مقدار ‪ Gini Index‬همواره بیشتر یا مساوی ‪ Entropy‬است‪.‬‬ ‫‪ (۲‬وقتی احتمال یک کالس تقریبا ‪ ۱‬باشد مقدار ‪ Entropy‬بیشینه ممکن است‪.‬‬ ‫‪ (۳‬در توزیع یکنواخت کالسها مقدار هر دو پارامتر بیشینه است‪.‬‬ ‫‪ (۴‬وقتی توزیع کالسها کامال متوازن باشد مقدار ‪ Entropy‬برابر ‪ ۱‬است‪.‬‬ ‫‪ (۵‬پارامتر ‪ Gini index‬نسبت به تغییرات کوچک در توزیع کالسها حساس تر است‪.‬‬ ‫‪.۱۴‬از یک مدل رگرسیون خطی برای پیشبینی قیمت خانهها استفاده کردهایم و روی‬ ‫مجموعه دادههای ‪ validation‬نتایج زیر بدست آمده است‪.‬‬ ‫‪#‬‬ ‫‪True Value‬‬ ‫‪Predicted Value‬‬ ‫‪1‬‬ ‫‪200‬‬ ‫‪210‬‬ ‫‪2‬‬ ‫‪150‬‬ ‫‪160‬‬ ‫‪3‬‬ ‫‪300‬‬ ‫‪280‬‬ ‫‪4‬‬ ‫‪250‬‬ ‫‪240‬‬ ‫‪5‬‬ ‫‪100‬‬ ‫‪130‬‬ ‫مقدار ‪) R²‬ضریب تعیین مدل( چند است؟‬ ‫‪fi‬‬ ‫‪0.53 (۱‬‬ ‫‪0.67 (۲‬‬ ‫‪0.72 (۳‬‬ ‫‪0.84 (۴‬‬ ‫‪0.93 (۵‬‬ ‫‪.۱۵‬در آموزش یک مدل رگرسیون لجستیک جدول خروجی زیر بدست آمده‪.‬‬ ‫‪#‬‬ ‫‪True Label‬‬ ‫‪Predicted Probability‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪0.9‬‬ ‫‪2‬‬ ‫‪0‬‬ ‫‪0.3‬‬ ‫‪3‬‬ ‫‪1‬‬ ‫‪0.6‬‬ ‫مقدار میانگین ‪ Log Loss‬را محاسبه کنید‪.‬‬ ‫‪0.24 (۱‬‬ ‫‪0.32 (۲‬‬ ‫‪0.45 (۳‬‬ ‫‪0.73 (۴‬‬ ‫‪0.89 (۵‬‬ ‫جدول لگاریتم‬ ‫‪N‬‬ ‫)‪ln(N‬‬ ‫‪Log N‬‬ ‫‪2‬‬ ‫‪0.69‬‬ ‫‪1‬‬ ‫‪3‬‬ ‫‪1.09‬‬ ‫‪1.58‬‬ ‫‪5‬‬ ‫‪1.60‬‬ ‫‪2.32‬‬ ‫‪7‬‬ ‫‪1.94‬‬ ‫‪2.80‬‬