آزمون شبیه ساز هوش مصنوعی گرینولی (تستی) PDF
Document Details

Uploaded by FerventLivermorium
Tags
Summary
این یک آزمون تستی هوش مصنوعی گرینولی است. این آزمون شامل تعدادی سوالات چند گزینه ای در مورد یادگیری ماشین و شبکه های عصبی است.
Full Transcript
آزمون شبیهساز مرحله دوم هوش مصنوعی گرینولی )تستی( *جدول مقادیر لگاریتم در آخرین صفحه هست* .۱کدام Cost Functionبرای انجام Binary Classi cationبا استفاده از یک MLP با الیه خروجی Sigmoidمناسبتر است ؟...
آزمون شبیهساز مرحله دوم هوش مصنوعی گرینولی )تستی( *جدول مقادیر لگاریتم در آخرین صفحه هست* .۱کدام Cost Functionبرای انجام Binary Classi cationبا استفاده از یک MLP با الیه خروجی Sigmoidمناسبتر است ؟ MSE (۱ MAE (۲ Categorical Cross-Entropy (۳ Hinge Loss (۴ Binary Cross-Entropy (۵ .۲روش همگنسازی L2چه کاری بر روی شبکههای عصبی انجام میدهد؟ (۱اضافه کردن نویز نرمال به ورودیها (۲پنالتی گذاشنت روی بزرگی وزنهای مدل (۳هرس نورونهای بدون استفاده )خروجی صفر( (۴دودویی کردن خروجی (۵نرمال کردن خروجی fi .۳کدام یک از موارد زیر معلول پدیده vanishing gradientدر شبکههای عصبی است؟ (۱در فرایند یادگیری وزنهای مدل به صفر میل میکنند. (۲در فرایند یادگیری وزنهای مدل به بینهایت میل میکنند. (۳توقف یادگیری در نورونهای خروجی. (۴کند شدن فرایند یادگیری در وزنها و بایاسهای مدل. (۵مدل روی training dataدچار over ttingمیشود. .۴کدام تابع فعالسازی در الیه خروجی یک multi-class classi cation network بیشتر مورد استفاده قرار میگیرد؟ Softmax (۱ Sigmoid (۲ ReLU (۳ Tanh (۴ SoftPlus (۵ fi fi .۵اگر در یک شبکه عصبی با تابع فعال سازی Sigmoidو تابع هزینه Cross-Entropy مقدار نورون خروجی برابر با 0.6و مقدار لیبل واقعی برابر با 1باشد ،در یک دور به روز رسانی بایاس نورون خروجی چقدر باید آن را تغییر بدهیم ؟ 0.4 (۱ 0.6 (۲ 0.16 (۳ 0.6 (۴ 0.4 (۵ .۶برای بررسی و پیشبینی یک مجموعه داده شدیدا نامتوازن که نمونههای مثبت بسیار کمیاب هستند دو مدل Aو Bرا ساختهایم. در مدل Aمشاهده ما recallباال و precisionنسبتا پایین است. در مدل Bنمودار ROCبا AUC = 0.95مشاهده شده اما نمودار precision-recall پایینتر از نمودار مدل Aاست. عملکرد کدام مدل مطلوبتر است و چرا ؟ (۱مدل Aبه خاطر بیشینه کردن recall (۲مدل Aبه خاطر AUCباالتر (۳مدل Bبه خاطر بیشینه کردن precision (۴مدل Bبه خاطر AUCباالتر (۵اطالعات کافی برای مقایسه دو مدل وجود ندارد. - - .۷روی یک مدل یادگیری ماشین 10-fold cross validationانجام دادیم و جدول نتایج زیر بدست آمده. Fold Train Error Test Error 1 0.20 0.25 2 0.19 0.24 3 0.18 0.27 4 0.21 0.26 5 0.19 0.22 6 0.20 0.23 7 0.20 0.25 8 0.19 0.26 9 0.18 0.28 10 0.21 0.31 کدام یک تفسیرهای زیر درستتر است ؟ (۱مدل دارای بایاس کم و واریانس زیاد است. (۲مدل دارای بایاس کم و واریانس کم است. (۳مدل احتماال دچار over ttingشده است. (۴گزینههای ۲و ۳محتمل هستند. (۵گزینههای ۱و ۳محتمل هستند. fi .۸یک مدل linear regressionبرای پیشبینی احتمال درخواست وام افراد بر اساس دو ویژگی سن )مقدار پیوسته عددی بین 20تا (70و درامد )مقدار پیوسته عددی بین 20kتا (100kطراحی کرده ایم. کدام یک از روشهای مهندسی ویژگی محتملتر است عملکرد مدل را بیشتر افزایش دهد؟ (۱استفاده از سن و درامد به عنوان ویژگیهای مستقل )بدون هیچ تبدیلی( (۲اضافه کردن مقدار درامد ضرب در سن به عنوان ویژگی سوم. (۳نرمال سازی ویژگیها با استفاده از روش min-max scaling (۴کاهش ابعاد با استفاده از روش PCA (۵استاندارد کردن ویژگیها. .۹در یک دیتاست شامل ۲۰۰۰سمپل که در سه دستهی مختلف مثبت ،نامشخص و منفی و به ترتیب از راست به چپ به صورت ) ۸۰۰و ۷۰۰و ،(۵۰۰ما به کمک دو درخت تصمیم مختلف دیتا رو دسته بندی کردیم.در عمق اول از این شکست ،سمپلها در بچهها به صورت زیر تقسیم شدهاند: درخت ۱بچه راست ۶۰۰) :و ۲۰۰و (۲۰۰ درخت ۱بچه چپ ۲۰۰) :و ۵۰۰و (۳۰۰ درخت ۲بچه راست ۵۰۰) :و ۴۰۰و (۳۰۰ درخت ۲بچه چپ ۳۰۰) :و ۳۰۰و (۲۰۰ با توجه به توضیحات داده شده کدام یک از گزینههای زیر درست است؟ (۱درخت ۱هم در Gini Indexو هم در Entropyبهتر است (۲درخت ۱در Gini Indexو درخت ۲در Entropyبهترند (۳درخت ۲در Gini Indexو درخت ۱در Entropyبهترند (۴درخت ۲هم در Gini Indexو هم در Entropyبهتر است (۵جفت درختها Information Gainیکسانی دارند. .۱۰در آموزش یک classi erبر روی یک مجموعه داده شدیدا نامتوازن ) ۵٪مثبت( ماتریس confusionزیر بدست آمده. Predicted 1 Predicted 0 Actual 1 10 5 Actual 0 20 1000 کدام یک از موارد زیر متر بهتری برای ارزیابی مدل است؟ Accuracy (۱ Precision (۲ Recall (۳ F1 (۴ Speci city (۵ fi fi .۱۱در سوال قبل مقدار عددی متر مناسب چیست ؟ 0.44 (۱ 0.50 (۲ 0.66 (۳ 0.33 (۴ 0.97 (۵ .۱۲کدام یک از گزارههای زیر در مورد معیار جداسازی nodeهای Decision Treeدر تسک Regressionدرست است ؟ (۱از معیار کاهش Entropyاستفاده میکنند. (۲از معیار کاهش واریانس یا کاهش SSRاستفاده میکنند. (۳از معیار کاهش Gini Impurityیا افزایش Information Gainاستفاده میکنند. (۴از معیار کاهش واریانس یا افزایش SSRاستفاده میکنند. (۵گزینههای ۱و ۳صحیح هستند. .۱۳گزاره صحیح در مورد Gini Indexو Entropyدر Decision Tree Classi erها کدام است ؟ (۱به ازای هر توزیعی مقدار Gini Indexهمواره بیشتر یا مساوی Entropyاست. (۲وقتی احتمال یک کالس تقریبا ۱باشد مقدار Entropyبیشینه ممکن است. (۳در توزیع یکنواخت کالسها مقدار هر دو پارامتر بیشینه است. (۴وقتی توزیع کالسها کامال متوازن باشد مقدار Entropyبرابر ۱است. (۵پارامتر Gini indexنسبت به تغییرات کوچک در توزیع کالسها حساس تر است. .۱۴از یک مدل رگرسیون خطی برای پیشبینی قیمت خانهها استفاده کردهایم و روی مجموعه دادههای validationنتایج زیر بدست آمده است. # True Value Predicted Value 1 200 210 2 150 160 3 300 280 4 250 240 5 100 130 مقدار ) R²ضریب تعیین مدل( چند است؟ fi 0.53 (۱ 0.67 (۲ 0.72 (۳ 0.84 (۴ 0.93 (۵ .۱۵در آموزش یک مدل رگرسیون لجستیک جدول خروجی زیر بدست آمده. # True Label Predicted Probability 1 1 0.9 2 0 0.3 3 1 0.6 مقدار میانگین Log Lossرا محاسبه کنید. 0.24 (۱ 0.32 (۲ 0.45 (۳ 0.73 (۴ 0.89 (۵ جدول لگاریتم N )ln(N Log N 2 0.69 1 3 1.09 1.58 5 1.60 2.32 7 1.94 2.80