۱۰ مرداد ۱۴۰۲ - ۲۲:۰۰

ChatGPT در آزمون پذیرش دانشگاه بهتر از دانشجویان عمل کرد

محققان دریافتند که مدل GPT-3 که زیربنای چت‌بات است، به راحتی توانست مسائل استدلالی مربوط به آزمون‌های هوش یا آزمون پذیرش دانشگاه‌ها حل کند و این کار را خیلی بهتر از دانشجویان انجام داد.

به گزارش خبرنگار علم و فناوری ایسکانیوز؛ مطالعات اخیر نشان می‌دهد که نسخه سوم چت‌جی‌پی‌تی تا ۸۰ درصد از مسائل استدلالی را به درستی حل می‌کند؛ این در حالی است که ۶۰ درصد از انسان‌ها می‌توانند این مسائل را درست حل کنند.

محققان دانشگاه کالیفرنیا در لس‌آنجلس می‌گویند: مدل GPT-3 که در ChatGPT استفاده شده، در حل بخشی از سوالات آزمون SAT که یک آزمون استاندارد برای ورود به دانشگاه است، نسبت به انسان عملکرد بهتری داشته است. آنها ادعا می‌کنند که این هوش مصنوعی در حل مسائل نیازمند به استدلال بهتر از متوسط دانشجویان این دانشگاه عمل کرده است.

بیشتر بخوانید:

بیل گیتس: ChatGPT به اندازه اختراع اینترنت اهمیت دارد

براساس این مطالعه، چت‌جی‌پی‌تی مسائل استدلالی را در سطحی حل کرد که با یک دانشجوی دوره کارشناسی همخوانی دارد یا حتی می‌تواند از آن هم پیشی بگیرد.

روانشناسان دانشگاه کالیفرنیا توانایی GPT-3 را برای پیش‌بینی تصویر بعدی در دنباله‌ای از تصاویر را بررسی کردند. البته این تصاویر ابتدا به متن تبدیل شده بود تا مدل هوش مصنوعی توانایی تشخیص آنها را داشته باشد. به‌علاوه، محققان مطمئن شده بودند که این مدل قبلاً هرگز با این سوالات مواجه نشده است.

همین مسائل برای ۴۰ دانشجوی این دانشگاه نیز مطرح شد و محققان دریافتند که چت‌جی‌پی‌تی نسخه سوم توانست به ۸۰ درصد از سوال‌ها به‌درستی پاسخ دهد، در حالی‌ که میانگین امتیاز دانشجویان ۶۰ درصد بوده است.

محققان در ادامه مدل هوش مصنوعی را وادار کردند که مساله قیاسی SAT را حل کند که در آن باید جفت کلماتی که به نوعی به هم مرتبطند را پیدا کند. این کلمات را به گونه‌ای انتخاب کردند که در اینترنت منتشر نشده بود و بنابراین هوش مصنوعی نمی‌توانست در حجم وسیعی از داده‌ها به دنبال جواب این مسائل باشد. نتیجه باز هم جالب بود؛ نمره هوش مصنوعی در جواب دادن به این سوالات از میانگین نمره انسان‌ها بالاتر بود.

البته در آزمایش دیگری این مدل عملکرد ضعیف‌تری داشت. محققان متون نثری را به این هوش مصنوعی ارائه کردند تا آنها را به داستان‌های کوتاهی با معنای مشابه وصل کند، ولی همانطور که گفته شد عملکرد این مدل ضعیف‌تر از دانشجویان بود.

محققان می‌گویند که این هوش مصنوعی در تعاملات اجتماعی، استدلال ریاضی و حل مسائلی که نیاز به درک فضای فیزیکی دارند، مانند بررسی اینکه کدام ابزار برای انتقال شیرینی از یک کاسه به کاسه دیگر بهترین است، هنوز می‌لنگد. با این وجود، در حال پیشرفت سریعی است.

آنها می‌افزایند: قطعاً این یک هوش کاملاً در سطح هوش انسانی نیست، اما قطعاً در یک زمینه خاص پیشرفت کرده است.

انتهای پیام/

کد خبر: 1192228