به گزارش خبرنگار علم و فناوری ایسکانیوز؛ مطالعات اخیر نشان میدهد که نسخه سوم چتجیپیتی تا ۸۰ درصد از مسائل استدلالی را به درستی حل میکند؛ این در حالی است که ۶۰ درصد از انسانها میتوانند این مسائل را درست حل کنند.
محققان دانشگاه کالیفرنیا در لسآنجلس میگویند: مدل GPT-3 که در ChatGPT استفاده شده، در حل بخشی از سوالات آزمون SAT که یک آزمون استاندارد برای ورود به دانشگاه است، نسبت به انسان عملکرد بهتری داشته است. آنها ادعا میکنند که این هوش مصنوعی در حل مسائل نیازمند به استدلال بهتر از متوسط دانشجویان این دانشگاه عمل کرده است.
بیشتر بخوانید:
بیل گیتس: ChatGPT به اندازه اختراع اینترنت اهمیت دارد
براساس این مطالعه، چتجیپیتی مسائل استدلالی را در سطحی حل کرد که با یک دانشجوی دوره کارشناسی همخوانی دارد یا حتی میتواند از آن هم پیشی بگیرد.
روانشناسان دانشگاه کالیفرنیا توانایی GPT-3 را برای پیشبینی تصویر بعدی در دنبالهای از تصاویر را بررسی کردند. البته این تصاویر ابتدا به متن تبدیل شده بود تا مدل هوش مصنوعی توانایی تشخیص آنها را داشته باشد. بهعلاوه، محققان مطمئن شده بودند که این مدل قبلاً هرگز با این سوالات مواجه نشده است.
همین مسائل برای ۴۰ دانشجوی این دانشگاه نیز مطرح شد و محققان دریافتند که چتجیپیتی نسخه سوم توانست به ۸۰ درصد از سوالها بهدرستی پاسخ دهد، در حالی که میانگین امتیاز دانشجویان ۶۰ درصد بوده است.
محققان در ادامه مدل هوش مصنوعی را وادار کردند که مساله قیاسی SAT را حل کند که در آن باید جفت کلماتی که به نوعی به هم مرتبطند را پیدا کند. این کلمات را به گونهای انتخاب کردند که در اینترنت منتشر نشده بود و بنابراین هوش مصنوعی نمیتوانست در حجم وسیعی از دادهها به دنبال جواب این مسائل باشد. نتیجه باز هم جالب بود؛ نمره هوش مصنوعی در جواب دادن به این سوالات از میانگین نمره انسانها بالاتر بود.
البته در آزمایش دیگری این مدل عملکرد ضعیفتری داشت. محققان متون نثری را به این هوش مصنوعی ارائه کردند تا آنها را به داستانهای کوتاهی با معنای مشابه وصل کند، ولی همانطور که گفته شد عملکرد این مدل ضعیفتر از دانشجویان بود.
محققان میگویند که این هوش مصنوعی در تعاملات اجتماعی، استدلال ریاضی و حل مسائلی که نیاز به درک فضای فیزیکی دارند، مانند بررسی اینکه کدام ابزار برای انتقال شیرینی از یک کاسه به کاسه دیگر بهترین است، هنوز میلنگد. با این وجود، در حال پیشرفت سریعی است.
آنها میافزایند: قطعاً این یک هوش کاملاً در سطح هوش انسانی نیست، اما قطعاً در یک زمینه خاص پیشرفت کرده است.
انتهای پیام/
نظر شما