تحقیق اوپن ای آی فاش كرد؛

مدل های جدید هوش مصنوعی به کاربر دروغ می گویند

به گزارش ساخت اپل آی دی، معیار جدید شرکت اوپن ای آی از آن حکایت می کند که مدلهای هوش مصنوعی این شرکت و همینطور دیگر همتایان آن از پاسخگویی درست به سوالات ناتوان هستند و همه آنها توهم دارند.

به گزارش ساخت اپل آی دی به نقل از فیوچریسم، شرکت اوپن ای آی یک معیار جدید به نام «پرسش و پاسخ ساده» (SimpleQA) عرضه کرده که هدف آن اندازه گیری دقت خروجی مدلهای هوش مصنوعی خود و شرکتهای دیگر است. این شرکت هوش مصنوعی با انجام چنین اقدامی نشان داد مدلهای جدید فناوری مذکور در فراهم کردن پاسخ درست به سوالات عملکرد بدی دارند. نسخه هوش مصنوعی o۱-preview این شرکت که ماه گذشته عرضه شد در آزمون جدید به نرخ موفقیت ۴۲.۷ درصد دست یافت. به بیان دیگر حتی برترین مدلهای بزرگ زبانی که اخیرا معرفی شده اند احتمال زیادی دارد به جای پاسخ درست، جوابی اشتباه به کاربر بدهند. با عنایت به آن که این فناوری در خیلی از وجوه مختلف زندگی انسان ها نفوذ کرده، چنین موردی نگران کننده است. مدلهای هوش مصنوعی رقیب مانند محصول شرکت «آنتروپیک» در آزمون SimpleQA امتیاز پایین تری کسب کردند، به طوریکه مدل تازه انتشار یافته Claude-۳.۵-sonnet این شرکت فقط به ۲۸.۹ درصد سوالات پاسخ درست داد. با این وجود مدل مذکور بیشتر تمایل داشت عدم قطعیت خویش را نشان دهد و از پاسخ دادن خودداری کند، که این امر با عنایت به نتایج ناامید کننده احیانا گزینه بهتری است. دراین میان اوپن ای آی متوجه شد مدلهای هوش مصنوعی خود این شرکت توانمندی هایشان را فراتر از حد معمول تخمین می زنند. این خصوصیت احیانا سبب می شود تا مدلها نسبت به پاسخ های اشتباهی که می سازند، اطمینان بیشتری داشته باشند. مدلهای زبانی بزرگ از مدت ها قبل با اشتباهات یا «توهمات» دست وپنجه نرم می کنند. این اصطلاحی است که شرکتهای هوش مصنوعی برای تمایل محصولاتشان به تولید پاسخ های بی ربط به کارمی برند. جدید ترین یافته های اوپن ای آی یک نشانه نگران کننده مهم در خود دارد و از آن حکایت می کند که مدلهای زبانی بزرگ نمی توانند حقیقت را بیان کنند.

منبع: idstore.ir

1403/08/13

14:38:14

5.0 / 5

311

تگهای خبر: شركت , فناوری , كاربر , محصولات

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

نظر شما در مورد این مطلب

نام:

ایمیل:

نظر:

سوال:

= ۷ بعلاوه ۲