بحث · Ars Technica · ٢٩ مايو ٢٠٢٦

نماذج اللغة تصر على الادعاءات الكاذبة

كشفت الأبحاث الجديدة أن نماذج اللغة الكبيرة تصر على المعلومات الخاطئة حتى بعد تحذيرات صريحة.

استناداً إلى تقرير Ars Technica — تحليل وصياغة دليلي

ينبثق نمط مقلق في الأبحاث الجديدة حول نماذج اللغة الكبيرة: تؤكد بثقة بيانات كاذبة حتى عندما تحذر بشكل صريح أن البيان خاطئ. اختبر الباحثون ما إذا كانت النماذج ستصحح نفسها عند إعطاؤها ملاحظات مباشرة. لم تفعل معظمها ذلك.

يسلط الاكتشاف الضوء على عدم تماثل في كيفية معالجة نماذج اللغة للمعلومات. تتفوق في مطابقة الأنماط والاستدلال الإحصائي، لكنها لا تفكر في التصحيح بالطريقة التي يفكر بها البشر. عندما يُخبر النموذج "هذا البيان خاطئ،" يفسره كسياق إضافي—رمز آخر في التسلسل—بدلاً من إلغاء منطقي. يستمر بتفكيره الخاطئ الأصلي.

هذا يهم للنشر في العالم الحقيقي. روبوتات الدردشة في خدمة العملاء، والمعلمون الاصطناعيون، وأنظمة دعم القرار تفترض جميعها بعض القدرة على التصحيح الذاتي. لكن إذا لم تستطع النماذج تحديث تفكيرها الداخلي بصراحة عند معارضتها، ينهار هذا الافتراض.

أبرز النقاط

نماذج اللغة تصر على الادعاءات الكاذبة حتى بعد تحذيرات صريحة
النماذج تعامل التصحيحات كسياق إضافي، وليس إلغاءات منطقية
تبرز الحاجة للحماية والإشراف البشري

ما أهمية ذلك

يكشف هذا البحث عن فجوة بين تفكير نماذج اللغة والتصحيح البشري. إذا لم تستطع النماذج تحديث منطقها عند معارضتها، فهي أقل موثوقية كأدوات دعم القرار.