ابتكار “ذكاء اصطناعي سام” لوقف خطر روبوتات الدردشة

منذ 8 أشهر

الأحد - 15 ديسمبر 2024

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة “تحاكي فضول الإنسان” لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود “خطيرة” على الأسئلة المثيرة.

ويطلق على الطريقة القائمة على التعلم الآلي، اسم “الفريق الأحمر القائم على الفضول” (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة،

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا،

لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال

“التعلم الآلي”، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة،

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

ابتكار “ذكاء اصطناعي سام” لوقف خطر روبوتات الدردشة

اقرء ايضاً

أهم 10 أدوات لإنشاء الصور باستخدام الذكاء الاصطناعي لعام 2024

أهمية الذكاء الاصطناعي في العالم الحديث

أفضل 10 أدوات لإنشاء الفيديوهات باستخدام الذكاء الاصطناعي لعام 2024:

أفضل مواقع انشاء الفيديو بالذكاء الاصطناعي مجانا 2024

بودنغ بذور الشيا وزبدة الفول السوداني والموز

خبز الشوفان بالزبادي

طريقة عمل خبز اللوز لدايت الكيتو

طريقة عمل ستيك لحم صحي

طريقة عمل مشروب الكاكاو للرجيم

طريقة لعمل صدور الفراخ دايت

ماذا تعرف عن عسل المانوكا ولماذا يعتبر العسل الأغلى

طريقة عمل ستيك لحم صحي

بسبوسة لمرضى السكري

فوائد لفاكهة القشطة للرجال..تعرف عليها

فوائد الخميرة للصحة والجسم وأبرز استخداماتها

تعرف على فوائد ورق الغار

الغذاء المتوازن…لصحة الأسرة

حمص بالقرع للرجيم

كيف تستخدمين الزنجبيل لخسارة الوزن

كيف تستخدمين الزنجبيل لخسارة الوزن