أعلنت شركة جوجل عن أن تقنية العلامة المائية النصية SynthID، وهي الأداة التي أنشأتها الشركة لتسهيل التعرف على النصوص التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، متاحة الآن كمصدر مفتوح من خلال مجموعة أدوات Google Responsible Generative AI Toolkit.
وقال بوشميت كوهلي، نائب رئيس الأبحاث في جوجل ديب مايند، لمجلة إم آي تي تكنولوجي ريفيو: “الآن، سيتمكن مطورو الذكاء الاصطناعي التوليدي الآخرون من استخدام هذه التكنولوجيا لمساعدتهم على اكتشاف ما إذا كانت مخرجات النص قد جاءت من [نماذج اللغة الكبيرة] الخاصة بهم، مما يسهل على المزيد من المطورين بناء الذكاء الاصطناعي بشكل مسؤول ” .
وأصبحت العلامات المائية أدوات ذات أهمية متزايدة مع استخدام نماذج لغوية كبيرة لنشر معلومات مضللة سياسية ، وتوليد محتوى جنسي غير توافقي ، ولأغراض خبيثة أخرى، وتدرس كاليفورنيا بالفعل جعل وضع العلامات المائية للذكاء الاصطناعي إلزاميًا، بينما بدأت حكومة الصين في فرض ذلك العام الماضى ، ومع ذلك لا تزال الأدوات قيد التطوير.
ويساعد SynthID، الذي تم الإعلان عنه في أغسطس الماضى، في جعل الناتج عن الذكاء الاصطناعي قابلاً للاكتشاف من خلال إضافة علامة مائية غير مرئية في الصور والصوت والفيديو والنص أثناء إنشائها.
وتقول Google إن الإصدار النصي من SynthID يعمل عن طريق جعل الناتج النصي أقل احتمالية قليلاً بطريقة يمكن اكتشافها بواسطة البرامج ولكن ليس البشر:
ويقوم نموذج LLM بإنشاء نص رمزي واحد في كل مرة ، ويمكن أن تمثل هذه الرموز حرفًا واحدًا أو كلمة أو جزءًا من عبارة، و لإنشاء تسلسل من النص المتماسك، يتنبأ النموذج بالرمز التالي الأكثر احتمالية للتوليد، و تستند هذه التوقعات إلى الكلمات السابقة ودرجات الاحتمال المعينة لكل رمز محتمل.
وتزعم شركة جوجل أن النظام، الذي تم دمجه بالفعل في روبوت الدردشة Gemini الخاص بها، لا يؤثر على جودة النص المُولَّد أو دقته أو إبداعه أو سرعته، وهو ما كان يمثل مشكلة منذ فترة طويلة مع أنظمة العلامات المائية.
وتقول جوجل إنه يمكن أن يعمل على نص قصير يصل إلى ثلاث جمل، بالإضافة إلى النص الذي تم اقتصاصه أو إعادة صياغته أو تعديله، لكنه يواجه صعوبات مع النص القصير، والمحتوى الذي تمت إعادة كتابته أو ترجمته، وحتى الردود على الأسئلة الواقعية.
وكتبت Google فى منشور على مدونتها في شهر مايو : ” “SynthID ليس حلاً سحريًا لتحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، لكنه حجر أساس مهم لتطوير أدوات تحديد أكثر موثوقية للذكاء الاصطناعي ويمكن أن يساعد ملايين الأشخاص على اتخاذ قرارات مستنيرة حول كيفية تفاعلهم مع المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعى.
تعليقات