لماذا لا تستطيع نماذج لغة الذكاء الاصطناعى مثل chatgpt فهم الزهور

الباحثون في جامعة ولاية أوهايو يعتبرون قدرة نماذج الذكاء الاصطناعى
تخيل أن تعلم مفهوم الزهرة دون أن تشم رائحة وردة أو تفريش أصابعك عبر بتلاتها. قد نكون قادرين على تشكيل صورة ذهنية أو وصف خصائصها ، هل ما زلنا نفهم حقًا مفهومها؟ هذا هو السؤال الأساسي الذي تم معالجته في دراسة حديثة أجرتها جامعة ولاية أوهايو التي تحقق ما إذا كانت نماذج اللغة الكبيرة مثل chatgpt ويمكن أن يمثل الجوزاء المفاهيم البشرية دون تجربة العالم من خلال الجسم. الجواب ، وفقًا للباحثين في أوهايو والمؤسسات المتعاونين ، هو أن هذا غير ممكن تمامًا.
تشير النتائج إلى أنه حتى الأكثر تقدمًا أدوات الذكاء الاصطناعي لا يزال يفتقر إلى التأريض الحسي الذي يعطي المفاهيم البشرية ثراءهم. في حين أن نماذج اللغة الكبيرة جيدة بشكل ملحوظ في تحديد الأنماط والفئات والعلاقات في اللغة ، غالبًا ما تتفوق على الأداء البشر في المهام اللفظية أو الإحصائية تمامًا ، تكشف الدراسة عن نقص ثابت عندما يتعلق الأمر بالمفاهيم المتجذرة في تجربة الحواس. وهكذا ، عندما يتضمن المفهوم حواس مثل الرائحة أو اللمس ، أو إجراءات جسدية مثل الاحتفاظ أو التحرك أو التفاعل ، يبدو أن اللغة وحدها ليست كافية.
جميع الصور من بابيل بافيل دانليوك
قد لا يدرك Chatgpt & Gemini مفهوم الزهرة تمامًا
ال الباحثون في اختبرت جامعة ولاية أوهايو أربعة نماذج رئيسية منظمة العفو الدولية-GPT-3.5 و GPT-4 و Palm و Gemini-على مجموعة بيانات تضم أكثر من 4400 كلمة قام البشر بتصنيفها سابقًا على أبعاد مفاهيمية مختلفة. تراوحت هذه الأبعاد بين الصفات المجردة مثل “الخيال” و “الإثارة العاطفية” ، إلى أكثر من تلك المؤسسة مثل مدى اختبارات المفهوم من خلال الحواس أو من خلال الحركة.
بعد ذلك ، تم تسجيل كلمات مثل “الزهرة” أو “الحافر” أو “التأرجح” أو “روح الدعابة” من قبل كل من البشر ونماذج الذكاء الاصطناعى لمدى توافقها مع كل بُعد. في حين أظهرت نماذج اللغة الكبيرة محاذاة قوية في الفئات غير المرئية مثل الخيال أو التكافؤ ، انخفض أدائها بشكل كبير عندما تورطت الصفات الحسية أو الحركية. قد يتم التعرف على الزهرة على أنها شيء بصري ، على سبيل المثال ، لكن منظمة العفو الدولية تكافح لتمثيل التجارب المادية المتكاملة التي يربطها معظم الناس بها بشكل طبيعي. “لا يمكن أن يشم نموذج اللغة الكبير رائحة وردة ، أو تلمس بتلات ديزي ، أو المشي عبر حقل من الزهور البرية” ، ” يقول Qihui Xu ، مؤلف الدراسة. “يحصلون على ما يعرفونه من خلال استهلاك كميات هائلة من النص – أوامر حجم أكبر مما يتعرض له الإنسان في حياته بأكملها – ولا يزالون لا يستطيعون التقاط بعض المفاهيم بالطريقة التي يفعلها البشر”.
التحقيق فيما إذا كانت نماذج اللغة الكبيرة مثل chatgpt ويمكن للجرميني تمثيل المفاهيم البشرية بدقة
دور الحواس والتجربة الجسدية في الفكر
الدراسة ، نشرت مؤخرا في Nature Human Behavior ، ينقر في مناقشة علمية إدراكية طويلة المفعول والتي تتساءل عما إذا كان بإمكاننا تشكيل مفاهيم دون أن نؤسس في تجربة جسدية. تشير بعض النظريات إلى أن البشر ، وخاصة أولئك الذين يعانون من إعاقات حسية ، يمكنهم بناء أطر مفاهيمية غنية باستخدام اللغة وحدها. لكن الآخرين يجادلون بأن التفاعل الجسدي مع العالم لا ينفصل عن كيفية فهمه. يُنظر إلى زهرة في هذا السياق خارج شكلها ككائن. إنها مجموعة من المشغلات الحسية والذكريات المجسدة ، على سبيل المثال الإحساس بأشعة الشمس على بشرتك أو لحظة التوقف عن استنشاق أزهار ، والتي تأتي مع ارتباطات عاطفية مع الحدائق أو الهدايا أو الحزن أو الاحتفال. هذه هي تجارب متعددة الوسائط ، متعددة الحواس ، وهذا شيء ما نماذج اللغة الحالية مثل الدردشة GPT و Gemini ، التي يتم تدريبها في الغالب على نص الإنترنت ، يمكن أن تقارب فقط.
مع ذلك ، في حديثها إلى قدرتها ، يوضح في جزء واحد من الدراسة أن نماذج الذكاء الاصطناعى ترتبط بدقة الورود والمعكرونة باعتبارها “عالية في الرائحة”. لكن من غير المرجح أن يفكر البشر فيهم على أنهم متشابهون من الناحية المفاهيمية لأننا لا نقارن فقط الأشياء بسمات واحدة ، لكننا نستخدم شبكة متعددة الأبعاد من التجارب التي تتضمن شعور الأشياء ، وما نفعله معهم ، وما يعنيه لنا.
تشير الدراسة التي أجرتها جامعة ولاية أوهايو إلى أن نماذج الذكاء الاصطناعى لا يمكنها فهم التجارب الإنسانية الحسية
مستقبل نماذج اللغة الكبيرة وتجسد الذكاء الاصطناعي
ومن المثير للاهتمام ، وجدت الدراسة أيضًا أن النماذج المدربة على كل من النصوص والصور كانت أفضل في بعض الفئات الحسية ، وخاصة في الأبعاد المتعلقة بالرؤية. هذا يلمح في السيناريوهات المستقبلية التي قد تساعد فيها التدريب متعدد الوسائط (الجمع بين النصوص والمرئيات وبيانات المستشعر في نهاية المطاف) نماذج الذكاء الاصطناعى على الاقتراب من الفهم الشبيه بالبشر. ومع ذلك ، فإن الباحثين حذرون. كما يلاحظ Qihui Xu ، حتى مع بيانات الصورة ، تفتقر الذكاء الاصطناعي إلى “القيام به‘ جزء ، والذي يتكون من كيفية تشكيل المفاهيم من خلال العمل والتفاعل.
قد يؤدي دمج الروبوتات ، وتكنولوجيا المستشعرات ، والتفاعل المجسد إلى نقل الذكاء الاصطناعي نحو هذا النوع من الفهم الموجود. ولكن في الوقت الحالي ، تظل التجربة الإنسانية أكثر ثراءً من النماذج اللغوية – بغض النظر عن حجمها أو المتقدمة – التي يمكن أن تتكرر.
في جزء واحد من نماذج الدراسة ، ربطت نماذج الذكاء الاصطناعي بدقة الورود والمعكرونة باعتبارها “عالية في الرائحة”







