نمط حياة

اكتشاف المحادثات التي ينشئها الذكاء الاصطناعي: دراسة جديدة

هل من السهل اكتشاف المحادثات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي؟

تتناول هذه المقالة دراسة جديدة تبحث في مدى سهولة اكتشاف المحادثات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، مع التركيز على نماذج اللغة الكبيرة.

هل من السهل اكتشاف المحادثات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي؟

ما مدى سهولة اكتشاف المحادثة الناتجة عن الذكاء الاصطناعي (AI) ونماذج اللغات الكبيرة (LLMs)؟ دراسة جديدة نشرت في العلوم المعرفية تقيم قدرة LLMs على خداع الناس بأنهم من صنع الإنسان، وليسوا مصطنعين، عندما يتعلق الأمر بالمحادثة المنطوقة.

الاستخدام المتزايد للذكاء الاصطناعي التوليدي

“لقد تم الإعلان عن الاستخدام المحتمل لنماذج اللغة الكبيرة (LLMs) لمحاكاة الإدراك والسلوك البشري باعتباره نقلة نوعية قادمة في أبحاث العلوم النفسية والاجتماعية”، كتب المؤلف الرئيسي إريك مايور، دكتوراه، باحث كبير في جامعة بازل، بالتعاون مع لوكاس بيتي، دكتوراه، أستاذ مشارك في علم النفس في الجامعة النرويجية للعلوم والتكنولوجيا (NTNU)، وأدريان بانجيرتر، دكتوراه، أستاذ علم النفس بجامعة نوشاتيل.

إن استخدام الذكاء الاصطناعي التوليدي آخذ في الارتفاع ويتم اعتماده بسرعة. الذكاء الاصطناعي التوليدي هو الفئة الشاملة للمحتوى الجديد مثل الصور ومقاطع الفيديو والصوت والنص الذي تم إنشاؤه بشكل مصطنع عبر التعلم الآلي. وفق التقرير السنوي لمؤشر الذكاء الاصطناعي 2025 وفقًا لمعهد ستانفورد للذكاء الاصطناعي المرتكز على الإنسان (HAI)، استخدم 71% من المشاركين في الاستطلاع الذكاء الاصطناعي التوليدي في عام 2024، وهو ما يمثل ارتفاعًا حادًا مقارنة بـ 33% من المشاركين في الاستطلاع في العام السابق.

قدرة LLMs على تقليد المحادثة البشرية

LLMs هي مجموعة فرعية من الذكاء الاصطناعي التوليدي الذي يركز على النص القائم على اللغة. تتضمن أمثلة موفري LLM OpenAI (سلسلة GPT)، وAnthropic (سلسلة Claude)، وMeta (سلسلة Llama)، وGoogle (Gemini)، وMistral AI (سلسلة Mistral)، وCohere (سلسلة Command)، وغيرها. بحلول عام 2030، من المتوقع أن يصل حجم السوق العالمية للماجستير في القانون إلى 35 مليار دولار أمريكي، وهو ما يمثل متوسط ​​معدل نمو مركب قدره 36.9٪ من حجم السوق العالمي الحالي البالغ 7.36 مليون دولار أمريكي وفقًا لتقديرات Grand View Research.

“معظم الدراسات تبحث في قدرات حاملي شهادة الماجستير في القانون على محاكاة المحادثات البشرية في الدردشة، أي، مكتوب،” كتب الباحثون. “قد يكون من الصعب محاكاة الطبيعة التفاعلية والمفتوحة للحوار الإنساني من قبل ماجستير إدارة الأعمال في تحدث المحادثات في وسيط في الوقت الفعلي (على سبيل المثال، وجهًا لوجه أو الهاتف أو الفيديو).”

شرع الثلاثي البحثي في ​​تحديد قدرة LLMs على تقليد المحادثة البشرية المنطوقة في تجربتين باستخدام GPT-4، وClaude Sonnet 3.5، وVicuna، وWayfarer.

نتائج التجارب

تتضمن التجربة الأولى تحليل LLM الناتج مقابل النصوص الفعلية للمحادثات الهاتفية البشرية. من قاعدة بيانات تحتوي على نصوص لما يقرب من 2500 محادثة هاتفية بشرية، قام الباحثون بإجراء عينات عشوائية من 200 محادثة لاستخدامها في المقارنة. لكل ماجستير إدارة، قام الفريق بإنشاء 200 محادثة. تمت مطالبة حاملي شهادة الماجستير في القانون بإنشاء محادثات هاتفية لتكون مشابهة قدر الإمكان للمحادثات الهاتفية البشرية الفعلية.

وجد الباحثون أن دورات المحادثة في LLM أطول بكثير، ولها مستويات أعلى من التوافق المفاهيمي والنحوي والمعجمي، ولها ميزات مختلفة في الافتتاحيات والختامات، وتنشر علامات التنسيق بمعدلات وأساليب مختلفة عن البشر. علاوة على ذلك، فإن توافق الحاصلين على ماجستير إدارة الأعمال يزداد بمرور الوقت أثناء المحادثات. ومن المثير للاهتمام أن المحادثات التي تم إنشاؤها بواسطة النماذج مفتوحة المصدر Vicuna و Wayfarer كانت أكثر شبهاً بالإنسان.

كتب العلماء: “أظهرت محادثات LLM محاذاة مبالغ فيها (وزيادة في المحاذاة مع ظهور المحادثة) مقارنة بالمحادثات البشرية، واستخدامًا مختلفًا وغير مناسب غالبًا لعلامات التنسيق، وكانت مختلفة عن المحادثات البشرية في الافتتاحيات والختامات”.

في التجربة الثانية، قام الباحثون بتجنيد 1081 مشاركًا بشريًا لمعرفة ما إذا كان بإمكانهم معرفة الفرق بين المحادثات الناتجة عن حاملي شهادة الماجستير في القانون مقابل المحادثات الهاتفية البشرية الفعلية. تم تكليف معظم المشاركين، 741 شخصًا، بتقييم مقتطفات المحادثة، وتم تكليف الـ 340 شخصًا المتبقين بتحليل مقتطفات طويلة. اكتشف الباحثون بشكل عام أن البيانات تظهر أن المشاركين في الدراسة البشرية يمكنهم معرفة الفرق بين المحادثات التي أجراها البشر والماجستير في القانون بشكل أكثر دقة بالنسبة للمقتطفات الطويلة مقابل المقتطفات القصيرة.

أفاد فريق البحث: “بالنسبة للمقتطفات القصيرة، وجدنا أن جميع الحاصلين على ماجستير إدارة الأعمال لا يُنظر إليهم على أنهم بشر في أجزاء من المحادثات التي أجروها، بينما يمررونها للآخرين”. “للاطلاع على مقتطفات طويلة، وجدنا أن القضاة يمكنهم تحديد محادثات ماجستير القانون بشكل صحيح على مستوى أفضل بكثير من الصدفة، مما يشير إلى أنه من الواضح أن حاملي ماجستير القانون يفشلون في أن يُنظر إليهم على أنهم بشر”.

في الوقت الحالي، المحادثة المنطوقة التي تنتجها LLM لا تخدع البشر. يشير العلماء إلى أن هناك احتمالًا أن يكون طلاب ماجستير القانون الآخرون الذين لم يتم تضمينهم في الدراسة، أو مزيجًا مختلفًا من الهندسة الفورية، على الرغم من بذلهم قصارى جهدهم في استخدام مجموعة متنوعة من المحفزات في تجاربهم، ربما قد ولّدوا المزيد من المحادثات الشبيهة بالإنسان. ومع ذلك، فإن النتائج التي توصلوا إليها تساعد في تقديم نظرة ثاقبة لقدرة حاملي شهادة الماجستير في إدارة الأعمال على إنشاء محادثة منطوقة شبيهة بالإنسان.

وخلص الباحثون إلى أن “المحادثات المنطوقة التي تولدها LLMs تختلف نوعيا وكميا عن تلك التي لدى البشر”.

بناءً على هذه الدراسة، عندما يتعلق الأمر بإنشاء محادثة منطوقة، يمكن للبشر اكتشاف المحتوى الذي تم إنشاؤه بواسطة حاملي شهادة الماجستير في القانون، في الوقت الحالي. قد يتغير هذا عندما تصبح خوارزميات الذكاء الاصطناعي أكثر تطوراً، وتصبح بيانات التدريب على المحادثة المنطوقة أكثر وفرة، ومع إجراء دراسات بحثية إضافية في المستقبل.

حقوق الطبع والنشر © 2025 كامي روسو جميع الحقوق محفوظة.

المصدر :- Psychology Today: The Latest

على الرغم من التقدم في تكنولوجيا الذكاء الاصطناعي، لا يزال بإمكان البشر التمييز بين المحادثات التي ينشئها الذكاء الاصطناعي وتلك التي يجريها البشر.

السابق
من المقاييس إلى المعنى: أهمية رضا الموظفين
التالي
كيفية منع السلوك الجنسي الضار بين الأشقاء

اترك تعليقاً