ContextEcho: الضغط لا يصحح انحراف الشخصية، اختبار معياري على 23 نموذجًا

TLDR : الضغط لا يصحح انحراف الشخصية في النماذج الذكية، وContextEcho تقدم حلاً جديداً باستخدام مرساة الإدخال الواحد. تم اختبار المنهجية على 23 نموذجًا، وتشير إلى أن الضغط التقليدي ليس فعالاً كما كان يعتقد.

إن ضغط السياق، الآلية القياسية التي يفعلها الناشرون لإدارة جلسات الوكيل الطويلة دون تشبع النافذة، لا يصحح انحراف الشخصية بشكل موثوق. يوثق معيار مفتوح المصدر هذه النقطة على 23 نموذجًا حدوديًا ويقدم إجابة مجربة: مرساة بإدخال واحد (single-shot anchor) تستعيد السجل الأصلي المدرب على جميع الأهداف التي تم تقييمها، دون إعادة تدريب، عبر واجهة برمجة التطبيقات القياسية لإكمال الرسائل (chat-completions). العمل، المسمى ContextEcho، تم إيداعه على arXiv في 22 مايو 2026 بواسطة Xianzhong Ding، الباحث في Center for Advanced AI التابع لـ Accenture وزميل ما بعد الدكتوراه السابق في Lawrence Berkeley National Lab (2024-2025) وفقًا لملفه الشخصي على OpenReview; وتم تقديمه أيضًا إلى NeurIPS 2026 Evaluations & Datasets Track، وهو حاليًا قيد التقييم المزدوج المجهول (مراجعة مزدوجة مجهولة). بيئة الاختبار، منشورة على Hugging Face، مرفقة بإطار اختبارات (أداة اختبار) تم إيداعه في مستودع مجهول الهوية والذي يظل الوصول إليه محدودًا أثناء التقييم المجهول.

23 نموذجًا تم تقييمها: قوة معلنة، تحقق محدود

يعلن ContextEcho عن نتائج على 23 نموذجًا حدوديًا من منظمات مختلفة دون نشر قائمتهم الاسمية في المصادر المتاحة. الجلسات الثلاث المرجعية المستخدمة تكون مجهولة، مما يُقيد إمكانية إعادة التحقق الخارجي. علاوة على ذلك، المعيار قيد المراجعة المزدوجة المجهولة في NeurIPS 2026 Evaluations & Datasets Track: لم تخضع استنتاجاته بعد لمراجعة نظراء منشورة.

مجموعة من 25 مسبارًا متصلة دون إزعاج الجلسة

يتكون الهيكل من أربعة أجزاء. مجموعة من 25 مسبار هوية (25-probe identity suite) تستجوب توافق السلوك النموذجي؛ بروتوكول snapshot-then-probe يفرع الحالة المحادثية دون إزعاج الجلسة الرئيسية، مما يسمح بقياس الانحراف دون التسبب فيه؛ أسطح قياس مكملة judged (تقييم بواسطة نموذج قاضٍ) وjudge-free (مقاييس محسوبة دون LLM وسيط) تقاطع بين الطريقتين. يعتمد الكل على ثلاث جلسات Claude Code مجهولة تغطي على التوالي 3746، وحتى 9716 جولة محادثة، وهو حجم بعيد عن متناول البروتوكولات الكلاسيكية لاستقرار الشخصية، التي تركز على الحوارات القصيرة. التقييم يتناول، حسب المؤلفين، 23 نموذجًا حدوديًا من منظمات مختلفة، لم تُنشر قائمتها الاسمية في هذه المرحلة: تم توثيق قوة المرساة بإدخال واحد على جميع الأهداف التي تم تقييمها، لكن الشروط الدقيقة لكل هدف تظل غير قابلة للتحقق بشكل مستقل خارج نطاق الورقة. من ناحية الاستخدام في الأسفل، التأثير يعتمد على الوضع: في الوضع بدون أدوات، الانحراف يكسر عقود التنسيق ويزيد من طول المخرجات؛ في الوضع مع الأدوات، يمكن أن يسهل استمرار استخدام الأدوات.

انحراف عام، وحل قياسي لا يصمد

أول درس هيكلي له نطاق عرضي: الانحراف الشخصي يُلاحظ بشكل عام عبر المنظمات، وليس خاصًا بعائلة نماذج. على مجمل اللوحة المقيمة، لا يبدو أن أي سلالة تقنية (سواء كانت من مختبر أمريكي، أوروبي أو آسيوي) محصنة. الدرس الثاني يستهدف آلية تُعرض عادة كحل: الضغط أثناء الجلسة لا يعيد تعيين انحراف الشخصية بشكل موثوق. الضغط (تلخيص السياق بشكل زلق أثناء المحادثة) هو بالتحديد الرافعة التي يفعلها الناشرون لإدارة الجلسات الطويلة دون تشبع النافذة. لذلك فإن ملاحظة المؤلفين تتعلق مباشرة بالبنى الوكيلة في الإنتاج التي تعتمد على هذا النبع. النتيجة لا تزال بحاجة إلى تأكيد بشكل مستقل: العمل مقدم إلى هذا المسار NeurIPS، قيد التقييم المجهول، وتتنوع تطبيقات الضغط بشكل ملموس من نظام لآخر، مما يستدعي الحذر قبل أي تعميم صناعي. التوافق السلوكي للوكلاء في الجلسات الطويلة هو الآن موضوع نشط: عمل مجاور من Purdue، When the Specification Emerges، يفحص بالتوازي فقدان الدقة لوكيل مشفر عندما تظهر المواصفات تدريجيًا. في المجال الأوسع لتقييم سلوكيات الذكاء الاصطناعي، كانت ActuIA قد لاحظت بالفعل أن Google DeepMind تقترح إطارًا لتصنيف القدرات والسلوكيات للذكاء الاصطناعي العام، مما يوضح نضوج المجال نحو بروتوكولات قياس موحدة.

لا يبدو أن أي سلالة تقنية محصنة.

الانحراف الشخصي يُلاحظ بشكل عام عبر المنظمات، وليس خاصًا بعائلة نماذج - وفقًا لمؤلفي ContextEcho على 23 هدفًا حدوديًا.

معيار مرتبط بشركة استشارية، وليس بمختبر أكاديمي بحت

يستحق الارتباط المؤسسي للمساهمة أن يُطرح. Xianzhong Ding هو باحث في Center for Advanced AI التابع لـ Accenture منذ 2025، بعد زمالة ما بعد الدكتوراه في Lawrence Berkeley National Lab بين 2024 و2025، وأطروحة في Electrical Engineering and Computer Sciences في UC Merced. لذلك يتقاطع الملف الشخصي مع الطاقة العامة الأمريكية والبحث التطبيقي في شركة استشارية كبيرة. كانت ActuIA قد وثقت بالفعل الاستثمار المتزايد للمجموعة في هذا المجال، وفقًا لإعلانات الشركة: أعلنت Accenture في 2023 عن استثمار 3 مليارات دولار في الذكاء الاصطناعي والبيانات وفقًا لاتصالها الخاص، ثم، وفقًا للمجموعة، عززت وجودها في فرنسا بمركزين مخصصين للذكاء الاصطناعي التوليدي. ContextEcho يندرج في هذه السياسة لإنتاج بحث منشور: العمل يهدف إلى حضور أكاديمي من الدرجة الأولى عالميًا (NeurIPS)، مع مجموعة من التقييم الخلوي ومقدمات الجلسات المقدمة، المتاحة على Hugging Face مع نفس التقديم. الخصوصية المنهجية تكمن في مرساة النشر: ثلاث جلسات Claude Code مجهولة تُستخدم كبيانات أساسية، مما يشير إلى أن المؤلفين فضلوا آثارًا من الاستخدام الفعلي بدلاً من بنوك اختبار تركيبية، وهو تمييز يعتبر ذا وزن، في مجال يعتمد فيه العديد من بروتوكولات التقييم على حوارات منشأة في المختبر.

عين ActuIA

الموضوع الحقيقي لـ ContextEcho ليس النص المرجعي، بل الملاحظة التي تجعله ضروريًا: الضغط، هذا النبع الذي تفعله الفرق افتراضيًا لإدارة الجلسات الطويلة، لا يفي بوعد التوافق. تعتمد طبقة تنظيم الناشرين للوكلاء، منذ ثمانية عشر شهرًا، على حل مؤقت يقول المؤلفون إنه معطل على 23 نموذجًا حدوديًا.

ترجمة من ContextEcho : la compaction ne corrige pas la dérive de persona, benchmark sur 23 modèles

حسب الفئة

حسب القطاع

ContextEcho: الضغط لا يصحح انحراف الشخصية، اختبار معياري على 23 نموذجًا

المحتوى

مجموعة من 25 مسبارًا متصلة دون إزعاج الجلسة

انحراف عام، وحل قياسي لا يصمد

معيار مرتبط بشركة استشارية، وليس بمختبر أكاديمي بحت

عين ActuIA