أمس، بمناسبة يوم الأرض، أعلنت IBM والوكالة الأوروبية للفضاء (ESA) عن إطلاق TerraMind، وهو نموذج أساسي للذكاء الاصطناعي التوليدي مصمم لتحليل وتفسير والتنبؤ بديناميات الكوكب من بيانات جغرافية متعددة الوسائط.
يأتي هذا الإطلاق في إطار FAST-EO (Foundation Models for Advanced Space-based Earth Observation)، وهي مبادرة أوروبية يديرها اتحاد رائد - يضم DLR (المركز الألماني للطيران والفضاء)، وForschungszentrum Jülich، وIBM Research Europe وKP Labs - بدعم علمي ومالي من مختبر Φ-lab التابع للوكالة الأوروبية للفضاء، وهو مختبر الابتكار المخصص لعلوم الأرض.
تهدف مبادرة FAST-EO إلى ديمقراطية الوصول إلى النماذج الأساسية داخل مجتمع مراقبة الأرض (EO) وتشجيع استخدامها في مجالات ذات أهمية كبيرة - مثل الإدارة المستدامة للموارد الطبيعية، والحفاظ على التنوع البيولوجي، والوقاية من الكوارث المناخية أو تحليل النظم الزراعية البيئية.
يأتي TerraMind في هذا السياق. تم تدريب النموذج مسبقًا في Forschungszentrum Jülich على "TerraMesh"، وهو أكبر مجموعة بيانات جغرافية تم إنشاؤها على الإطلاق. يتضمن هذا المجموع أكثر من 9 ملايين عينة تغطي تسع وسائل مختلفة: من الصور الضوئية والرادارية من أقمار Copernicus Sentinel-1 و-2، إلى التمثيلات النصية للبيئة، مرورًا بعلم أشكال الأرض والبيانات المناخية التاريخية.
يعتمد TerraMind على بنية التشفير-فك التشفير القائمة على المحولات المتماثلة، ويمكنه معالجة مدخلات من نوع البكسل، الرموز، والتسلسل في نفس الوقت. يمكنه، على سبيل المثال، مطابقة ديناميات الغطاء النباتي مع الاتجاهات المناخية السابقة ووصفات استخدام الأراضي لتحديد المخاطر الناشئة أو نمذجة تطور النظام البيئي.
ابتكار ثوري: التفكير في الوسائط (TiM)
إلى جانب قدرته على معالجة حجم كبير من البيانات غير المتجانسة، يقدم TerraMind تقدمًا منهجيًا: التفكير في الوسائط (TiM). وفقًا لمصمميه، يُعتبر هذا النموذج الأساسي الأول الذي يُطبق بشكل توليدي ومتعدد الوسائط على مراقبة الأرض. تُمكنه هذه الطريقة من إنتاج بيانات اصطناعية بشكل مستقل في حالة نقص المدخلات - وهي حالة شائعة في الاستشعار عن بُعد بسبب الغطاء السحابي، أو دقة المستشعرات المتغيرة أو الفجوات الزمنية في السلاسل الملاحظة.
تعتمد أصالة العملية على التفكير السياقي بين الوسائط. مستوحى من سلاسل الأفكار المستخدمة في النماذج اللغوية الكبيرة (LLMs)، يتيح آلية TiM للنموذج الجمع بين البيانات والتنبؤ بها وإعادة بنائها من خلال العلاقات المتعلمة بين الصور، النصوص، المتغيرات الفيزيائية أو الجغرافية. خلال التدريب الدقيق أو الاستدلال، تُعزز هذه القدرة على إثراء السياق الجزئي من قوة النموذج وتُحسن من دقته في مواقف محددة.
يُظهر تطبيق هذه التقنية على قضايا مثل التنبؤ بنقص المياه - التي تتطلب متغيرات متنوعة مثل المناخ، واستغلال الأراضي، والغطاء النباتي، والهيدروغرافيا، أو الممارسات الزراعية - إمكاناتها التشغيلية، حيث كانت الطرق التقليدية تتعثر أمام عوائق البيانات أو الفجوات الزمنية.
فعالية محسنة
رغم حجمه - مع استخدام أكثر من 500 مليار رمز خلال مرحلة التدريب - يُعتبر TerraMind نموذجًا مقتصدًا للغاية. بفضل بنيته وتكثيفه الفعال للتمثيلات، يستهلك عشر مرات أقل من الموارد مقارنة بالنماذج المماثلة في مهام مشابهة. يفتح هذا الاختلاف آفاقًا حقيقية للنشر على نطاق واسع، بما في ذلك في البيئات المقيدة بقدرات الحوسبة أو الاتصال.
إنه أيضًا الأكثر أداءً. تم تقييم TerraMind بواسطة الوكالة الأوروبية للفضاء على PANGAEA، وهو معيار قياسي للمجتمع: وقد تفوق بنسبة 8% أو أكثر على 12 نموذجًا أساسيًا لمراقبة الأرض في مهام حقيقية، مثل تصنيف الغطاء الأرضي، واكتشاف التغيرات، ومراقبة البيئة وتحليل المستشعرات المتعددة والزمن المتعدد.
يأتي النموذج كجزء من استراتيجية IBM في مجال الذكاء الاصطناعي المناخي والبيئي، مكملًا لنماذج IBM-NASA Prithvi وGranite. يجعل توفره على IBM Geospatial Studio وHugging Face من السهل الوصول إليه وتكامله.
وفقًا لنكولاس لونجيبي، عالم بيانات مراقبة الأرض في الوكالة الأوروبية للفضاء:
"هذا المشروع هو مثال مثالي للتعاون الناجح بين المجتمع العلمي، والشركات التكنولوجية الكبرى، والخبراء للاستفادة من إمكانات التكنولوجيا في خدمة علوم الأرض. التآزر بين خبراء بيانات مراقبة الأرض، وأخصائيي التعلم الآلي، وعلماء البيانات والمهندسين في الحوسبة عالية الأداء (HPC) هو سحري".