DocLang: معيار مفتوح للمستندات صديقة الذكاء الاصطناعي بدعم من IBM وNVIDIA وRed Hat

مشكلة المستندات التقليدية في عصر الذكاء الاصطناعي

كل يوم، تنتج المؤسسات آلاف المستندات بصيغ PDF و DOCX و JPEG. هذه الملفات صُممت لتكون مقروءة من قبل البشر، وليس من قبل الآلات. عندما تُغذى هذه المستندات في خطوط أنابيب الذكاء الاصطناعي، تحدث مشاكل متعددة: ترتيب القراءة يختل، الجداول تنهار إلى نصوص مسطحة، والصور تختفي تماماً. الجودة المنطقية للمستند تصبح هي عنق الزجاجة، وليس قدرة النموذج نفسه.

في 9 يونيو 2026، أعلنت مؤسسة LF AI & Data (تحت مظلة مؤسسة لينكس) عن تشكيل مجموعة عمل لتطوير DocLang، وهو معيار مفتوح وعالمي للمستندات الصديقة للذكاء الاصطناعي . الهدف هو إنشاء تنسيق موحد يمكن لنماذج الذكاء الاصطناعي فهمه بسهولة، مع الحفاظ على البنية الدلالية والهندسية والتخطيطية للمستند .

🔗 الموقع الرسمي: github.com/doclang-project/doclang 🔗 مجموعة العمل: lfaidata.foundation/projects/doclang

ما هو DocLang؟

DocLang هو تنسيق ترميزي (markup format) أصلي للذكاء الاصطناعي، مصمم للمحتوى غير المهيكل مثل المستندات والصور ووسائط المتعددة . يُعرّف بنية موحدة وقابلة للقراءة آلياً للمستندات من أي نوع . فكر فيه كـ “JSON للبيانات” أو “HTML للويب”، لكن هذه المرة للذكاء الاصطناعي . يمكن لأي أداة تنفيذه، وأي خط أنابيب استهلاكه .

يدعم DocLang العناصر التالية:

الحفاظ على المعنى الدلالي (semantic meaning) والتخطيط الهندسي (geometric layout) معاً في تنسيق واحد .
تمثيل العناصر الهيكلية مثل العناوين والفقرات والجداول مع مواضعها الدقيقة على الصفحة .
دعم مدمج للوسائط المتعددة: الصوت والصورة والفيديو .
دعم طبيعي للجداول والرسوم البيانية والصيغ الرياضية وكتل الأكواد .
تضمين بيانات الحوكمة (governance metadata) مثل سياسات الخصوصية، نطاق الاستخراج، وأذونات تدريب النماذج، مباشرة داخل الملف بدلاً من ملف منفصل .

هذا المعيار ليس بديلاً عن PDF، بل هو طبقة تكامل فوق البنية التحتية الحالية. PDF كان للطباعة، DOCX للمحررين، أما DocLang فهو “لما سيأتي بعد” .

الأطراف المؤسسة والداعمة

المعيار يأتي بدعم من نخبة من شركات التكنولوجيا الرائدة، تحت إدارة محايدة لضمان عدم سيطرة شركة واحدة على خارطة الطريق :

IBM: قدمت أبحاثها الأولية التي قادت إلى DocLang، بما في ذلك تقنيات مثل OTSL (للتمثيل المضغوط للجداول) و DocTags (للحفاظ على بنية المستند) .
NVIDIA: ستساعد في تسريع تبني هذا التنسيق عبر الصناعات .
Red Hat: تخطط لدمج Docling (أداة المعالجة) في إصدارات Red Hat Enterprise Linux AI القادمة .
ABBYY: تدمج المعيار بالفعل في منتجها FineReader beta .
HumanSignal: تساهم في تطوير المعيار من منظور وضع العلامات على البيانات .

مجموعة العمل تعمل تحت نموذج الحوكمة المفتوح المحايد لمؤسسة التطوير المشترك (Joint Development Foundation) .

العلاقة بين DocLang و Docling

لفهم المشروع بالكامل، يجب التفريق بين عنصرين متكاملين:

Docling هو أداة معالجة المستندات مفتوحة المصدر التي طورتها IBM Research Zurich وأطلقها فريق “AI for Knowledge”. تم إصدارها كمفتوح المصدر في يوليو 2024، وحققت أكثر من 61 ألف نجمة على GitHub . تعمل Docling كمحرك للتحويل والاستخراج: تأخذ مستنداً بصيغة PDF أو DOCX أو HTML أو صورة، وتحلله باستخدام نماذج متقدمة لفهم التخطيط والجداول، ثم تخرج تمثيلاً منظمًا (DoclingDocument) .

DocLang هو تنسيق التبادل القياسي. بينما تقوم Docling بالمعالجة “التحويل”، يوفر DocLang الصيغة الموحدة “للمخرجات” التي يمكن تبادلها بين الأنظمة المختلفة .

معاً، يشكلان مجموعة تقنية كاملة: Docling للتناول (ingestion) والتحليل، و DocLang للمعيار المفتوح القابل للتبادل. كلاهما مستضاف الآن تحت مؤسسة LF AI & Data .

الإصدار الحالي وكيفية تجربته

المعيار لا يزال في مراحله الأولى، وهو متاح كإصدار v0.6، ويتم تطويره بشكل علني على GitHub تحت رخصة Apache 2.0 .

يمكن تجربة DocLang حالياً عبر:

تثبيت أداة التحقق (validator) المرجعية عبر PyPI:
```
pip install doclang
doclang validate -n my_document.dclg.xml
```
استخدام Docling لتحويل مستنداتك إلى تنسيق DocLang مباشرة.
تجربة ABBYY FineReader beta الذي يدعم المعيار الجديد .

ماذا يعني هذا للمطورين والمؤسسات؟

إذا كنت مطوراً يبني تطبيقات تعتمد على استرجاع معزز بتوليد (RAG) أو وكلاء ذكاء اصطناعي، فإن DocLang يقدم لك مصدر بيانات موثوقاً ومتسقاً. تخيل أن تكون قادراً على ضمان أن كل مستند في نظامك يُقرأ بنفس الترتيب، ويتم استخراج جداوله بشكل صحيح، ولا تفقد صوره، وألا تضطر إلى كتابة كود معالجة خاص لكل صيغة ملف.

وفقاً لـ Peter Staar، مدير الأبحاث في IBM: “رؤيتنا هي أن يصبح DocLang معياراً دولياً معتمداً على نطاق واسع للمستندات الجاهزة للذكاء الاصطناعي، مما يوفر تمثيلاً ثابتاً لكل من البشر والآلات، تماماً كما أصبح PDF هو المعيار العالمي لتبادل المستندات في العصر البشري” .

الخلاصة

إعلان DocLang ليس مجرد خبر تقني عابر. إنه اعتراف من أكبر اللاعبين في المجال (IBM، NVIDIA، Red Hat) بأن البنية التحتية الحالية للمستندات غير صالحة لعصر الذكاء الاصطناعي. بدلاً من ترك كل شركة تبتكر معيارها المغلق، تتحد هذه الشركات تحت مؤسسة لينكس لتقديم بديل مفتوح ومحايد.

المعيار لا يزال طفلاً (v0.6)، لكنه ولد برعاية عمالقة التكنولوجيا ومجتمع مفتوح المصدر. تأثيره الحقيقي سيظهر خلال السنوات القادمة، عندما تبدأ أدوات الذكاء الاصطناعي في افتراض أن المستندات التي تتعامل معها هي بتنسيق DocLang، وليس PDF قديماً.