OpenLedger: بناء بنية تحتية للاقتصاد الذكي المدفوع بالبيانات

2025-07-28 21:13:44

الغوص العميق في OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب

واحد، المقدمة | الانتقال بين طبقات نموذج Crypto AI

البيانات والنماذج والقدرة الحاسوبية هي العناصر الأساسية الثلاثة للبنية التحتية للذكاء الاصطناعي، ولا يمكن الاستغناء عن أي منها. على غرار مسار تطور البنية التحتية في صناعة الذكاء الاصطناعي التقليدية، شهدت أيضًا مجال الذكاء الاصطناعي المرتبط بالتشفير مراحل مماثلة. في أوائل عام 2024، سيطر سوق المشاريع اللامركزية القائمة على وحدات معالجة الرسوميات (GPU) لفترة، حيث تم التأكيد بشكل عام على منطق النمو الواسع القائم على "تجميع القدرة الحاسوبية". ومع دخول عام 2025، بدأ اهتمام الصناعة يتحول تدريجيًا نحو مستوى النماذج والبيانات، مما يدل على أن الذكاء الاصطناعي المرتبط بالتشفير ينتقل من منافسة الموارد الأساسية إلى بناء متوسط المستوى أكثر استدامة وقيمة تطبيقية.

النماذج العامة الكبيرة (LLM) مقابل النماذج المتخصصة (SLM)

تعتمد نماذج اللغة الكبيرة التقليدية (LLM) بشكل كبير على مجموعات البيانات الضخمة والهياكل الموزعة المعقدة، حيث يتراوح حجم المعلمات بين 70B و 500B، وغالبًا ما تصل تكلفة التدريب لمرة واحدة إلى ملايين الدولارات. بينما تعتبر SLM (نموذج اللغة المتخصصة) كصيغة تعديل خفيف لنموذج أساسي يمكن إعادة استخدامه، عادة ما تستند إلى نماذج مفتوحة المصدر، وتجمع بين كمية صغيرة من البيانات المتخصصة عالية الجودة وتقنيات مثل LoRA، لبناء نماذج خبراء تمتلك معرفة في مجالات محددة بسرعة، مما يقلل بشكل كبير من تكلفة التدريب والعقبات التقنية.

من الجدير بالذكر أن SLM لن يتم دمجه في أوزان LLM، بل سيتم تشغيله بالتعاون مع LLM من خلال استدعاء هيكل الوكيل، نظام المكونات الإضافية لتوجيه ديناميكي، التوصيل الساخن لوحدات LoRA، وRAG (التوليد المعزز بالاسترجاع) وغيرها من الطرق. تحتفظ هذه البنية بقدرة LLM الواسعة، بينما تعزز الأداء المتخصص من خلال وحدات الضبط الدقيق، مما يشكل نظام ذكاء مركب عالي المرونة.

قيمة وحدود الذكاء الاصطناعي في طبقة النموذج

مشاريع Crypto AI من الصعب بشكل أساسي تعزيز القدرات الأساسية لنماذج اللغة الكبيرة (LLM) مباشرة، والسبب الرئيسي هو

عائق تقني مرتفع جداً: حجم البيانات والموارد الحاسوبية والقدرات الهندسية المطلوبة لتدريب نموذج الأساس ضخمة للغاية، ولا تمتلك سوى عدد قليل من عمالقة التكنولوجيا هذه القدرات.
قيود النظام البيئي مفتوح المصدر: على الرغم من أن النماذج الأساسية السائدة قد تم فتح مصدرها، إلا أن المفتاح الحقيقي لدفع اختراق النماذج لا يزال مركزًا حول المؤسسات البحثية ونظام الهندسة المغلقة، حيث إن المساحة للمشاركة في مستوى النموذج الأساسي لمشاريع السلسلة محدودة.

ومع ذلك، لا يزال مشروع Crypto AI قادراً على تحقيق قيمة ممتدة من خلال ضبط نماذج اللغة المتخصصة (SLM) على النماذج الأساسية مفتوحة المصدر، ودمج القابلية للتحقق وآليات التحفيز في Web3. كـ «طبقة واجهة محيطية» في سلسلة صناعة الذكاء الاصطناعي، يتم تجسيدها في اتجاهين رئيسيين:

طبقة التحقق الموثوقة: من خلال تسجيل مسارات توليد النموذج ومساهمات البيانات واستخدامها على السلسلة، تعزز من إمكانية تتبع مخرجات الذكاء الاصطناعي وقدرتها على مقاومة التلاعب.
آلية التحفيز: من خلال استخدام توكن الأصلي، لتحفيز سلوكيات مثل رفع البيانات، استدعاء النموذج، وتنفيذ الوكلاء، لبناء حلقة إيجابية لتدريب النموذج والخدمات.

تصنيف أنواع نماذج الذكاء الاصطناعي وتحليل ملاءمتها للبلوكشين

من هنا يتضح أن النقاط القابلة للتطبيق لمشاريع Crypto AI من نوع نموذجية تتركز بشكل رئيسي على تحسين خفة SLM الصغيرة، ودمج البيانات والتحقق منها على السلسلة باستخدام بنية RAG، بالإضافة إلى نشر وتحفيز النماذج المحلية Edge. وبالاقتران مع قابلية التحقق من blockchain وآلية الرموز، يمكن لـ Crypto أن توفر قيمة فريدة لهذه السيناريوهات ذات الموارد المتوسطة إلى المنخفضة، مما يشكل قيمة مميزة لطبقة واجهة AI.

سلسلة Blockchain AI المعتمدة على البيانات والنماذج يمكنها تسجيل مصدر مساهمة كل بيانات ونموذج بوضوح وبشكل غير قابل للتغيير، مما يعزز بشكل كبير موثوقية البيانات وقابلية تتبع تدريب النماذج. في الوقت نفسه، من خلال آلية العقود الذكية، يتم تفعيل توزيع المكافآت تلقائيًا عند استدعاء بيانات أو نماذج، مما يحول سلوك AI إلى قيمة رمزية قابلة للقياس والتداول، وبناء نظام تحفيزي مستدام. بالإضافة إلى ذلك، يمكن لمستخدمي المجتمع أيضًا تقييم أداء النماذج من خلال تصويت الرموز، والمشاركة في وضع القواعد وتحديثها، وتحسين هيكل الحوكمة اللامركزية.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-62B3FAe810F4772AABA3D91C74C1AA6)

اثنان، نظرة عامة على المشروع | رؤية OpenLedger لسلسلة الذكاء الاصطناعي

OpenLedger هو أحد المشاريع القليلة في سوق blockchain AI التي تركز على بيانات ونماذج آليات التحفيز. وقد اقترح أولاً مفهوم "Payable AI"، والذي يهدف إلى بناء بيئة تشغيل AI عادلة وشفافة وقابلة للتجميع، لتحفيز المساهمين بالبيانات ومطوري النماذج وبناة تطبيقات AI للتعاون على نفس المنصة، والحصول على عائدات على السلسلة بناءً على المساهمات الفعلية.

OpenLedger تقدم حلقة مغلقة كاملة من "توفير البيانات" إلى "نشر النماذج" وصولاً إلى "استدعاء التقاسم"، وتشمل وحداتها الأساسية:

مصنع النماذج: لا حاجة للبرمجة، يمكنك استخدام LLM مفتوح المصدر لتدريب وتعديل النماذج المخصصة باستخدام LoRA ونشرها؛
OpenLoRA: يدعم التعايش مع آلاف النماذج، تحميل ديناميكي حسب الحاجة، مما يقلل بشكل كبير من تكاليف النشر؛
PoA (إثبات النسبة): تحقيق قياس المساهمة وتوزيع المكافآت من خلال تسجيل استدعاءات على السلسلة؛
داتانييتس: شبكة بيانات هيكلية موجهة نحو المشاهد الرأسية، تم بناؤها والتحقق منها من خلال التعاون المجتمعي؛
منصة اقتراح النماذج (Model Proposal Platform): سوق نماذج على السلسلة قابلة للتجميع، وقابلة للاستدعاء، وقابلة للدفع.

من خلال الوحدات المذكورة أعلاه، قامت OpenLedger ببناء "البنية التحتية للاقتصاد الذكي" المدفوعة بالبيانات والقابلة للتجميع وفقًا للنماذج، مما يدفع سلسلة قيمة الذكاء الاصطناعي إلى أن تكون على السلسلة.

وفي اعتماد تقنية البلوكشين، قامت OpenLedger بتأسيس بيئة تشغيل بيانات وعقود عالية الأداء ومنخفضة التكلفة وقابلة للتحقق باستخدام OP Stack + EigenDA كقاعدة.

مبني على OP Stack: يعتمد على تقنية Optimism، يدعم التنفيذ عالي الإنتاجية وبتكاليف منخفضة؛
التسوية على الشبكة الرئيسية للإيثيريوم: ضمان أمان المعاملات وسلامة الأصول؛
متوافق مع EVM: يسهل على المطورين نشر وتوسيع بسرعة بناءً على Solidity؛
EigenDA تقدم دعم توافر البيانات: تقلل بشكل كبير من تكاليف التخزين، وتضمن قابلية التحقق من البيانات.

بالمقارنة مع بعض سلاسل الذكاء الاصطناعي العامة التي تركز على السيادة البيانات، تركز OpenLedger بشكل أكبر على بناء سلسلة ذكاء اصطناعي مخصصة لتحفيز البيانات والنماذج، وتهدف إلى جعل تطوير النماذج واستخدامها قابلاً للتتبع، وقابلاً للتجميع، ومستداماً على السلسلة. إنها بنية تحتية لتحفيز النماذج في عالم Web3، تجمع بين استضافة النماذج، وفوترة الاستخدام، وواجهات قابلة للتجميع على السلسلة، مما يعزز طريق تحقيق "النموذج كأصل".

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-19C2276FCCC616CCF9260FB7E35C9C24)

ثلاثاً، المكونات الأساسية و الهيكل الفني ل OpenLedger

3.1 مصنع النماذج، نموذج مصنع بدون كود

ModelFactory هو منصة لتعديل نماذج اللغة الكبيرة (LLM) ضمن نظام OpenLedger البيئي. بخلاف أطر التعديل التقليدية، يوفر ModelFactory واجهة رسومية بحتة للعمل، دون الحاجة إلى أدوات سطر الأوامر أو تكامل API. يمكن للمستخدمين تعديل النماذج بناءً على مجموعات البيانات التي تم التفويض والمراجعة عليها في OpenLedger. وقد تم تحقيق سير العمل المتكامل لتفويض البيانات، وتدريب النماذج ونشرها، وتتضمن العمليات الأساسية ما يلي:

التحكم في الوصول إلى البيانات: يقوم المستخدم بتقديم طلبات البيانات، ويقوم المزود بمراجعة الموافقة، وتدخل البيانات تلقائيًا إلى واجهة تدريب النموذج.
اختيار النموذج وتكوينه: يدعم LLM الرائجة، من خلال واجهة المستخدم الرسومية لتكوين المعلمات الفائقة.
تعديل خفيف الوزن: محرك LoRA / QLoRA المدمج، يعرض تقدم التدريب في الوقت الفعلي.
تقييم النموذج ونشره: أدوات التقييم المدمجة، تدعم تصدير النشر أو مشاركة الاستدعاء في البيئة.
واجهة التحقق التفاعلي: توفر واجهة محادثة، مما يسهل اختبار قدرة النموذج على الإجابة.
توليد رصد RAG: الإجابة مع الاقتباسات المصدرية، لتعزيز الثقة وقابلية التدقيق.

يتكون هيكل نظام Model Factory من ستة وحدات، تشمل التحقق من الهوية، صلاحيات البيانات، ضبط النموذج، تقييم النشر و RAG تتبع المصدر، لإنشاء منصة خدمات نماذج متكاملة آمنة وقابلة للتحكم، تفاعلية في الوقت الحقيقي، وقابلة للتحقيق المستدام.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-F23F47F09226573B1FCACEBDCFB8c1f3)

جدول ملخص قدرات نماذج اللغة الكبيرة المدعومة حالياً من ModelFactory كما يلي:

سلسلة LLaMA: الأكثر تنوعًا في النظام البيئي، مجتمع نشط، أداء عام قوي، تُعتبر واحدة من النماذج الأساسية مفتوحة المصدر الأكثر شيوعًا حاليًا.
Mistral: هيكل عالي الكفاءة، وأداء استدلال ممتاز، مناسب للتطبيقات المرنة والموارد المحدودة.
Qwen：أداء ممتاز في المهام باللغة الصينية، قدرة شاملة قوية، مناسبة للاختيار الأول للمطورين المحليين.
ChatGLM: تأثير المحادثة باللغة الصينية بارز، مناسب لخدمة العملاء في مجالات محددة والمشاهد المحلية.
Deepseek: يتفوق في توليد الشفرات والاستدلال الرياضي، مناسب لأدوات المساعدة في التطوير الذكي.
جيمما: هيكل واضح، سهل الاستخدام والتجربة بسرعة.
فالكون: كان معيار الأداء، مناسب للأبحاث الأساسية أو اختبارات المقارنة، لكن نشاط المجتمع قد انخفض.
BLOOM: دعم متعدد اللغات قوي، لكن أداء الاستنتاج ضعيف، مناسب للأبحاث التي تغطي اللغات.
GPT-2: نموذج كلاسيكي مبكر، مناسب فقط للأغراض التعليمية والتحقق، ولا يُنصح باستخدامه في النشر الفعلي.

على الرغم من أن مجموعة نماذج OpenLedger لا تتضمن أحدث نماذج MoE عالية الأداء أو النماذج متعددة الأنماط، إلا أن استراتيجيتها ليست قديمة، بل هي تكوين "الأولوية العملية" المستند إلى القيود الواقعية للتطبيق على السلسلة (تكاليف الاستدلال، توافق RAG، توافق LoRA، بيئة EVM).

يعتبر Model Factory كأداة سلسلة بدون كود، حيث تم دمج جميع النماذج بآلية إثبات المساهمة، لضمان حقوق المساهمين في البيانات ومطوري النماذج، مع مزايا انخفاض العتبة، وقابلية التحويل والتجميع، مقارنة بأدوات تطوير النماذج التقليدية:

للمطورين: توفير مسار كامل لنماذج الحضانة والتوزيع والإيرادات؛
للمنصة: تشكيل تدفق الأصول النموذجية وبيئة التركيب؛
للمستخدمين: يمكن دمج النماذج أو الوكلاء كما لو كنت تستدعي API.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ moments-909dc3f796ad6aa44a1c97a51ade4193)

3.2 OpenLoRA،资产化 نموذج التخصيص على السلسلة

LoRA (التكيف منخفض الرتبة) هي طريقة فعالة لضبط المعلمات، من خلال إدخال "مصوفة منخفضة الرتبة" في نموذج كبير مدرب مسبقاً لتعلم مهام جديدة، دون تعديل معلمات النموذج الأصلي، مما يقلل بشكل كبير من تكاليف التدريب ومتطلبات التخزين. غالباً ما تحتوي النماذج اللغوية الكبيرة التقليدية (مثل LLaMA وGPT-3) على عشرات المليارات أو حتى مئات المليارات من المعلمات. لاستخدامها في مهام محددة (مثل أسئلة قانونية، استشارات طبية)، تحتاج إلى ضبطها (التعديل الدقيق). الاستراتيجية الأساسية لـ LoRA هي: "تجميد معلمات النموذج الكبير الأصلي، وتدريب فقط مصفوفة المعلمات الجديدة المدخلة". إن كفاءتها في المعلمات، وسرعة التدريب، ومرونة النشر تجعلها الطريقة السائدة حالياً المناسبة لنشر نماذج Web3 واستدعائها بشكل مركب.

OpenLoRA هو إطار استدلال خفيف الوزن تم إنشاؤه بواسطة OpenLedger، مصمم لنشر نماذج متعددة ومشاركة الموارد. الهدف الأساسي منه هو معالجة المشكلات الشائعة في نشر نماذج الذكاء الاصطناعي الحالية، مثل التكلفة العالية، وانخفاض إعادة الاستخدام، وإهدار موارد GPU، ودفع تنفيذ "الذكاء الاصطناعي القابل للدفع".

OpenLoRA نظام هيكل المكونات الأساسية ، يعتمد على تصميم معياري ، يغطي تخزين النماذج ، تنفيذ الاستدلال ، توجيه الطلبات وغيرها من الجوانب الرئيسية ، لتحقيق كفاءة منخفضة التكلفة في نشر واستدعاء النماذج المتعددة:

وحدة تخزين محولات LoRA ( محولات LoRA للتخزين ): يتم استضافة محول LoRA الذي تم ضبطه في OpenLedger، مما يتيح التحميل عند الطلب، وتجنب تحميل جميع النماذج مسبقًا في الذاكرة، وتوفير الموارد.
استضافة النماذج وطبقة دمج المحولات (Model Hosting & Adapter Merging Layer): جميع نماذج التعديل المشترك تستخدم النموذج الأساسي (base model)، أثناء الاستدلال يتم دمج LoRA adapter ديناميكيًا، مما يدعم الاستدلال المشترك لعدة محولات (ensemble) لتحسين الأداء.
محرك الاستدلال (Inference Engine): يتضمن تقنيات تحسين CUDA مثل Flash-Attention و Paged-Attention و SGMV.
وحدة توجيه الطلبات وإخراج التدفقات (Request Router & Token Streaming):

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 20