الذكاء الاصطناعي: الخوادم

حول

يتكامل Agent DVR بالكامل مع خوادم الذكاء الاصطناعي مثل DeepStack AI و CodeProject AI و PlateRecognizer.com و Claude و Gemini و OpenAI (ChatGPT) و LLMs المحلية مثل Ollama و vLLM و LM Studio لإضافة تصفية تنبيهات ذكية، والتعرف على الكائنات، والتعرف على المشاهد، والتحكم الذكي في الأحداث.

بالإضافة إلى DeepStack و CodeProject AI، يمكنك أيضًا استخدام خوادم ذكاء اصطناعي أخرى تدعم نفس واجهة البرمجة:

التعرف على الكائنات ورؤية الكمبيوتر

https://codeproject.github.io/ - خادم معالجة الذكاء الاصطناعي المعتمد على GPU/CPU عبر الأنظمة
https://docs.platerecognizer.com/ - خادم التعرف على لوحات السيارات (واجهة برمجة تطبيقات قائمة على الويب)
https://github.com/runningman84/docker-coral-rest-server - نماذج Tensorflow-lite على RPi (أو Linux/Mac) مع تسريع من عصا Coral USB
https://github.com/robmarkcole/coral-pi-rest-server/ - نماذج Tensorflow-lite على مسرع Coral USB عبر تطبيق Flask
https://github.com/xnorpx/blue-candle - خادم التعرف على الكائنات صغير جداً

خدمات الذكاء الاصطناعي السحابية

https://platform.openai.com/ - واجهة برمجة تطبيقات OpenAI (ChatGPT، GPT-4 Vision) لتحليل الصور والدردشة
https://console.anthropic.com/ - واجهة برمجة تطبيقات Anthropic Claude للتفكير المتقدم وفهم الصور
https://ai.google.dev/ - واجهة برمجة تطبيقات Google Gemini لإمكانات الذكاء الاصطناعي متعددة الأنماط
https://docs.anthropic.com/ - وثائق واجهة برمجة تطبيقات Claude
https://platform.openai.com/docs/ - وثائق واجهة برمجة تطبيقات OpenAI
https://ai.google.dev/gemini-api/docs - وثائق واجهة برمجة تطبيقات Gemini

خوادم الذكاء الاصطناعي المحلية (LLMs)

https://ollama.com/ - Ollama: تشغيل نماذج اللغة الكبيرة محليًا
https://docs.vllm.ai/ - vLLM: استنتاج وتقديم LLM عالي الإنتاجية
https://lmstudio.ai/ - LM Studio: تطبيق سطح مكتب سهل الاستخدام لنماذج LLM المحلية
https://github.com/ollama/ollama - مستودع Ollama على GitHub
https://github.com/vllm-project/vllm - مستودع vLLM على GitHub

ملاحظة: تتطلب خدمات الذكاء الاصطناعي السحابية مفاتيح API وقد تتطلب تكاليف استخدام. تعمل خوادم الذكاء الاصطناعي المحلية على الأجهزة الخاصة بك وتحافظ على خصوصية البيانات ولكنها تتطلب موارد نظام أكثر.

إضافة نماذج الذكاء الاصطناعي

لإضافة ملفات النموذج الخاصة بك إلى Agent DVR، انتقل إلى إعدادات الخادم > إعدادات الذكاء الاصطناعي وانقر على تكوين تحت نماذج الذكاء الاصطناعي. يأتي Agent مع نموذجين مسبقين تم ضبط أدائهما لـ Agent DVR.

قبل أن تقوم بتكوين نموذج، ستحتاج إلى إضافته إلى مجلد نماذج Agent DVR. عادةً ما يوجد في Agent/Media/Models/ONNX (قد يختلف المسار حسب نظام التشغيل). يتم عرض المسار الكامل في صفحة إضافة النموذج إذا كنت غير متأكد. يستخدم Agent نماذج .onnx. يمكنك تحويل تنسيقات نماذج الذكاء الاصطناعي الأخرى إلى ONNX باستخدام أدوات Python.

بمجرد أن تقوم بإنشاء النموذج ونسخه، فإن إضافته إلى Agent سهلة - انقر لإضافة نموذج:

الاسم: أعطِ نموذجك اسمًا - يمكن أن يكون أي شيء تريده.
ملف النموذج: اختر اسم ملف النموذج الذي قمت بنسخه إلى المجلد.
التسميات: أدخل قائمة بالتسميات (أو "الفئات") التي يبحث عنها نموذجك بتنسيق CSV بدون اقتباسات (يتم قص المسافات تلقائيًا).
التخطيط: اختر ما إذا كان نموذجك NCHW أو NHWC. معظم النماذج هي NCHW إذا كنت غير متأكد.
ترتيب القناة: اختر ما إذا كان نموذجك يريد الصور بتنسيق RGB أو BGR. تستخدم معظم النماذج RGB. إذا كان نموذجك أحادي القناة (تدرج الرمادي) فسيتم تجاهل ذلك.
تطبيع: اختر كيف يجب تطبيع البيانات قبل استخدامها في نموذجك. تستخدم معظم النماذج تطبيع 0-1 (قسّم قيم البكسل على 255).
توسيع الصورة: يتحكم هذا في ما إذا كان يجب تمديد الصورة إلى الأبعاد المدخلة أو إضافة حواف سوداء. عادةً ما يكون من الأفضل إضافة حواف للصورة من أجل الدقة.
يمتلك NMS: تحقق من هذا إذا كان نموذجك يقوم بالفعل بتنفيذ تقليل الحد الأقصى غير الأقصى داخليًا. خلاف ذلك، سيقوم Agent بتنفيذ NMS بنفسه. يتحكم NMS في كيفية تصفية مستطيلات النتائج.
NMS الافتراضي: اضبط محدد التداخل لـ NMS (الافتراضي هو 45% تداخل).

بمجرد إضافة نموذجك، سيكون متاحًا للاستخدام في علامة التعرف على الكائنات في جهازك. إذا واجهت مشاكل، يمكنك العودة إلى تكوين النموذج وإجراء تغييرات. يدعم Agent أيضًا إعادة تحميل ملف النموذج، لذا يمكنك نسخه بإصدار جديد أثناء تشغيله.

إعداد خوادم الذكاء الاصطناعي

```html

لإعداد خوادم الذكاء الاصطناعي، انقر على أيقونة في أعلى يسار واجهة مستخدم Agent DVR الرئيسية. ثم انقر على الإعدادات تحت التكوين، اختر إعدادات الذكاء الاصطناعي من القائمة المنسدلة، وانقر على تكوين تحت خوادم الذكاء الاصطناعي.

يتكامل Agent DVR مع CodeProject.AI لمجموعة متنوعة من ميزات الذكاء الاصطناعي بما في ذلك التعرف على الأشياء، التعرف على الوجوه، ALPR (التعرف التلقائي على لوحات السيارات)، والدقة الفائقة (تحسين). يتم أيضًا دعم PlateRecognizer.com كمزود ALPR. CodeProject.AI مفتوح المصدر ومجاني ومتوافق مع معظم المنصات.

للبدء، قم بتثبيت خادم ذكاء اصطناعي لمنصتك وقم بتوصيل Agent DVR به عن طريق النقر على زر تكوين ثم إضافة.

يمكنك إضافة عدد غير محدود من خوادم الذكاء الاصطناعي إلى Agent DVR حسب الحاجة. يمكن تكوين الكاميرات في Agent DVR لاستخدام خوادم ذكاء اصطناعي مختلفة لكل وظيفة، أو يمكنك استخدام خادم ذكاء اصطناعي واحد لجميع المهام.

تحذير: معالجة الذكاء الاصطناعي قد تكون مكثفة من حيث الموارد. تأكد من أن جهاز الكمبيوتر الخاص بك لديه طاقة كافية لتشغيله.

تكوين خادمك

الاسم: سمِّ خادمك، مثل، Cat Catcher.
عنوان URL لخادم الذكاء الاصطناعي: أدخل عنوان URL لخادم الذكاء الاصطناعي الخاص بك، مثل، http://localhost:32168/
مفتاح API: أدخل مفتاحك إذا تم إعداده (اختياري).
مهلة: المهلة بالثواني لطلبات الخادم.
تأخير إعادة المحاولة: الوقت بالثواني قبل إعادة محاولة طلب فاشل إلى هذا الخادم.

انقر على موافق لحفظ إعداداتك.

```

باستخدام OpenAI

لإعداد OpenAI ("Chat GPT") للرد على الأسئلة حول ما يحدث في تغذية الفيديو الخاصة بك، انتقل إلى إعدادات الخادم - خوادم الذكاء الاصطناعي وحدد "Open AI" تحت Ask AI.

الرابط: أدخل الرابط للخدمة. الافتراضي هو "https://api.openai.com/v1/chat/completions".
مفتاح API لـ OpenAI: بعد التسجيل في OpenAI، انتقل إلى صفحة مفاتيح الواجهة البرمجية وأنشئ مفتاحًا سريًا جديدًا. انسخ هذا المفتاح والصقه في الحقل المحدد.
النموذج: حدد النموذج الذي سيتم استخدامه. الافتراضي هو gpt-4o. قد يقوم OpenAI بإزالة أو تغيير هذا في وقت لاحق.
أقصى عدد من الرموز: يحدد هذا الحد الأقصى لاستخدام الرموز في كل طلب. إذا واجهت مشكلات، تحقق من السجلات على /logs.html حيث يمكن أن تكون ذات صلة باستخدام الرموز.

بمجرد تكوين OpenAI، راجع Ask AI للحصول على تعليمات حول كيفية استخدامه للرد على الأسئلة العامة حول ما يحدث في تغذية الكاميرا الخاصة بك.

استخدام السحابة

لإعداد Claude AI للرد على الأسئلة حول ما يحدث في تغذية الفيديو الخاصة بك، انتقل إلى إعدادات الخادم - خوادم AI وحدد "Claude" تحت Ask AI.

رابط URL: أدخل الرابط إلى الخدمة. الافتراضي هو "https://api.anthropic.com/v1/messages".
مفتاح API لـ Claude: بعد التسجيل في Claude، قم بزيارة صفحة مفاتيح الـ API وأنشئ مفتاح سري جديد. انسخه والصقه في الحقل.
الإصدار: حدد الإصدار المراد استخدامه. الافتراضي هو 2023-06-01 يمكن إزالته أو تغييره في وقت معين من قبل Anthropic.
النموذج: حدد النموذج المراد استخدامه. الافتراضي في وقت الكتابة هو claude-3-sonnet-20240229.
الحد الأقصى للرموز: يتحكم هذا في الحد الأقصى للرموز المستخدمة في كل طلب. تحقق من السجلات على /logs.html إذا كانت لديك مشاكل لأنه قد يكون ذلك متعلقًا بإنفاق الرموز.

بمجرد تكوين Claude، انظر Ask AI لمعرفة كيفية استخدامه للاعتراف بالسيناريوهات العامة في تغذية الكاميرا الخاصة بك.

باستخدام Gemini

لإعداد Gemini للرد على الأسئلة حول ما يحدث في تغذية الفيديو الخاصة بك، انتقل إلى إعدادات الخادم - خوادم الذكاء الاصطناعي واختر "Gemini" تحت Ask AI.

عنوان URL: أدخل عنوان URL للخدمة. الافتراضي هو "https://generativelanguage.googleapis.com".
مفتاح Gemini API: بعد التسجيل في Gemini، قم بزيارة صفحة مفاتيح الواجهة البرمجية وأنشئ مفتاحًا سريًا جديدًا. انسخ هذا المفتاح والصقه في الحقل.
الإصدار: حدد الإصدار الذي تريد استخدامه. الافتراضي هو v1beta وقد يتم إزالته أو تغييره في وقت ما من قبل Google.
النموذج: حدد النموذج الذي تريد استخدامه. الافتراضي في وقت الكتابة هو gemini-1.5-flash.
أقصى عدد من الرموز: يتحكم هذا في الحد الأقصى لإنفاق الرموز لكل طلب. تحقق من السجلات على /logs.html إذا كانت لديك مشاكل لأنه قد يكون ذلك متعلقًا بإنفاق الرموز.

بمجرد تكوين Gemini، انظر Ask AI لمعرفة كيفية استخدامه للتعرف على السيناريوهات العامة في تغذية الكاميرا الخاصة بك.

استخدام خوادم LLM الأخرى

من v6.5.3.0+ يمكنك استخدام خوادم LLM المحلية الخاصة بك (مثل vLLM وOllama وLM Studio) لوصف الصور التي يلتقطها Agent DVR من كاميراتك في أحداث التنبيه والإجابة على الأسئلة حول ما يحدث في تدفقات الفيديو الخاصة بك. راجع AI Describe وAsk AI.

لتكوين خادم AI محلي، انتقل إلى إعدادات الخادم - خوادم AI وانقر على زر التكوين بجوار LLM الذي ترغب في استخدامه (Ollama أو vLLM أو LM Studio).

URL: حدد نقطة النهاية التي يعمل عليها خادم LLM الخاص بك. عناوين URL الافتراضية هي:
- Ollama:
```
http://localhost:11434/api/chat
```
- vLLM:
```
http://localhost:8000/v1/chat/completions
```
- LM Studio:
```
http://localhost:1234/v1/chat/completions
```
API Key: إذا كان خادم LLM الخاص بك يتطلب مصادقة، أدخل مفتاح API هنا. معظم الخوادم المحلية لا تتطلب ذلك ما لم يتم تكوينها بشكل محدد.
Model: اختر النموذج القابل للرؤية للاستخدام في تحليل الصور. يجب أن تكون قد قمت بتنزيل هذا النموذج وتحميله في خادم LLM الخاص بك. الخيارات الشائعة تشمل:
- نماذج LLaVA (رؤية عامة)
- Qwen2-VL (أداء عالي)
- Llama 3.2 Vision (الأحدث من Meta)
Temperature: يتحكم في الإبداع مقابل الدقة في الردود (0.0-1.0). القيم المنخفضة (0.3-0.4) تنتج أوصافًا أكثر دقة وثباتًا. القيم الأعلى (0.6-0.8) تولد ردودًا أكثر تنوعًا وإبداعًا. الموصى به: 0.4 لتحليل كاميرات الأمان.
Max Tokens: الحد الأقصى لعدد الكلمات/الرموز في رد AI. القيم الأعلى تسمح بأوصاف أكثر تفصيلاً ولكن تستغرق وقتًا أطول للتوليد. الموصى به: 300-500 لتحليل الصور التفصيلي، 150-250 للأوصاف القصيرة.
top_p: يتحكم في تنوع الردود من خلال تقييد اختيار المفردات (0.0-1.0). القيم المنخفضة تستخدم كلمات أكثر شيوعًا، والقيم الأعلى تسمح بمفردات أكثر تنوعًا. الموصى به: 0.9 لتحقيق توازن جيد بين الدقة واللغة الطبيعية.
top_k: يحدد النموذج لاختيار من بين أعلى K من الكلمات المحتملة التالية. القيم المنخفضة (20-40) تنتج ردودًا أكثر تركيزًا، والقيم الأعلى (80-100) تسمح بتنوع أكبر. الموصى به: 50 لأوصاف الصور الموثوقة.

ملاحظة: يجب عليك تثبيت وتكوين خادم LLM الذي اخترته بشكل منفصل. تأكد من أنك قد قمت بتنزيل نموذج قابل للرؤية قبل تكوين Agent DVR. للحصول على أفضل النتائج مع كاميرات الأمان، استخدم نماذج تحتوي على 7B على الأقل من المعلمات وتأكد من أن نظامك يحتوي على VRAM كافٍ (يوصى بـ 5GB+).

استخدام PlateRecognizer.com

لتكوين تعرف لوحة التراخيص (LPR) في Agent DVR، انتقل إلى إعدادات الخادم - إعدادات الذكاء الاصطناعي وأدخل التفاصيل تحت Plate Recognizer. قم بالتسجيل للحصول على فترة تجريبية مجانية على Plate Recognizer. لا يلزم بطاقة ائتمان.

URL: أدخل عنوان URL للخدمة. الافتراضي هو "https://api.platerecognizer.com/v1/plate-reader/"، أو استخدم خادمك الخاص إذا كنت تستضيف نسختك الخاصة.
Token: بعد التسجيل في Plate Recognizer، قم بزيارة صفحة الحساب وانسخ رمز API.
Regions: اتركه فارغًا للافتراضي أو أدخل قائمة CSV من المناطق.
Config: أدخل قيم تكوين إضافية من الوثائق إذا لزم الأمر.

استخدام DoubleTake

DoubleTake هي منصة مفتوحة المصدر توفر واجهة برمجة تطبيقات موحدة لمعالجة التعرف على الوجه باستخدام:

CompreFace
Amazon Rekognition
DeepStack
CodeProject.AI Server
Facebox

ستحتاج إلى تثبيت وتكوين DoubleTake مع خيارات التعرف على الوجه المفضلة لديك.

بمجرد إعداد DoubleTake، افتح Agent DVR وانتقل إلى إعدادات الخادم - خوادم الذكاء الاصطناعي وانقر على زر التكوين بجوار DoubleTake.

أدخل عنوان URL لخادم doubletake الخاص بك (على سبيل المثال http://localhost:3000/) وكلمة المرور إذا تم إعدادها.

انقر على موافق ثم قم بتحرير كاميرا وانتقل إلى التعرف على الوجه. قم بتعيين خيار خادم الذكاء الاصطناعي إلى DoubleTake و قم بتكوين التعرف على الوجه حسب الحاجة.

إدارة وحدات الذكاء الاصطناعي

في قائمة خوادم الذكاء الاصطناعي (المشار إليها أعلاه)، لديك خيارات لتكوين واختبار وتحرير وإزالة خوادم الذكاء الاصطناعي. انقر فوق زر التكوين لعرض الوحدات المتاحة أو المثبتة على الخادم المحدد.

يسترد Agent DVR قائمة الوحدات الحالية من خادمك ويقدم واجهة مستخدم لتثبيت وإلغاء تثبيت وتكوين واختبار كل وحدة. يتم توفير الدعم لجميع وحدات CodeProject.UI الافتراضية، على الرغم من أن Agent DVR يستخدم فقط جزءًا من هذه الوحدات.

يُوصى بتثبيت إحدى خيارات وحدة التعرف على الكائن فقط. قم بمراجعة وصف كل وحدة لتحديد الأنسب لنظامك.

لاستخدام تعرف على لوحة ترخيص السيارات الآلي (ALPR)، وضوح فائق، أو التعرف على الوجوه في Agent DVR، ستحتاج إلى تثبيت الوحدة المعنية من هذه الصفحة. عادةً، تكون الإعدادات الافتراضية كافية لهذه الوحدات، ولكن يمكنك تكوينها عن طريق النقر فوق الرمز تحت كل وحدة.

اللغة