
الشركة تلعب Nvidia بقوة في عالم الذكاء الاصطناعي مع أحدث جيل من الأجهزة، ولكنها الآن تضيف أيضًا برامج مع NVLM. سوف تتنافس مع جي بي تي-4o والمكالمات من خلال LLM مفتوح المصدر للانضمام إلى النماذج متعددة الوسائط (الصورة والنص).
نفيديا تهيمن على أجهزة الذكاء الاصطناعي مع وحدات معالجة الرسومات الخاصة بها لمركزية البيانات، مع نموذجي H100 وB200 باعتبارهما الأكثر تمثيلاً. ولكن مع NVLM يأتي رهان جديد لقطاع نماذج اللغات الكبيرة (LLM). يأتي اقتراح Nvidia للقتال في قطاع تهيمن عليه OpenAI وGPT-4°. ومع ذلك، هناك منافسون آخرون أيضًا، مثل Gemini من Google، وMeta's Llama، وAnhtropic’s Claude 3.5.
ما الذي يقترحه NVLM من Nvidia لإحداث ثورة في عالم الذكاء الاصطناعي؟
NVLM 1.0 من نفيديا هو المنافس الجديد في عالم نماذج اللغات الكبيرة للذكاء الاصطناعي. نشر المطورون دراسة توضح بالتفصيل كيفية عملها وما سيسمح به هذا الاقتراح الجديد الذي يهدف إلى التنافس في قطاع البرمجيات باستخدام الذكاء الاصطناعي.
باختصار، NVLM عبارة عن عائلة كاملة من برامج LLM متعددة الوسائط التي، وفقًا لشركة Nvidia، تحقق نتائج رائعة في الرؤية واللغة. تشير الدراسة إلى قدرة تحليل وتطوير مشابهة جدًا لتلك الموجودة في النماذج الأخرى الشائعة بالفعل، مثل GPT-4o.
في NVLM نجد أ نموذج يحتوي على 72.000 مليار معلمةوهو الرقم الأكثر طموحًا وقدرة حتى الآن. وفقًا لـ Nvidia، فإن سلوكها ونوع استجاباتها أفضل من سلوك Llama 3 405B، وهو نموذج أكبر بكثير وفقًا لاختبارات الأداء.
ميزة أخرى لاقتراح Nvidia هي أن NVLM تقدم نموذجًا مفتوح المصدر للذكاء الاصطناعي للأوزان المفتوحة. ويعد المسؤولون بنشر الكود المستخدم لتدريب النموذج، وهو أمر مفيد للغاية. سيتمكن المطورون من استخدامه في مشاريعهم وشوكاتهم الخاصة.
ماذا ستقدم NVLM لعالم الذكاء الاصطناعي؟
باستخدام NVLM، يمكنك تحليل المدخلات المرئية والنصية. يُترجم هذا إلى قدرة الذكاء الاصطناعي على تفسير الميمات وتحليل الصور. بالإضافة إلى ذلك، يمكنك أيضًا استخدام نموذج اللغة هذا الذي أنشأته Nvidia لحل المشكلات الرياضية خطوة بخطوة.
عمل هذا النظام يجمع بين التعرف الضوئي على الحروف والترجمة والحس السليم والمعرفة العالمية ومهارات البرمجة. كل هذا معًا يسمح لـ NVLM بالاستجابة للطلبات والمواقف المختلفة بتنوع كبير. إن استكشاف نطاق نموذج لغة الذكاء الاصطناعي الجديد هذا ومقارنته في الأداء مع اللاعبين الآخرين في هذا القطاع يسمح لنا بفهم أين تتقدم التكنولوجيا.
حول ما قبل التمرين
استخدم المسؤولون عن تدريب NVLM بنية محسنة للتدريب والتفكير في نموذجهم. قدراتها متعددة الاستخدامات وهي قادرة على معالجة 72.000 مليون معلمة ومنافسين مباشرين GPT-4o، وLlama 3-V-70B، وGemini 1.5 Pro. وقد أثبت أداءه الأعظم حاليًا في حل المشكلات الرياضية ومعالجة الصور والنصوص.
تم اختيار المعلومات المستخدمة للتدريب المسبق والتدريب بعناية مع إجراء تعديلات دقيقة والإشراف البشري. وقد ساهم العمل في التحقق من جودة مجموعات البيانات بالإضافة إلى تنوع المهام المتوافقة والمتدرجة، بما في ذلك خلال مرحلة ما قبل التعلم.
El خوارزمية قوية أنشأتها نفيديا تم إصداره كمصدر مفتوح، جنبًا إلى جنب مع النموذج مع التعليمات ومعايير التدريب. ويمكن استخدامها وتعديلها دون أي تكلفة، ويتم توزيعها من خلال مكتبة تطوير الشركة Megatron-Core.
يعد هذا علامة فارقة حقيقية في الصناعة، لأن Nvidia تسهل على المنظمات الصغيرة الأخرى أو الباحثين المستقلين المساهمة أيضًا في تقدم الذكاء الاصطناعي. هو حرية الوصول إلى الأداة وخصائصها المشابهة لتلك الخاصة بمنتجات التكنولوجيا الكبرى الأخرى ستشكل علامة فارقة في السباق للسيطرة على القطاع.
مع LLM الجديد، الهدف هو توسيع قاعدة المستخدمين والعملاء، وتفضيل الأعمال المربحة بالفعل. ولكنها الآن ستضيف المزيد من المتحمسين والمستخدمين المحتملين حول العالم. خطوة ممتازة لشركة Nvidia، التي بالإضافة إلى هيمنتها على قطاع الذكاء الاصطناعي من خلال الأجهزة، فإنها تستهدف الآن قطاع البرمجيات بشكل مباشر.
استراتيجية الأعمال الهجينة
المكانة الرائدة التي اتخذتها نفيديا في القطاع التكنولوجي وفي تطوير الذكاء الاصطناعي فإنه يستجيب لاستراتيجية عمل هجينة. فمن ناحية، تفكر في تطوير وإنتاج الرقائق وبيع الأنظمة المتقدمة لتعزيز تشغيل خوارزميات متنوعة للغاية. وقد أدى ذلك إلى تسريع توليد الدخل والحصول على موافقة المستثمرين. من ناحية أخرى، يتم العمل على خوارزميات الذكاء الاصطناعي بحيث تضع Nvidia نفسها في شريحة تكون فيها في وضع غير مؤات مقارنة بـ OpenAI وGoogle وMeta. ولكن بفضل هذه الإستراتيجية، أثبتت NVLM أنها أداة رائعة، قادرة على القتال وجهاً لوجه مع عمالقة الذكاء الاصطناعي الموجودين بالفعل.
مع معالجات Nvidia الجديدة، أصبحت السرعة والقدرة على التحليل وحل المشكلات الرياضية التي يحققها المستخدمون ملحوظة. سيمثل وصول NVLM 1.0 مرحلة ما قبل وبعد هذا القطاع، مما يولد إمكانية وجود ممثل جديد بمقترحات مفتوحة المصدر للوصول إلى عدد أكبر من المستخدمين والشركات الصغيرة والمتوسطة الحجم.
كيف سيكون وضع سوق الذكاء الاصطناعي الآن بعد دخول Nvidia مع NVLM؟
حتى الآن، عرضت نفيديا أهم المعالجات ووحدات معالجة الرسومات لجميع أنواع مراكز البيانات والخوادم التي يتم فيها تنفيذ نماذج الذكاء الاصطناعي. لكن NVLM يعني ضمناً هبوط Nvidia المباشر في القطاع، وهذا قد يولد بعض الاحتكاك مع بقية المنافسة. إن مبادرة المصدر المفتوح وقوة المعالجة الطموحة تجعل من NVLM نموذجًا لغويًا جذابًا للغاية. ويبقى أن نرى كيف يتكيف والاستخدامات التي يبدأ مجتمع المستخدمين في منحها لفهم نطاقه بشكل كامل. من المحتمل أن نبدأ بسماع أخبار مهمة من قطاع الذكاء الاصطناعي الآن بعد دخول Nvidia إلى اللعبة.
