الذكاء الاصطناعي يواجه حائطًا: تبحث الشركات الناشئة عن طرق لتوسيع نطاق أعمالها
سيظهر النموذج المستقبلي للذكاء الاصطناعي من OpenAI نموًا أقل في الأداء مقارنةً بالسلالات السابقة. هذا ما ذكرته مجلة The Information مشيرةً إلى المصادر.
وفقًا لتقرير الصحيفة، وصلت ORION إلى مستوى GPT-4 بعد اجتياز 20٪ من التدريب. هذا يشير إلى أن زيادة أداء GPT-5 مقارنة بـ GPT-4 ستكون أقل من زيادة أداء GPT-3 إلى GPT-4.
"أوريون ليس أفضل من سابقته في حل بعض المشاكل. إنه يعمل بشكل جيد في معالجة المشاكل اللغوية ، ولكنه لا يتفوق على النماذج السابقة في الترميز" ، قال موظفو الشركة للمنشور.
التحسينات الأكثر وضوحا في الشبكات العصبية عادة ما تحدث في مراحل مبكرة من التدريب. في الفترة التالية، يبطئ التقدم. وبالتالي، فإن الـ 80% المتبقية من الوقت من غير المحتمل أن توفر زيادة كبيرة في الأداء، حسب ما لاحظت مصادر The Information.
الذكاء الاصطناعي يصطدم بالسقف
نتائج OpenAI غير المتفائلة تشير إلى مشكلة أكثر أساسية تواجه صناعة بأكملها: نضوب البيانات عالية الجودة للتدريب.
في البحث المنشور في يونيو ، يؤكد مجموعة من الخبراء أن شركات الذكاء الاصطناعي تستخدم جميع المواد النصية المتاحة عمومًا في الفترة بين 2026 و 2032. وهذا سيكون نقطة حاسمة للطرق التقليدية لتطوير الذكاء الاصطناعي.
«تظهر نتائجنا أن الاتجاهات الحالية في تطوير LLM لا يمكن أن تدعم إلا الحساب التقليدي لتوسيع البيانات»، يقول أصحاب الدراسة
يؤكد البحث على ضرورة تطوير نهج بديل لتحسين الشبكات العصبية مثل توليد البيانات الاصطناعية أو استخدام المعلومات المغلقة.
لاحظت The Information أن الاستراتيجية التعليمية المعتمدة اليوم في LLM على البيانات النصية العامة من مواقع الويب والكتب ومصادر أخرى وصلت إلى نقطة العائد المتناقص، لأن "المطورين استفاضوا من هذا النوع من المعلومات بقدر ما استطاعوا"
الحل موجود
OpenAI ولاعبون آخرون يقومون بتغيير جذري في أساليب تطوير الذكاء الاصطناعي
"على خلفية التباطؤ في معدل تحسن GPT ، يبدو أن الصناعة تحول تركيزها من التوسع أثناء التدريب إلى تحسين النماذج بعد تدريبهم الأولي. يمكن أن يؤدي هذا النهج إلى تشكيل قوانين جديدة للتوسع ، "تقارير المعلومات.
لتحقيق حالة تحسين مستمرة، تقسم OpenAI تطوير النماذج إلى اتجاهين مختلفين:
تتمحور سلسلة O حول إمكانيات التفكير. هذه النماذج تعمل بكثافة حسابية أعلى بكثير ومصممة لحل المشاكل المعقدة. تتطلب الحسابات جهدًا كبيرًا: تكاليف التشغيل ترتفع بستة أضعاف مقارنة بالنماذج الحالية. ومع ذلك، تبرر إمكانيات التفكير الموسعة زيادة التكاليف لتطبيقات معينة تتطلب معالجة تحليلية؛
سلسلة GPT متطورة بشكل متوازي موجهة نحو مهام الاتصال العامة. تستخدم النموذج قاعدة معرفية أوسع.
خلال جلسة أسئلة وأجوبة المستقبلية ، لفت كيفن ويل ، مدير المنتجات في OpenAI ، الانتباه إلى أن هناك خططًا لدمج كلا التطويرين في المستقبل.
استخدام البيانات الاصطناعية خطير
يمكن أن يشكل الاقتراب من حل مشكلة نقص البيانات من خلال إنشائها اصطناعيًا خطرًا على جودة المعلومات. يتم ذكر ذلك في دراسة قام بها مجموعة من الخبراء من جامعات مختلفة في المملكة المتحدة.
بالنسبة لهم، قد يؤدي هذا القرار في النهاية إلى فصل الذكاء الاصطناعي تمامًا عن الواقع وإلى "انهيار النموذج". المشكلة تكمن في استخدام البيانات غير الصحيحة من قبل الشبكة العصبية لتشكيل مجموعة تدريب الجيل القادم من الذكاء الاصطناعي.
لحل مشكلة OpenAI، تقوم بتطوير آليات الفرز للحفاظ على جودة المعلومات، من خلال دمج أساليب فحص مختلفة لفصل المحتوى عالي الجودة عن المحتوى المحتمل للمشاكل
التحسين بعد التدريب - نهج آخر مهم. يقوم الباحثون بتطوير أساليب لزيادة أداء الشبكات العصبية بعد المرحلة الأولية من الضبط، دون الاعتماد فقط على توسيع مجموعة المعلومات
في وقت سابق ، ذكرت وسائل الإعلام عن خطط OpenAI لإطلاق نموذج الذكاء الاصطناعي المتقدم التالي ، الذي يحمل الاسم الرمزي Orion ، بحلول ديسمبر. في وقت لاحق ، نفى رئيس الشركة ، سام ألتمان ، هذه المعلومات.
النهج الآخر للشركات
قال عدد من العلماء والباحثين والمستثمرين لرويترز إن الأساليب الكامنة وراء نموذج الذكاء الاصطناعي o1 الذي تم الكشف عنه مؤخرا "يمكن أن تغير سباق التسلح" في الذكاء الاصطناعي
في سبتمبر، قدمت OpenAI نموذج لغوي كبيرًا o1، تم تدريبه بطريقة تعزيزية لأداء استدلالات معقدة. الشبكة العصبية قادرة على التفكير - يمكنها إنشاء سلسلة طويلة من الأفكار الداخلية أثناء تحليل السؤال، وفقًا للشركة.
لاحظ إليا سوتسكيفر، مؤسس شركات الذكاء الاصطناعي الناشئة Safe Superintelligence (SSI) و OpenAI ، أن نتائج التدريب باستخدام كمية كبيرة من البيانات غير المميزة وصلت إلى ذروتها.
«كانت سنوات 2010 عصر التوسع، والآن عدنا مرة أخرى إلى أوقات العجائب والاكتشافات. الجميع يبحث عن جديد»، لاحظ.
رفض سوتسكيفير مشاركة تفاصيل عمل شركته الجديدة SSI، مشيرًا فقط إلى وجود نهج بديل لتوسيع نطاق التعلم المبكر
ذكرت مصادر رويترز أن الباحثين في المختبرات الكبرى للذكاء الاصطناعي يواجهون تأخيرًا ونتائج غير مرضية في سعيهم لإنشاء نموذج لغوي كبير يفوق GPT-4 من OpenAI الذي تم إطلاقه قبل ما يقرب من عامين.
يحاولون تطبيق تقنية تحسين الشبكات العصبية أثناء مرحلة ما يسمى بـ 'الإخراج'. على سبيل المثال ، بدلاً من تقديم إجابة واحدة ، يقوم الذكاء الاصطناعي بتوليد عدة خيارات أولاً ويختار الأفضل.
في تذكير، أفادت وسائل الإعلام في أكتوبر بأن OpenAI يعمل على رقاقة AI الخاصة بها.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
أعجبني
إعجاب
1
إعادة النشر
مشاركة
تعليق
0/400
GateUser-e56c75f6
· 2024-11-13 10:12
إذا كنت ترغب في القصير ، فكن قاسيًا ، يا قمامة صغيرة
اصطدم الذكاء الاصطناعي بالسقف: تبحث الشركات الناشئة عن طرق لتوسيع نطاقها
الذكاء الاصطناعي يواجه حائطًا: تبحث الشركات الناشئة عن طرق لتوسيع نطاق أعمالها
سيظهر النموذج المستقبلي للذكاء الاصطناعي من OpenAI نموًا أقل في الأداء مقارنةً بالسلالات السابقة. هذا ما ذكرته مجلة The Information مشيرةً إلى المصادر.
وفقًا لتقرير الصحيفة، وصلت ORION إلى مستوى GPT-4 بعد اجتياز 20٪ من التدريب. هذا يشير إلى أن زيادة أداء GPT-5 مقارنة بـ GPT-4 ستكون أقل من زيادة أداء GPT-3 إلى GPT-4.
التحسينات الأكثر وضوحا في الشبكات العصبية عادة ما تحدث في مراحل مبكرة من التدريب. في الفترة التالية، يبطئ التقدم. وبالتالي، فإن الـ 80% المتبقية من الوقت من غير المحتمل أن توفر زيادة كبيرة في الأداء، حسب ما لاحظت مصادر The Information.
الذكاء الاصطناعي يصطدم بالسقف
نتائج OpenAI غير المتفائلة تشير إلى مشكلة أكثر أساسية تواجه صناعة بأكملها: نضوب البيانات عالية الجودة للتدريب.
في البحث المنشور في يونيو ، يؤكد مجموعة من الخبراء أن شركات الذكاء الاصطناعي تستخدم جميع المواد النصية المتاحة عمومًا في الفترة بين 2026 و 2032. وهذا سيكون نقطة حاسمة للطرق التقليدية لتطوير الذكاء الاصطناعي.
يؤكد البحث على ضرورة تطوير نهج بديل لتحسين الشبكات العصبية مثل توليد البيانات الاصطناعية أو استخدام المعلومات المغلقة.
لاحظت The Information أن الاستراتيجية التعليمية المعتمدة اليوم في LLM على البيانات النصية العامة من مواقع الويب والكتب ومصادر أخرى وصلت إلى نقطة العائد المتناقص، لأن "المطورين استفاضوا من هذا النوع من المعلومات بقدر ما استطاعوا"
الحل موجود
OpenAI ولاعبون آخرون يقومون بتغيير جذري في أساليب تطوير الذكاء الاصطناعي
لتحقيق حالة تحسين مستمرة، تقسم OpenAI تطوير النماذج إلى اتجاهين مختلفين:
خلال جلسة أسئلة وأجوبة المستقبلية ، لفت كيفن ويل ، مدير المنتجات في OpenAI ، الانتباه إلى أن هناك خططًا لدمج كلا التطويرين في المستقبل.
استخدام البيانات الاصطناعية خطير
يمكن أن يشكل الاقتراب من حل مشكلة نقص البيانات من خلال إنشائها اصطناعيًا خطرًا على جودة المعلومات. يتم ذكر ذلك في دراسة قام بها مجموعة من الخبراء من جامعات مختلفة في المملكة المتحدة.
بالنسبة لهم، قد يؤدي هذا القرار في النهاية إلى فصل الذكاء الاصطناعي تمامًا عن الواقع وإلى "انهيار النموذج". المشكلة تكمن في استخدام البيانات غير الصحيحة من قبل الشبكة العصبية لتشكيل مجموعة تدريب الجيل القادم من الذكاء الاصطناعي.
لحل مشكلة OpenAI، تقوم بتطوير آليات الفرز للحفاظ على جودة المعلومات، من خلال دمج أساليب فحص مختلفة لفصل المحتوى عالي الجودة عن المحتوى المحتمل للمشاكل
التحسين بعد التدريب - نهج آخر مهم. يقوم الباحثون بتطوير أساليب لزيادة أداء الشبكات العصبية بعد المرحلة الأولية من الضبط، دون الاعتماد فقط على توسيع مجموعة المعلومات
في وقت سابق ، ذكرت وسائل الإعلام عن خطط OpenAI لإطلاق نموذج الذكاء الاصطناعي المتقدم التالي ، الذي يحمل الاسم الرمزي Orion ، بحلول ديسمبر. في وقت لاحق ، نفى رئيس الشركة ، سام ألتمان ، هذه المعلومات.
النهج الآخر للشركات
قال عدد من العلماء والباحثين والمستثمرين لرويترز إن الأساليب الكامنة وراء نموذج الذكاء الاصطناعي o1 الذي تم الكشف عنه مؤخرا "يمكن أن تغير سباق التسلح" في الذكاء الاصطناعي
في سبتمبر، قدمت OpenAI نموذج لغوي كبيرًا o1، تم تدريبه بطريقة تعزيزية لأداء استدلالات معقدة. الشبكة العصبية قادرة على التفكير - يمكنها إنشاء سلسلة طويلة من الأفكار الداخلية أثناء تحليل السؤال، وفقًا للشركة.
لاحظ إليا سوتسكيفر، مؤسس شركات الذكاء الاصطناعي الناشئة Safe Superintelligence (SSI) و OpenAI ، أن نتائج التدريب باستخدام كمية كبيرة من البيانات غير المميزة وصلت إلى ذروتها.
رفض سوتسكيفير مشاركة تفاصيل عمل شركته الجديدة SSI، مشيرًا فقط إلى وجود نهج بديل لتوسيع نطاق التعلم المبكر
ذكرت مصادر رويترز أن الباحثين في المختبرات الكبرى للذكاء الاصطناعي يواجهون تأخيرًا ونتائج غير مرضية في سعيهم لإنشاء نموذج لغوي كبير يفوق GPT-4 من OpenAI الذي تم إطلاقه قبل ما يقرب من عامين.
يحاولون تطبيق تقنية تحسين الشبكات العصبية أثناء مرحلة ما يسمى بـ 'الإخراج'. على سبيل المثال ، بدلاً من تقديم إجابة واحدة ، يقوم الذكاء الاصطناعي بتوليد عدة خيارات أولاً ويختار الأفضل.
في تذكير، أفادت وسائل الإعلام في أكتوبر بأن OpenAI يعمل على رقاقة AI الخاصة بها.