جولة حصرية في مختبرات Trainium: سلاح «أمازون» السري لكسر احتكار «إنفيديا» وجذب عمالقة الذكاء الاصطناعي

جولة حصرية في مختبرات Trainium: سلاح «أمازون» السري لكسر احتكار «إنفيديا» وجذب عمالقة الذكاء الاصطناعي

مقامرة الـ 50 مليار دولار: لماذا تراهن OpenAI وAnthropic على رقائق أمازون؟

بعد فترة وجيزة من إعلان آندي جاسي، الرئيس التنفيذي لشركة أمازون، عن صفقة استثمارية ضخمة بقيمة 50 مليار دولار مع OpenAI، حصلنا على فرصة نادرة لزيارة مختبر تطوير الرقائق الذي يمثل قلب هذه الشراكة. يراقب خبراء الصناعة عن كثب شريحة Trainium التي تنتجها شركة AWS، ليس فقط لقدرتها على خفض تكاليف «الاستنتاج» (Inference) في الذكاء الاصطناعي، ولكن لإمكانية إحداث شرخ حقيقي في احتكار شركة «إنفيديا» (Nvidia) شبه الكامل للسوق.

تعد AWS المنصة السحابية الرئيسية لشركة Anthropic منذ أيامها الأولى، وهي علاقة صمدت حتى بعد انضمام مايكروسوفت كشريك سحابي لـ Anthropic. واليوم، تجعل صفقة OpenAI من AWS المزود الحصري لبناء وكلاء الذكاء الاصطناعي الجديد «Frontier»، وهو مشروع قد يغير وجه الأعمال في وادي السيليكون.

تفوق تقني وتوفير في التكاليف

ما الذي يجعل OpenAI تنجذب نحو AWS؟ كجزء من هذه الصفقة، وافقت أمازون على تزويد OpenAI بقدرة حوسبة تصل إلى 2 جيجاوات من شرائح Trainium. هذا التزام ضخم، خاصة وأن Anthropic وخدمة Bedrock الخاصة بأمازون تستهلكان هذه الشرائح بمعدل أسرع مما يمكن لأمازون إنتاجه.

  • تم نشر 1.4 مليون شريحة Trainium عبر ثلاثة أجيال حتى الآن.
  • يعتمد نموذج Claude الخاص بـ Anthropic على أكثر من مليون شريحة من طراز Trainium2.
  • توفر خوادم Trn3 UltraServers الجديدة تكلفة تشغيل أقل بنسبة تصل إلى 50% مقارنة بالخوادم السحابية التقليدية لنفس مستوى الأداء.

وعلى الرغم من أن Trainium صُممت في الأصل لتدريب النماذج، إلا أنها تُستخدم الآن بكثافة في «الاستنتاج» (Inference) — وهي العملية الفعلية لتشغيل النموذج لتوليد الاستجابات — والتي تعد حالياً أكبر عنق زجاجة في أداء الصناعة.

إرث «Annapurna Labs» وتحدي إنفيديا

تعود جذور وحدة تصميم الرقائق في أمازون إلى عام 2015، عندما استحوذت على الشركة الإسرائيلية «Annapurna Labs» مقابل حوالي 350 مليون دولار. واليوم، يقع هذا المختبر المتطور في منطقة «ذا دومين» في أوستن، تكساس، حيث يعمل المهندسون على تصميم كل شيء بدءاً من المعالجات وصولاً إلى أنظمة التبريد السائل المتطورة.

أحد أكبر التحديات التي واجهت المنافسين تاريخياً هو تكلفة الانتقال؛ فالتطبيقات المكتوبة لشرائح إنفيديا تتطلب عادةً إعادة هندسة لتعمل على شرائح أخرى. ومع ذلك، تؤكد أمازون أن Trainium يدعم الآن PyTorch، وهو إطار عمل مفتوح المصدر يحظى بشعبية هائلة، مما يجعل الانتقال يتطلب «تغييراً في سطر واحد من الكود فقط»، وفقاً لمهندسي الشركة.

داخل المختبر: ثقافة العمل والابتكار

المختبر ليس مجرد مكان هادئ للبحث، بل هو بيئة صناعية صاخبة مليئة بالمعدات. هنا تتم عملية «الـ Bring-up» — وهي المرة الأولى التي يتم فيها تنشيط الشريحة بعد 18 شهراً من التطوير. يصف المهندسون هذه اللحظة بأنها «حفلة مبيت» تستمر طوال الليل لحل المشكلات التقنية المفاجئة.

على سبيل المثال، واجه الفريق مشكلة في أبعاد نظام التبريد في شريحة Trainium3 (المصنعة بتقنية 3 نانومتر من قبل TSMC)، ولم يترددوا في استخدام أدوات الطحن اليدوية في غرفة الاجتماعات لتعديل القطع المعدنية وتفعيل الشريحة في الوقت المحدد.

رؤية آندي جاسي لمستقبل AWS

لا يخفي آندي جاسي فخره بهذا المختبر، حيث وصف Trainium بأنها تجارة بمليارات الدولارات لـ AWS وواحدة من أكثر التقنيات التي تثير حماسه. ومع الضغوط المتزايدة لتوفير سعة حوسبة هائلة، يعمل المهندسون على مدار الساعة لضمان إنتاج الشرائح بكميات تجارية ووضعها في مراكز البيانات بأسرع وقت ممكن.

بهذه الخطوات، لا تكتفي أمازون بكونها مزوداً للسحابة، بل تتحول إلى عملاق في صناعة الأجهزة والعتاد، مما يضعها في مواجهة مباشرة مع إنفيديا في سباق تسلح الذكاء الاصطناعي العالمي.

المصدر: TechCrunch

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *