نویسنده همکار: پیمان قاسمزاده، محقق حوزه فراگیری مالی / در بحبوحه جنگ ۴۰ روزه، دشمن تهدید کرده بود که زیرساختهای حیاتی کشور را مورد حمله قرار میدهد. مردم که نگران شنیدن اخباری درباره تخریب پل و یا سدها بودند، ناگهان با خبر حمله به دانشگاه صنعتی شریف در روز ۱۷ فروردین ۱۴۰۵ مواجه شدند. بنابر گزارشها مرکز پردازش سریع، زیرساختهای هوش مصنوعی و دیتاسنتر مرکزی دانشگاه مجموعههایی بودند که در این حمله مورد اصابت قرار گرفتند و تخریب شدند.
با اعلام این خبر، پرسشهای زیادی در افکار عمومی ایجاد شد؛ یک سکوی هوش مصنوعی اصلا یعنی چه؟ چه ویژگیهایی دارد و کاربردش چیست؟ اهمیتش چه بوده و چرا دشمن این مرکز را مورد نشانه قرار گرفته است؟
سکوی هوش مصنوعی از منظر فنی
به طور معمول یک مزرعه پردازنده گرافیکی (GPU Farm) از مجموعهای از رکها (Rack) یا برجهای پردازشی (Tower) تشکیل میشود که هرکدام چندین سرور را در خود جای دادهاند. در معماریهای رایج امروزی، هر رک شامل ۴ تا ۸ سرور قدرتمند است و هر سرور نیز بین ۴ تا ۸ پردازنده گرافیکی (GPU) تخصصی در اختیار دارد؛ یعنی یک رک میتواند در مجموع بین ۳۲ تا ۶۴ پردازنده را بهصورت همزمان مدیریت کند. در نسلهای جدیدتر، مانند سامانههای مبتنی بر معماریهای NVIDIA NVL72، این عدد حتی به ۷۲ شتابدهنده پردازشی در یک رک واحد نیز میرسد.
در مراکز بزرگتر، دهها رک در کنار هم قرار میگیرند و یک خوشه پردازشی (Cluster) را تشکیل میدهند؛ خوشهای که مجموع توان آن گاهی به هزاران پردازنده گرافیکی (GPU) میرسد. این پردازندهها از طریق شبکههای فوقسریع به یکدیگر متصل میشوند تا بتوانند همزمان روی آموزش مدلهای هوش مصنوعی، تحلیل دادههای عظیم و پردازشهای سنگین محاسباتی کار کنند. تفاوت یک سکوی هوش مصنوعی با مزرعه پردازنده گرافیکی در آن است که سکوها علاوه بر زیرساخت سختافزاری، دارای زیرساختهای نرمافزاری موردنیاز نیز هستند.
قدرت واقعی این سکوها صرفاً به تعداد پردازندهها وابسته نیست، بلکه در توان پردازشی تجمیعشده آنها معنا پیدا میکند. هر پردازنده گرافیکی (GPU) مدرن میتواند هزاران میلیارد عملیات را در هر ثانیه انجام دهد و زمانی که صدها یا هزاران پردازنده گرافیکی (GPU) بهصورت هماهنگ فعالیت میکنند، سکو به سطحی از قدرت میرسد که برای آموزش مدلهای زبانی بزرگ، تحلیل تصاویر ماهوارهای، شبیهسازیهای صنعتی، امنیت سایبری و پردازش دادههای ملی قابل استفاده است. توان مصرفی هر رک هوش مصنوعی نیز بهمراتب بالاتر از زیرساختهای عادی است؛ بهطوریکه رکهای سنتی دیتاسنتری معمولاً ۵ تا ۱۰ کیلووات مصرف دارند، اما رکهای مخصوص هوش مصنوعی بین ۳۰ تا ۱۰۰ کیلووات و حتی بیشتر انرژی مصرف میکنند.
اهمیت سکوهای هوش مصنوعی
در سالهای اخیر، طیف گستردهای از فعالیتهای اقتصادی و فناورانه، از آموزش مدلهای هوش مصنوعی و پردازش تصاویر ماهوارهای گرفته تا شبیهسازیهای صنعتی، پیشبینی آبوهوا و… به منابع پردازشی عظیم و تخصصی وابسته شدهاند. همانگونه که در بخشهای پیشین اشاره شد، تأمین این زیرساختها مستلزم سرمایهگذاری اولیه بسیار سنگین برای خرید تجهیزات، بهویژه پردازندههای گرافیکی پیشرفته (GPU) است. با این حال، هزینهها به مرحله تأمین محدود نمیشود؛ مصرف قابل توجه انرژی برق، نیاز به سامانههای خنککننده پیشرفته، نگهداری تخصصی و تعمیرات، بهروزرسانی مستمر تجهیزات و تأمین نیروی انسانی متخصص، هزینههای دائمی و قابل توجهی را به بهرهبرداران تحمیل میکند.
این در حالی است که نیاز بسیاری از سازمانها و شرکتها به چنین ظرفیت پردازشی، ماهیتی مقطعی یا دورهای دارد و تنها در زمان اجرای پروژههای خاص، آموزش مدلها یا انجام محاسبات سنگین بروز میکند. در نتیجه، سرمایهگذاری مستقل برای ایجاد و نگهداری این زیرساختها در بسیاری از موارد از نظر اقتصادی توجیهپذیر نبوده و استفاده از سکوهای اشتراکی و مزارع پردازشی متمرکز به راهکاری کارآمد و مقرونبهصرفه تبدیل شده است.
اگر در قرن بیستم نیروگاهها زیرساخت تولید انرژی بودند، در قرن بیستویکم سکوهای هوش مصنوعی را میتوان زیرساخت تولید و پردازش دانش دانست. همانگونه که کارخانهها بدون برق قادر به فعالیت نیستند، بسیاری از خدمات و فناوریهای نوین نیز بدون دسترسی به توان پردازشی گسترده امکان توسعه ندارند. در ادامه، برخی از کاربردهای رایج این سکوها معرفی میشود.
آموزش مدلهای زبانی بزرگ
آموزش مدلهای زبانی بزرگ مانند ChatGPT و Gemini یکی از سنگینترین کاربردهای مزارع پردازنده گرافیکی محسوب میشود. این مدلها با استفاده از صدها میلیارد تا چندین تریلیون کلمه مستخرج از کتابها، مقالات، کد نرمافزاری و محتوای اینترنتی آموزش میبینند تا بتوانند به انواع پرسشها در حوزههای مختلف پاسخ دهند. در فرایند آموزش، مدل باید چندین پارامتر را طی تکرارهای متعدد تنظیم کند که به دهها هزار پردازنده گرافیکی (GPU) متصل به شبکههای فوقسریع نیاز دارد.
کشف دارو
در صنعت داروسازی، هوش مصنوعی برای شناسایی مولکولهای جدید، پیشبینی خواص دارویی و تحلیل ساختار پروتئینها به کار گرفته میشود. یک پروژه کشف دارو ممکن است نیازمند بررسی میلیونها یا حتی میلیاردها ترکیب شیمیایی بالقوه باشد که انجام آن با روشهای سنتی سالها زمان میبرد. مدلهای هوش مصنوعی میتوانند این فرایند را به چند هفته یا چند ماه کاهش دهند، اما در مقابل نیازمند حجم عظیمی از محاسبات موازی هستند.
شبیهسازی صنعتی
در صنایعی نظیر نفت و گاز، پتروشیمی، خودروسازی، هوافضا و… برای طراحی و بهینهسازی تجهیزات خود از شبیهسازیهای پیچیده استفاده میکنند. این شبیهسازیها شامل تحلیل جریان سیالات، انتقال حرارت، رفتار سازهها، احتراق، آیرودینامیک و مدلسازی تجهیزات صنعتی است که هر کدام میتواند شامل انواع سناریوها باشد. ترکیب این سناریوها میتواند منجر به هزاران پیشامد محتمل گردد که هر یک مستلزم انجام حجم قابل توجهی از محاسبات است. با استفاده از پردازندههای گرافیکی (GPU) میتوان زمان این محاسبات را از هفتهها به چند روز و یا حتی ساعت کاهش داد.
پردازش تصاویر ماهوارهای
امروزه ماهوارههای تجاری و دولتی روزانه چندین پتابایت تصویر از سطح زمین تولید میکنند. این تصاویر برای کاربردهایی نظیر پایش مرزها، مدیریت بحران، کشاورزی هوشمند، اکتشاف منابع طبیعی، برنامهریزی شهری و نظارت زیستمحیطی مورد استفاده قرار میگیرند. تعداد بالای تصاویر و کیفیت بالای آنها باعث میشود که تحلیل سنتی این حجم از داده غیرممکن باشد؛ ازاینرو از مدلهای هوش مصنوعی برای پردازش آن استفاده میشود.
امنیت سایبری
سامانههای امنیت سایبری مدرن باید بهصورت پیوسته صدها رویداد شبکه، لاگهای سیستمی، رفتار کاربران و فعالیت نرمافزارها را تحلیل کنند تا بتوانند حملات سایبری را در کوتاهترین زمان ممکن شناسایی نمایند. همچنین زمانی که صحبت از سیستمهای حیاتی نظیر سامانه حملونقل یک شهر، سامانه سلامت یک کشور و… به میان باشد، ممکن است تعداد این رویدادها به چند میلیارد هم برسد. امروزه از مدلهای یادگیری ماشین و هوش مصنوعی برای کشف بدافزارهای ناشناخته، تشخیص رفتارهای مشکوک، تحلیل حملات پیشرفته و پیشبینی تهدیدات آینده استفاده میشود.
هزینه تأسیس و نگهداری سکوی هوش مصنوعی
طبق گزارشها، هزینه یک خوشه متوسط با ۵۰۰ الی ۱۰۰۰ پردازنده گرافیکی (GPU) با توجه به نسل پردازنده گرافیکی (GPU)، زیرساخت شبکه و غیره حدود ۱۰ تا ۶۰ میلیون دلار است. در مقیاس بزرگتر، یک خوشه دارای ۱۰,۰۰۰ پردازنده گرافیکی (GPU) به طور معمول در بازه ۵۰۰ میلیون تا ۲ میلیارد دلار برآورد میشود. در این مقیاس، خود پردازنده گرافیکی (GPU) حدود ۶۰ تا ۷۰ درصد هزینه را تشکیل میدهند و بقیه مربوط به شبکه پرسرعت، ذخیرهسازی، برق و سیستمهای خنککننده است. در سطح بسیار بزرگتر نظیر ابردیتاسنترهای دارای چند دههزار پردازنده گرافیکی (GPU)، هزینه کل میتواند به ۵ تا ۱۰ میلیارد دلار و حتی بیشتر برسد. به عنوان مثال، گزارشهای صنعتی نشان میدهند ساخت یک دیتاسنتر هوش مصنوعی در مقیاس ۱ گیگاواتی حدود ۳۰ تا ۳۵ میلیارد دلار هزینه دارد.
سکوی هوش مصنوعی شریف
پروژه سکوی ملی هوش مصنوعی از اواخر سال ۱۴۰۳ با محوریت دانشگاه صنعتی شریف و حمایت معاونت علمی ریاستجمهوری وارد فاز اجرایی شد. هدف اصلی این پروژه، ایجاد یک زیرساخت بومی و متمرکز برای توسعه مدلهای هوش مصنوعی، پردازش دادههای کلان و پشتیبانی از اکوسیستم شرکتهای دانشبنیان عنوان شد. در اسفند ۱۴۰۳ نخستین نسخه آزمایشی این سکو رونمایی شد و تیم توسعه اعلام کرد که بیش از ۷۰ پژوهشگر و ۱۶ عضو هیئت علمی در طراحی آن مشارکت دارند. اطلاعات دقیقی از مشخصات فنی سکوی هوش مصنوعی شریف در اختیار نیست، اما به استناد وبسایت مرکز پردازش سریع (این مرکز در سال ۱۳۹۲ تأسیس شد و یکی از مراکزی بود که در حمله ۱۷ فروردین تخریب شد)، این مرکز (مرکز پردازش سریع) دارای ۸۵ عدد پردازنده گرافیکی (GPU) و بیش از ۱۷ ترابایت حافظه اصلی است.
در خرداد ماه ۱۴۰۴، مجری این طرح ملی مجموع هزینه پیشبینیشده برای توسعه نسخههای MVP، آلفا و بتای این سکو را از آبان 1403 تا اسفند ۱۴۰۴ حدود ۲۹٬۸ میلیارد تومان اعلام کرد و نقطه تثبیت پروژه را اسفند ۱۴۰۴ میدانست. همچنین مدیران پروژه ادعا میکردند که راهاندازی کامل این سکو میتواند زمینه را برای ایجاد حداقل ۱۰۰۰ تا ۲۰۰۰ کسبوکار جدید فراهم کرده و بازاری با ارزش بالغ بر ۴۰ هزار میلیارد تومان (۴۰ همت) یا بیشتر خلق کند.
بدیهی است که بخش قابل توجهی از این پیشبینیها با رخ دادن جنگ و تخریب مراکز، به طور کلی بیاعتبار شدند. در ۴ خرداد سال ۱۴۰۵، رئیس مرکز راهبردی ستادهای توسعه اقتصاد دانشبنیان معاونت علمی ریاستجمهوری اعلام کرد که علیرغم آسیبهایی که به این مراکز وارد شده است، سکوی ملی هوش مصنوعی به زودی وارد مدار میشود.
آنچه امروز از آن با عنوان «سکوی هوش مصنوعی» یاد میشود، دیگر صرفاً یک پروژه دانشگاهی، یک آزمایشگاه تحقیقاتی یا حتی یک فناوری مد روز نیست. همانگونه که نیروگاهها زیرساخت تأمین انرژی، شبکههای مخابراتی زیرساخت ارتباطات و جادهها زیرساخت حملونقل کشورها محسوب میشوند، سکوهای هوش مصنوعی نیز به زیرساخت تولید، پردازش و بهرهبرداری از دانش در عصر دیجیتال تبدیل شدهاند. از توسعه فناوری و اقتصاد دیجیتال گرفته تا امنیت سایبری، سلامت، صنعت، دفاع و مدیریت کشور، همگی به درجات مختلف به این توان پردازشی وابسته شدهاند. از این منظر، حمله به چنین مراکزی صرفاً آسیب به چند سرور یا یک پروژه فناورانه نیست، بلکه لطمه به بخشی از زیرساخت راهبردی کشور محسوب میشود؛ زیرساختی که نقش آن در سالهای آینده، به احتمال زیاد کمتر از زیرساختهای سنتی نخواهد بود.