تحول زیرساخت‌ها؛ از نیروگاه تا سکوی هوش مصنوعی

نویسنده همکار: پیمان قاسم‌زاده، محقق حوزه فراگیری مالی / در بحبوحه جنگ ۴۰ روزه، دشمن تهدید کرده بود که زیرساخت‌های حیاتی کشور را مورد حمله قرار می‌دهد. مردم که نگران شنیدن اخباری درباره تخریب پل و یا سدها بودند، ناگهان با خبر حمله به دانشگاه صنعتی شریف در روز ۱۷ فروردین ۱۴۰۵ مواجه شدند. بنابر […]

نویسنده همکار: پیمان قاسم‌زاده، محقق حوزه فراگیری مالی / در بحبوحه جنگ ۴۰ روزه، دشمن تهدید کرده بود که زیرساخت‌های حیاتی کشور را مورد حمله قرار می‌دهد. مردم که نگران شنیدن اخباری درباره تخریب پل و یا سدها بودند، ناگهان با خبر حمله به دانشگاه صنعتی شریف در روز ۱۷ فروردین ۱۴۰۵ مواجه شدند. بنابر گزارش‌ها مرکز پردازش سریع، زیرساخت‌های هوش مصنوعی و دیتاسنتر مرکزی دانشگاه مجموعه‌هایی بودند که در این حمله مورد اصابت قرار گرفتند و تخریب شدند.

با اعلام این خبر، پرسش‌های زیادی در افکار عمومی ایجاد شد؛ یک سکوی هوش مصنوعی اصلا یعنی چه؟ چه ویژگی‌هایی دارد و کاربردش چیست؟ اهمیتش چه بوده و چرا دشمن این مرکز را مورد نشانه قرار گرفته است؟

سکوی هوش مصنوعی از منظر فنی

به طور معمول یک مزرعه پردازنده گرافیکی (GPU Farm) از مجموعه‌ای از رک‌ها (Rack) یا برج‌های پردازشی (Tower) تشکیل می‌شود که هرکدام چندین سرور را در خود جای داده‌اند. در معماری‌های رایج امروزی، هر رک شامل ۴ تا ۸ سرور قدرتمند است و هر سرور نیز بین ۴ تا ۸ پردازنده گرافیکی (GPU) تخصصی در اختیار دارد؛ یعنی یک رک می‌تواند در مجموع بین ۳۲ تا ۶۴ پردازنده را به‌صورت همزمان مدیریت کند. در نسل‌های جدیدتر، مانند سامانه‌های مبتنی بر معماری‌های NVIDIA NVL72، این عدد حتی به ۷۲ شتاب‌دهنده پردازشی در یک رک واحد نیز می‌رسد.

در مراکز بزرگ‌تر، ده‌ها رک در کنار هم قرار می‌گیرند و یک خوشه‌ پردازشی (Cluster) را تشکیل می‌دهند؛ خوشه‌ای که مجموع توان آن گاهی به هزاران پردازنده گرافیکی (GPU) می‌رسد. این پردازنده‌ها از طریق شبکه‌های فوق‌سریع به یکدیگر متصل می‌شوند تا بتوانند هم‌زمان روی آموزش مدل‌های هوش مصنوعی، تحلیل داده‌های عظیم و پردازش‌های سنگین محاسباتی کار کنند. تفاوت یک سکوی هوش مصنوعی با مزرعه پردازنده گرافیکی در آن است که سکوها علاوه بر زیرساخت سخت‌افزاری، دارای زیرساخت‌های نرم‌افزاری موردنیاز نیز هستند.

قدرت واقعی این سکوها صرفاً به تعداد پردازنده‌ها وابسته نیست، بلکه در توان پردازشی تجمیع‌شده آن‌ها معنا پیدا می‌کند. هر پردازنده گرافیکی (GPU) مدرن می‌تواند هزاران میلیارد عملیات را در هر ثانیه انجام دهد و زمانی که صدها یا هزاران پردازنده گرافیکی (GPU) به‌صورت هماهنگ فعالیت می‌کنند، سکو به سطحی از قدرت می‌رسد که برای آموزش مدل‌های زبانی بزرگ، تحلیل تصاویر ماهواره‌ای، شبیه‌سازی‌های صنعتی، امنیت سایبری و پردازش داده‌های ملی قابل استفاده است. توان مصرفی هر رک هوش مصنوعی نیز به‌مراتب بالاتر از زیرساخت‌های عادی است؛ به‌طوری‌که رک‌های سنتی دیتاسنتری معمولاً ۵ تا ۱۰ کیلووات مصرف دارند، اما رک‌های مخصوص هوش مصنوعی بین ۳۰ تا ۱۰۰ کیلووات و حتی بیشتر انرژی مصرف می‌کنند.

اهمیت سکوهای هوش مصنوعی

در سال‌های اخیر، طیف گسترده‌ای از فعالیت‌های اقتصادی و فناورانه، از آموزش مدل‌های هوش مصنوعی و پردازش تصاویر ماهواره‌ای گرفته تا شبیه‌سازی‌های صنعتی، پیش‌بینی آب‌وهوا و… به منابع پردازشی عظیم و تخصصی وابسته شده‌اند. همان‌گونه که در بخش‌های پیشین اشاره شد، تأمین این زیرساخت‌ها مستلزم سرمایه‌گذاری اولیه بسیار سنگین برای خرید تجهیزات، به‌ویژه پردازنده‌های گرافیکی پیشرفته (GPU) است. با این حال، هزینه‌ها به مرحله تأمین محدود نمی‌شود؛ مصرف قابل توجه انرژی برق، نیاز به سامانه‌های خنک‌کننده پیشرفته، نگهداری تخصصی و تعمیرات، به‌روزرسانی مستمر تجهیزات و تأمین نیروی انسانی متخصص، هزینه‌های دائمی و قابل توجهی را به بهره‌برداران تحمیل می‌کند.

این در حالی است که نیاز بسیاری از سازمان‌ها و شرکت‌ها به چنین ظرفیت پردازشی، ماهیتی مقطعی یا دوره‌ای دارد و تنها در زمان اجرای پروژه‌های خاص، آموزش مدل‌ها یا انجام محاسبات سنگین بروز می‌کند. در نتیجه، سرمایه‌گذاری مستقل برای ایجاد و نگهداری این زیرساخت‌ها در بسیاری از موارد از نظر اقتصادی توجیه‌پذیر نبوده و استفاده از سکوهای اشتراکی و مزارع پردازشی متمرکز به راهکاری کارآمد و مقرون‌به‌صرفه تبدیل شده است.

اگر در قرن بیستم نیروگاه‌ها زیرساخت تولید انرژی بودند، در قرن بیست‌ویکم سکوهای هوش مصنوعی را می‌توان زیرساخت تولید و پردازش دانش دانست. همان‌گونه که کارخانه‌ها بدون برق قادر به فعالیت نیستند، بسیاری از خدمات و فناوری‌های نوین نیز بدون دسترسی به توان پردازشی گسترده امکان توسعه ندارند. در ادامه، برخی از کاربردهای رایج این سکوها معرفی می‌شود.

آموزش مدل‌های زبانی بزرگ

آموزش مدل‌های زبانی بزرگ مانند ChatGPT و Gemini یکی از سنگین‌ترین کاربردهای مزارع پردازنده گرافیکی محسوب می‌شود. این مدل‌ها با استفاده از صدها میلیارد تا چندین تریلیون کلمه مستخرج از کتاب‌ها، مقالات، کد نرم‌افزاری و محتوای اینترنتی آموزش می‌بینند تا بتوانند به انواع پرسش‌ها در حوزه‌های مختلف پاسخ دهند. در فرایند آموزش، مدل باید چندین پارامتر را طی تکرارهای متعدد تنظیم کند که به ده‌ها هزار پردازنده گرافیکی (GPU) متصل به شبکه‌های فوق‌سریع نیاز دارد.

کشف دارو

در صنعت داروسازی، هوش مصنوعی برای شناسایی مولکول‌های جدید، پیش‌بینی خواص دارویی و تحلیل ساختار پروتئین‌ها به کار گرفته می‌شود. یک پروژه کشف دارو ممکن است نیازمند بررسی میلیون‌ها یا حتی میلیاردها ترکیب شیمیایی بالقوه باشد که انجام آن با روش‌های سنتی سال‌ها زمان می‌برد. مدل‌های هوش مصنوعی می‌توانند این فرایند را به چند هفته یا چند ماه کاهش دهند، اما در مقابل نیازمند حجم عظیمی از محاسبات موازی هستند.

شبیه‌سازی صنعتی

در صنایعی نظیر نفت و گاز، پتروشیمی، خودروسازی، هوافضا و… برای طراحی و بهینه‌سازی تجهیزات خود از شبیه‌سازی‌های پیچیده استفاده می‌کنند. این شبیه‌سازی‌ها شامل تحلیل جریان سیالات، انتقال حرارت، رفتار سازه‌ها، احتراق، آیرودینامیک و مدل‌سازی تجهیزات صنعتی است که هر کدام می‌تواند شامل انواع سناریوها باشد. ترکیب این سناریوها می‌تواند منجر به هزاران پیشامد محتمل گردد که هر یک مستلزم انجام حجم قابل توجهی از محاسبات است. با استفاده از پردازنده‌های گرافیکی (GPU) می‌توان زمان این محاسبات را از هفته‌ها به چند روز و یا حتی ساعت کاهش داد.

پردازش تصاویر ماهواره‌ای

امروزه ماهواره‌های تجاری و دولتی روزانه چندین پتابایت تصویر از سطح زمین تولید می‌کنند. این تصاویر برای کاربردهایی نظیر پایش مرزها، مدیریت بحران، کشاورزی هوشمند، اکتشاف منابع طبیعی، برنامه‌ریزی شهری و نظارت زیست‌محیطی مورد استفاده قرار می‌گیرند. تعداد بالای تصاویر و کیفیت بالای آن‌ها باعث می‌شود که تحلیل سنتی این حجم از داده غیرممکن باشد؛ ازاین‌رو از مدل‌های هوش مصنوعی برای پردازش آن استفاده می‌شود.

امنیت سایبری

سامانه‌های امنیت سایبری مدرن باید به‌صورت پیوسته صدها رویداد شبکه، لاگ‌های سیستمی، رفتار کاربران و فعالیت نرم‌افزارها را تحلیل کنند تا بتوانند حملات سایبری را در کوتاه‌ترین زمان ممکن شناسایی نمایند. همچنین زمانی که صحبت از سیستم‌های حیاتی نظیر سامانه حمل‌ونقل یک شهر، سامانه سلامت یک کشور و… به میان باشد، ممکن است تعداد این رویدادها به چند میلیارد هم برسد. امروزه از مدل‌های یادگیری ماشین و هوش مصنوعی برای کشف بدافزارهای ناشناخته، تشخیص رفتارهای مشکوک، تحلیل حملات پیشرفته و پیش‌بینی تهدیدات آینده استفاده می‌شود.

هزینه تأسیس و نگهداری سکوی هوش مصنوعی

طبق گزارش‌ها، هزینه یک خوشه متوسط با ۵۰۰ الی ۱۰۰۰ پردازنده گرافیکی (GPU) با توجه به نسل پردازنده گرافیکی (GPU)، زیرساخت شبکه و غیره حدود ۱۰ تا ۶۰ میلیون دلار است. در مقیاس بزرگ‌تر، یک خوشه دارای ۱۰,۰۰۰ پردازنده گرافیکی (GPU) به طور معمول در بازه ۵۰۰ میلیون تا ۲ میلیارد دلار برآورد می‌شود. در این مقیاس، خود پردازنده گرافیکی (GPU) حدود ۶۰ تا ۷۰ درصد هزینه را تشکیل می‌دهند و بقیه مربوط به شبکه پرسرعت، ذخیره‌سازی، برق و سیستم‌های خنک‌کننده است. در سطح بسیار بزرگ‌تر نظیر ابر‌دیتاسنترهای دارای چند ده‌هزار پردازنده گرافیکی (GPU)، هزینه کل می‌تواند به ۵ تا ۱۰ میلیارد دلار و حتی بیشتر برسد. به ‌عنوان مثال، گزارش‌های صنعتی نشان می‌دهند ساخت یک دیتاسنتر هوش مصنوعی در مقیاس ۱ گیگاواتی حدود ۳۰ تا ۳۵ میلیارد دلار هزینه دارد.

سکوی هوش مصنوعی شریف

پروژه سکوی ملی هوش مصنوعی از اواخر سال ۱۴۰۳ با محوریت دانشگاه صنعتی شریف و حمایت معاونت علمی ریاست‌جمهوری وارد فاز اجرایی شد. هدف اصلی این پروژه، ایجاد یک زیرساخت بومی و متمرکز برای توسعه مدل‌های هوش مصنوعی، پردازش داده‌های کلان و پشتیبانی از اکوسیستم شرکت‌های دانش‌بنیان عنوان شد. در اسفند ۱۴۰۳ نخستین نسخه آزمایشی این سکو رونمایی شد و تیم توسعه اعلام کرد که بیش از ۷۰ پژوهشگر و ۱۶ عضو هیئت علمی در طراحی آن مشارکت دارند. اطلاعات دقیقی از مشخصات فنی سکوی هوش مصنوعی شریف در اختیار نیست، اما به استناد وب‌سایت مرکز پردازش سریع (این مرکز در سال ۱۳۹۲ تأسیس شد و یکی از مراکزی بود که در حمله ۱۷ فروردین تخریب شد)، این مرکز (مرکز پردازش سریع) دارای ۸۵ عدد پردازنده گرافیکی (GPU) و بیش از ۱۷ ترابایت حافظه اصلی است.

در خرداد ماه ۱۴۰۴، مجری این طرح ملی مجموع هزینه پیش‌بینی‌شده برای توسعه نسخه‌های MVP، آلفا و بتای این سکو را از آبان 1403 تا اسفند ۱۴۰۴ حدود ۲۹٬۸ میلیارد تومان اعلام کرد و نقطه تثبیت پروژه را اسفند ۱۴۰۴ می‌دانست. همچنین مدیران پروژه ادعا می‌کردند که راه‌اندازی کامل این سکو می‌تواند زمینه را برای ایجاد حداقل ۱۰۰۰ تا ۲۰۰۰ کسب‌وکار جدید فراهم کرده و بازاری با ارزش بالغ بر ۴۰ هزار میلیارد تومان (۴۰ همت) یا بیشتر خلق کند.

بدیهی است که بخش قابل توجهی از این پیش‌بینی‌ها با رخ دادن جنگ و تخریب مراکز، به طور کلی بی‌اعتبار شدند. در ۴ خرداد سال ۱۴۰۵، رئیس مرکز راهبردی ستادهای توسعه اقتصاد دانش‌بنیان معاونت علمی ریاست‌جمهوری اعلام کرد که علی‌رغم آسیب‌هایی که به این مراکز وارد شده است، سکوی ملی هوش مصنوعی به زودی وارد مدار می‌شود.

آنچه امروز از آن با عنوان «سکوی هوش مصنوعی» یاد می‌شود، دیگر صرفاً یک پروژه دانشگاهی، یک آزمایشگاه تحقیقاتی یا حتی یک فناوری مد روز نیست. همان‌گونه که نیروگاه‌ها زیرساخت تأمین انرژی، شبکه‌های مخابراتی زیرساخت ارتباطات و جاده‌ها زیرساخت حمل‌ونقل کشورها محسوب می‌شوند، سکوهای هوش مصنوعی نیز به زیرساخت تولید، پردازش و بهره‌برداری از دانش در عصر دیجیتال تبدیل شده‌اند. از توسعه فناوری و اقتصاد دیجیتال گرفته تا امنیت سایبری، سلامت، صنعت، دفاع و مدیریت کشور، همگی به درجات مختلف به این توان پردازشی وابسته شده‌اند. از این منظر، حمله به چنین مراکزی صرفاً آسیب به چند سرور یا یک پروژه فناورانه نیست، بلکه لطمه به بخشی از زیرساخت راهبردی کشور محسوب می‌شود؛ زیرساختی که نقش آن در سال‌های آینده، به احتمال زیاد کمتر از زیرساخت‌های سنتی نخواهد بود.

منبع این گزارش:

این خبر به صورت خودکار توسط پلتفرم BankdariPress از خبرگزاری راه پرداخت استخراج شده است.

مشاهده متن کامل