قویترین کامپیوترهای جهان
پنجشنبه, ۲۲ اسفند ۱۳۹۲، ۰۹:۵۱ ق.ظ
مجله تخصصی کامپیوتر:
در این مقاله شما را با ابرکامپیوترهایی آشنا میکنیم که با کمک پی سی های معمولی ، بزرگترین اکتشافات دنیا را به پیش میبرد.
دسترسی به قدرت بیشتر آن چیزی است که صنعت محاسبات و پردازش را گسترش میدهد. آرزوی غلبه بر قوانین مور – پیش بینی دوبرابر شدن تعداد ترانزیستورها در مدارهای مجتمع هر دوسال یکبار(میزان پیچیدگی) - به این معناست که هر سال شرکتهای AMD و Intel پردازشگرهایی را روانه بازار میکند که قابلیتهای نسل قبل را تحت تاثیر قرار داده و چرخه ایی از ارتقا سخت افزاری و نرم افزاری را هدایت میکنند.
این خواسته هیچ جا بارزتر از مرکز محاسبات عالی (HPC) نمیباشد. نمونه ایی از ابرکامپیوترهایی (انبوه سیستمهای موازی) که یادآور سالهایی است که محاسبات نیازمند اتاقهای پر از کامپیوتر بود که استفاده از آنها به تنهایی ایستگاههای برق متعددی را میطلبید.
HPC پیشگام در پیشرفتهای فنی و علمی میباشد که پیش تر غیرممکن می نمود اما امروزه به محققین دسترسی به محاسبات پرقدرت را که نیازمند پردازش انبوهی از داده ها و همچنین شبیه سازی هر چه بیشتر محیط واقعی میباشد، را داده است.
در سالهای اخیر مسیر پیشرفت به گونه ایی معکوس گردیده است. پیشرفت ابتدا از ابر پردازش ها یی آغاز شد در سطح کامپیوتر های خانگی، نظیر آنچه که شبکه آرپانت در ارتقا اینترنت انجام داد، اما امروزه ابر کامپیوترها وجودشان را مدیون فن آوریهایی هستند که با هدف ارتقا کامپیوترهای خانگی و لپ تاب ها و حتی کنسولهای بازی ایجاد شده بودند.
ابرکامپیوترهای ابتدایی
عبارت «ابرکامپیوتر» اولین بار در سال 1960 توسط شرکت Control Data به عنوان یک واژه تجاری برای محصول CDC 6600 به کاربرده شد که این محصول توسط سیمور کری و پیش از اینکه شرکت فوق را جهت تاسیس شرکت ابر پردازش خودش ترک کند، طراحی شده بود.
مفهوم ابرپردازش گذشته را تا به آینده امتداد می بخشد. شرکت بریتانیایی Ferranti از پیشگامان محاسبات علمی، سیستم Pegasus 1 را در سال 1956 عرضه کرد. فن آوری بکار گرفته شده در پگاسوس امروزه خیلی قدیمی است هرچند در زمان خودش سریع بود اما امروزه و علیرغم محاسبه بیش از هزاران عملیات در ثانیه، حتی از گوشیهای تلفن همراه هوشمند نیز عقب است.
هر نسل از ابرکامپیوترها بطور طبیعی و با کمترین تخمین، کارآیی محصولات خود را دو برابر ارتقا میدهد. این میتواند در زمینه ابداعات فن آوری - برای مثال به جایگزینی لامپهای خلاء با ترازیستورهای سخت که به افزایش خیره کننده در کارآیی و اطمینان پذیری منجر گردید - یا همچنین در بحث جلوگیری از نفوذ به اطلاعات (Brute-Force) با نوشتن اجزاء و کابینتهای بیشتر در برنامه اشاره کرد.
یک چیزهایی در این صنعت هیچگاه تغییر نمیکند : یک ابرکامپیوتر متوسط امروزی فضای زیادی از اتاق را اشغال میکند همچنانکه پگاسوس 1 شرکت فرانتی اشغال کرد و دیگر ، کارکنان متخصص و توان مصرفی بسیار بالا و همچنین سیستم خنک کننده مناسب است. اما سایر موارد قابل تغییر است یعنی همان مواردی که پردازش های کامپیوترهای خانگی را به ابرپردازشها تبدیل مینماید.
پردازشها ی مصرفی
سیمون کاکس ، پروفسور متدهای محاسباتی در دانشگاه ساوتهمپتون ، برای مدت دو دهه در خط مقدم این ابرپردازشها بوده است. او زمان خودش در دانشگاه بارها شاهد ارتقا مکرر قابلیتهای پردازشی بود، مسیری که از سال 1956 زمانیکه دانشگاه، پگاسوس فرانتی خودش را تحویل گرفت آغاز گردید. «این صنعت بیش از آنچه که مور میگوید حرف برای گفتن دارد»، این نظر کاکس از دفترش واقع در گروه تحقیقات طراحی و مهندسی محاسباتی در دانشگاه بود. اما در پشت قانون مور، داستان ارزش سرمایه به چشم میخورد. این انفجار در پردازشها، همچنان در حیطه کالاگرایی قرار داشت به این معنی که رغبت ما به بازی و برنامه های نوشتاری ما را به سمت استفاده از ماشینهایی پیش میبرد که به ارتقاء سطح پردازش اینگونه محصولات کمک میکرد.
او همچنین میگوید « تحقیقات من در اواسط سال های 1990 به آنجا منجر شد که دانشگاه ساوتهمپتون اولین مرکز در نصب ماشینی بر اساس خواسته بازار گردید به این معنا که از دسک تاپ ها و کامپیوترهای معمولی که شما میتوانستید از نزدیکترین فروشگاه محل خود تهیه کنید ، تشکیل میشد. ناگفته پیداست که تمام این صنعت امروزه جز یک یا دو مورد استثناء، در راستای این نوع فن آوری مبتنی بر کالاگرایی تغییر کرده است .
این ابرپردازشگرها که به Clusterها معروف هستند(چندین کامپیوتر که برای مثال توسط کابل شبکه به هم متصل میباشند)، برنامه های پرقدرت کاربرن خود را از طریق توزیع آنها مابین تعدادی پردازشگرهای کند و کم سرعت انجام میدهند. در واقع این ایده جدیدی نیست چرا که سالهاست این ابرکامپیوترها از چندین پردازشگر با هم و بصورت موازی استفاده میکنند اما به تازگی به جائی رسیده اند که این کلاسترها میتوانند به کمک بستر اینترنت از آندسته از پردازشگرهای بلااستفاده که در کامپیوترهای خانگی وجود دارند نیز برای پروژه هایی نظیر Folding@home (پروژه درمانی برای بیماریهایی نظیر آلزایمر ، پارکینسون و سرطان و....) بهره ببرند.
ابر کامپیوتر حال حاضر دانشگاه ساوتههمپتون بنام Iridis3 (الهام گرفته از الهه رنگی کمان در یونان باستان) سریعترین ماشین دانشگاهی و سازگارترین ابرکامپیوتر با محیط زیست در بین دانشگاههای بریتانیا- زمانی که سال 2009 آغاز به کار کرد- بود . هرچند قدرت اگر از آن استفاده نشود ، ابزار بیهوده ایی بیش نیست.
موارد استفاده ابرکامپیوترها
ابر کامپیوترهای مدرن ابزارهای با طیف گسترده هستند نظیر آنچه که Iridis3 رنگین کمانی میباشد. این ابر کامپیوتر همه منظوره به نقل از کاکس شامل یک برنامه مهندسی ، باستان شناسی ، دارویی، هواشناسی، نور و الکترونیک و فیزیک ذرات میباشد که ما را قادر میسازد که با خریدن این ماشین از تمام علوم آن بهره ببریم. او باور دارد که حداقل 40درصد از حاصل تحقیقات ما ، به طریقی کم و بیش، به بکارگیری ما از محاسبات و پردازش ها باز میگردد.
تحقیقات انجام شده در دانشگاه صرفا جنبه تئوری ندارد. او میگوید : « گاهی اوقات مردم از کامپیوتر فقط برای انجام یک شبیه سازی کمک میگیرند اما فن آوری پردازش در خیلی از آزمایشات بزرگ ما نقش به سزایی ایفا میکند نظیر آزمایشات عظیم مهندسی یا طراحی یک تیغه توربین با رولز-رویس.
علم پزشکی یکی از بیشترین تراکنشها با پردازشهای بالا را دارا میباشد چه در کار با تجهیزاتی با حجم داده بسیار سنگین نظیر اسکنرهای پرتونگاری که با کمک کامپیوتر کار میکنند و چه در خلق شبیه سازیهایی که به درک بهتر بیولوژیکی ما از دنیای اطراف مان کمک میکند.
« به تازگی مقاله ایی را مشاهده کردم که افرادی درجایی مشغول شبیه سازی تغییرات یک سلول میباشند زمانیکه شما سوزنی برای استخراج هسته در آن فرو میبرید، که این به نوبه خود توسعه طراحی سوزن و شناخت فعالیتهای بیولوژیکی سلول را در بردارد» اینها گفته های یان باک مدیر بخش محاسبات گرافیکی GPU در شرکت NVIDIA و خالق زبان برنامه نویسی موازی CUDA (Compute Unified Device Architecture) میباشد.
هر چند که این موضوع به تیغه های توربین و پزشکی منحصر نمیشود. دپارتمان انرژِی ایالت متحده که مجری برنامه سلاحهای هسته ایی و همچنین تولید انرژی بومی میباشد عمده ترین قدرت در دنیای ابرپردازش ها میباشد که به تازگی رتبه اول ، دوم و چهارم را در فهرست دوسالانه TOP500 در میان سریعترین ابرکامپیوترهای جهان کسب نموده است. این فن آوری همچنین توسط کمپانیهای نفتی در راستای جستجوهای ممتدشان برای ذخایر هر چند کوچک و خرد از میان انبوهی از داده ها به منظور پیدا کردن سودمندترین مکانها برای حفاری، مورد استفاده میباشد.
پردازشهای شتاب داده شده
افزایش قدرت ابر پردازشگرها، شبیه سازیها و پردازشهایی را که در این راه نیاز است ، میسر مینماید. گرچه قانون مورکمک زیادی کرد لیکن تقاضا برای کارآیی هر چه بیشتر ، ما را از آنچه که مور پیش بینی کرده بود (میزان 5/1 یا 2 برابر پیچیدگی هر نسل) نیز پیشتر برده است.
اینجا ست که پیشرفت فن آوری در سطح پردازش های مصارف معمولی نظیر کارتهای گرافیک، به توسعه آنها به سوی ابرپردازشها کمک مینماید.
قویترین کامپیوترهای حهان
سریعترین کامپیوتر حهان ، تیتان، از 18688 عدد پردازشگر مدل AMD Opteron 6274 – همان مدلهای 16 هسته ایی که این شرکت به تعداد کمتر آنرا به سازندگان سرور میفروشد- و به همین تعداد پردارشگرهای گرافیکی Nvidia Tesla k20 ساخته شده است که با محاسبه بیش از 17590 تریلیون عملیات اعشاری در ثانیه (17.59 petaFLOPS) چند سر و گردن بالاتر از رقبای خودش قرار دارد.
برای یک ابرکامپیوتر با هزینه ساخت بیش از 97 میلیون دلار، خیلی تعجب آور نیست، اما واقعیتی است که بیش ار 90 درصد این کارآیی به واسطه پردازنده های گرافیکی میباشد که سهم به سزایی در تغییرات عمده این صنعت را دارد.
« برای مدت طولانی تا زمانیکه CPU ها روز به روز به سرعتشان افزوده میشد مگاهرتز، گیگاهرتز ....این ما بودیم که منحنی بازار CPU ها را در دست داشتیم.اما اون اوقات خوش دیگر تمام شده» اینها گفته های باک از شرکت Nvidia میباشد کسیکه هزینه های تجاری زیادی را متحمل گردید تا GPU ها را از سال 2006 تا بحال وارد مرکزHPC کند. بازی و گرافیک محصول مشابه دیگری بود که وارد بازار شد تا با ضرورت نیاز به افزایش کارآیی، توان و قابلیت برنامه ریزی آن ، اساس رشد چشمگیر دیگری را پایه گذاری نماید. بیشترین محصولات حال حاضر Nvidia بر روی خط تولید مرکز HPC، Tesla k20 و برد های شتاب دهنده K20X میباشد که از مهمترین فرآورده های این شرکت بر مبنای همان پردازشگرهای گرافیکی مورد مطالبه بازار میباشد.
در هنگامیکه کارتهای گرافیکی محیط اطراف را واقعی تر مینمایاند، یا کیفیت بازیها شما را بیشتر درگیر میکند، محصولات Tesla توسط تکنیکی که محاسبات واحد پردازش تصویر همه منظوره یا GPGPU ترجمه میشود ، و با استفاده از زبان برنامه نویسی موازی CUDA ، سرعت محاسبات علمی را افزایش میدهد.
هرجا که این برنامه به درستی بکار گرفته شده نتیجه غیر قابل باور است. روتین تکثیر ماتریس DGEMM ، که قسمتی از بسته ای جهت انجام عملیات جبری در محاسبات علمی میباشد، در مدل Tesla K20X از شرکت Nvidia تقریبا 8 برابر سریعتر از پردازشگر Xeon از شرکت اینتل میباشد، و این میسر نیست جز با به خدمت گرفتن پردازشگرهای گرافیکی چند هسته ایی بصورت موازی. متاسفانه این کار به سادگی اجرای یک برنامه برروی GPU به جای CPU نیست.
«برنامه نویسی موازی به کار زیادی نیاز دارد. شما باید به مسائل و الگوریتم حل آنها همزمان و بصورت موازی بیاندیشید.» اینها را باک میگوید. ابن به بدین معنی است که تعدادی از الگوریتم هایی که امروزه و بطور متداول از آنها استفاده میکنیم ممکن است جوابگوی ما برای توسعه و کارآیی نباشد و یا تنها قسمت کوچکی از آن الگوریتم پاسخگو باشد.
اما بدین معنی نیست که آن مسئله به روش موازی قابل حل نباشد، شاید بدین معنی است که شما احتمالا به الگوریتم متفاوتی احتیاج دارید و باید کمی بیشتر فکر کنید. در موارد متعددی یک الگوریتم غیر بهینه و زمانبر نظیر Brute-Force (امتحان تمام حالتهای ممکن برای رمزگشایی یک کد) برروی GPU خیلی سریعتر و موثر تر از یک الگوریتم بهینه سازی شده برروی CPU است.»
پاسخ اینتل
رشد ابرپردازشهای شتاب داده شده تعجب آور بوده است. « با هر مقیاسی که شما به آن نگاه کنید در طول 2 یا 3 سال گذشته استفاده از GPU ها بعنوان شتابدهنده ها در مرکز HPC تازه آغاز شده است. « سامیت گوپتا مدیر بخش محاسبات Tesla در شرکت Nvidia نقل میکند. « لذا همه چیز در دنیای محاسبات علمی یا یک نیاز شروع شد، و در ادامه با چالش هایی نظیر میزان توان و مقدار هزینه روبرو گشت. شتابدهنده های GPU میتوانند به این نیاز با مد نظر قرار دادن هزینه و انرژی، در مقایسه با محاسبات از طریق CPU به تنهایی، پاسخ دهند.»
فهرست TOP500 قطعا این اظهارات را تائید میکند. در آخرین گزارش که در نوامبر سال گذشته منتشر شد سریعترین ابرکامپیوترهای جهان که برپایه محاسبات شتاب داده شده است تعداد 62 عدد در مقابل تنها 17 عدد در 2 سال پیش است. تنها چیزی که بدون تغییر مانده است سلطه Nvidia است بطوریکه 50 عدد از این آمار 62 سیستم، از پردازشگرهای گرافیکی Nvidia به عنوان منابع اصلی در اینگونه پردازشها استفاده مینمایند.
اینتل که تا مدتها با بیشترین رقم در فهرست TOP500، بر بازار HPC مسلط بود امروزه احساس تهدید میکند. در پاسخ به این تهدید Xeon Phi را روانه بازار کرده ، یک بورد پردازش که نظیر GPGPU موازی سازی در پردازش را ارائه میدهد در حالیکه کماکان از همان مجموعه دستورات x86 در پردازش های خود بهره میبرد.
« شما میتوانید برنامه هایی بنویسید که در هر دو معماری Xeon و Xeon Phi قابل اجرا باشد به نحوی که اگر شما از بورد پردازشگر استفاده میکنید میتوانید آن را در کد برنامه قرار داده و از فوائد آن بهره ببرید و یا اگر این بورد را ندارید میتوانید همچنان بر روی Xeon و بدون استفاده از بورد آن را اجرا کنید» اینها گفته استفان جیلیچ ، مدیر عامل بخش محاسبات ابرکارآمد در منطقه EMEA میباشد. نظیر بوردهای شتابدهنده در Nvidia ، Xeon Phi نیز به شکل یک کارت قابل تعبیه PCI با تعداد بسیار زیادی هسته های پردازش موازی پیشرفته ارائه میشود که در این مورد 50 تا میباشد که هرکدام برپایه همان معماری قدیمی پنتیوم است. آنها کندتر از هسته های Xeon هستند اما این کندی را با افزایش تعداد جبران میکنند.
« شما برنامه های کاربردی دارید که از این(بگذارید آنها را هسته های بزرگتر بنامیم) بهره زیادی میبرند چون در مقایسه با هسته های کوچکتر قابلیتهای بیشتری دارند، و شما به راحتی توازن بین این دو معماری را مشاهده مینماید» این را جلیچ میگوید تا آینده پیش روی شرکت خود را با ارائه هر دو محصول Xeon و Xeon Phi ترسیم نماید.
هزینه ابرپردازش
رساندن یک ابرکامپیوتر به فهرست TOP500 کار ارزانی نیست. « ما برای هر ماشین حدود 3 میلیون پوند هزینه میکنیم که با فرض به روزرسانی برای هر 2 یا 3 سال یکبار یک میلیون پوند دیگر به آن افزوده خواهد شد» به نقل از سیمون کاکس، پروفسور روشهای محاسباتی در دانشگاه ساوتهمپتون. این هزینه، تازه ابرکامپیوتر Iridis 3 را در رتبه 331 از این فهرست قرار میدهد. برای نزدیک شدن به جایگاههای بالاتر نظیر آنچه که فوق پردازشگر دولتی تیتان قرار دارد، باید چیزی بیش از 60 میلیون پوند هزینه صرف کرد. تازه به این مبلغ باید هزینه های جاری را نیز اضافه کرد. برای Iridis 3 رقمی حدود 250000 پوند فقط هزینه سالیانه برق مصرفی میباشد.» اگر شما میخواهید عمر سرمایه گذاری 3 میلیون پوندی خود را گارانتی کنید، باید مبلغ یک میلیون پوند برای هزینه برق آن اختصاص دهید.» کاکس اظهار میدارد.» این رقم ها بسیار گزاف میباشند»
آینده
در حالیکه CPU ها از مرز محدودیتهای فیزیکی در قانون مور میگذرند ، GPU ها و بوردهای شتابدهنده احتمالا به بالا بردن راندمان هرچه بیشتر در بازار ابرپردازشها، ادامه میدهند. طبیعت پردازش موازی در آنها، اینبار در زمینه دیگری وارد خواهد شد: تحصیل.
به قول جلیچ « ما باید قابلیتهای برنامه نویسی موازی را با توجه به نیاز به افزایش کارآیی، هرچه زودتر برای نسل پیش رو بسط دهیم . اگر ما نتوانیم این کار را انجام دهیم رشد کارایی در معماری موازی سازی محدود خواهد شد. شرکت ما مدتی است که در این رابطه، توسعه تحصیلی را آغاز نموده و در زمینه های متعددی در حال حاضر فعال میباشد تا این ایده و همچنین نحوه برنامه نویسی موازی را گسترش دهیم.»
در این باور که تحصیل، کلید آینده در پردازشهای علمی بسیار کارآمد میباشد، شرکت اینتل تنها نیست.» ما باید الهام بخش نسل بعدی برای ورود به اینگونه پردازش ها باشیم.» گفته های پروفسور سیون کاکس میباشد.»این کار بسیار حیاتی است.»
این مسئله در این راز نهفته است که اینتل با عمومی کردن ابرپردازش به چه هدفی میاندیشد؟. اگر برگردیم به زمانیکه دانشگاه ساوتهمپتون اولین Pegasus Ferranti را در اختیار گرفت ، تنها عده کمی از مردم در کشور به منابع پردازش دسترسی داشتند، در حالیکه امروز هر خانه ایی در بریتانیا حداقل یک کامپیوتر داشته و یا به آن دسترسی دارد.
بسیاری از اینها شامل پردازشگرهای گرافیکی Nvidia میباشد که برپایه همان فن آوری بوردهای شتابدهنده Tesla بوده که به دانش آموزان اجازه میدهند کدهای موازی را از طریق CUDA و بدون هیچگونه سخت افزار اضافی دریافت کنند. اکثریت همچنین از مجموعه دستورالعملهای x86 استفاده کرده تا بتوانند با محصولات Xeon و Xeon Phi شرکت اینتل نیز کار کنند.
برای کسانیکه در این زمینه علاقه مند میباشند Raspberry Pi که توسط کاکس به منظور بسته پردازش موازی کم هزینه و با کیفیت و برای مقاصد تحصیلی استفاده میشود، نظیر Parallella محصول Adapteva با پردازشگر 16 هسته ایی تعبیه شده بر روی بورد، میتواند راهی به سوی یادگیری اسرار پردازش های موازی باشد.
آینده ابر پردازشها از هم اکنون در دستهای نسل بعدی میباشد.
۹۲/۱۲/۲۲