У дома Напредничаво мислене Суперкомпютър 15: по-големи промени на хоризонта

Суперкомпютър 15: по-големи промени на хоризонта

2024

Видео: Настя и сборник весёлых историй (Ноември 2024)

Докато разглеждам съобщенията и процедурите на конференцията Supercomputing 15 (SC15) от миналия месец в Остин, изглежда, че макар и високоефективните компютри да са малко в затишие, това е пазар, готов за някои големи промени през годината до идвам.

Ако погледнете лидерите в списъка на топ500, два пъти годишно изброяване на най-бързите компютри в света, лидерът за шести пореден път е Tianhe-2, суперкомпютър, изграден от Китайския национален университет по отбранителни технологии. Според списъка на топ500, тази машина осигурява 33, 86 петафлоп / сек (квадрилиони изчисления в секунда) с устойчиво представяне на бенчмарка Linpack и 54, 9 петафлоп / с теоретични пикови показатели. Това се базира на процесорите Intel Xeon и Xeon Phi.

Второто място продължава да заема Titan, система Cray XK7, базирана на процесори AMD Opteron и графични процесори Nvidia K20x, инсталирани в Националната лаборатория на Oak Ridge на DOE, със скорост 17.59 петафлоп / s за устойчиво представяне на бенчмарка Linpack.

Две нови машини пробиха топ 10. Компютърът Trinity в Националната лаборатория на Лорънс Ливърмор (LLNL) е шести с 8, 1 петафлоп / сек, докато системата Hazel-Hen в германския Höchstleistungsrechenzentrum Stuttgart (HLRS) дойде на осмо място с 5.6 петафлоп / сек. И двете са машини Cray XC, базирани на процесори Intel Xeon с взаимосвързаност Aries.

По-големи промени настъпват по-далеч от списъка, особено при голям ръст на броя на китайските системи, който нарасна до 109, в сравнение със само 37 в предишния списък. Отчасти това изглежда е от повече китайски системи, които изпълняват показателите и представят резултати за списъка. В резултат на това броят на американските системи спадна от 231 на 200, което е най-ниското число от началото на списъка през 1993 г .; а броят на европейските системи спадна от 141 на 108.

Една голяма тенденция е увеличаването на броя на системите, които използват ускорители или копроцесори, които нараснаха до 104 системи в текущия списък, спрямо 90 през юли. По-голямата част от тези системи използват графични процесори Nvidia Tesla, последвани от копроцесори Xeon Phi на Intel, като няколко от тях използват комбинация. Nvidia посочи, че тя е в 70 от тези системи, включително 23 от 24-те нови системи в списъка.

По време на изложението Nvidia изтъкна растежа на ускорителите и по-специално броя на приложенията, които вече са достъпни, оптимизирани за CUDA архитектурата на фирмата. Компанията твърди, че 90 процента от топ 10 високоефективните компютърни приложения и 70 процента от топ 50 вече са ускорени. Една интригуваща употреба е за системи, работещи със симулации на времето, основно приложение за високоефективни изчисления, тъй като прогнозите за времето се изготвят от всякакви правителства. Крей по-рано посочи използването на такива ускорители в Швейцарската служба по метеорология (MeteoSwiss) и говори за това как работи с изследователи в Швейцария при пренаписването на много от приложенията му. Сега Nvidia посочва използването на ускорители от Националната администрация за океански и атмосферни влияния (NOAA) и за някои от прогнозите си за времето.

Наред с други приложения, Cray рекламира приложения за нефт и газ, като например използва 3D геофизика за симулиране на резервоар, както и финансови услуги, като например оценка на риска. Такива приложения рядко представляват най-бързите системи в света, но са индикация, че високоефективните компютри играят по-широка роля в повече корпоративни приложения. Крей говори за стабилна прогресия към изпълнението на по-големи и по-подробни модели във всички научни и инженерни дисциплини и за съчетаване на традиционните натоварвания с анализа.

Интересува ме и съобщение на Linux Foundation за ново усилие, наречено OpenHPC, предназначено да създаде по-отворени стандарти в света на HPC. Това е интересна идея и тази, която изглежда има много големи играчи, които влизат.

В работата има редица нови системи. IBM изгражда нова машина, наречена Summit в Oak Ridge National Laboratories (ORNL) и друга, наречена Sierra в Националната лаборатория на Лорънс Ливърмор (LLNL), и двете базирани на взаимодействията между процесорите на IBM Power, графичните процесори на Nvidia Tesla и Mellanox. Очаква се срещата на върха да доведе до 150 до 300 пикови петафлоп / сек, а Сиера над 100 петафлоп / сек.

Освен това Intel и Cray изграждат нова машина, наречена Aurora, базирана на предстоящите процесори Intel Xeon Phi на Knights Hill за The Argonne Leadership Computing Facility (част от Argonne National Labs), чиято цел е 150 петафлопа през 2018 г. Всичко това са част от програма на Министерството на енергетиката, известна като Сътрудничество на Oak Ridge, Argonne и националните лаборатории на Лорънс Ливърмор (CORAL), насочена към ускоряване на развитието на високоефективните изчисления, и по-специално на проекта FastForward 2.

И все пак ни предстои дълъг път към „компенсиране на големи компютри“.

Междувременно имаше няколко съобщения за процесори, които могат да покажат добре за бъдещето. По-специално Nvidia стимулира използването на суперкомпютри за висококачествени уеб приложения, по-специално машинно обучение. Той обяви няколко малко по-нисък клас продукти: дъската на Tesla M40 с 3072 CUDA ядра, за която каза, че е способна да изпълнява до 7 единични прецизни терафлопа / сек, насочени главно към обучение в дълбоко обучение и M4, платка с по-ниска мощност с 1024 ядра и 2.2 едноточни терафлопа / s, които могат да се използват за дълбоко извеждане на науката, както и за неща като обработка на изображения и видео. В допълнение, компанията обяви нов „свръхскален пакет“ с приложения, насочени към най-големите компютърни сайтове. И двата нови хардуерни продукта са базирани на 28nm технологична технология и архитектурата на Maxwell на компанията.

Компанията обяви две последващи архитектури, известни като Pascal, които следва да се появят през следващата година, и Volta, които ще я последват. Intel се съсредоточи върху това как HPC влияе на науката, а аз бях заинтригуван от неговото описание как използва собствения си суперкомпютър - понастоящем класиран на 99 в топ 500 списъка - за да помогне да проектира свои собствени процесори. По-специално компанията заяви, че използва милион CPU часа само за проектиране на фотомаски за процесори от следващо поколение.

Голяма част от дейността на Intel беше фокусирана върху Knights Landing, следващата версия на чипа й Xeon Phi, който може да се използва като ускорител, но и да се стартира; и нейната материя Omni-Path. Въпреки че Intel вече казва, че общата наличност ще бъде през първата половина на 2016 г., няколко клиенти имат ранен достъп до Knights Landing. В момента Крей тества голяма система за кацане на рицари в подготовка за доставка на нов суперкомпютър, наречен Cori за Националния научно-изчислителен център за енергийни изследвания (NERSC), и Националната лаборатория в Лос Аламос и Националната лаборатория Sandia през следващата година. Bull, звено на френския системен интегратор Atos, също получи ранни версии на Knights Landing, за да се подготви за системата Tera 1000, която изгражда за Френската комисия за алтернативна енергия и атомна енергия. Argonne Leadership Computing Facility работи по система, наречена Theta, която трябва да бъде доставена през следващата година, а Sandia National Laboratories работи с Penguin Computing за надграждане на няколко системи, които използват по-ранни поколения от съвместни процесори на Xeon Phi.

Intel каза по-рано, че ще има три различни версии на Knights Landing: основен хост процесор (способен да се самозареди), хост процесор с интегрирана материя Omni-Path и PCIe ускорител карта. Самият чип ще се състои от 36 плочки всяка с две ядра на процесора (общо 72 ядра), четири вектори за обработка (две на ядро), 1MB споделен L2 кеш и кеширащ агент за поддържане на съгласуваност; и Intel заяви, че трябва да осигури около три пъти по-голяма скаларна производителност на процесора Knights Corner, с 3 терафлоп / с двойна прецизност и 6 терапевтични връзки с единична точност. Той също така използва нова система памет, наречена MCDRAM, вградена памет с над 3x достъпната честотна лента в сравнение с излизането на DDR4, което изглежда е вариант на архитектурата на Hybrid Memory Cube, за която Intel и Micron са говорили за това. На изложението Cray имаше прототипна система, включваща стартиращ Knights Landing, а редица други доставчици показваха системи, проектирани за Knights Landing. Тази версия на Xeon Phi е планирана да бъде последвана от версия, наречена Knights Hill, която трябва да бъде изградена на предстоящия 10 nm процес.

В допълнение, Fujitsu говори малко повече за проекта си Flagship 2020, базиран на нов чип, известен като FX100 с 32 ядра. Очаква се това да увеличи приблизително утроената производителност с плаваща запетая през текущия FX10 и подобно на Knights Landing, FX100 на Fujitsu също ще използва версия на архитектурата на Hybrid Memory Cube. В допълнение, NEC има проект с кодово наименование Aurora (несвързан с проекта CORAL), въз основа на последващите му действия към чипа SX-ACE, но с по-голяма честотна лента на паметта. Това е насочено към 2017 г.