У дома Напредничаво мислене Алтернативните архитектури ли ще управляват суперкомпютрите?

Алтернативните архитектури ли ще управляват суперкомпютрите?

2024

Видео: Настя и сборник весёлых историй (Ноември 2024)

През последните години видяхме някои интересни нови подходи към високоефективните изчисления, по-специално изместване от традиционните големи процесори и към клъстери от x86 процесори с ускорители или копроцесори за ускоряване на конкретни видове изчисления. Излизайки от шоуто Supercomputing от миналата седмица, видяхме Intel да настоява да интегрира своя копроцесор Xeon Phi с традиционния си сървърен процесор Xeon, за да улесни програмирането; Nvidia представя нова версия на своя ускорител за графичен процесор Tesla; и Micron подкрепя много различен вид процесор за още по-специализирани изчисления. И всичко това се случваше в момент, когато ускорителите и копроцесорите идват да доминират в списъка на топ 500 на най-бързите компютри в света, което кара някои експерти да предполагат, че съществуващите критерии придават твърде голяма тежест на тези процесори.

Nvidia обявяваше своите успехи със своите ускорителни платки Tesla, големи клъстери от графични процесори, свързани с основните процесори от Intel или AMD. Такива чипове се използват в голямо разнообразие от системи, включително системата Titan в Националната лаборатория Oak Ridge и новата система Piz Daint в Швейцарския национален компютърно-изчислителен център за суперизчисления. По-интересното е, че компанията казва, че платките на Tesla са във всички топ 10 системи в най-новия списък Green 500 на най-енергийно ефективните суперкомпютри в света. Всички тези системи също използват Intel Xeons с изключение на базираната на AMD Opteron базова Titan, която е втората най-бърза система в света в Топ 500, но се нарежда много по-ниско в списъка на Зелените 500.

В допълнение, Nvidia обяви партньорство с IBM, за да предложи своите ускорители на Tesla в системи, базирани на архитектурата на IBM Power. IBM отдавна рекламира серийното си представяне, а неговата система BlueGene / Q, базирана на процесори Power, управлява системата Sequoia в Националната лаборатория на Лорънс Ливърмор и системата Mira в Националната лаборатория Аргон. Съвместната работа на IBM и Nvidia трябва да доведе до някои интересни системи в бъдеще.

На изложението компанията обяви своя Tesla K40, следващото поколение на своя GPU ускорител. Компанията обяви, че ще предлага 1, 4 терафлопа с двойно прецизна производителност, 12 GB памет (288GBps честотна лента) и функция за увеличаване на графичния процесор, което му позволява да работи с по-бърза тактова скорост в някои ситуации. Това е ъпгрейд от съществуващата серия Tesla K20, използвайки същия основен графичен графичен дизайн, произведен по 28nm технология.

Други инициативи включват начини за улесняване на програмирането на графичния процесор, включително CUDA 6, който сега поддържа унифицирана памет, като позволява на разработчиците да се приближават до паметта като единен пул, въпреки че процесорът и графичната процесор остават отделни. Компанията също така поддържа OpenACC, стандартна колекция от директиви за компилация, която казва на системата кои части от програмата (написани на C / C ++ и Fortran) могат да бъдат прехвърлени от процесора в ускорител за повишаване на производителността.

Подходът на Intel, който нарича своята архитектура Many Integrated Core (MIC), е много различен. Той комбинира множество малки x86 ядра в един чип, наречен Xeon Phi. През последните няколко години Intel известява факта, че всички x86s улесняват програмирането, въпреки че е ясно, че разработчиците все още трябва да се насочат директно към архитектурата. Текущата версия на Xeon Phi, наречена Knights Corner, е проектирана да се използва като ускорител заедно с по-традиционните сървърни чипове на Xeon E и се използва от най-добрите системи, включително китайския Tianhe-2 (в момента най-бързата система в света) и системата Stampede в Advanced Computing Center в Университета на Тексас.

На изложението Intel обяви нова версия с кодово име Knights Landing, която също ще работи като самостоятелен процесор, който може да се впише в стандартна архитектура на стелажи и да стартира директно операционната система, без да изисква хост процесор (като Xeon E). Това може да бъде много важно за разширяване на привлекателността на Xeon Phi, особено на пазара на работни станции. Отново това е създадено, за да улесни разработчиците на софтуер да го разглеждат като един процесор. Knights Landing ще се предлага както като самостоятелен процесор, така и като PCI Express платка, която се вписва в съществуващите системи като надстройка от Knights Corner.

Има и други значителни промени в Knights Landing, включително добавяне на "близо памет", ефективно DRAM, която се предлага в пакета с процесора и по този начин може да осигури много по-голяма честотна лента от традиционната DDR памет, която е ограничена от скоростта на Автобусът. (Това също става по-бързо, но не почти толкова.) Това не е първият ход в тази посока; IBM от години рекламира вградената DRAM в своята архитектура Power, а самият Intel поставя вградена DRAM за графика във версиите Iris Pro на семейството си Haswell Core. Все пак предполагам, че ще видим много повече усилия в тази посока през следващите години.

Междувременно един от най-интересните нови подходи идва от Micron, който обяви нов ускорител, наречен процесор Automata, предназначен най-вече за справяне със сложни неструктурирани проблеми с данни.

Микрон описа това като предлага плат, състоящ се от десетки хиляди до милиони обработващи елементи, свързани за решаване на конкретни задачи. Компанията, един от най-големите производители на DRAM и NAND памет, казва, че това ще използва базирана на паметта обработка за решаване на сложни компютърни предизвикателства в области като мрежова сигурност, биоинформатика, обработка на изображения и анализи. Micron първоначално ще разпространява процесора Automata на PCI-Express платка, за да накара разработчиците да работят с него, но компанията планира да продава процесорите на стандартни модули с памет, известни като DIMM, или като отделни чипове за вградени системи. По някакъв начин това звучи подобно на програмируеми на полето масиви от врати (FPGAs), които са настроени за решаване на конкретни приложения, включващи съпоставяне на образи.

Компанията заяви, че работи с Georgia Tech, Университета в Мисури и Университета на Вирджиния за разработване на нови приложения за Automata. Въпреки че компанията не е обявила дата за крайните продукти, предстои да излезе комплект за разработка на софтуер през следващата година, заедно с инструменти за симулация.

Automata звучи като незавършена работа и вероятно е твърде рано да се знае колко широки са приложенията, но това е интересен подход.

Като цяло наблюдаваме еволюцията на високоефективните изчисления. Преди много години най-бързите компютри бяха предимно просто огромен брой стандартни сървърни процесори. Всъщност системите на IBM Blue Gene и тези, базирани на Sparc (като компютъра K от Разширения институт за компютърни науки RIKEN в Япония, който използва процесори Fujitsu Sparc), все още представляват голяма част от пазара, включително пет от 10-те най-бързи системи в света. Но през последните години инерцията се насочи към копроцесора, като системите, използващи Tesla и по-скоро Xeon Phi ускорители, съставляват повече от по-новите системи. С подобрения в тези системи, нови партньорства, по-добър софтуер и някои нови подходи, пазарът на суперкомпютри може да бъде много различен в бъдеще.