AstekHPC

parallelComputing

ارزیابی کارایی کلاسترهای موازی

یکی از نیازهای مهم در کلاسترهای محاسباتی و سیستمهای پردازش موازی، ارزیابی میزان کارایی سخت افزار و نرم افزار محاسباتی طراحی شده می باشد. در این مطلب یک Benchmark از ناسا معرفی شده است که ترکیبی از اجرای مسائل پیچیده محاسباتی با ورودیهای مختلف در تعدادی از رشته های تخصصی ریاضی، مکانیک سیالات و .. می باشد. این محاسبات با چارچوبهای مختلفی از قبیل OpenMP, MPI و زبانهای برنامه نویسی C و Fortran نوشته شده است.

NAS PARALLEL BENCHMARKS

The NAS Parallel Benchmarks (NPB) are a small set of programs designed to help evaluate the performance of parallel supercomputers. The benchmarks are derived from computational fluid dynamics (CFD) applications and consist of five kernels and three pseudo-applications in the original "pencil-and-paper" specification (NPB 1). The benchmark suite has been extended to include new benchmarks for unstructured adaptive mesh, parallel I/O, multi-zone applications, and computational grids.  Problem sizes in NPB are predefined and indicated as different classes. Reference implementations of NPB are available in commonly-used programming models like MPI and OpenMP (NPB 2 and NPB 3).

BENCHMARK SPECIFICATIONS

The original eight benchmarks specified in NPB 1 mimic the computation and data movement in CFD applications:

  • five kernels
    • IS - Integer Sort, random memory access
    • EP - Embarrassingly Parallel
    • CG - Conjugate Gradient, irregular memory access and communication
    • MG - Multi-Grid on a sequence of meshes, long- and short-distance communication, memory intensive
    • FT - discrete 3D fast Fourier Transform, all-to-all communication
  • three pseudo applications
    • BT - Block Tri-diagonal solver
    • SP - Scalar Penta-diagonal solver
    • LU - Lower-Upper Gauss-Seidel solver

Multi-zone versions of NPB (NPB-MZ) are designed to exploit multiple levels of parallelism in applications and to test the effectiveness of multi-level and hybrid parallelization paradigms and tools.  There are three types of benchmark problems derived from single-zone pseudo applications of NPB:

  • BT-MZ - uneven-size zones within a problem class, increased number of zones as problem class grows
  • SP-MZ - even-size zones within a problem class, increased number of zones as problem class grows
  • LU-MZ - even-size zones within a problem class, a fixed number of zones for all problem classes

Benchmarks for unstructured computation, parallel I/O, and data movement

  • UA - Unstructured Adaptive mesh, dynamic and irregular memory access
  • BT-IO - test of different parallel I/O techniques
  • DC - Data Cube
  • DT - Data Traffic

GridNPB is designed specifically to rate the performance of computational grids. Each of the four benchmarks in the set consists of a collection of communicating tasks derived from the NPB. They symbolize distributed applications typically run on grids.

  • ED - Embarrassingly Distributed
  • HC - Helical Chain
  • VP - Visualization Pipeline
  • MB - Mixed Bag

DOCUMENTS ON BENCHMARK SPECIFICATIONS:

BENCHMARK CLASSES

  • Class S: small for quick test purposes
  • Class W: workstation size (a 90's workstation; now likely too small)
  • Classes A, B, C: standard test problems; ~4X size increase going from one class to the next
  • Classes D, E, F: large test problems; ~16X size increase from each of the previous classes

Details of NPB Problem Sizes and Parameters.

REFERENCE IMPLEMENTATIONS

Vendors and others implement the detailed specifications in the NPB 1 report, using algorithms and programming models appropriate to their different machines. NPB 1 implementations are generally proprietary and are not distributed by NAS.

A set of reference implementations of the NPB specifications has been written and distributed by NAS as NPB 2 and NPB 3. These source-code implementations are intended to be run with little or no tuning, and approximate the performance a typical user can expect to obtain for a portable parallel program. NPB 2 contains MPI-based source code implementations of the original eight benchmarks, and NPB 3 has included new benchmarks and problem classes as well as implementations using other programming models.  The latest release is NPB 3.3.1.

Summary of source code releases
Version Benchmarks Included Problem Classes Programming Models Used Major Changes
NPB 3.3 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA, DC, DT S,W,A,B,C,D,E MPI, OpenMP, serial added Class E
NPB 3.3-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D,E,F MPI+OpenMP, OpenMP, serial nested OpenMP version
NPB 3.2 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA, DC, DT S,W,A,B,C,D MPI, OpenMP, serial added DC, DT
NPB 3.2-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D,E,F MPI+OpenMP, SMP, serial added Class E, Class F
NPB 3.1 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU, UA S,W,A,B,C,D MPI, OpenMP, serial added UA, Class D to OpenMP, serial
NPB 3.1-MZ BT-MZ, SP-MZ, LU-MZ S,W,A,B,C,D MPI+OpenMP, SMP, serial allowed a variable number of threads
GridNPB 3.1 ED, HC, VP, MB S,W,A,B Globus, Java, serial added Globus version
NPB 3.0 IS, EP, CG, MG, FT, BT, SP, LU S,W,A,B,C OpenMP, HPF, Java new programming paradigms
NPB 2.4 IS, EP, CG, MG, FT, BT, BT-IO, SP, LU S,W,A,B,C,D MPI added BT-IO, Class D
NPB 2.3 IS, EP, CG, MG, FT, BT, SP, LU S,W,A,B,C MPI, serial added CG, serial version

 

 

Login
HPCLab Media
HPCLab RSS

News | TOP500 Supercomputer Sites

TOP500 News Ceases Operations; The List Continues to Expand 1.1.1970 01:00

Scaling Beyond Exa; Intel Goes 3D 1.1.1970 01:00

High Performance Computing in 2018: Hits and Misses 1.1.1970 01:00

Finnish Science Center to Install Two Petascale Supercomputers 1.1.1970 01:00

Intel Goes Vertical, Will Stack Logic Chips Into 3D Packages 1.1.1970 01:00

Injecting Deep Learning into Climate Models 1.1.1970 01:00

Supercomputing Is Heading Toward an Existential Crisis 1.1.1970 01:00

Intel Ramps Up Neuromorphic Computing Effort with New Research Partners 1.1.1970 01:00

Amazon Web Services Extends Its Reach in HPC, Hyperscale, and Enterprise 1.1.1970 01:00

UC Berkeley, Intel Explore Potential Replacement for CMOS Technology 1.1.1970 01:00

IBM Takes Aim at Reduced Precision for New Generation of AI Chips 1.1.1970 01:00

DeepMind Stops Playing Games, Debuts AI Software for Predicting Protein Structures 1.1.1970 01:00

AWS Adds New Instances, Network Enhancements for HPC 1.1.1970 01:00

Russian Company Develops Mobile Petascale Supercomputer 1.1.1970 01:00

NVIDIA Expands GPU Computing Mindshare with HGX-2 1.1.1970 01:00

More News From SC18; Updates from Atos, Mellanox, and Panasas 1.1.1970 01:00

Atos Broadens HPC Portfolio with Modular Supercomputer 1.1.1970 01:00

China Spills Details on Exascale Prototypes 1.1.1970 01:00

SC18 Rolls on in Dallas; Processors Take Center Stage 1.1.1970 01:00

Panasas Unveils Next-Generation ActiveStor, PanFS 1.1.1970 01:00

Site encyclopedia section

In this section, you will find articles and information you need.

Paper Categories
نرم افزار پایش کلاسترهای محاسباتی

این نرم افزار میزان استفاده از منابع محاسباتی و همچنین کار های در حال اجرا روی کلاستر را پایش میکند. به منظور نصب نسخه موبایل استک ابتدا JuiceSSH نصب شود.

Download More

PuTTY

PuTTY is a free and open-source terminal emulator, serial console and network file transfer application. It supports several network protocols, including SCP, SSH, Telnet, rlogin, and raw socket connection. It can also connect to a serial port.

Download More

Winscp

WinSCP is a free and open-source SFTP, FTP, WebDAV and SCP client for Microsoft Windows. Its main function is secure file transfer between a local and a remote computer.

Download More

VNC Viewer

VNC offers a deceptively simple service it allows you to view and control a remote system as though seated next to it, wherever you are.

Download More

NEWS

ابر رایانه واتسون جان زن مبتلا به سرطان را نجات داد

ابر رایانه واتسون (Watson) که محصولی از کمپانی IBM است، دقیق‌ترین تعریفی است که از قدرت هوش مصنوعی و یادگیری ماشینی می‌توانیم داشته باشیم. این کامپیوتر غول‌آسا بعد از برنده شدن در مسابقات تلویزیونی و پخت غذاهای عجیب و غریب، حالا توانسته است مهمترین کار تمام دوران خود را انجام دهد: نجات جان یک انسان!   ...

چین قدرتمندترین ابر کامپیوتر جهان را ساخت

یکی از نتایج توسعه تکنولوژی تولید کامپیوترهای بسیار قدرتمندی موسوم به سوپر کامپیوترها است که همواره نقشی حیاتی در پیشرفت علمی بشر داشته‌اند. امسال شاهد تولید بزرگ‌ترین سوپر کامپیوتر حال حاضر جهان توسط یک شرکت چینی با TaihuLight نام هستیم که توانسته با اختلافی بسیار زیاد از رقبا جایگاه نخست کنفرانس بین المللی ابرکامپیوترهای امسال را کسب کند.   ...

فوجيتسو و فروش يک ابر کامپيوتر 20 ترافلاپي به کانن

دیروز فوجیتسو اعلام کرد که یک دستگاه ابر کامپیوتر تجاری PRIMEHPC FX10 را به شرکت کانن فروخته است. فوجیتسو از معرفی رسمی این سری از سوپرکامپیوترها در سال 2011، چند عدد از آن‌ها را به اهالی صنعت فناوری فروخته است.   ...

درباره ما

بنیاد توسعه کاربردها رایانش سریع و ابری(High performance and Cloud Computing Development Foundation) به منظور طراحی، ساخت و گسترش کاربردهای رایانش سریع در علوم مختلف توسط جمعی از اساتید دانشگاه پیام نور استان یزد پایه گذاری شده است. این بنیاد به دنبال ایجاد بستری با ظرفیت محاسباتی و ذخیره سازی بالا مبتنی بر CPU و GPU می باشد تا بتواند از آن طریق سرویسهای متعددی را به متقاضیان آن ارائه نماید. خدمات این شرکت در حوزه های زیر ارائه می گردد :

  • رایانش سریع و ابری (HPC & Cloud Computing)
  • کلان داده و پردازش داده های حجیم (Big Data Analysis)
  • طراحی و پیاده سازی کلاسترهای محاسباتی مبتنی بر Linux
  • طراحی و اجرای پروژه های انبار داده Data Warehouse
  • مجازی سازی و اجرای شبکه های مبتنی بر نرم افزار (Software Defined Network)