Nvidia Tesla

ტრადიციულად შეგახსენებთ, რომ სანამ ამ სტატიის კითხვას დაიწყებთ, აუცილებლად ყურადღებით უნდა წინა პოსტი.


როდესაც ადამიანმა პირველი მიკროჩიპი შექმნა და სახელად პროცესორი უწოდა, მას ვერცკი წარმოედგინა თუ რა სისწრაფით განვითარდებოდა იგიგ და რაოდენ გასაოცარ სიმძლავრეებს მიაღწევდა მომავალში. პირველი პროცესორები ანუ CPU–ები მარტო ერთი ბირთვით და ერთი ნაკადით იყვნენ აღჭურვილი. მათ მხოლოდ ერთი დასახული ამოცანის შესრულება შეეძლოთ და ამასაც საკმაოდ დიდ დროს ანდომებდნენ. შემდგომში შემუშავებულ იქნა მრავალბირთვიანი და მრავალნაკადოვანი პროცესორები, რამაც გამოიწვია პარალელური გამოთვლების კონცეფციის ჩამოყალიბება. მარტივად რომ ვთქვათ 4 ბირთვი უფრო სწრაფად გამოთვლის მისთვის დასახული ამოცანის შედეგს, ვიდრე 1 ბირთვი და 240 ბირთვი უფრო სწრაფად ვიდრე 4. დღევანდელ CPU–ებს შეიძლება პარალელური პროცესორებიც ვუწოდოთ, გამომდინარე მათი აგებულებიდან და გამოთვლების წარმოების სქემიდან.

Posted Image

CUDA

ზოგადად კომპიუტერი ორ ნაწილად იყოფა: ჰარდი და სოფტი. ჰარდის შესაძლებლობების გამოყენება რეალურად შეუძლებელია სოფტის გარეშე და ამის ნათელ მაგალითს გვაძლევს Nvidia–ს მიერ შემუშავებული CUDA. CUDA პროგრამირების მოდელი მოიცავს სტანდარტული C ენის გაფართოებას, რაც გამოიხატება CUDA SDK–ს შექმნაში და მასზე პარალელური გამოთვლებისთვის გათვლილი პროგრამების დაწერას. საქმე ისაა, რომ პროგრამისტს საშუალება ეძლევა დავალება მისცეს ერთდროულად განუსაზღვრელი რაოდენობის პროცესორს და არა ერთს, როგორც ადრე ხდებოდა. რასაკვირველია აქ დრის წესრიგში დგება GPU–ს გამოყენება გამოთვლების საწარმოებლად, რადგან CPU–ს ბირთვების რაოდენობა შეზღუდულია საკმაოდ მცირე რიცხვით, მაშინ როცა GPU-ში მათი რიცხვი ასეულობითაა.

პირველად GeForce 8800 იყო GPU, რომელსაც CUDA-ს პრაქტიკაში ამუშავება შეეძლო. შეიძლება ითქვას, რომ ეს იყო პირველი Tesla არქიტექტურის GPU. თუ რა არის Tesla, ამას ქვემოთ მოგახსენებთ დაწვრილებით.

NVIDIA Tesla GPU არქიტექტურა.

მსგავსად თანამოძმე Quadro-სი Tesla-ც სხვა არაფერია, თუ არა მოდიფიცირებული დესკტოპ სეგმენტში გამოყენებული ვიდეობარათი, მაგრამ საკმაო განსხვავებით. ჯერ ერთი Tesla განსხვავებით Quadro-სგან არაა გათვლილი მონიტორზე ინფორმაციის გამოტანისთვის და საერტოდაც იგი არაა ვიდეობარათი, იგი GPGPU არის. მაგალითისთვის ავიღოთ GeForce 8800 GTX. მას 16 SM-ად ჰქონდა გაერთიანებული CUDA Core-ები. თითოეული მისი პროცესორი გვაძლევდა 1,024 რეგისტრს რასაც დაახლოებით ნაკადის მნიშვნელობა აქვს. საბოლო ჯამში 12,288 ნაკადს ვიღებთ! ეს უზარმაზარი ციფრია და ალბათ იოლი წარმოსადგენია თუ რა სიმძლავრესთან გვაქვს საქმე. მაგრამ მოდით უფრო დიდ ციფრებზე ვისაუბროთ და მაგალითად მოვიყვან GeForce GTX 280-ს რომელსაც Tesla T10 GPU შეესაბამება. მას 240 CUDA ბირთვი აქვს, რომლებიც საერთო ჯამში 30,720 კონკურენტულ ნაკადს გამოიმუშავებენ. ამის შემდეგ ჩვეულებრივ CPU-ებს ისღა დარჩენიათ რომ დაიმალონ.

Resized to 63% (was 1130 x 626) – Click image to enlargePosted Image

სურათზე გამოსახულია GeForce GTX 280/Tesla T10-ის სქემა, სადაც იოლად შეგვიძლია გავარკვიოთ, რომ 30SM მულტინაკადოვან მრავალბირთვიან პროცესორების კომპლექსში გაერთიანებულია 240 ნაკადოვანი პროცესორი.

Tesla გამოყენებაში

როგორც ცნობილია Tesla შეიქმნა იმისათვის, რომ CUDA-ს მეშვეობით აწარმოოს იმ ტიპის გამოთვლები, რომლებზეც ჩვეულებრი და თუ გნებავთ სუპერ მძლავრი i 980X-იც კი მოკვდებოდა. ძირითადად მას იყენებენ მეცნიერები სხვადასხვა დარგიდან.

მოლეკულური დინამიკა.

მოლეკულური დინამიკა არის სიმულაციის ტექნიკა, რომელიც ხშირად გამოიყენება ქიმიაში, ფიზიკასა და ბილოგიაში. მისი მიზანია გამოთვალოს ატომების და მოლეკულების გადაადგილების ტრაექტორიები, მათი გადაადგილების სიხშირე და დროის ინტერვალი. საბოლოო გამოთვლის მიზანი კი ნივთიერების სტატიკურ დინამიკური თვისებების განსაზღვრა, კრისტალების ზრდის და პროტეინის “მუშაობის” შესწავლაა. ქვემოთ მოყვანილ სურათზე გამოსახულია ერთ-ერთი პოლიმერის 64 017 შემადგენელი ნაწილაკი, რომელთა დამუშავებაც ხდება CUDA ტექნოლოგიის დახმარებით. სანაძლეოს ჩამოვდივარ, რომ ნებისმიერი ექსტრიმი თუ ზეონი ფეხებს გაფშიკავდა ამ ამოცანის შესრულებისას

Posted Image

მოლეკულური დინამიკა სხვა არაფერია თუ არა CUDA-ზე დაფუძნებული გამოთვლითი ტექნიკა და თითოეული პროცესისას ხდება აბსოლუტურად ყველა ატომის გადაადგილების ტრაექტორიის, მანძილის, დროის და სიხშირის გამოთვლა. ატომები კი წამში რამდენიმე მილიარდჯერ იცვლიან მდგომარეობას. ლითონებში კი ამ პროცესს რხევა ეწოდება და იქ სხვანაირად არის საჭირო გამოთვლების ჩატარება. ანუ იქ რხევების რიცხვის დათვლა ხდება. შეიძლება ერთი შეხედვით მარტივი ჩანს, მაგრამ საკმაოდ რთული პროცედურაა და ჩვეულებრივი პროცესორი არ გამოდგება ამ საქმისთვის.

ზემოთმოყვანილი ცდის ამსახველ სურათზე გამოსახულმა ატომებმა შეიძლება შეასრულონ 18 მილიონი “ნაბიჯი” დროში. ამას თან ერთვის ისიც, რომ ყველა ატომი დამოუკიდებლად გადაადგილდება სხვებისაგან განსხვავებით. 2.4GHz-ზე მომუსავე Opteron 280 პროცესორს წამში 6.46 ასეთი ნაბიჯის დათვლა შეუძლია. სრული პროცესის დასრულებისთვის მას 32 დღე დასჭირდებოდა. სწორედ აქ ერთვება საქმეში პარალელური გამოთვლითი ტექნიკა. მეცნიერები ასეთი სამუშაოებისთვის იყენებენ სოფტს სახელწოდებით LAMMPS. ამ შემთხვევაში 32 ერთეული Opteron 280 პროცესორისგან გაკეთებული კლასტერი საქმეს ერთ დღეში დაასრულებს, მაგრამ მეტისმეტად ძვირი სიამოვნება კი არის. სულ უბრალო CUDA-თი აღჭურვილ GeForce 8800GTX-ს, რომელიც ოპტიმიზირებულია HOOMD-ზე (Highly Optimized Object-Oriented Molecular Dynamics), შეუძლია წამში 203 ნაბიჯი დაითვალოს, რომელიც ექვივალენტურია ზემოთ ნახსენები 32 პროცესორიანი კლასტერისა. მოლეკულურ დინამიკაში 2008 წლისთვის მულტი GPU ტექნოლოგია არ იყო დანერგილი და ამჟამად რა სიტუაციაა, ვერ მოგახსენებთ. ფაქტია, რომ თუ ამ ტიპის გამოთვლებში მრავალი GPU ჩაერთვება, წარმადობა არანორმალურად გაიზრდება.

რათქმაუნდა მოლეკულური დინამიკა არ არის ერთადერთი დარგი, სადაც პარალელური გამოთვლები გამოიყენება. ციფრული წრფივი ალგებრა არის დარგი სადაც ნათლად ჩანს პარალელური გამოთვლების ძალა. თვალსაჩინოებისთვის მოვიყვან სქემებს სადაც GPU და CPU არის შედარებული

Posted Image

Posted Image

სხვაობა აშკარაა.

მედიცინა

TechniScan Medical Systems-მა ჯერ კიდევ 2008 წელს დაიწყო ალგორითმების შემუშავება, რომლებიც გამოთვლებისთვის GPU-ს გამოიყენებდნენ. თანამედროვე პროცესორების დახმარებით შესაძლებელია მთლიანი გულმკერდის სკანირების(WBU) პროგრამის დამუშავება რამდენიმე საათში. ამ გრაფიკზე ასახულია GPU-ს, რომელსაც მხოლოდ ერთი ბირთვი აქვს ჩართული და 4 ბირთვიანი პროცესორის შედარება. ორი Tesla D870s ამ საქმეს 16 წუთში მორჩებოდა.

ციფრული ტომოსინთეზი არის პროცესი, როდესაც სიმსივნის საშიშროება ადრეულ სტადიებზე. მასაჩუსეტსის ჰოსპიტალში გამოიყენეს Nvidia-ს GPU-ები რათა ეწარმოებინათ გამოთვლები, რაც დაკავშირებული იყო რენტგენის სხივების დახმარებით მიღებული შედეგების დამუშავებასთან.

Boston Scientific-მა მოახერხა და მრავალი CPU-სგან შექმნილი კლასტერი წარმატებით ჩაანაცვლა GPU-ებით, რითაც გამოთვლების პროცესი 20-ჯერ ააჩქარა. ელექტრომაგნიტური ველის გადატანის შესაძლო პროცესების გამოთვლისათვის იქნა გამოყენებული ეს GPU-ები

გეოლოგია.

მეცნიერები აქტიურად იყენებენ GPGPU სისტემებს სასარგებლო წიაღისეულის შესაძლო არსებობის კვლევისთვის. აქაც რასაკვირველია GPU-ებმა წარმატებით შეცვალეს CPU-ები. სურათზე სწორედ ერთ-ერთი ასეთი გამოთვლის პროცესს ხედავთ.

Posted Image

ეს არაა სრული ჩამონათვალი, სადაც ეფექტურად გამოიყენება GPU და GPGPU სისტემები. მეცნიერების ბევრი დარგი გადავიდა უკვე ალტერნატიული გამოთვლების მეთოდზე და კიდევ უამრავი სფეროა სადაც მომავალში ვიხილავთ Tesla-ს

Tesla GPGPU

სულ სამი სერიაა გამოშვებული. მე თითოეულ მათგანს წარმოგიდგენთ.

NVIDIA Tesla 8 სერია.

Tesla S870

ეს მონსტრი აერთიანებს 4 GPU-ს, რომლებიც 1350 MHz-ზე მუშაობენ. მეხსიერება სულ 6 გიგაბაიტაია, რომელიც თანაბრადაა განაწილებული ოთხად და თითოეული GPU 1.5GB მოცულობის მეხსიერებასთან არის დაკავშირებული. მეხსიერების სამუშაო სიხშირე 800 MHz-ია, ინტერფეისი კი 384 bit.

Posted Image

ურიგო არ იქნება თუ მის არქიტექტურასაც გადავავლებთ თვალს:

Posted Image

Tesla D870

მასში გაერთიანებულია ორი Tesla C870 GPU. თითოეულს 128 ნაკადოვანი პროცესორი აქვს. მეხსიერების მოცულობა 3 GB-ია და ორადაა გაყოფილი. სისტემა გაყიდვაშია ამნაირი სუპერკომპიუტერის სახით, მაგრამ ცალკეც შეიძლება GPGPU-ს შეძენა

Posted Image

Posted Image

არქიტექტურა:

Posted Image

Tesla C870

მისი GPU 128 ნაკადოვანი პროცესორისგან შედგება და 1.35 GHz-ზე მუშაობს. მეხსიერების მოცულობა 1536 MB-ია, სიხშირე კი 800 MHz.

Posted Image

NVIDIA Tesla 10 სერია

Tesla C1060

მისი GPU 240 ნაკადოვანი პროცესორით არის აღჭურვილი და 1.296 GHz-ზე მუშაობს. მის 4 GB-იან მეხსიერებას 512 ბიტიანი ინტერფეისი აქვს.

Posted Image

არქიტექტურა:

Posted Image

Tesla S1070

სერვერი, რომელშიც 4 GPU არის გაერთიანებული. ჯამში 16 GB მეხსიერებაა გამოყენებული.

Posted Image

Tesla 20 სერია

Tesla S2050

ეს სერია Fermi-ს არქიტექტურის მოდიფიცირებული ვარიანტია. GPU-ს 448 ნაკადოვანი პროცესორი აქვს და 1.15 GHz სიხშირეზე მუშაობს. GDDR5 ტიპის 3 GB მეხსიერება გააჩნია.
სუპერკომპიუტერში გაერთიანებისას 4 ასეთი Tesla გამოიყენება. არქიტექტურა კი ასეთი აქვს:

Posted Image

ამით ამოწურულია ჩემი თემა. იმედია ბევრი სისულელები არ დამიწერია, საკმაოდ რთული დარგია GPU სეგმენტისთვისაც კი.

წყარო: overclockers.ge

კომენტარის დატოვება

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  შეცვლა )

Google photo

You are commenting using your Google account. Log Out /  შეცვლა )

Twitter picture

You are commenting using your Twitter account. Log Out /  შეცვლა )

Facebook photo

You are commenting using your Facebook account. Log Out /  შეცვლა )

Connecting to %s