Путівник по процесорам Intel Sandy Bridge


У попередньому "Путівнику по новим процесорам Intel", опублікованому приблизно рік тому ми говорили про мікроархітектурі Nehalem, що прийшла на зміну Core наприкінці 2008 року. У цьому огляді мова піде про архітектурі Sandy Bridge, яка найближчим часом повинна повністю замінити Nehalem.

На сьогоднішній день чіпи на базі Sandy Bridge представлені у всіх лінійках процесорів Intel, включаючи серверні Xeon, дестопные і мобільні Core i3/35/i7, Pentium і Celeron і "екстремальні" Core i7 Extreme. Незадовго до публікації цієї статті, 22 травня 2011 року, були представлені ще сім нових процесорів на базі Sandy Bridge.

У чому ж полягають принципові відмінності Sandy Bridge від Nehalem і в чому полягають особливості та переваги нової мікроархітектури Intel? Коротко ці відмінності такі: оновлене графічне ядро у складі "системного агента" розташоване на одному кристалі з обчислювальним, передбачені новий буфер мікрокоманд L0, поділюваний кеш L3, модернізована технологія Turbo Boost, розширений набір SIMD інструкцій AVX і перероблений двоканальний контролер оперативної пам'яті DDR3 1333 МГц. Разом з новою архітектурою з'явився і новий процесорний роз'єм LGA 1155.

Intel Sandy Bridge

Одне з головних конструктивних відмінностей Sandy Bridge від Nehalem - розміщення обчислювальних ядер і північного мосту (системного агента) на одному кристалі. Нагадаємо, що в Nehalem сам ЦП і північний міст розташовувалися під загальною кришкою, але фактично розміщувалися на самостійних чіпах, які, до того ж, були виконані по різним технологічним нормам: ЦП - по 32-нм, а північний міст - по 45-нм. У Sandy Bridge це кристал, виконаний по 32-нм техпроцесу, на якому знаходяться обчислювальні ядра, графічне ядро, контролери оперативної пам'яті, PCI Express, електроживлення (Power Control Unit, PCU) і блок відеовиходу.

Intel Sandy Bridge

Новий набір SIMD-інструкцій у чіпах Sandy Bridge отримав назву AVX - Advanced Vector Extensions, тобто "розширені векторні інструкції". Фактично це чергове покоління SIMD-інструкцій (Single Instruction, Multiple Data - "одиночний потік команд-множинний потік даних" SSE5, альтернативна набору x86, розробленим в AMD. Розрядність регістрів XMM в інструкціях AVX збільшено вдвічі з 128 до 256 біт, з'явилися 12 нових інструкцій з підтримкою четырехоперандных команд. Підтримуються технологія апаратного шифрування Advanced Encryption Standard (AES) і система віртуалізації Virtual Machine Extensions (VMX).

Intel Sandy Bridge

Незважаючи на схожу конструкцію у чіпів Sandy Bridge більше виконавчих блоків, ніж у Nehalem: 15 проти 12 (див. блок-схему). Кожен виконавчий блок підключений до планування інструкцій через 128-бітний канал. Для виконання нових інструкцій AVX, що містять 256-розрядні дані, одночасно використовуються два виконавчих блоку.

Чіпи Sandy Bridge здатні обробляти до чотирьох інструкцій за такт завдяки чотирьом декодерам, вбудованим в блоки вибірки команд. Ці декодери перетворять інструкції x86 в прості RISC-подібні микроинструкции.

Найважливіше нововведення в процесорах Sandy Bridge - це так званий "кеш нульового рівня" L0, в принципі відсутній в процесорах попереднього покоління. Цей кеш здатний зберігати до 1536 декодованих микроинструкций: його сенс полягає в тому, що коли виконується програма входить до кільцевої цикл, тобто повторно виконує одні й ті ж інструкції, не потрібно заново декодувати одні і ті ж інструкції. Така схема дозволяє помітно підвищити продуктивність: за оцінками фахівців Intel, L0 використовується в 80% машинного часу, тобто в переважній більшості випадків. Крім того, при використанні L0 відключаються декодери і кеш-пам'ять першого рівня, а чіп споживає менше енергії і виділяє менше тепла.

У зв'язку з появою в чіпах Sandy Bridge "кеша нульового рівня" часто згадують трасувань кеш (trace cache) "ветеранів гонки гігагерц" - процесорів Pentium 4 на базі архітектури NetBurst. Між тим, ці буфери працюють по-різному: в трассировочном кеші інструкції записуються точно в такому порядку, в якому вони виконувалися, тому в ньому можуть кілька разів повторювати одні і ті ж інструкції. У L0 зберігаються поодинокі інструкції, що, зрозуміло, більш раціонально.

Зазнав помітні зміни блок пророкування розгалужень, отримав буфер передбачення результату розгалужень (branch target buffer) подвоєного об'єму. Крім того, в буфері тепер використовується спеціальний алгоритм стиснення даних, завдяки чому блок здатний готувати великі обсяги інструкцій, тим самим підвищуючи продуктивність розрахунків.

Підсистема пам'яті Sandy Brigde була також оптимізована для роботи з 256-бітними інструкцій AVX. Нагадаємо, що в Nehalem використовувалися виділені порти завантаження, зберігання адрес і зберігання даних, прив'язані до окремих дисптчерским портів, що означає можливість завантаження 128 біт даних з кеш-пам'яті L1 за такт. У Sandy Brigde порти завантаження і зберігання при необхідності можуть змінювати призначення і одночасно виступати в ролі пари портів завантаження або зберігання, що дозволяє працювати з 256 біт даних за такт.

Для зв'язку компонентів чіпа, тобто обчислювальних ядер, об'єм кеш-пам'яті L3, графічного ядра і системного агента (контролерів пам'яті, PCI Express, харчування та дисплея), Sandy Bridge використовується кільцева шина (ring interconnect). За основу була взята швидкісна шина QPI (Quick Path Interconnect, пропускна здатність до 6,4 Гбайт/с на частоті 3,2 ГГц), вперше реалізована в чіпах Nehalem Lynnfield (Core i7 9xxx для Socket LGA1366), адресованих ентузіастам.

Intel Sandy Bridge

По суті кільцева шина Sandy Bridge являє собою чотири 32-байных кільця: шини даних, шини запитів, шини підтвердження та шини моніторингу. Обробка запитів здійснюється на частоті роботи обчислювальних ядер, при цьому при тактовій частоті 3 ГГц пропускна здатність шини досягає 96 Гбайт в секунду. При цьому система автоматично визначає найкоротший шлях передачі даних, забезпечуючи мінімальну латентність.

Використання кільцевої шини дозволило іншим способом реалізувати кеш-пам'ять третього рівня L3, яка Sandy Bridge отримала назву LLC (Last Level Cache, тобто "кеш останнього рівня"). На відміну від Nehalem, тут LLC не є загальним для всіх ядер, але при цьому він може при необхідності розподілятися між усіма ядрами, а також графікою і системним агентом. Важливо зазначити, що хоча для кожного обчислювального ядра виділений свій сегмент LLC, цей сегмент не прив'язаний жорстко до "свого" ядру і його обсяг може допомогою кільцевої шини розподілятися між іншими компонентами.

При переході на Sandy Bridge Intel присвоїли всім компонентами центрального процесора, які не відносяться до власне обчислювальних ядер, загальна назвою System Agent, тобто "системний агент". Фактично це всі компоненти так званого "північного мосту" набору системної логіки, однак це назва все-таки більше підходить окремій мікросхемі. У застосуванні до Nehalem використовувалося дивний і явно невдале найменування "Uncore", тобто "неядро", так що "системний агент" звучить набагато доречніше.

До основних елементів "системного агента" слід віднести модернізований двоканальний контролер оперативної пам'яті DDR3 до 1333 МГц, контролер PCI Express 2.0 з підтримкою однієї шини x16, двох шин x8 або однієї шини x8 і двох x4. В чіпі є спеціальний блок керування живленням, на основі якого реалізована технологія автоматичного розгону Turbo Boost нового покоління. Завдяки цій технології, що враховує стан як обчислювальних, так і графічних ядер, чіп при необхідності може істотно перевищувати свій термопакет на час до 25 секунд без пошкодження процесора і шкоди для працездатності.

Intel Sandy Bridge

У Sandy Bridge використовуються графічні процесори нового покоління Intel HD Graphics 2000 і HD Graphics 3000, які можуть складатися з шести або дванадцяти виконавчих блоків (execution units, EU), залежно від моделі процесора. Номінальна тактова частота графіки становить 650 або 850 МГц, при цьому вона може підвищуватися до 1100, 1250 або 1350 МГц в режимі Turbo Boost, яка тепер поширюється і на відеоприскорювач. Графіка підтримує програмний інтерфейс Direct X 10.1 - розробники визнали зайвою підтримку Direct X 11, справедливо вважаючи, що шанувальники комп'ютерних ігор, де дійсно затребуваний цей API, в будь-якому випадку віддадуть перевагу значно більш продуктивну дискретну графіку.

Intel Sandy Bridge

Маркування процесорів Sandy Bridge досить проста і логічна. Як і раніше, вона складається з цифрових індексів, які в деяких випадках супроводжуються буквеним. Відрізнити Sandy Bridge від Nehalem можна по назві: індекс нових чіпів чотиризначний і починається з двійки ("друге покоління"), а старих - тризначний. Приміром, перед нами процесор Intel Core i5-2500K. Тут "Intel Core" означає марку, "i5" - серію, "2" - покоління, "500" - індекс моделі, а "K" - буквений індекс.

Що стосується літерних індексів, то за чіпів з мікроархітектурою Nehalem відомий один з них це "S" (процесори i5-750S і i7-860S). Він присвоюється чіпам, орієнтованим на домашні мультимедійні машини. Процесори з однаковим числовим індексом відрізняються тим, що моделі з індексом "S" працюють на трохи меншій номінальній тактовій частоті, але "турбочастота", що досягається при автоматичному розгоні Turbo Boost, у них однакова. Іншими словами, в штатному режимі вони економічніше, а їх система охолодження тихіше, ніж у стандартних моделей. Всі нові десктопні Core другого покоління без індексів споживають 95 Вт, а з індексом "S" - 65 Вт.

Модифікації з індексом "T" працюють на ще більш низькій тактовій частоті, ніж "базові", при цьому "турбочастота" у них теж нижче. Термопакет такі процесорів складає всього 35 або 45 Вт, що цілком порівнянно з TDP сучасних мобільних чіпів.

І, нарешті, індекс "K" означає розблокований множник, що дозволяє безперешкодно розганяти процесор, підвищуючи його тактову частоту.

Ми познайомилися із загальними технічними рішеннями, реалізованими в "настільних" процесорів з архітектурою Sandy Bridge. Далі ми поговоримо про особливості різних серій, вивчимо актуальний модельний ряд і дамо рекомендації, які конкретні моделі можна вважати кращими покупками в своєму класі.


Сторінки: 1 2 Слід.